人工智能

NVIDIA GPU弱爆了!世界第一AI芯片升级4万亿晶体管、90万核心

字号+作者: 来源:快科技 2024-03-14 06:57 评论(创建话题) 收藏成功收藏本文

快科技3月14日消息,Cerebras Systems发布了他们的第三代晶圆级AI加速芯片WSE-3”(Wafer Scale Engine 3),规格参数更加疯狂,而且在功耗、价格不变的前提下'...

快科技3月14日消息,Cerebras Systems发布了他们的第三代晶圆级AI加速芯片WSE-3”(Wafer Scale Engine 3),规格参数更加疯狂,而且在功耗、价格不变的前提下性能翻了一番。KIN品论天涯网

2019年的第一代WSE-1基于台积电16nm工艺,面积46225平方毫米,晶体管1.2万亿个,拥有40万个AI核心、18GB SRAM缓存,支持9PB/s内存带宽、100Pb/s互连带宽,功耗高达15千瓦。KIN品论天涯网

KIN品论天涯网

2021年的第二代WSE-2升级台积电7nm工艺,面积不变还是46225平方毫米,晶体管增至2.6万亿个,核心数增至85万个,缓存扩至40GB,内存带宽20PB/s,互连带宽220Pb/s。KIN品论天涯网

KIN品论天涯网

如今的第三代WSE-3再次升级为台积电5nm工艺,面积没说但应该差不多,毕竟需要一块晶圆才能造出一颗芯片,不可能再大太多了。KIN品论天涯网

晶体管数量继续增加达到惊人的4万亿个,AI核心数量进一步增加到90万个,缓存容量达到44GB,外部搭配内存容量可选1.5TB、12TB、1200TB。KIN品论天涯网

乍一看,核心数量、缓存容量增加的不多,但性能实现了飞跃,峰值AI算力高达125PFlops,也就是每秒12.5亿亿次浮点计算,堪比顶级超算。KIN品论天涯网

KIN品论天涯网

它可以训练相当于GPT-4、Gemini十几倍的下一代AI大模型,能在单一逻辑内存空间内存储24万亿参数,无需分区或者重构。KIN品论天涯网

用它来训练1万亿参数大模型的速度,相当于用GPU训练10亿参数。KIN品论天涯网

四颗并联,它能在一天之内完成700亿参数的调教,而且支持最多2048路互连,一天就可以完成Llama 700亿参数的训练。KIN品论天涯网

WSE-3的具体功耗、价格没公布,根据上代的情况看应该在200多万美元。KIN品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]