人工智能

泄漏的DeepSeek R2信息揭示其运用自主AI基础设施实现性能提升

字号+作者:cnBeta.COM 来源:cnBeta 2025-04-27 02:51 评论(创建话题) 收藏成功收藏本文

据知名AI业内人士@iruletheworldmo在X上透露,DeepSeek凭借其R1模型席卷AI世界之后,目前正在准备发布一款据称性能得到大幅改进的全新DeepSeekR2模型。在'...

据知名AI业内人士@iruletheworldmo在X上透露,DeepSeek凭借其R1模型席卷AI世界之后,目前正在准备发布一款据称性能得到大幅改进的全新DeepSeekR2模型。在华为Ascend910B芯片集群、潜在的华为Atlas900以及DeepSeek内部分布式训练框架的支持下,R2将这些加速器的利用率提升至令人印象深刻的82%,相当于512PetaFLOPS的FP16性能——计算能力为exaFLOP的一半。t9E品论天涯网

根据华为实验室的数据,这大约是NVIDIA旧款A100集群所提供的性能的91%,但DeepSeek声称它将单位训练成本降低了97.3%。t9E品论天涯网

DeepSeekR2背后是一个精心培育的合作伙伴生态系统。拓维信息是昇腾系列的领先OEM厂商,承接了DeepSeek超过一半的超级计算硬件订单,而曙光则提供每台功率高达40kW的液冷服务器机架。为了控制功耗,旭创科技的硅光收发器与传统解决方案相比,可再降低35%的功耗。t9E品论天涯网

从地理位置上看,运营分布在几个主要的枢纽:润建股份运营着华南超级计算中心,每年的合同金额超过50亿元人民币,中贝通信在西北地区保留了1500PetaFLOP的备用计算能力,以应对峰值需求。t9E品论天涯网

在软件方面,DeepSeekR2已经支持私有部署和微调,通过云赛智联平台为15个省的智慧城市计划提供支持。由鸿博股份旗下英博数字负责监管的华北节点将计算能力再提升3000PetaFLOP。t9E品论天涯网

如果计算能力不足,华为准备部署其CloudMatrix384系统,该系统定位为NVIDIA200GBNVL72的国产替代方案。它配备384个Ascend910C加速器,可实现NVL72集群整体petaFLOPS的1.7倍和HBM总容量的3.6倍——然而,其单芯片性能明显落后,功耗几乎是NVL72集群的四倍。t9E品论天涯网

t9E品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]