人工智能

NVIDIA计算卡被华为取代过程扰乱了训练 导致DeepSeek R2模型推迟发布

字号+作者:cnBeta.COM 来源:cnBeta 2025-08-15 07:43 评论(创建话题) 收藏成功收藏本文

中国坚持要求企业使用国产AI芯片而非英伟达芯片,这会不会付出一些代价?据一份新报告称,北京方面曾敦促DeepSeek放弃英伟达硬件,转而在其R2型号中使用华为芯'...

中国坚持要求企业使用国产AI芯片而非英伟达芯片,这会不会付出一些代价?据一份新报告称,北京方面曾敦促DeepSeek放弃英伟达硬件,转而在其R2型号中使用华为芯片,但训练过程中不断出现技术问题,导致发布推迟,并被迫重新转向NVIDIA进行训练,而推理部分则使用了华为芯片。EoF品论天涯网

EoF品论天涯网

今年1月,DeepSeek的R1模型发布时震惊了整个人工智能行业。据称,该模型在2048块英伟达H800上进行了训练,耗资557.6万美元,与其他人工智能公司数十亿美元的投入相比只是零头。但后来有消息称,DeepSeek使用了大约5万块HopperGPU,其中包括1万块H800和1万块H100,以及3万块HGXH20单元。EoF品论天涯网

据《金融时报》援引三位知情人士的话称,对于R2的后续型号,中国当局“鼓励”DeepSeek放弃NVIDIA技术,转而使用国产硬件。EoF品论天涯网

DeepSeek采纳了这一建议(或者说需求),转而使用华为基于昇腾平台进行R2版本的训练。然而,这带来了性能不稳定、互联速度变慢以及华为CANN软件工具包限制等问题。EoF品论天涯网

华为派出了一个工程师团队前往DeepSeek的数据中心,希望解决这些问题。尽管他们已经到位,但在Ascend平台上进行的训练从未成功过,不过使R2与Ascend兼容推理的工作仍在继续。EoF品论天涯网

R2原定于5月推出,但由于华为交换机故障而推迟了其发布——目前预计该型号将在几周后上市。EoF品论天涯网

EoF品论天涯网

加剧延误的是中国高端英伟达GPU的短缺。本月早些时候,美国政府与英伟达和AMD达成协议,根据协议,这两家科技巨头将向华盛顿提供在中国销售的人工智能芯片(包括H20芯片)15%的销售额。作为交换,这两家公司将获得向中国客户销售产品所需的许可证。EoF品论天涯网

然而,中国官方媒体此前报道称,H20GPU不安全、过时且对环境有害。中国监管机构约谈英伟达,讨论与该芯片相关的国家安全问题,导致该公司向用户保证其产品中没有后门、终止开关或间谍软件。EoF品论天涯网

北京试图阻止英伟达收购DeepSeek并不令人意外。本周有报道称,中国当局一直在敦促几家大型企业避免使用H20芯片。他们还要求企业提供订购这些芯片的合理性,并解释为什么这些芯片比国产芯片更受欢迎。EoF品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]