人工智能

DeepSeek上新 Prover-V2-671B新开源模型发布

字号+作者:快科技 来源:快科技 2025-04-30 19:15 评论(创建话题) 收藏成功收藏本文

今日下午,DeepSeek在AI开源社区HuggingFace发布了一个名为DeepSeek-Prover-V2-671B的新模型。据介绍,DeepSeek-Prover-V2-671B其参数量达到6710亿,使用了'...

今日下午,DeepSeek在AI开源社区HuggingFace发布了一个名为DeepSeek-Prover-V2-671B的新模型。据介绍,DeepSeek-Prover-V2-671B其参数量达到6710亿,使用了更高效的safetensors文件格式,并支持BF16、FP8、F32等多种计算精度,方便模型更快、更省资源地训练和部署。IAI品论天涯网

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。IAI品论天涯网

同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。IAI品论天涯网

有网友分析,该模型被视为Prover-V1.5的升级版,专注于形式化定理证明,专门用于攻克数学难题,擅长自动证明定理和复杂计算,类似于AlphaGo在围棋中的自我对弈方式。IAI品论天涯网

接下来它的性能测试表现会如何,值得期待。IAI品论天涯网

IAI品论天涯网

IAI品论天涯网

IAI品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]