人工智能

通义千问团队开源首个千亿参数模型Qwen1.5-110B

字号+作者: 来源:站长之家 2024-04-28 08:28 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com)4月28日 消息:通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和 Chat 评估中表现出色,与其他同类模型相比有显'...

站长之家(ChinaZ.com)4月28日 消息:通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和 Chat 评估中表现出色,与其他同类模型相比有显著提升。Qwen1.5-110B 采用了 Transformer 解码器架构,支持多种语言,并且具有高效的分组查询注意力机制。在 Chat 评估中,该模型相较于之前的版本表现更好,显示了更大规模模型的潜力。afX品论天涯网

微信截图_20240428082933.pngafX品论天涯网

110B 模型的性能提升主要来自于增加的模型规模,而训练方法并未大幅改变。然而,尽管未改变训练方法,模型规模的增加依然带来了更好的 Chat 模型效果,这表明模型规模的扩展在提升性能方面具有重要意义。afX品论天涯网

Qwen1.5-110B 是通义千问系列中规模最大的模型,也是首个拥有超过1000亿参数的模型。它在与最近发布的 SOTA 模型的性能比较中表现出色,显示出在模型大小扩展方面仍有很大的提升空间。afX品论天涯网

未来,团队将继续探索模型规模提升和扩展预训练数据规模两种方法带来的优势。afX品论天涯网

模型链接:afX品论天涯网

Qwen1.5-110B-Chat:afX品论天涯网

https://www.modelscope.cn/models/qwen/Qwen1.5-110B-ChatafX品论天涯网

Qwen1.5-110B:afX品论天涯网

https://www.modelscope.cn/models/qwen/Qwen1.5-110BafX品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章