人工智能

阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo

字号+作者: 来源:站长之家 2024-05-09 11:01 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com)5月9日 消息:阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千'...

站长之家(ChinaZ.com)5月9日 消息:阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型,成为开源领域的新星。CEN品论天涯网

与通义千问2.1版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,理解能力提升了9%,逻辑推理能力提升了16%,指令遵循能力提升了19%,而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4Turbo持平,证明了其在自然语言处理领域的领先地位。CEN品论天涯网

阿里云、通义千问CEN品论天涯网

除了通义千问2.5的发布,通义还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均表现出色,成功超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B更是荣登榜首,进一步巩固了通义开源系列在业界的领先地位。CEN品论天涯网

通义的多模态模型和专有能力模型同样令人瞩目。其中,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V,其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,展现了其在代码生成和代码理解方面的卓越能力。CEN品论天涯网

这一模型的推出不仅满足了开发者对于高效代码生成的需求,也为企业客户提供了更为智能的代码管理和优化解决方案。CEN品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]