人工智能

Mistral Small 3模型发布 比OpenAI和Google类似产品更快更好

字号+作者:cnBeta.COM 来源:cnBeta 2025-01-31 16:53 评论(创建话题) 收藏成功收藏本文

欧洲领先的人工智能公司之一MistralAI推出了一款名为MistralSmall3的新模型。这是一个包含240亿参数的模型,但与Llama3.370B和Qwen32B等大型模型相当(至'...

欧洲领先的人工智能公司之一MistralAI推出了一款名为MistralSmall3的新模型。这是一个包含240亿参数的模型,但与Llama3.370B和Qwen32B等大型模型相当(至少在MMLU-Pro基准测试中如此)。它不仅运行速度与Llama3.370B不相上下,而且速度更快。caM品论天涯网

ChatGPT上最常用的模型是GPT-4omini,它是用户用完GPT-4o请求后的备用模型。MistralSmall3的性能比这个OpenAI模型更好,据说延迟也更低。caM品论天涯网

caM品论天涯网

MistralAI介绍说:"我们在Apache2.0下发布了预训练和指令调整的检查点。检查点可以作为加速进展的强大基础。需要注意的是MistralSmall3既未使用RL也未使用合成数据进行训练,因此与DeepseekR1(一项伟大而互补的开源技术!)等模型相比,它在模型制作流程中处于较早阶段。它可以作为建立累积推理能力的基础模型。我们期待看到开源社区如何采用和定制它。"caM品论天涯网

作为一个偏小型的模型,如果你的电脑配置较高,也有可能在自己的电脑上本地运行它。MistralAI表示,它可以在单块NVIDIARTX4090显卡或配备32GB内存的MacBook上运行。caM品论天涯网

虽然该机型在MMLU-Pro基准测试中的表现优于上述其他机型,但它并不总是人类评估人员的首选。Mistral在一组超过1k的专有编码和通用提示中将其模型与其他模型进行了比较。研究发现,与Gemma-227B和Qwen-32B相比,MistralSmall3是首选方案,但与Llama3.370B和GPT-4omini相比,MistralSmall3的首选度较低。caM品论天涯网

caM品论天涯网

MistralSmall3现以mistral-small-latest或mistral-small-2501的形式在平台上提供。caM品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

14
扫二维码添加收藏返回顶部