法国初创公司MistralAI今天宣布推出Large2,这是其新的旗舰机型,在代码生成、数学和推理方面的能力大大增强。Mistral还在Large2中增加了更好的多语言支持和高级函数调用功能。
MistralLarge2型号有1230亿个参数,可在单个H100节点上以高吞吐量运行。它支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、汉语、日语和韩语。在编码方面,它支持80多种编码语言,包括Python、Java、C、C++、JavaScript和Bash。
MistralLarge2现已开放权重,但只能免费用于研究和非商业用途。商业用途需获得模型许可。
在编程基准测试中,MistralLarge2(123B)的性能可与OpenAI的GPT-4o、ClaudeOpus3和最近发布的Meta的Llama3.1405B相媲美。在WildBench、ArenaHard和MTBench基准测试中,Large2的表现优于Llama3.1405B和Claude3Opus。在流行的MMLU基准测试中,这款新型号的表现优于Llama3.170B,与Llama3.1405B不相上下。
对于开发人员来说,MistralLarge2现在具有改进的函数调用和检索技能。它现在可以执行并行和顺序函数调用,使开发人员能够构建复杂的商业人工智能应用。
随着Large2的发布,Mistral正在整合其模型组合。它将拥有两个通用机型MistralNemo和MistralLarge,以及两个专业机型Codestral和Embed。未来,Mistral将停产Apache型号(Mistral7B、Mistral8x7B和8x22B、CodestralMamba、Mathstral)。
微软和Mistral已经建立了合作关系,在Azure上提供Mistral模型。今天,Mistral将其合作伙伴关系扩展到Google,在Google云上提供Mistral模型。
MistralLarge2和Llama3.1的连续发布标志着开放人工智能生态系统的一个重要里程碑,为研究和开发提供了两个强大的GPT-4级模型。这一突飞猛进的进展推动了人工智能向更加开放和协作的方向发展。
了解更多:
https://mistral.ai/news/mistral-large-2407/
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】