6月1日,稀宇科技正式发布新一代模型MiniMaxM3。该模型具备前沿编程能力、最高1M超长上下文,并支持原生多模态(图片、视频输入及电脑桌面操作),成为国内首个同时具备这三项能力的模型,也是目前唯一的开源模型。
据官方披露,在编程评测集SWE-BenchPro上,M3得分59.0%,超过GPT-5.5和Gemini3.1Pro,接近Opus4.7;在Agent评测Claw-Eval上,M3获得最高分;在多模态测试集OmniDocBench上,M3得分超过Gemini3.1Pro。
M3采用了全新的稀疏注意力架构MSA(MiniMaxSparseAttention),在100万上下文下每token计算量仅为上代模型的1/20,prefilling阶段加速超9倍,decoding阶段加速超15倍。
MiniMax同步更新了Agent产品MiniMaxCode,并推出TokenPlan订阅方案(Plus49元/月、Max119元/月、Ultra469元/月)。M3API即日起开放使用,512k上下文版本上线限时5折,持续7天。模型权重及技术报告将于10天内开源。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】