JetBrains近日宣布,将其面向软件工程系统的新一代机器学习模型Mellum2正式开源。这距离公司在2025年开源首个Mellum模型仅过去一年多时间,当时的Mellum是一款专注代码补全的小型模型,参数规模约为40亿。与之相比,Mellum2的总参数量扩大到120亿,但JetBrains强调,通过采用稀疏专家混合(Mixture-of-Experts,MoE)架构,每个token实际参与计算的仅为约25亿活跃参数,从而在标准硬件上依然能够保持较快推理速度。
与仅在编辑器中执行代码补全任务的“聚焦型”Mellum不同,Mellum2被定位为一款完整的智能编码助手。它既可以生成和编辑代码,也能调用外部工具,执行多步“Agentic”工作流,支持长对话,并具备显式推理能力。开发者可以在Apache2.0许可下使用其基础版、指令调优版和“思考版”模型,在构建产品或内部工具时保持对数据的完全控制。
从规格上看,Mellum2相比初代Mellum在多个关键指标上有明显变化:原始Mellum采用的是稠密参数设计,而Mellum2转向MoE架构;总参数量从40亿提升至120亿,但活跃参数从40亿降至25亿;上下文窗口从8192token大幅提升到131072token,使其更适合处理长文档和复杂工程场景;两代模型均采用Apache2.0开源许可证。
JetBrains表示,Mellum2特别适合用于路由与编排复杂的AI工作负载,构建低延迟的检索增强生成(RAG)管线,为大型系统中的子Agent提供快速推理支持,以及在本地或私有环境中部署AI。为进一步提升模型在代码与数学等专业领域的表现,团队在预训练阶段采用了三阶段数据“课程”,逐步从多样的Web数据迁移到更精心筛选的代码和数学内容。
除Mellum2之外,JetBrains还公布了一项产品线调整:公司将停止维护面向Python开发者的数据科学IDEDataSpell。根据官方信息,DataSpell已于5月28日正式“退役”,相关的数据科学功能将被整合进入PyCharm专业版。现有的DataSpell有效订阅会在2026年9月1日自动转换到PyCharmPro。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】