人工智能

JetBrains开源发布Mellum 一种开放的AI编程模型

字号+作者:cnBeta.COM 来源:cnBeta 2025-05-01 14:49 评论(创建话题) 收藏成功收藏本文

JetBrains是一家开发一系列流行应用程序开发工具的公司,它发布了其首个用于编码的“开放”AI模型。周三,JetBrains将Mellum公开发布在AI开发平台HuggingF'...

JetBrains是一家开发一系列流行应用程序开发工具的公司,它发布了其首个用于编码的“开放”AI模型。周三,JetBrains将Mellum公开发布在AI开发平台HuggingFace上。Mellum是该公司去年为其各种软件开发套件发布的代码生成模型。8z3品论天涯网

Mellum经过超过4万亿个标记的训练,包含40亿个参数,专为代码补全(即根据周围环境补全代码片段)而设计。参数大致对应于模型解决问题的能力,而标记则是模型处理的原始数据。一百万个标记相当于约3万行代码。8z3品论天涯网


8z3品论天涯网

JetBrains在一份技术报告中解释道:“Mellum专为集成到专业开发人员工具(例如,集成开发人员环境中的智能代码建议)、人工智能编码助手以及代码理解和生成研究而设计,也非常适合教育应用和微调实验。 ”8z3品论天涯网

JetBrains表示,他们使用一系列数据集对Mellum进行了训练,该模型获得了Apache2.0许可,其中包括来自GitHub和英文维基百科文章的许可代码。在256块H200NVIDIAGPU集群上,训练耗时约20天。8z3品论天涯网

Mellum的启动和运行需要一些工作。基础模型无法开箱即用,必须先进行微调。虽然JetBrians提供了一些针对Python微调的Mellum模型,但该公司提醒称,这些模型旨在“评估潜在能力”,而非部署到生产环境中。8z3品论天涯网

8z3品论天涯网

人工智能生成的代码无疑正在改变软件的构建方式,但它也带来了新的安全挑战。根据开发者安全平台Snyk在2023年末进行的一项调查,超过50%的组织有时或经常遇到人工智能生成的代码的安全问题。8z3品论天涯网

事实上,JetBrains指出,Mellum可能“反映公共代码库中存在的偏见”(例如,生成与开源存储库风格相似的代码),并且其代码建议不一定“安全或没有漏洞”。8z3品论天涯网

JetBrains在一篇博客文章中写道:“这仅仅是个开始。我们不追求通用性——我们只是在建立焦点。如果Mellum能够激发哪怕一次有意义的实验、贡献或合作,我们都会认为这是一次胜利。”8z3品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]