Jetbrains释放Mellum，一种“开放” AI编码模型

2025年05月06日 12:49发布

3683阅读

Jetbrains是一系列流行的应用开发工具背后的公司，它发布了第一个用于编码的“开放” AI模型。

周三，Jetbrains Make Marlum是该公司于去年为其各种软件开发套件发布的代码生成模型，在AI Dev Platform Hugging Face上公开可用。接受了超过4万亿代币的培训的梅勒姆（Mellum）重量为40亿个参数，专门用于代码完成（即，基于周围的上下文完成代码片段）。

参数大致对应于模型解决问题的技能，而令牌是模型处理的数据的原始位置。一百万个令牌相当于约30,000行代码。

“旨在集成到专业开发人员工具（例如，在集成开发人员环境中的智能代码建议），AI驱动的编码助手以及有关代码理解和生成的研究，Mellum也是W，Mellum也是WELL适合教育应用和微调实验。”

Jetbrains说，它训练了已获得Apache 2.0许可的Mellum，该数据集收集了一系列数据集，包括GitHub的允许许可代码和英语Wikipedia文章。训练大约花了20天的256 H200 NVIDIA GPU。

梅勒姆（Mellum）需要一些工作才能开始运行。基本型号无法开箱即用；它必须先进行微调。尽管Jetbrians为Python提供了一些微调的Mellum模型，但该公司表示，他们的意思是“估计潜在能力”，而不是部署到生产环境中。

AI生成的代码无疑是在改变软件的构建方式，但它也引入了新的安全挑战。根据2023年后期的一项调查由开发人员安全平台Snyk。

TechCrunch活动 TechCrunch会议展览：AI 在TC会议上确保您的位置：AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览：AI 在TC会议上确保您的位置：AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。加利福尼亚州伯克利 | 6月5日立即预订

的确，Jetbrains指出，Mellum可能“反映公共代码库中存在的偏见”（例如，生成与开源存储库相似的代码的生成代码），其代码建议不一定是“安全的或没有漏洞的”。

“这仅仅是开始，” Jetbrains写道在博客文章中。 “我们不是在追逐一般性 - 我们正在建立重点。如果梅勒姆（Mellum）火花甚至有意义的实验，贡献或协作，我们会认为这是一场胜利。”