Jetbrains释放Mellum,一种“开放” AI编码模型
Jetbrains是一系列流行的应用开发工具背后的公司,它发布了第一个用于编码的“开放” AI模型。
周三,Jetbrains Make Marlum是该公司于去年为其各种软件开发套件发布的代码生成模型,在AI Dev Platform Hugging Face上公开可用。接受了超过4万亿代币的培训的梅勒姆(Mellum)重量为40亿个参数,专门用于代码完成(即,基于周围的上下文完成代码片段)。
参数大致对应于模型解决问题的技能,而令牌是模型处理的数据的原始位置。一百万个令牌相当于约30,000行代码。
“旨在集成到专业开发人员工具(例如,在集成开发人员环境中的智能代码建议),AI驱动的编码助手以及有关代码理解和生成的研究,Mellum也是W,Mellum也是WELL适合教育应用和微调实验。”
Jetbrains说,它训练了已获得Apache 2.0许可的Mellum,该数据集收集了一系列数据集,包括GitHub的允许许可代码和英语Wikipedia文章。训练大约花了20天的256 H200 NVIDIA GPU。
梅勒姆(Mellum)需要一些工作才能开始运行。基本型号无法开箱即用;它必须先进行微调。尽管Jetbrians为Python提供了一些微调的Mellum模型,但该公司表示,他们的意思是“估计潜在能力”,而不是部署到生产环境中。
AI生成的代码无疑是在改变软件的构建方式,但它也引入了新的安全挑战。根据2023年后期的一项调查由开发人员安全平台Snyk。
TechCrunch活动 TechCrunch会议展览:AI 在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览:AI 在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 加利福尼亚州伯克利 | 6月5日 立即预订的确,Jetbrains指出,Mellum可能“反映公共代码库中存在的偏见”(例如,生成与开源存储库相似的代码的生成代码),其代码建议不一定是“安全的或没有漏洞的”。
> >“这仅仅是开始,” Jetbrains写道在博客文章中。 “我们不是在追逐一般性 - 我们正在建立重点。如果梅勒姆(Mellum)火花甚至有意义的实验,贡献或协作,我们会认为这是一场胜利。”
发布评论