阿里巴巴揭幕了Qwen3,一个“混合” AI推理模型的家族

中国科技公司阿里巴巴周一发行了Qwen3,该公司声称该公司可以匹配,在某些情况下,它优于Google和Openai的最佳模型。

阿里巴巴揭幕了Qwen3,一个“混合” AI推理模型的家族

大多数模型都是(或很快)可在AI Dev Platform拥抱面和GitHub上的“打开”许可下下载。它们的大小从6亿到2350亿个参数不等。 (参数大致对应于模型的解决问题的技能,并且参数更多的模型通常比参数较少的模型表现更好。)

QWEN(例如Qwen)的兴起的模型系列的兴起增加了对OpenAI等美国实验室的压力,以提供更有能力的AI技术。他们还导致决策者实施旨在限制中国人工智能公司获得培训模型所需筹码的能力的限制。

介绍qwen3!

我们释放和开放权重QWEN3,我们最新的大型语言模型,包括2个MOE型号和6个密集的型号,范围从0.6B到235B。我们的旗舰模型QWEN3-235B-A22B,在编码,数学,一般…pic.twitter.com/jwzkjehwwc

的基准评估中取得了竞争成就。

- Qwen(@alibaba_qwen)2025年4月28日

根据阿里巴巴的说法,QWEN3模型是“混合”模型 - 他们可以花时间通过复杂的问题来“推理”,或者快速回答更简单的请求。推理使模型能够有效地检查事实检查本身,类似于Openai的O3,但以更高的延迟为代价。

“我们拥有无缝集成的思维和非思想模式,为用户提供了控制思维预算的灵活性,” QWEN团队在博客文章中写道。 “此设计使用户可以更轻松地配置特定于任务的预算。”

一些模型还采用了专家(MOE)体系结构的混合,对于回答查询,这在计算上可能更有效。 Moe将任务分解为子任务,并将其委派给较小的专业“专家”模型。 

TechCrunch活动 TechCrunch会议展览:AI 在TC会​​议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览:AI 在TC会​​议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 加利福尼亚州伯克利 | 6月5日 立即预订 阿里巴巴说,

QWEN3型号支持119种语言,并接受了36万亿代币的数据集培训。 (令牌是模型处​​理的数据的原始数据; 100万个令牌是等等的该公司表示Qwen3经过教科书,“问答对”,代码片段,AI生成的数据等。

与其前身Qwen2相比,这些改进与其他改进相比,大大提高了Qwen3的能力。 QWEN3型号似乎都没有头部和肩膀高于OpenAI的O3和O4-Mini,但它们的表现都很强。

在CodeForces是一个编程比赛的平台上,是最大的QWEN3型号-QWEN-3-235B-A22B-刚刚击败OpenAI的O3-Mini和Google的Gemini 2.5 Pro。 QWEN-3-235B-A22B还在最新版本的Aime(一个具有挑战性的数学基准)和BFCL上最擅长O3-Mini,这是评估模型对问题“推理”能力的测试。

但是QWEN-3-235B-A22B尚未公开可用 - 至少还没有。

阿里巴巴的内部基础Qwen33.Image积分:阿里巴巴的ARK结果

最大的公共QWEN3模型QWEN3-32B仍然具有许多专有和开放的AI模型,包括中国AI Lab DeepSeek的R1。 QWEN3-32B在多个测试中超过OpenAI的O1型号,包括编码基准LiveCodeBench。

阿里巴巴说Qwen3在工具称呼功能以及按照说明并复制特定数据格式的QWEN3“擅长”。除了下载模型外,QWEN3还可以从云提供商那里获得,包括烟花AI和双曲线。

AI Cloud Host Baseten的联合创始人兼首席执行官Tuhin Srivastava表示,Qwen3是开放模型的趋势线的另一个点,以与OpenAI等封闭式系统保持同步。

“美国正在加倍限制筹码到中国的销售和从中国购买的销售,但是像Qwen 3这样的模型无疑是在国内使用的,并且将在国内使用,”他告诉TechCrunch。 “这反映了一个现实,即企业都在建立自己的工具(以及)通过人类和Openai等封闭模型公司购买货架。”

avatar

知识小能手 管理员

发布了:24898篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信