Openai推出了一对AI推理模型O3和O4-Mini
OpenAI于周三宣布,新的AI推理模型O3和O4-Mini启动,旨在在回答之前暂停并通过问题进行工作。
该公司称O3为有史以来最先进的推理模型,在测量数学,编码,推理,科学和视觉理解能力的测试上表现出色。同时,O4-Mini提供了Openai所说的是价格,速度和性能之间的竞争权衡 - 开发人员在选择AI模型来为其应用程序供电时经常考虑三个因素。
与以前的推理模型不同,O3和O4-Mini可以使用CHATGPT中的工具(例如Web浏览,Python代码执行,图像处理和图像生成)生成响应。从今天开始,这些模型以及O4-Mini的变体称为“ O4-Mini-High”,它花费了更多的时间来提高其可靠性,可用于Openai's Pro,Plus和Team PL的订阅者Ans。
新车型是Openai在Cutthroat Global AI比赛中击败Google,Meta,XAI,Anthropic和Deepseek努力的一部分。虽然Openai首次发布AI推理模型O1,但竞争对手很快就进行了自己的版本,其版本是匹配或超过Openai阵容的性能。实际上,当AI实验室希望从其系统中脱颖而出,推理模型已经开始主导该领域。
O3几乎没有在chatgpt发布。 Openai首席执行官Sam Altman在2月表示,该公司打算将更多的资源投入到融合O3技术的复杂替代方案中。但是竞争性压力似乎刺激了Openai,以逆转路线。
OpenAI说,O3在经过验证的SWE板凳上实现了最先进的性能(无定制的脚手架),测量测量能力的测试能力,得分为69.1%。 O4-Mini模型的性能相似,得分为68.1%。 Openai的nExt最佳模型O3-Mini在测试中得分49.3%,而Claude 3.7十四行诗得分为62.3%。
OpenAI声称O3和O4-Mini是其第一个可以“使用图像思考”的型号。实际上,用户可以将图像上传到chatgpt,例如白板草图或PDF的图表,并且模型将在回答之前分析图像在其“经过思考链”阶段的过程中进行分析。多亏了这种新发现的能力,O3和O4-Mini可以理解模糊和低质量的图像,并且可以执行诸如缩放或旋转图像之类的任务。
除了图像处理功能之外,O3和O4-Mini可以通过Chatgpt的Canvas功能直接在浏览器中运行并执行Python代码,并在询问有关当前事件的Web时搜索网络。
除了chatgpt外,所有三个型号(O3,O4-Mini和O4-Mini-high)还将通过OpenAI的面向开发人员的端点,聊天完成API和响应API提供,允许工程师构建AP以基于用法的价格与公司的模型进行拼写。
OpenAI向开发商收取相对较低的O3的价格,鉴于其性能提高,每百万美元输入令牌(大约750,000个字)(大约750,000个单词,比《指环王》系列的长度更长),每百万产量代币40美元。对于O4-Mini,Openai的收费与O3-Mini相同,每百万美元的投入令牌和每百万美元的产出代币4.40美元。
在接下来的几周中,Openai说,它计划发布O3-Pro,这是O3的版本,该版本使用更多的计算资源来产生其答案,专门用于Chatgpt Pro订阅者。
OpenAI首席执行官Sam Altman表示O3和O4-Mini可能是GPT-5之前的Chatgpt中的最后一个独立的AI推理模型,该公司表示,该模型将统一具有其推理模型的传统模型。
。
发布评论