Openai推出了一对AI推理模型O3和O4-Mini

知识菜鸟

2025年04月19日 10:02发布

1231阅读

OpenAI于周三宣布，新的AI推理模型O3和O4-Mini启动，旨在在回答之前暂停并通过问题进行工作。

该公司称O3为有史以来最先进的推理模型，在测量数学，编码，推理，科学和视觉理解能力的测试上表现出色。同时，O4-Mini提供了Openai所说的是价格，速度和性能之间的竞争权衡 - 开发人员在选择AI模型来为其应用程序供电时经常考虑三个因素。

与以前的推理模型不同，O3和O4-Mini可以使用CHATGPT中的工具（例如Web浏览，Python代码执行，图像处理和图像生成）生成响应。从今天开始，这些模型以及O4-Mini的变体称为“ O4-Mini-High”，它花费了更多的时间来提高其可靠性，可用于Openai's Pro，Plus和Team PL的订阅者Ans。

新车型是Openai在Cutthroat Global AI比赛中击败Google，Meta，XAI，Anthropic和Deepseek努力的一部分。虽然Openai首次发布AI推理模型O1，但竞争对手很快就进行了自己的版本，其版本是匹配或超过Openai阵容的性能。实际上，当AI实验室希望从其系统中脱颖而出，推理模型已经开始主导该领域。

O3几乎没有在chatgpt发布。 Openai首席执行官Sam Altman在2月表示，该公司打算将更多的资源投入到融合O3技术的复杂替代方案中。但是竞争性压力似乎刺激了Openai，以逆转路线。

OpenAI说，O3在经过验证的SWE板凳上实现了最先进的性能（无定制的脚手架），测量测量能力的测试能力，得分为69.1％。 O4-Mini模型的性能相似，得分为68.1％。 Openai的nExt最佳模型O3-Mini在测试中得分49.3％，而Claude 3.7十四行诗得分为62.3％。

OpenAI声称O3和O4-Mini是其第一个可以“使用图像思考”的型号。实际上，用户可以将图像上传到chatgpt，例如白板草图或PDF的图表，并且模型将在回答之前分析图像在其“经过思考链”阶段的过程中进行分析。多亏了这种新发现的能力，O3和O4-Mini可以理解模糊和低质量的图像，并且可以执行诸如缩放或旋转图像之类的任务。

除了图像处理功能之外，O3和O4-Mini可以通过Chatgpt的Canvas功能直接在浏览器中运行并执行Python代码，并在询问有关当前事件的Web时搜索网络。

除了chatgpt外，所有三个型号（O3，O4-Mini和O4-Mini-high）还将通过OpenAI的面向开发人员的端点，聊天完成API和响应API提供，允许工程师构建AP以基于用法的价格与公司的模型进行拼写。

OpenAI向开发商收取相对较低的O3的价格，鉴于其性能提高，每百万美元输入令牌（大约750,000个字）（大约750,000个单词，比《指环王》系列的长度更长），每百万产量代币40美元。对于O4-Mini，Openai的收费与O3-Mini相同，每百万美元的投入令牌和每百万美元的产出代币4.40美元。

在接下来的几周中，Openai说，它计划发布O3-Pro，这是O3的版本，该版本使用更多的计算资源来产生其答案，专门用于Chatgpt Pro订阅者。

OpenAI首席执行官Sam Altman表示O3和O4-Mini可能是GPT-5之前的Chatgpt中的最后一个独立的AI推理模型，该公司表示，该模型将统一具有其推理模型的传统模型。

。