与此同时,o4-mini提供了OpenAI所说的价格、速度和性能之间的平衡——这三个因素是开发人员在选择用于支持其应用程序的AI模型时经常考虑的。
与之前的推理模型不同,o3和o4-mini可以使用ChatGPT中的工具(例如网页浏览、Python代码执行、图像处理和图像生成)生成响应。从今天开始,这些模型以及o4-mini的一个变体o4-mini-high(花费更多时间精心设计答案以提高其可靠性)可供OpenAI的Pro、Plus和Team计划的订阅者使用。
这些新模型是OpenAI在激烈的全球AI竞赛中击败Google、Meta、xAI、Anthropic和DeepSeek的努力之一。虽然OpenAI率先发布了AI推理模型o1,但竞争对手也迅速跟进,推出了性能匹敌甚至超越OpenAI的版本。事实上,随着AI实验室不断提升系统性能,推理模型已开始成为该领域的主导。
O3差点没能在ChatGPT中发布。OpenAI首席执行官SamAltman今年2月曾表示,公司打算投入更多资源,开发一个融合O3技术的更复杂的替代方案。但竞争压力似乎最终促使OpenAI改变了方向。
OpenAI表示,o3在SWE-bench验证中达到了最佳性能,该测试衡量了编程能力,得分为69.1%。o4-mini模型也达到了类似的性能,得分为68.1%。OpenAI的次优模型o3-mini在测试中得分为49.3%,而Claude3.7Sonnet得分为62.3%。
OpenAI声称,o3和o4-mini是其首批能够“用图像思考”的模型。实际上,用户可以将图像上传到ChatGPT,例如白板草图或PDF中的图表,模型会在“思维链”阶段分析图像,然后再做出回答。凭借这项新发现的能力,o3和o4-mini能够理解模糊和低质量的图像,并在推理过程中执行缩放或旋转图像等任务。
除了图像处理功能之外,o3和o4-mini还可以通过ChatGPT的Canvas功能直接在浏览器中运行和执行Python代码,并在被问及时搜索网络。
除了ChatGPT之外,所有三种模型(o3、o4-mini和o4-mini-high)都将通过OpenAI面向开发人员的端点ChatCompletionsAPI和ResponsesAPI提供,从而允许工程师按照基于使用率的费率使用该公司的模型构建应用程序。
鉴于o3性能的提升,OpenAI向开发者收取的费用相对较低,每百万输入词元(约75万字,比《指环王》系列更长)收费10美元,每百万输出词元收费40美元。对于o4-mini,OpenAI的收费与o3-mini相同,每百万输入词元收费1.10美元,每百万输出词元收费4.40美元。
OpenAI表示,未来几周内,它计划发布o3-pro,这是o3的一个版本,它使用更多的计算资源来生成答案,专门供ChatGPTPro订阅者使用。
OpenAI首席执行官SamAltman表示,o3和o4-mini可能是GPT-5之前ChatGPT中的最后几个独立AI推理模型,该公司表示,GPT-5将把GPT-4.1等传统模型与其推理模型统一起来。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】