人工智能

OpenAI推出一对AI推理模型:o3和o4-mini

字号+作者:cnBeta.COM 来源:cnBeta 2025-04-17 01:36 评论(创建话题) 收藏成功收藏本文

OpenAI周四宣布推出o3和o4-mini,这是新的AI推理模型,旨在在回答问题之前暂停并思考问题。该公司称o3是其迄今为止最先进的推理模型,在数学、编码、推理、'...

OpenAI周四宣布推出o3和o4-mini,这是新的AI推理模型,旨在在回答问题之前暂停并思考问题。该公司称o3是其迄今为止最先进的推理模型,在数学、编码、推理、科学和视觉理解能力的测试中均超越了该公司之前的模型。zuv品论天涯网

与此同时,o4-mini提供了OpenAI所说的价格、速度和性能之间的平衡——这三个因素是开发人员在选择用于支持其应用程序的AI模型时经常考虑的。zuv品论天涯网

zuv品论天涯网

与之前的推理模型不同,o3和o4-mini可以使用ChatGPT中的工具(例如网页浏览、Python代码执行、图像处理和图像生成)生成响应。从今天开始,这些模型以及o4-mini的一个变体o4-mini-high(花费更多时间精心设计答案以提高其可靠性)可供OpenAI的Pro、Plus和Team计划的订阅者使用。zuv品论天涯网

这些新模型是OpenAI在激烈的全球AI竞赛中击败Google、Meta、xAI、Anthropic和DeepSeek的努力之一。虽然OpenAI率先发布了AI推理模型o1,但竞争对手也迅速跟进,推出了性能匹敌甚至超越OpenAI的版本。事实上,随着AI实验室不断提升系统性能,推理模型已开始成为该领域的主导。zuv品论天涯网

O3差点没能在ChatGPT中发布。OpenAI首席执行官SamAltman今年2月曾表示,公司打算投入更多资源,开发一个融合O3技术的更复杂的替代方案。但竞争压力似乎最终促使OpenAI改变了方向。zuv品论天涯网

OpenAI表示,o3在SWE-bench验证中达到了最佳性能,该测试衡量了编程能力,得分为69.1%。o4-mini模型也达到了类似的性能,得分为68.1%。OpenAI的次优模型o3-mini在测试中得分为49.3%,而Claude3.7Sonnet得分为62.3%。zuv品论天涯网

OpenAI声称,o3和o4-mini是其首批能够“用图像思考”的模型。实际上,用户可以将图像上传到ChatGPT,例如白板草图或PDF中的图表,模型会在“思维链”阶段分析图像,然后再做出回答。凭借这项新发现的能力,o3和o4-mini能够理解模糊和低质量的图像,并在推理过程中执行缩放或旋转图像等任务。zuv品论天涯网

除了图像处理功能之外,o3和o4-mini还可以通过ChatGPT的Canvas功能直接在浏览器中运行和执行Python代码,并在被问及时搜索网络。zuv品论天涯网

除了ChatGPT之外,所有三种模型(o3、o4-mini和o4-mini-high)都将通过OpenAI面向开发人员的端点ChatCompletionsAPI和ResponsesAPI提供,从而允许工程师按照基于使用率的费率使用该公司的模型构建应用程序。zuv品论天涯网

鉴于o3性能的提升,OpenAI向开发者收取的费用相对较低,每百万输入词元(约75万字,比《指环王》系列更长)收费10美元,每百万输出词元收费40美元。对于o4-mini,OpenAI的收费与o3-mini相同,每百万输入词元收费1.10美元,每百万输出词元收费4.40美元。zuv品论天涯网

OpenAI表示,未来几周内,它计划发布o3-pro,这是o3的一个版本,它使用更多的计算资源来生成答案,专门供ChatGPTPro订阅者使用。zuv品论天涯网

OpenAI首席执行官SamAltman表示,o3和o4-mini可能是GPT-5之前ChatGPT中的最后几个独立AI推理模型,该公司表示,GPT-5将把GPT-4.1等传统模型与其推理模型统一起来。zuv品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]