人工智能

OpenAI 揭示了其 o3-mini 模型的更多思维过程

字号+作者:cnBeta.COM 来源:cnBeta 2025-02-07 15:38 评论(创建话题) 收藏成功收藏本文

为了应对包括中国人工智能公司DeepSeek在内的竞争对手的压力,OpenAI正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四,OpenAI宣'...

为了应对包括中国人工智能公司DeepSeek在内的竞争对手的压力,OpenAI正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四,OpenAI宣布,该公司的人工智能聊天机器人平台ChatGPT的免费和付费用户将看到更新的"思维链",其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。EQv品论天涯网

据OpenAI称,在"高推理"配置中使用o3-mini的高级ChatGPT计划的用户也将看到这一更新的读数。EQv品论天涯网

OpenAI发言人通过电子邮件表示:"我们为o3-mini引入了更新的[思维链],旨在让人们更容易理解模型是如何思考的。有了这个更新,你将能够遵循模型的推理,让你对它的反应更清晰、更有信心。"EQv品论天涯网

像o3-mini这样的推理模型在给出结果之前会对自己进行彻底的事实检查,这有助于它们避免一些通常会让模型翻车的陷阱 。代价是推理模型需要更长的时间才能得出解决方案,通常需要几秒到几分钟的时间。EQv品论天涯网

DeepSeek的R1模型是一个类似于o3-mini的"推理"模型,它揭示了完整的思维过程,许多人工智能研究人员都认为这是首选的方法。除了使模型更易于研究之外,推理步骤还能在某些情况下提供更好的用户体验,帮助指示模型何时可能处于正确或错误的轨道上。EQv品论天涯网

部分由于竞争原因,OpenAI选择不显示o3-mini及其前身o1和o1-mini的完整推理步骤。相反,用户只能看到推理步骤的摘要--有时是错误的摘要。EQv品论天涯网

EQv品论天涯网

不过,OpenAI仍然没有展示o3-mini的完整推理步骤,但该公司表示,它"找到了一个平衡点":o3-mini可以"自由思考",然后将其"想法"整理成更详细的摘要。EQv品论天涯网

"为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,在这个步骤中,模型会审查原始的思维链,删除任何不安全的内容,然后简化任何复杂的想法,"OpenAI发言人继续说道。"此外,这一后处理步骤还能让非英语用户接收到母语版本的思维链,从而创造出更加易用和友好的体验。"EQv品论天涯网

在上周的一次RedditAMA中,OpenAI的首席产品官凯文-韦尔暗示这一变化即将到来。EQv品论天涯网

他说:"我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。"EQv品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

13
扫二维码添加收藏返回顶部