为了应对包括中国人工智能公司DeepSeek在内的竞争对手的压力,OpenAI正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四,OpenAI宣布,该公司的人工智能聊天机器人平台ChatGPT的免费和付费用户将看到更新的"思维链",其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。
据OpenAI称,在"高推理"配置中使用o3-mini的高级ChatGPT计划的用户也将看到这一更新的读数。
OpenAI发言人通过电子邮件表示:"我们为o3-mini引入了更新的[思维链],旨在让人们更容易理解模型是如何思考的。有了这个更新,你将能够遵循模型的推理,让你对它的反应更清晰、更有信心。"
像o3-mini这样的推理模型在给出结果之前会对自己进行彻底的事实检查,这有助于它们避免一些通常会让模型翻车的陷阱 。代价是推理模型需要更长的时间才能得出解决方案,通常需要几秒到几分钟的时间。
DeepSeek的R1模型是一个类似于o3-mini的"推理"模型,它揭示了完整的思维过程,许多人工智能研究人员都认为这是首选的方法。除了使模型更易于研究之外,推理步骤还能在某些情况下提供更好的用户体验,帮助指示模型何时可能处于正确或错误的轨道上。
部分由于竞争原因,OpenAI选择不显示o3-mini及其前身o1和o1-mini的完整推理步骤。相反,用户只能看到推理步骤的摘要--有时是错误的摘要。
不过,OpenAI仍然没有展示o3-mini的完整推理步骤,但该公司表示,它"找到了一个平衡点":o3-mini可以"自由思考",然后将其"想法"整理成更详细的摘要。
"为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,在这个步骤中,模型会审查原始的思维链,删除任何不安全的内容,然后简化任何复杂的想法,"OpenAI发言人继续说道。"此外,这一后处理步骤还能让非英语用户接收到母语版本的思维链,从而创造出更加易用和友好的体验。"
在上周的一次RedditAMA中,OpenAI的首席产品官凯文-韦尔暗示这一变化即将到来。
他说:"我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。"
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】