OpenAI 揭示了其 o3-mini 模型的更多思维过程-品论天涯网

为了应对包括中国人工智能公司DeepSeek在内的竞争对手的压力，OpenAI正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四，OpenAI宣布，该公司的人工智能聊天机器人平台ChatGPT的免费和付费用户将看到更新的"思维链"，其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。Kh3品论天涯网

据OpenAI称，在"高推理"配置中使用o3-mini的高级ChatGPT计划的用户也将看到这一更新的读数。Kh3品论天涯网

OpenAI发言人通过电子邮件表示："我们为o3-mini引入了更新的[思维链]，旨在让人们更容易理解模型是如何思考的。有了这个更新，你将能够遵循模型的推理，让你对它的反应更清晰、更有信心。"Kh3品论天涯网

像o3-mini这样的推理模型在给出结果之前会对自己进行彻底的事实检查，这有助于它们避免一些通常会让模型翻车的陷阱。代价是推理模型需要更长的时间才能得出解决方案，通常需要几秒到几分钟的时间。Kh3品论天涯网

DeepSeek的R1模型是一个类似于o3-mini的"推理"模型，它揭示了完整的思维过程，许多人工智能研究人员都认为这是首选的方法。除了使模型更易于研究之外，推理步骤还能在某些情况下提供更好的用户体验，帮助指示模型何时可能处于正确或错误的轨道上。Kh3品论天涯网

部分由于竞争原因，OpenAI选择不显示o3-mini及其前身o1和o1-mini的完整推理步骤。相反，用户只能看到推理步骤的摘要--有时是错误的摘要。Kh3品论天涯网

Kh3品论天涯网

不过，OpenAI仍然没有展示o3-mini的完整推理步骤，但该公司表示，它"找到了一个平衡点"：o3-mini可以"自由思考"，然后将其"想法"整理成更详细的摘要。Kh3品论天涯网

"为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，在这个步骤中，模型会审查原始的思维链，删除任何不安全的内容，然后简化任何复杂的想法，"OpenAI发言人继续说道。"此外，这一后处理步骤还能让非英语用户接收到母语版本的思维链，从而创造出更加易用和友好的体验。"Kh3品论天涯网

在上周的一次RedditAMA中，OpenAI的首席产品官凯文-韦尔暗示这一变化即将到来。Kh3品论天涯网

他说："我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼，但我们也知道人们（至少是高级用户）想要它，所以我们会找到合适的方法来平衡它。"Kh3品论天涯网