GPT“草莓”项目：推理能力翻倍定价200美元？-品论天涯网

外界对OpenAI“草莓（Strawberry）”项目的关注由来已久，但很长时间以来都是：只闻其声，不见其人。这种局面可能很快就会被打破。TheInformation在最新的报道中披露，两位测试过“草莓”模型的人士表示，OpenAI可能将在接下来的两周内发布“草莓”模型，并上线ChatGPT。但不同于GPT-4o、GPT-4omini是在优化使用体验和成本，“草莓”的目标是再一次让大模型向AGI前进。iV6品论天涯网

iV6品论天涯网

图/TheInformationiV6品论天涯网

那些取消ChatGPTPlus的用户，可能又要重新订阅了，但据称新模型将拥有一个让人“amazing”的定价。iV6品论天涯网

“草莓”成熟时，大模型也要“成熟”iV6品论天涯网

OpenAI将在未来两周内推出“草莓”的消息，无疑引起了业内的广泛关注，因为这不仅是OpenAI在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。iV6品论天涯网

根据目前流出的信息来看，相比以往的GPT模型，“草莓”在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人工智能（AGI）迈出的重要一步。iV6品论天涯网

首先，“草莓”项目的核心亮点是大幅增强了推理能力。据报道，“草莓”能够自主完成深度研究任务，这意味着它不再仅限于生成答案，而是能够提前规划、自动导航互联网，甚至自主解决高度复杂的科学问题。iV6品论天涯网

相比现有的GPT-4系列模型，“草莓”被寄予了厚望，可以帮助AI更好地模仿人类的思维过程，尤其是在数学和科学领域表现突出，成功解决了此前困扰大模型的多步骤推理问题。iV6品论天涯网

除了推理能力的突破，“草莓”还引入了名为“后训练（Post-training）”的新技术，即在完成大数据集的预训练后，进一步对模型进行调整，使其在特定任务上表现更加出色。iV6品论天涯网

iV6品论天涯网

关于STaR的一篇论文，图/arXiviV6品论天涯网

这个方法类似于斯坦福大学开发的“自学推理者（STaR）”模型，通过自我生成训练数据，AI能够不断迭代优化自身智能水平。这使得“草莓”在应对复杂任务时能够表现得更为灵活和高效，尤其是执行长时间任务（LHT）时，其规划能力和执行能力均得到显著提升。iV6品论天涯网

然而，尽管“草莓”项目充满了潜力，此前也有爆料指出了早期测试中暴露出的一些问题。例如，在处理简单任务时，响应速度偶尔过慢，且其记忆对话的功能尚不稳定。这些问题显然会影响使用体验，但也是新技术在探索中的必然过程。iV6品论天涯网

关键是推出之时，OpenAI能否解决或者改善这些问题。iV6品论天涯网

但无论如何，“草莓”或是当下最可能引领AI推理能力质变的大模型，这也让行业内外对于“草莓”的期待愈发高涨。因为它不仅意味着大语言模型的发展进入了新的阶段，也让我们看到了实现AGI的曙光。iV6品论天涯网

OpenAI宫变“导火索”：从Q*到草莓iV6品论天涯网

“草莓”项目的诞生并非一蹴而就，它的根源可以追溯到OpenAI早期一个代号为“Q*”的秘密项目。对于很多人来说，“Q*”这个代号可能并不熟悉，但一定知道去年底的OpenAI宫斗事件。iV6品论天涯网

2023年末，OpenAI突然爆发了宫斗级别的管理层震荡，CEO山姆·奥特曼（SamAltman）被董事会短暂罢免，而直接导火索正是“Q*”项目的安全风险与争议。iV6品论天涯网

iV6品论天涯网

“OpenAI的灵魂”：左二为奥特曼、左四位伊利亚，图/OpenAIiV6品论天涯网

事情的起因可以追溯到“Q*”的初步测试阶段，当时项目展示了在解决数学和科学推理问题上的惊人成果，特别是在一些复杂的多步骤问题上，模型的表现超越了现有的大模型。这让部分研究人员感到兴奋的同时，也产生了深深的忧虑。iV6品论天涯网

这些突破预示着，OpenAI可能正在快速逼近通用人工智能（AGI），这一发展超出了某些董事会成员的预期。他们担心AI的快速进化带来不可控的风险，甚至可能对社会产生深远的影响。OpenAI内部，围绕“Q*”是否应该继续推进的争论愈演愈烈。iV6品论天涯网

部分董事会成员认为项目的推进过于激进，尤其是涉及AGI的潜在危险，应该更加谨慎对待。最终，分歧达到了顶点，奥特曼在未与董事会充分沟通的情况下加速推进了“Q*”，引发了他短暂离职的戏剧性事件。iV6品论天涯网

但事实上矛盾是以另一方的离场作为结果。奥特曼回归之后，作为OpenAI灵魂人物、首席科学家的伊利亚（IlyaSutskever）再也没有现身官方发布活动，并在GPT-4o发布后官宣离职。iV6品论天涯网

iV6品论天涯网

图/XiV6品论天涯网

3天后，另一位OpenAI“超级对齐”团队负责人JanLeike也宣布了离职。而与此同时，“Q*”项目还在加速推进，并演变成了后来更广为人知的“草莓”项目。iV6品论天涯网

今年夏天，奥特曼还在X上发布了一张草莓的实拍图，一度引起了“草莓”即将落地的猜测。iV6品论天涯网

iV6品论天涯网

图/XiV6品论天涯网

重新向AGI进发：“草莓”重新定义AI？iV6品论天涯网

过去近两年，大模型厂商的方向显然已经发生了一些改变。最早，整个行业都把OpenAI的ScalingLaw奉为金科玉律，每一代生成式AI模型的进化都伴随着庞大参数量的提升，背后的依据是参数越大，智能涌现的潜力就越高。iV6品论天涯网

但到了2024年，各家大模型其实在放缓对“参数规模”的追逐，开始转向中小型参数规模、更具成本效益的模型。7月，就连OpenAI也推出了GPT-4omini，更不用说此前，国内和国外的知名大模型基本都已经推出了中等规模或者较小规模的模型。iV6品论天涯网

在这个大背景下，OpenAI的“草莓”项目仍然显得与众不同。在“草莓”项目上，OpenAI不再通过堆叠参数规模来获得智能涌现，而是试图通过优化模型的推理逻辑，通过增强推理能力和自我训练算法，突破了传统AI的性能瓶颈。iV6品论天涯网

从目前透露出的情况来看，“草莓”似乎不仅具备了类似人类的推理能力，能为解决复杂的多步骤问题提供了新的可能性。比如在科学研究、复杂决策、数据分析等领域，传统的语言模型往往只能通过简单的文本生成来应对，而“草莓”则能够根据问题的复杂性自主生成解决方案，并进行推理验证。iV6品论天涯网

iV6品论天涯网

图/DALL·E生成iV6品论天涯网

这种转变对推动AI真正从“工具”到“智能助手”的角色转变至关重要，也将使更多企业受益于AI推理能力的进步。iV6品论天涯网

另一方面，“草莓”还在一定程度上具备了自我迭代、自我提升的能力，接近AI领域梦寐以求的“递归自我改进（RecursiveSelf-Improvement）”。通过自我生成训练数据并进行迭代优化，“草莓”能够在过程中“学习”如何更有效地解决复杂问题，并且在应对新任务时，能够利用已有的经验快速适应。iV6品论天涯网

然而，“草莓”项目当然也有一些不可忽视的挑战。比如大规模使用中的稳定性表现，又比如引发OpenAI宫变的“安全”问题。此外还有一个更加实际问题是，与现有的GPT-4等多模态模型相比，据称“草莓”仍然缺乏多模态处理能力，这也意味着它在处理图像、视频等复杂数据时可能面临局限性。iV6品论天涯网

还有价格。iV6品论天涯网

首先要说明的是，在官方还未发布甚至官宣定价之前，实际“草莓”模型的价格是个未知数。但几乎可以肯定，“草莓”模型的训练和推理成本都会更贵。而按照TheInformation的消息源表示，OpenAI高管一度讨论过将“草莓”模型和“Orion”模型（可能是GPT-5）的订阅价格定在：iV6品论天涯网

2000美元/月。iV6品论天涯网

你没看错，不是20美元（目前ChatGPTPlus的定价），也不是200美元，而是2000美元。尽管只是“一度讨论过”，甚至可能只是面对企业用户，但从中也能体现出“草莓”的高成本，以及OpenAI在一定程度上的自信。iV6品论天涯网

iV6品论天涯网

目前Plus的价格，图/ChatGPTiV6品论天涯网

或许，如何平衡高推理能力、成本、用户体验等方面之间的关系，是“草莓”项目必须面对的一个问题。也就说，OpenAI推出不同等级、不同价格的“草莓”也没未必没有可能。iV6品论天涯网

但无论如何，前提条件还是“草莓”要有足够优秀、亮眼的表现，就如2022年末横空出世的ChatGPT（GPT-3.5）一般。iV6品论天涯网

而在未来两周内，OpenAI是否能凭借“草莓”项目再次定义AI的边界，值得所有人拭目以待。iV6品论天涯网

GPT“草莓”项目：推理能力翻倍 定价200美元？

GPT“草莓”项目：推理能力翻倍定价200美元？