人工智能

OpenAI“草莓”推理大模型两周内就要上架?用户恐将面临耐心考验

字号+作者: 来源:​财联社 2024-09-11 08:56 评论(创建话题) 收藏成功收藏本文

沉寂了数月的全球AI龙头OpenAI,似乎马上要有大动作了。根据《信息报》周二援引多名知情人士报道,OpenAI计划在大约两周时间里,正式推出以推理能力为核心的'...

沉寂了数月的全球AI龙头OpenAI,似乎马上要有大动作了。根据《信息报》周二援引多名知情人士报道,OpenAI计划在大约两周时间里,正式推出以推理能力为核心的“草莓”AI模型,并加入ChatGPT服务。由于OpenAICEO奥尔特曼等人对“草莓”的大力宣传,叠加公司的确也有一阵子没有令人兴奋的消息了,外界对于这个新产品也算是有一定的期待。4z3品论天涯网

会主动“沉思”的大模型4z3品论天涯网

报道称,作为以推理为卖点的大模型,“草莓”在面对复杂、多步骤的提问时,会比现在的GPT-4o能力更强、更加易用4z3品论天涯网

在使用GPT-4o时,如果要提出一个多步骤推理的问题,为了避免机器胡乱回答,用户往往需要明确告知机器人解答问题时的每一个推理步骤——类似于输入“思考链的提示词”。使用“草莓”时则没有那么麻烦,输出的结果也会更好。例如,这个模型能够解答《纽约时报》字谜游戏。4z3品论天涯网


4z3品论天涯网

(来源:《纽约时报》)4z3品论天涯网

因此,除了数学、代码外,“草莓”也适合回答更加宽泛、主观的问题。例如要求它“头脑风暴”一个市场营销策略,“草莓”给出的回答更加贴近用户所在的实际场景,也更加关注细节,例如生成一个以周为单位的执行计划。4z3品论天涯网

造成回答质量差异的核心原因,在于“草莓”模型不会立即回答用户的提问,而是会进行“思考”,也会向用户提出追加的问题,从而更加全面地给出答案。4z3品论天涯网

当然,这个步骤也是“草莓”作为互联网产品的潜在弱点——报道称,模型可能需要10-20秒的时间才会开始回答问题。对于日益强调与AI实时交流的行业而言,付费用户能否接受交互间隔拉大到十秒以上会是个问题4z3品论天涯网

更致命的问题是,在回答一些GPT-4o也能推理的问题(事实上人类至今都不清楚AI的能力边界在哪里),“草莓”可能会出现思考一段时间后,只给出稍稍好一些的回答。体验过这种差异的知情人士称,结果的提升并不值得等待这么长时间,能做到“脱口而出”的GPT-4o反而体验更好。4z3品论天涯网

知情人士同时表示,在内部测试中,“草莓”也出现难以记住对话历史等问题。同时这个模型目前只能输入和输出文字,并不能处理图像,尚未跨过关键的多模态门槛。4z3品论天涯网

商业策略也是看点4z3品论天涯网

即使爆料准确,这件事情的看点除了“草莓”本身的能力外,还有OpenAI对商业策略的考量。4z3品论天涯网

根据早些时候的报道,OpenAI在内部商讨中,考虑给即将推出的推理专长“草莓”大模型,或下一代旗舰模型Orion订一个更高的价格。更符合实际的操作是,OpenAI可能会在现有的ChatGPTPlus外新增一个付费档次,提供“草莓”的无限制访问或响应速度提升。当然,这一切的前提是有大量用户认可“草莓”能力的提升。4z3品论天涯网

在目前的定价体系中,面向个人用户的ChatGPTPlus每月收费20美元,企业用户的收费标准介于每月25-60美元/每个账号不等。4z3品论天涯网

上个月曾经有消息称,OpenAI每月能通过企业服务和ChatGPT订阅赚到2.83亿美元的收入,但公司层面依然处于净亏损的状态。4z3品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]