人工智能

GPT-5.6或将下周问世:从“模型”迈向“可执行Agent” 定价或仅为竞品1/3

字号+作者:华尔街见闻 来源:华尔街见闻 2026-06-21 14:32 评论(创建话题) 收藏成功收藏本文

OpenAI据报将于本月下旬推出新一代旗舰模型GPT-5.6,市场预期该模型将在编码、Agent工作流及3D生成等核心能力上实现跨越式提升,同时以更低定价直接冲击竞'...

OpenAI据报将于本月下旬推出新一代旗舰模型GPT-5.6,市场预期该模型将在编码、Agent工作流及3D生成等核心能力上实现跨越式提升,同时以更低定价直接冲击竞争对手。6月19日,据科技媒体testingcatalog报道,GPT-5.6系列涵盖mini、标准版及Pro版,最可能的发布窗口为6月22日至28日。TN4品论天涯网

预测市场Polymarket上该窗口的概率一度高达八成,不过X平台上帖文称GPT5.6因内部问题而推迟,概率仅剩不足三成,合约总交易量已超过100万美元。TN4品论天涯网


TN4品论天涯网

据报道,OpenAI首席科学家JakubPachocki已在内部向员工表示,GPT-5.6是对GPT-5.5的"有意义的改进(meaningfulimprovement)"。TN4品论天涯网

此前,OpenAICodex后端路由日志中已短暂出现"gpt-5.6"标识。部分ChatGPTPro用户据报已接触到早期隐秘测试版本,并反馈在相同提示词下输出质量有显著提升。TN4品论天涯网

核心能力:从"语言模型"迈向"可执行Agent"TN4品论天涯网

据报道,GPT-5.6在技术层面最受关注的升级,在于其Agent化能力的全面强化。TN4品论天涯网

上下文窗口从100万tokens扩展至约150万tokens,较GPT-5.5提升约43%,有助于处理更长周期的编码任务和多步会话。TN4品论天涯网

与此同时,据报词元效率再度提升10%至15%,意味着相同费用可处理更多工作量。TN4品论天涯网

从泄露测试反馈来看,GPT-5.6已能够实现视觉复刻(将设计稿直接还原为可运行代码)、SVG3D对象生成(支持浏览器内旋转与缩放)以及Playwright浏览器自动化(真实执行点击、输入、页面跳转等操作)。TN4品论天涯网

三项能力的组合,使其不再仅是一个给出建议的对话工具,具备直接在用户设备上执行操作的能力。TN4品论天涯网

X网友点评称GPT-5.6脑子还是那个脑子,但他已经长出手了,“一个能和你聊天、告诉你该怎么做的人,现在能打开你的浏览器,移动你的鼠标,复制一个设计,生成一个3D图标,保存到桌面上。”TN4品论天涯网


TN4品论天涯网

据wavespeed.ai报道,在智能体编码(agenticcoding)场景中,GPT-5.6的表现据称已优于Anthropic的Mythos系列,SVG生成能力亦被指超越ClaudeFable5。TN4品论天涯网

此外,此前GPT-5.5版本中存在的部分对齐问题(包括rewardhacking)据报也在新版本中得到修复。TN4品论天涯网

定价策略,以价格战扩大市场份额TN4品论天涯网

在商业策略层面,GPT-5.6或将成为OpenAI在定价上对Anthropic发起正面冲击的重要节点。TN4品论天涯网

据媒体报道,GPT-5.6的token价格可能仅为ClaudeFable5的约三分之一,延续OpenAI当前token价格约为Anthropic一半的定价优势。TN4品论天涯网

分析认为,在性能持平乃至领先的前提下,OpenAI通过大幅降价压缩对手的市场空间,加速企业级客户向OpenAI平台迁移。TN4品论天涯网

GPT-5.6的推进,折射出当前头部AI厂商之间愈发激烈的迭代竞争。TN4品论天涯网

据aiweekly.co报道,OpenAI旗舰模型的发布节奏已明显加速,GPT-5.4至GPT-5.5的间隔约为六周,GPT-5.6或延续了这一节奏。TN4品论天涯网

与此同时,Anthropic的Fable5及Opus系列、GoogleGemini等竞品亦在同期保持高频更新,部分社区将6月下旬视为"AI大事件周"。TN4品论天涯网

网友泼冷水:别太期待GPT-5.6,真正的突破要等GPT-6TN4品论天涯网

近日,多名用户反映GPT-5.5出现"降智"现象,猜测OpenAI正在后台测试GPT-5.6。TN4品论天涯网

有用户直接揣测:TN4品论天涯网

我认为他们在测试5.6,这就是Codex现在这么蠢的原因。

用户Hyper-Jason则补充,他认为软件表现异常源于集成问题,"这几乎是他们一贯的历史",同时表达希望GPT-5.6"不像之前的GPT-5模型那么受限"。TN4品论天涯网

X平台中文用户也吐槽GPT-5.5的性能下降:TN4品论天涯网

GPT-5.5绝对这两天是降智了……如果你三天内不出GPT-5.6我就不原谅你了。

此外,有Reddit网友提醒外界降低预期。5.6仅为小迭代更新,参数规模不会大幅跃升,真正的模型级别突破需等待GPT-6。Reddit用户写道:TN4品论天涯网

如果版本号是5.6(也就是一个小版本迭代,不是新版本),那大家就得降低期望值了。Fable之所以有自己的版本号(而不是Opus4.9),是因为它是一个新版本,而不是旧版本的迭代。而5.6应该是(或者说是)一个迭代版本,而不是新版本。

Reddit网友则从参数规模角度泼冷水:TN4品论天涯网

Fable大约是6T级模型,5.5是约2T级。5.6预计不会在参数规模上跳跃2-3倍,我们预计GPT-6才会是下一次模型级别跃升。

用户亦持相似立场:TN4品论天涯网

GPT5.6不是Fable。GPT要达到Fable水平,得等到预训练参数量接近的时候。

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]