GPT-5.6或将下周问世：从“模型”迈向“可执行Agent” 定价或仅为竞品1/3-品论天涯网

OpenAI据报将于本月下旬推出新一代旗舰模型GPT-5.6，市场预期该模型将在编码、Agent工作流及3D生成等核心能力上实现跨越式提升，同时以更低定价直接冲击竞争对手。6月19日，据科技媒体testingcatalog报道，GPT-5.6系列涵盖mini、标准版及Pro版，最可能的发布窗口为6月22日至28日。zuK品论天涯网

预测市场Polymarket上该窗口的概率一度高达八成，不过X平台上帖文称GPT5.6因内部问题而推迟，概率仅剩不足三成，合约总交易量已超过100万美元。zuK品论天涯网

zuK品论天涯网

据报道，OpenAI首席科学家JakubPachocki已在内部向员工表示，GPT-5.6是对GPT-5.5的"有意义的改进（meaningfulimprovement）"。zuK品论天涯网

此前，OpenAICodex后端路由日志中已短暂出现"gpt-5.6"标识。部分ChatGPTPro用户据报已接触到早期隐秘测试版本，并反馈在相同提示词下输出质量有显著提升。zuK品论天涯网

核心能力：从"语言模型"迈向"可执行Agent"zuK品论天涯网

据报道，GPT-5.6在技术层面最受关注的升级，在于其Agent化能力的全面强化。zuK品论天涯网

上下文窗口从100万tokens扩展至约150万tokens，较GPT-5.5提升约43%，有助于处理更长周期的编码任务和多步会话。zuK品论天涯网

与此同时，据报词元效率再度提升10%至15%，意味着相同费用可处理更多工作量。zuK品论天涯网

从泄露测试反馈来看，GPT-5.6已能够实现视觉复刻（将设计稿直接还原为可运行代码）、SVG3D对象生成（支持浏览器内旋转与缩放）以及Playwright浏览器自动化（真实执行点击、输入、页面跳转等操作）。zuK品论天涯网

三项能力的组合，使其不再仅是一个给出建议的对话工具，具备直接在用户设备上执行操作的能力。zuK品论天涯网

X网友点评称GPT-5.6脑子还是那个脑子，但他已经长出手了，“一个能和你聊天、告诉你该怎么做的人，现在能打开你的浏览器，移动你的鼠标，复制一个设计，生成一个3D图标，保存到桌面上。”zuK品论天涯网

zuK品论天涯网

据wavespeed.ai报道，在智能体编码（agenticcoding）场景中，GPT-5.6的表现据称已优于Anthropic的Mythos系列，SVG生成能力亦被指超越ClaudeFable5。zuK品论天涯网

此外，此前GPT-5.5版本中存在的部分对齐问题（包括rewardhacking）据报也在新版本中得到修复。zuK品论天涯网

定价策略，以价格战扩大市场份额zuK品论天涯网

在商业策略层面，GPT-5.6或将成为OpenAI在定价上对Anthropic发起正面冲击的重要节点。zuK品论天涯网

据媒体报道，GPT-5.6的token价格可能仅为ClaudeFable5的约三分之一，延续OpenAI当前token价格约为Anthropic一半的定价优势。zuK品论天涯网

分析认为，在性能持平乃至领先的前提下，OpenAI通过大幅降价压缩对手的市场空间，加速企业级客户向OpenAI平台迁移。zuK品论天涯网

GPT-5.6的推进，折射出当前头部AI厂商之间愈发激烈的迭代竞争。zuK品论天涯网

据aiweekly.co报道，OpenAI旗舰模型的发布节奏已明显加速，GPT-5.4至GPT-5.5的间隔约为六周，GPT-5.6或延续了这一节奏。zuK品论天涯网

与此同时，Anthropic的Fable5及Opus系列、GoogleGemini等竞品亦在同期保持高频更新，部分社区将6月下旬视为"AI大事件周"。zuK品论天涯网

网友泼冷水：别太期待GPT-5.6，真正的突破要等GPT-6zuK品论天涯网

近日，多名用户反映GPT-5.5出现"降智"现象，猜测OpenAI正在后台测试GPT-5.6。zuK品论天涯网

有用户直接揣测：zuK品论天涯网

我认为他们在测试5.6，这就是Codex现在这么蠢的原因。

用户Hyper-Jason则补充，他认为软件表现异常源于集成问题，"这几乎是他们一贯的历史"，同时表达希望GPT-5.6"不像之前的GPT-5模型那么受限"。zuK品论天涯网

X平台中文用户也吐槽GPT-5.5的性能下降：zuK品论天涯网

GPT-5.5绝对这两天是降智了……如果你三天内不出GPT-5.6我就不原谅你了。

此外，有Reddit网友提醒外界降低预期。5.6仅为小迭代更新，参数规模不会大幅跃升，真正的模型级别突破需等待GPT-6。Reddit用户写道：zuK品论天涯网

如果版本号是5.6（也就是一个小版本迭代，不是新版本），那大家就得降低期望值了。Fable之所以有自己的版本号（而不是Opus4.9），是因为它是一个新版本，而不是旧版本的迭代。而5.6应该是（或者说是）一个迭代版本，而不是新版本。

Reddit网友则从参数规模角度泼冷水：zuK品论天涯网

Fable大约是6T级模型，5.5是约2T级。5.6预计不会在参数规模上跳跃2-3倍，我们预计GPT-6才会是下一次模型级别跃升。

用户亦持相似立场：zuK品论天涯网

GPT5.6不是Fable。GPT要达到Fable水平，得等到预训练参数量接近的时候。