OpenAI据报将于本月下旬推出新一代旗舰模型GPT-5.6,市场预期该模型将在编码、Agent工作流及3D生成等核心能力上实现跨越式提升,同时以更低定价直接冲击竞争对手。6月19日,据科技媒体testingcatalog报道,GPT-5.6系列涵盖mini、标准版及Pro版,最可能的发布窗口为6月22日至28日。
预测市场Polymarket上该窗口的概率一度高达八成,不过X平台上帖文称GPT5.6因内部问题而推迟,概率仅剩不足三成,合约总交易量已超过100万美元。
据报道,OpenAI首席科学家JakubPachocki已在内部向员工表示,GPT-5.6是对GPT-5.5的"有意义的改进(meaningfulimprovement)"。
此前,OpenAICodex后端路由日志中已短暂出现"gpt-5.6"标识。部分ChatGPTPro用户据报已接触到早期隐秘测试版本,并反馈在相同提示词下输出质量有显著提升。
核心能力:从"语言模型"迈向"可执行Agent"
据报道,GPT-5.6在技术层面最受关注的升级,在于其Agent化能力的全面强化。
上下文窗口从100万tokens扩展至约150万tokens,较GPT-5.5提升约43%,有助于处理更长周期的编码任务和多步会话。
与此同时,据报词元效率再度提升10%至15%,意味着相同费用可处理更多工作量。
从泄露测试反馈来看,GPT-5.6已能够实现视觉复刻(将设计稿直接还原为可运行代码)、SVG3D对象生成(支持浏览器内旋转与缩放)以及Playwright浏览器自动化(真实执行点击、输入、页面跳转等操作)。
三项能力的组合,使其不再仅是一个给出建议的对话工具,具备直接在用户设备上执行操作的能力。
X网友点评称GPT-5.6脑子还是那个脑子,但他已经长出手了,“一个能和你聊天、告诉你该怎么做的人,现在能打开你的浏览器,移动你的鼠标,复制一个设计,生成一个3D图标,保存到桌面上。”
据wavespeed.ai报道,在智能体编码(agenticcoding)场景中,GPT-5.6的表现据称已优于Anthropic的Mythos系列,SVG生成能力亦被指超越ClaudeFable5。
此外,此前GPT-5.5版本中存在的部分对齐问题(包括rewardhacking)据报也在新版本中得到修复。
定价策略,以价格战扩大市场份额
在商业策略层面,GPT-5.6或将成为OpenAI在定价上对Anthropic发起正面冲击的重要节点。
据媒体报道,GPT-5.6的token价格可能仅为ClaudeFable5的约三分之一,延续OpenAI当前token价格约为Anthropic一半的定价优势。
分析认为,在性能持平乃至领先的前提下,OpenAI通过大幅降价压缩对手的市场空间,加速企业级客户向OpenAI平台迁移。
GPT-5.6的推进,折射出当前头部AI厂商之间愈发激烈的迭代竞争。
据aiweekly.co报道,OpenAI旗舰模型的发布节奏已明显加速,GPT-5.4至GPT-5.5的间隔约为六周,GPT-5.6或延续了这一节奏。
与此同时,Anthropic的Fable5及Opus系列、GoogleGemini等竞品亦在同期保持高频更新,部分社区将6月下旬视为"AI大事件周"。
网友泼冷水:别太期待GPT-5.6,真正的突破要等GPT-6
近日,多名用户反映GPT-5.5出现"降智"现象,猜测OpenAI正在后台测试GPT-5.6。
有用户直接揣测:
用户Hyper-Jason则补充,他认为软件表现异常源于集成问题,"这几乎是他们一贯的历史",同时表达希望GPT-5.6"不像之前的GPT-5模型那么受限"。
X平台中文用户也吐槽GPT-5.5的性能下降:
此外,有Reddit网友提醒外界降低预期。5.6仅为小迭代更新,参数规模不会大幅跃升,真正的模型级别突破需等待GPT-6。Reddit用户写道:
Reddit网友则从参数规模角度泼冷水:
用户亦持相似立场:

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】