奥特曼“红色警戒”5个月后GPT Image 2屠榜断层领先反杀Google-品论天涯网

发布当天，三榜通杀。GPTImage2上线12小时，Text-to-Image（文生图）、Single-ImageEdit（单图编辑）、Multi-ImageEdit（多图编辑）三个分榜全部登顶。Arena官方原话：「acleansweep」（全胜）。x9P品论天涯网

x9P品论天涯网

文生图主榜，GPTImage21512分，NanoBanana21271分。241分差距，Arena史上最大。x9P品论天涯网

“没有任何模型曾以这种差距统治过ImageArena”，Arena官方表示。x9P品论天涯网

在ImageArena所有盲测对决中，GPTImage2的胜率是93%：100张图配对盲选，93张人们选了OpenAI那张。x9P品论天涯网

“如果把DALL-E看作洞穴壁画，把Images1.0视为古代艺术，那么Images2.0就是文艺复兴”。x9P品论天涯网

OpenAI在发布会开场中这样介绍Images2.0，奥特曼更是将它称作跨代升级：x9P品论天涯网

这好像一下子从GPT-3跃升到了GPT-5。x9P品论天涯网

x9P品论天涯网

https://www.youtube.com/watch?v=sWkGomJ3TLIx9P品论天涯网

OpenAI官方API文档对Images2.0给出了一个最高级的评价。x9P品论天涯网

x9P品论天涯网

https://developers.openai.com/api/docs/models/gpt-image-2x9P品论天涯网

但真正的故事，并不在数据里。x9P品论天涯网

被Google压了半年x9P品论天涯网

OpenAI总算扳回一局x9P品论天涯网

时间倒回2025年8月。x9P品论天涯网

Google放出了NanoBanana。这个在Gemini里嵌入的图像生成模型，在C端瞬间引爆。x9P品论天涯网

三个月后的Q3财报会上，GoogleCEOSundarPichai亲口披露了一组数字：Gemini月活，从7月的4.5亿涨到10月的6.5亿。x9P品论天涯网

GoogleLabs负责人JoshWoodward称，这一增长很大程度上来自NanoBanana带动的图像生成热潮。x9P品论天涯网

11月，Google再发NanoBananaPro。文本渲染能力惊艳，AI图像第一次能把字写对，OpenAI在C端被反超。x9P品论天涯网

11月18日，Google再补一刀。Gemini3发布即登顶LMArena，1501分，首个突破1500的前沿模型。x9P品论天涯网

这一月底，奥特曼对全公司发了一份“红色警戒”（codered）的内部备忘录。x9P品论天涯网

据TheInformation报道，奥特曼私下告诉员工，Gemini3可能给OpenAI带来经济逆风。YahooFinance后续披露：codered之下，OpenAI暂停了AIAgent等其他产品的研发，资源全部倾斜到ChatGPT。x9P品论天涯网

12月，OpenAI仓促拿出GPTImage1.5。Arena第一，但C端没能引爆。x9P品论天涯网

2026年2月，Google再补一刀，NanoBanana2登场，Arena再度领先。x9P品论天涯网

OpenAI又输了一次。x9P品论天涯网

一直到4月21日，GPTImage2上线，OpenAI这才实现反超，重新扳回一局。x9P品论天涯网

画图AI将被重新定义x9P品论天涯网

GPTImage2凭什么能领先241分？x9P品论天涯网

核心答案藏在架构层面。x9P品论天涯网

GPTImage2不是StableDiffusion那一代的扩散模型。x9P品论天涯网

OpenAI研究负责人BoyuanChen称这是“revampedfromscratch”（从零重构）的“generalistmodel”（通用模型），OpenAI的内部叫法是“图像版的GPT”。x9P品论天涯网

但Chen在pressbriefing时拒绝公开承认它具体是扩散还是自回归架构。x9P品论天涯网

外界普遍把它理解为“带推理规划的图像生成系统”：画之前先规划，再下笔。这正是GPTImage2和上一代图像模型最大的不同。x9P品论天涯网

OpenAI在官方说明里给了它一个新标签：首个具备原生思考能力的图像模型（imagemodelwithnativethinkingcapabilities）。x9P品论天涯网

画之前先想、画完自己检查、需要时联网搜索资料、一次能产出8张前后连贯的图。x9P品论天涯网

这不是画笔，是会思考的视觉助理。x9P品论天涯网

Arena榜单分项数据显示：x9P品论天涯网

文字渲染（TextRendering）单项，GPTImage2比前代涨了316分；卡通动漫和人像各涨296分；3个产品/3D/写实分类，整体在+247到+277分区间。x9P品论天涯网

文字渲染是2025年11月NanoBananaPro首次解决的问题，但当时准确率94%。GPTImage2把它推到了99%。x9P品论天涯网

x9P品论天涯网

OpenAI发布会现场演示：让GPTImage2画一碗米饭，其中只有一粒米上写有模型名字。x9P品论天涯网

具体到能力展示，OpenAI总裁GregBrockman在自己的X账号上做了示范。x9P品论天涯网

第一个案例，老照片修复。x9P品论天涯网

x9P品论天涯网

褪色发黄的家庭老照片，一个提示词，立刻变身高清彩色版。x9P品论天涯网

OpenAI官方API文档里那句“high-fidelityimageinputs”（高保真图像输入），说的就是模型对原图细节的保留能力：输入端能精确读取褪色的、破损的、模糊的老照片细节，输出端才能重新渲染出清晰版。x9P品论天涯网

第二个案例中，Brockman转发了用户@doodlestein的一组测试图：用同一个复杂提示词让GPTImage2画一张数学解释图。x9P品论天涯网

他评价说，即便是复杂提示词，GPTImage2也能生成风格各异的图。x9P品论天涯网

x9P品论天涯网

@doodlestein测试GPTImage2用同一个提示词画一张线性代数解释图。模型一口气画出4个完全不同的版本：同样是MonaLisa+特征向量教学，每个版本的构图、配色、信息密度完全不同。x9P品论天涯网

这个案例真正价值不在“能画数学图”，而是解决了过去两年中AI生图的一个重要的痛点：输出单一、变体可控性差。x9P品论天涯网

GPTImage2第一次让“一个prompt给我4个完全不同的方向”变成了产品级能力。x9P品论天涯网

业内一位LMArena资深测试者点评道：x9P品论天涯网

GPTImage2和NanoBananaPro之间的差距，跟NanoBananaPro和DALL-E之间的差距一样大。x9P品论天涯网

跨了整整一代。x9P品论天涯网

x9P品论天涯网

GPTImage2Thinking模式生成的manga风格漫画页：从一个简单提示词出发，模型保持角色一致性、铺出多格剧情。x9P品论天涯网

DALL-E退役x9P品论天涯网

AdobeCanva被逼到墙角x9P品论天涯网

发布当天，下游工具集成的速度比技术圈预期的还快。x9P品论天涯网

Figma、Canva、AdobeFirefly、fal、HermesAgent，全部在4月21日当天完成集成。x9P品论天涯网

API定价更是暗藏杀机：x9P品论天涯网

高质量出图$0.21一张；ChatGPTPlus$20一个月，图像生成已经包含在套餐里。x9P品论天涯网

这个差价背后，可能带来2026年图像生成行业最大的产业重构。x9P品论天涯网

x9P品论天涯网

GPTImage2生成的photorealisticcandid（写实抓拍）。海岸、阴天、复古车、胶片质感——这种过去要专业摄影师外拍+后期才能达到的视觉效果，现在API$0.21一张。OpenAI研究员GabrielGoh说，photorealism是他对这个模型最兴奋的能力。x9P品论天涯网

5月12日，DALL-E2和DALL-E3正式退役。x9P品论天涯网

它们是2022年开启了整个AIGC视觉革命的开山祖师。三年后，被OpenAI自家的继承者，亲手送入历史。x9P品论天涯网

OpenAI在官方发布说明里提到：x9P品论天涯网

图像不是装饰，是语言。一张好图做的事和一个好句子一样：选择、排列、揭示。x9P品论天涯网

这代表了一种产品哲学的转向。x9P品论天涯网

当然，也不是没有反方声音。ZDNet在实测中发现，GPTImage2无法准确复刻品牌logo，连ZDNet自己的logo都被画歪了。x9P品论天涯网

NanoBanana2在portraitrealism和multi-reference一致性上仍有优势。x9P品论天涯网

GPTImage2虽然还不够完美，但赛道格局已经出现了变化。x9P品论天涯网

渲染时代结束了x9P品论天涯网

推理时代刚开始x9P品论天涯网

Google把推理塞进图像模型里。OpenAI把图像工具塞进推理模型里。242分Elo差距测的就是二者架构上的差异。x9P品论天涯网

implicator.ai的这句评价，划分了图像生成的两个时代。x9P品论天涯网

2022到2025年，是渲染时代。x9P品论天涯网

DALL-E、Midjourney、StableDiffusion，目标都是“画得像”。模型是画笔，用户是画师，prompt是画稿。x9P品论天涯网

GPTImage2代表的是一个推理时代。x9P品论天涯网

模型先思考再下笔，能搜索、能自检、能完成任务。它不是画笔，是会画画的助手。x9P品论天涯网

GPTImage2发布真正值得重视的，是图像生成走向“会思考”这件事本身。x9P品论天涯网

短期看，BlackForestLabs（Flux2）麻烦可能最大。x9P品论天涯网

KingyAI直言：作为diffusion-first（扩散为先）的厂商，Flux2的整条技术流水线在架构上和“token-by-token”的推理路线是冲突的。x9P品论天涯网

要么融合，要么重写，没有第三条路。x9P品论天涯网

中期看，Google可能会在下个季度反击。NanoBanana3，或者Imagen-Reason，时间不会太久。x9P品论天涯网

长期看，这件事的影响远不止图像生成。x9P品论天涯网

当AI开始用“思考”来产出图像、视频、音频、代码，整个生成式AI的范式都会跟着发生变化。x9P品论天涯网

去年12月，奥特曼在备忘录里敲下“codered”的时候，应该没想到五个月后会以这种方式回到Arena榜首。x9P品论天涯网

但这次反杀的真正意义，可能不是OpenAI赢了Google，而是OpenAI改写了图像生成赛道的规则。x9P品论天涯网

x9P品论天涯网

Arena.AI单图编辑榜（ImageEditArena）：GPTImage2(medium)仍以1510+分继续登顶，第二、三、四、五名全部被OpenAI自家模型和GoogleGemini系列占据。https://arena.ai/leaderboard/image-editx9P品论天涯网

Google下一拳什么时候出？这个问题决定了2026下半年AI格局的走向。x9P品论天涯网

而在那一拳挥出来之前，GPTImage2会在Arena榜首坐多久，没人知道。x9P品论天涯网

参考资料：x9P品论天涯网

https://x.com/gdb/status/2048449695622586576x9P品论天涯网

https://arena.ai/leaderboard/image-editx9P品论天涯网

奥特曼“红色警戒”5个月后GPT Image 2屠榜 断层领先反杀Google

奥特曼“红色警戒”5个月后GPT Image 2屠榜断层领先反杀Google