OpenAI近日宣布,其迄今为止最先进的代理式编程模型GPT-5.2-Codex正式通过API向开发者开放接入。这一模型此前已经在OpenAI自家的Codex开发环境中率先上线,如今借由ResponsesAPI面向更广泛的开发者群体,主打复杂、长周期的软件开发任务场景。
GPT-5.2-Codex基于上一代GPT-5.2模型系列构建,而后者在多项通用AI基准测试中刷新了最新成绩,用于支撑ChatGPT普通用户使用以及开发者API需求。
在编程领域,OpenAI一直延续“通用大模型+专用编程模型”的双线推进策略,先后推出多款Codex方向的专项模型。去年,OpenAI发布了针对代理式编程任务优化的GPT-5.1-Codex,以及面向长时间运行和高复杂度任务的GPT-5.1-Codex-Max,将自动完成大型重构、特性开发等工作作为主要卖点。如今的GPT-5.2-Codex则是在此基础上的又一次跃升,被官方定位为最新一代“前沿级”代理式编程模型。
据介绍,GPT-5.2-Codex针对代理式工作流进行了多项技术强化,包括通过上下文压缩提升长程任务性能、加强对超大规模代码库的理解与操作能力,并着重提升整体可靠性。在真实开发环境中,模型被设计用于承担如构建新功能、重构现有代码、排查并修复缺陷等长时间链路任务。OpenAI表示,在安全能力上,GPT-5.2-Codex也是目前自家“网络安全能力最强”的编程模型之一,用于帮助开发者发现和理解代码库中的潜在问题。
目前,GPT-5.2-Codex已经集成进包括Cursor、Windsurf、Factory、GitHub等在内的多款流行开发工具和IDE中,让开发者可以在熟悉的环境内直接调用这一新模型。在标准化评测方面,该模型在SWE-BenchPro和Terminal-Bench2.0等权威编程基准测试上取得了目前处于领先水平的成绩,进一步强化了其“面向生产级大型工程”的定位。
第三方开发工具Cursor的团队在社交平台X上表示,GPT-5.2-Codex是他们眼中的“长时任务前沿模型”,并披露了一次极端压力测试案例。在这次测试中,团队让模型在Cursor环境中连续运行了一整周,最终从零构建出一个完整的Web浏览器,累计生成超过三百万行代码,分布在数千个文件中。该浏览器包含了一个完全从头编写的Rust渲染引擎,涵盖HTML解析、CSS层叠与布局、文本排版、绘制流程以及定制的JavaScript虚拟机,展示出模型在复杂系统工程项目上的持续推进能力。
随着GPT-5.2-Codex的API全面开放,OpenAI进一步加快了在“AI代理写代码”赛道上的布局,同时也给其他厂商带来更大压力。报道指出,2026年刚刚开年,业界已经可以预见,在年底之前,OpenAI、Anthropic、Google等公司还将推出更强大的新一代编程模型。这些模型在能力和成本上都有可能对现有软件开发流程产生结构性冲击,在不少现代项目中,逐步替代相当比例的初级乃至中级软件工程岗位,将不再只是理论上的远景。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】