OpenAI宣布为其AI编程代理Codex推出多项重要更新,重点增强在Mac平台上的自动化操作、图像生成以及个性化记忆能力。Codex现在可以通过自身的光标直接操控桌面级Mac应用,能够“看到”屏幕内容,并完成点击、输入等操作,以执行各类任务。
更新后,Codex可以在同一台Mac上并行运行多个代理实例,而且不会干扰用户的日常使用。OpenAI表示,这一能力将有助于开发者进行应用测试、前端界面迭代等工作。Codex还加入了更强的记忆功能,能够记住每位用户的偏好、常用工作流、技术栈等信息,从而更贴合个人的日常开发流程。
在自动化方面,Codex现在可以基于现有对话线程在中断后恢复工作,并能为自己安排未来的工作任务,在数天甚至数周的时间跨度内持续推进同一项目。它还会结合项目上下文、记忆内容以及连接的插件,主动提出可执行的工作建议。
此次更新还为Codex引入了一款内置浏览器,用户可以直接在网页上进行批注,以向代理提供更精确的指令。未来,Codex还将获得对该浏览器的完整控制能力,包括打开网站、按用户流程操作页面、截取屏幕截图以及检查输出结果等。
在生成式能力方面,Codex已升级为使用gpt-image-1.5模型,在应用内生成图像。OpenAI称,这将有助于为产品概念和界面原型快速创建可视化素材。同时,Codex现在支持多个终端标签页,能够处理GitHub代码审查评论,并可在侧边栏中直接打开文件,为PDF、电子表格等文档提供丰富预览。
配合这些功能更新,Codex还新增了90多个插件,用于组合多种技能、应用集成以及MCP服务器,以提升其对上下文信息的获取和实际操作能力。
OpenAI表示,这些更新将从即日起向使用ChatGPT账号登录的Codex桌面版用户陆续推送。不过,个性化相关功能目前尚未向企业版、教育版以及欧盟和英国用户开放,预计将在稍后时间推出。同时,电脑操控功能在欧盟和英国地区暂时也无法使用。
下载地址:
https://persistent.oaistatic.com/codex-app-prod/Codex.dmg

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】