Anthropic公司于本周一发布了其最新前沿人工智能模型——ClaudeSonnet4.5。该公司称,ClaudeSonnet4.5在编码基准测试上表现卓越,能够支持开发“可投入生产的应用程序”,而不仅限于原型开发,其可靠性较此前的人工智能模型实现了重大突破。
据介绍,ClaudeSonnet4.5将通过ClaudeAPI及Claude聊天机器人开放使用,开发者付费标准与ClaudeSonnet4保持一致:每百万输入词元(约75万字,超过《魔戒》全书长度)收费3美元,每百万输出词元收费15美元。
近一年间,Anthropic的AI模型因在软件工程任务中的优异表现,逐渐成为开发者及企业青睐的选择。报道称,苹果及Meta公司已在内部使用ClaudeAI模型,Anthropic也积极开展API授权业务,用于支持诸如Cursor、Windsurf与Replit等AI编程应用。但最近,OpenAI发布的GPT-5已在多项编码测试中超越Claude系列模型,激烈竞争令行业格局持续变动。
Anthropic表示,ClaudeSonnet4.5在多项目编码基准(包括SWE-BenchVerified)上拥有行业领先表现。然而,Anthropic的AI研究员DavidHershey在采访中表示,ClaudeSonnet4.5的实际能力无法单凭基准测试全面衡量。据介绍,在企业客户的早期测试中,ClaudeSonnet4.5曾自主编码长达30小时,不仅成功构建应用程序,还能建立数据库服务、购买域名,甚至完成SOC2安全审计,确保产品安全合规。
Cursor首席执行官MichaelTruell表示,ClaudeSonnet4.5在长期编码任务上展现出业界最前沿的性能。Windsurf首席执行官JeffWang也认为,ClaudeSonnet4.5代表了“新一代编码模型”。
据Anthropic介绍,ClaudeSonnet4.5还是其当前最具“对齐性”的前沿AI模型,谄媚与欺骗行为发生率低于以往,且已增强对提示注入攻击的防护能力。
与ClaudeSonnet4.5一同发布的还有ClaudeAgentSDK,Anthropic介绍称,这是支撑ClaudeCode的同一基础设施,可供开发者自定义打造AI代理。此外,公司还推出了仅对Max订阅者开放的临时研究预览功能“ImaginewithClaude”,展示AI模型按需实时生成软件代码的能力,无需预设功能或预写代码。
AI领域竞争加剧,使得各公司旗舰模型迭代频率异常密集。ClaudeSonnet4.5距离Anthropic上一次发布的AI模型ClaudeOpus4.1仅不到两个月时间。如此快的更新周期,也让任何企业都难以长期维持领先地位。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】