面对“东方AI力量”的压力,美国OpenAI公司周五正式上线竞品推理模型o3-mini,并
(来源:OpenAI)
公司宣称,o3具备更先进、近似人类的推理能力,在解决编程、数学、科学等理工科问题方面均超越现役的o1模型。公司曾表示,o3-mini会在1月底先上架,o3则“会在不久之后推出”。
OpenAI介绍称,
在周五的新闻稿中,OpenAI披露,在2024年美国数学邀请赛(AIME2024)的测试中,
在博士级科学问题(GPQADiamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。
横向对比,DeepSeek-R1模型在AIME2024测试中的准确率为79.8%,而在GPQADiamond测试中的准确率为71.5%。
当然,
OpenAI宣布,从周五开始,免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3-mini模型,这也是
对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPTPlus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPTPro用户,能无限制地访问o3-mini。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】