人工智能

OpenAI王炸新一波:向第三方开发者开放最强推理模型o1 更低价GPT-4o进入API

字号+作者:硬AI 来源:硬AI 2024-12-18 08:42 评论(创建话题) 收藏成功收藏本文

OpenAI通过API向在OpenAI消费至少1000美元的开发者推出正式版o1,替代API中已有的o1预览版,o1拥有视觉输入推理能力等新功能,使用的推理token比预览版平均'...

OpenAI通过API向在OpenAI消费至少1000美元的开发者推出正式版o1,替代API中已有的o1预览版,o1拥有视觉输入推理能力等新功能,使用的推理token比预览版平均少60%,但收费较高,每分析约75万个单词收费15美元,相当于GPT-4o收费的三到四倍;OpenAI同时更新RealtimeAPI,新API支持WebRTC,纳入收费更低的新版GPT-4o和4omini模型,GPT-4o音频定价降低了60%。xyY品论天涯网

在为期12个工作日的线上新品和新技术发布活动中,OpenAI的王炸又来了一波:将OpenAI的最强推理模型o1向开发者开放,用于开发语音类App的API中纳入了收费更低的先进模型GPT-4o版本。xyY品论天涯网

美东时间12月17日周二进行的第九日线上分享中,OpenAI宣布,从周二开始,通过应用程序编程接口(API)向第三方开发者推出o1。但OpenAI并非向所有开发者敞开使用o1,而是以“第五层”使用类别的形式提供,要获得第五层的使用资格,开发者必须在OpenAI的产品上花费至少1000美元,并且拥有的账户自首次成功付款以来已使用超过30天。xyY品论天涯网

虽然OpenAI只是向部分开发者推出了o1,但此举已经标志着开发者在AI领域的最新进步,他们将有机会打造新的高级AI应用程序App,或者将最先进的OpenAI技术集成到他们现有的App和工作流程中,无论是面向企业还是面向消费者。xyY品论天涯网

今年9月,OpenAI发布了o1的预览版o1preview,称o1是第一个具备真正通用推理能力的大模型,它的核心能力推理在测试化学、物理和生物学专业知识的基准GPQA-diamond上得到了充分体现。xyY品论天涯网

据OpenAI的评估,o1在该测试中全面超过了人类博士专家,准确率达到78.3%,而人类专家的得分为69.7%。OpenAI称,“通用人工智能(AGI)之路,已经没有任何阻碍”。此外,o1在多个高难度的推理基准测试中表现优异,例如在美国数学邀请赛(AIME)中,o1的正确率达到了83.3%,远超其前身GPT-4o的表现。xyY品论天涯网

本月5日,OpenAI在预告的连续12日王炸发布活动首日就推出了正式版的o1,所谓满血o1,它被纳入ChatGPTPlus套餐。正式版o1支持多模态输入,具备视觉推理能力。相比o1preview版本,正式版o1的平均响应速度快了60%,OpenAI还发现正式版o1在推理时犯重大错误的频率比o1preview减少34%。xyY品论天涯网

在包括编码、数学和视觉推理任务在内的一系列基准测试中,正式版o1都相比预览版取得了明显进步。例如在SWE-benchVerified基准的编码测试中,o1的评分从o1preview的41.3提高到48.9,而以数学为重点的AIME测试中的评分甚至从42跃升至79.2。xyY品论天涯网


xyY品论天涯网

O1的新功能为开发者提供更多帮助。比如结构性输出StructuredOutputs功能让响应可靠地匹配自定义格式,如JSON模式,从而确保与外部系统交互时的一致性;函数调用Functioncalling功能简化了将o1连接到API和数据库的过程;对视觉输入进行推理的能力Visoncapabilities发掘了制造、科学和编码方面用例的前景。xyY品论天涯网

开发人员还可以使用新的reasoning_effort参数微调o1的行为,该参数控制模型在任务上花费的时间,以此平衡性能和响应时间。xyY品论天涯网

本周二推出的API中,正式版o1替代了API中已有的o1preview版本。因为需要大量计算资源才能运行o1,OpenAI对o1API的收费也较高,o1每分析约75万个单词收取15美元,模型每生成约75万个单词收取60美元,相当于OpenAI最新非推理模型GPT-4o收费的三到四倍。xyY品论天涯网

同时,o1的延迟更低,对于给定的请求,o1使用的推理token比o1-preview平均少60%。xyY品论天涯网

更新RealtimeAPI,纳入收费更低的新版GPT-4o和4omini模型,支持WebRTCxyY品论天涯网

本周二OpenAI还更新了支持语音助手、实时翻译工具等低延迟自然对话体验的RealtimeAPI。RealtimeAPI目前还处于测试阶段,用于打造低延迟的AI生成语音响应的App,此次更新中包括GPT-4o和GPT-4omini模型各自的新版本,新版本的数据效率更高、可靠性提高,用起来也更便宜。xyY品论天涯网

更新后RealtimeAPI拥有一些新功能,比如并发带外响应,它可以让内容审核等后台任务在不中断交互的情况下运行。该API现在还支持WebRTC,它是为基于浏览器的客户端、智能手机和物联网设备构建实时语音应用程序的开放标准。xyY品论天涯网

在RealtimeAPI中结合WebRTC意味着,API可以直接支持音频流、噪声抑制和拥塞控制,从而简化打造基于语音的App。开发者现在可以以最少的设置集成实时功能,即使在多变的网络条件下也是如此。借助WebRTC,开发者现在只需几行Javascript代码即可添加Realtime功能。xyY品论天涯网


xyY品论天涯网

OpenAI同时降低了RealtimeAPI的收费,将GPT-4o音频的定价降低了60%,降至每100万个输入token收费40美元,每100万个输出token收费80美元。xyY品论天涯网

缓存音频输入定价降低了87.5%,现在定价为每100万个输入token收费2.50美元。OpenAI将要添加的更小模型GPT-4omini定价更便宜,每100万个输入token收费10美元,每100万个输出token收费20美元。xyY品论天涯网

GPT-4omini的文本token费率也大幅下调,输入token起步价0.60美元,输出token起步价2.40美元。xyY品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]