人工智能

OpenAI的新AI机器人gpt-4o-latest在LMSYS跑分中重新夺回第一名

字号+作者: 来源:cnBeta 2024-08-14 14:13 评论(创建话题) 收藏成功收藏本文

上周,OpenAI发布了其最新的前沿模型,正式命名为gpt-4o-2024-08-06,该新模型在API中支持结构化输出。昨天,OpenAI出人意料地宣布了另一个名为chatgpt-4o-'...

上周,OpenAI发布了其最新的前沿模型,正式命名为gpt-4o-2024-08-06,该新模型在API中支持结构化输出。昨天,OpenAI出人意料地宣布了另一个名为chatgpt-4o-latest的新前沿模型。虽然OpenAI仍建议开发人员将gpt-4o-2024-08-06用于大多数API使用,但chatgpt-4o-latest模型将允许开发人员测试OpenAI在聊天用例方面的最新改进。FBH品论天涯网

FBH品论天涯网

根据OpenAI的官方文档页面,chatgpt-4o-latest将是一个动态模型,将不断更新到ChatGPT中GPT-4o的最新版本。新的chatgpt-4o-latest模型支持128000个标记和16384个输出标记的上下文。该模型仅用于研究和评估。FBH品论天涯网

上周,Google在LMSYS聊天机器人跑分系统中上架了一款新的实验性Gemini1.5Pro模型,以1297分的成绩夺得第一名。这是自聊天机器人竞技场发布以来,Google首次登顶。凭借最新的聊天gpt-4o模型,OpenAI以1314分的创纪录成绩重新夺回竞技场第一的位置。根据得分,新的ChatGPT-4o在编程、指令执行和硬提示方面都有显著提升。FBH品论天涯网

LMSYS聊天机器人竞技场中新的ChatGPT-4o类别排名:FBH品论天涯网

综合:第一名FBH品论天涯网

数学:第1-2名FBH品论天涯网

编程:第一名FBH品论天涯网

硬提示:第一名FBH品论天涯网

指令遵循:第一名FBH品论天涯网

较长的查询:第一名FBH品论天涯网

多轮:第一名FBH品论天涯网

这款最新的聊天gpt-4o模型自上周以来一直在为OpenAI的ChatGPT提供支持。如果您注意到ChatGPT的响应在过去一周有所改进,可以肯定地说,这是因为有了新的模型。FBH品论天涯网

OpenAI最近宣布了2024年开发者大会(DevDay2024)的消息,该大会将在全球三个城市举行。在宣布消息时,OpenAI明确表示不会在这些活动中透露他们今年早些时候开始训练的下一个重大前沿模型。相反,这些开发者活动将专注于API和开发工具的改进。FBH品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]