人工智能

遥遥领先GPT-4!谷歌最强AI大模型Gemini 1.0发布

字号+作者: 来源:快科技 2023-12-07 07:32 评论(创建话题) 收藏成功收藏本文

快科技12月7日消息,在5月举行的开发者大会上,谷歌首次透露其正在开发的AI大模型Gemini,时隔7个月,Gemini终于来了。据谷歌官方公众号消息,谷歌日前正式发布G'...

快科技12月7日消息,在5月举行的开发者大会上,谷歌首次透露其正在开发的AI大模型Gemini,时隔7个月,Gemini终于来了。b77品论天涯网

据谷歌官方公众号消息,谷歌日前正式发布Gemini 1.0,这是谷歌迄今为止构建的最强大、最通用、最灵活的模型。b77品论天涯网

b77品论天涯网

据介绍,针对不同场景,谷歌发布了三种不同版本:b77品论天涯网

Gemini Ultra:谷歌规模最大且功能最强大的模型,适用于高度复杂的任务。b77品论天涯网

Gemini Pro:适用于各种任务的最佳模型。b77品论天涯网

Gemini Nano:手机等设备最高效的模型。b77品论天涯网

谷歌还将Gemini与OpenAI的GPT-4进行了比较,除HellaSwag数据集外,Gemini其它基准测试全面领先GPT-4。b77品论天涯网

b77品论天涯网

官方表示,从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的32项学术基准中,Gemini Ultra的性能有30项都超过了目前最先进的水平。b77品论天涯网

Gemini Ultra以90.0%得分成为第一个在MMLU(大规模多任务语言理解)测试中超过人类专家的模型,MMLU综合使用了数学、物理、历史、法律、医学和伦理等57个科目,用于测试世界知识和解决问题的能力。b77品论天涯网

在新的MMMU基准测试中,Gemini Ultra也取得了59.4%的成绩,该基准测试由横跨不同领域、需要仔细推理的多模态任务组成。b77品论天涯网

b77品论天涯网

据悉,Gemini 1.0具有复杂多模态推理能力,可帮助理解复杂的书面和视觉信息,在海量数据中发掘难以辨别的知识内容。b77品论天涯网

谷歌称,Gemini 1.0经过训练,可以同时识别并理解文本、图像、音频等,因此它能更好地理解具有细微差别的信息,回答与复杂主题相关的问题,尤其擅长解释数学和物理等复杂科目中的推理。b77品论天涯网

b77品论天涯网

b77品论天涯网

编码能力上,第一代Gemini可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C 和Go)的高质量代码。b77品论天涯网

b77品论天涯网

据谷歌介绍,Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等,将在170多个国家和地区提供英语服务,并计划在未来扩展不同的模态,并支持新的语言和地区。b77品论天涯网

另外,谷歌还将在谷歌Pixel上使用Gemin,Pixel 8 Pro是首款搭载Gemini Nano的智能手机,将支持录音应用中的总结”等新功能,并在Gboard中推出智能回复”功能。b77品论天涯网

未来几个月,Gemini将应用于谷歌搜索、广告、Chrome和Duet AI。b77品论天涯网

从12月13日开始,开发者和企业客户可通过Google AI Studio或Google Cloud Vertex AI中的Gemini API获取Gemini Pro。b77品论天涯网

对于Gemini,谷歌表示,这是AI发展过程中的一座重要里程碑,也标志着谷歌迈进新纪元的开始。b77品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章