人工智能

文心一言通义千问们互评高考作文 友商们快打起来了

字号+作者: 来源:AI蓝媒汇 2024-06-07 13:51 评论(创建话题) 收藏成功收藏本文

又是一年高考时,随着第一科语文考试结束,全国高考作文题目再度成为全网热议。一年前的今天,大模型风口渐起,除了照例有各路大V、达人在朋友圈、微博等社交'...

又是一年高考时,随着第一科语文考试结束,全国高考作文题目再度成为全网热议。一年前的今天,大模型风口渐起,除了照例有各路大V、达人在朋友圈、微博等社交平台展开作文大赛之外,ChatGPT、文心一言、讯飞星火三款头部大模型也被“请来”作答高考作文。2lw品论天涯网

而在2024年,百花齐放的国产大模型已在性能和体验上不输GPT-4,使用更多中文语料的训练也让这些本土玩家普遍“更懂中文”。2lw品论天涯网

于是,AI蓝媒汇以新课标I卷作文题为例,分别测评了BAT三家传统大厂,以及科大讯飞、月之暗面、百川智能三位热门选手的共计六款主流大模型,还引入了大模型互评环节。2lw品论天涯网

谁考得最好,谁没发挥好,拭目以待。2lw品论天涯网

·新课标I卷作文题目:2lw品论天涯网

阅读下面的材料,根据要求写作。(60分)2lw品论天涯网

随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?2lw品论天涯网

以上材料引发了你怎样的联想和思考?请写一篇文章。2lw品论天涯网

要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。2lw品论天涯网

·百度文心一言4.0:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:55.82lw品论天涯网

·阿里云通义千问2.5:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:56.82lw品论天涯网

附:文心一言给出满分的原因2lw品论天涯网


2lw品论天涯网

·腾讯元宝:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:58.22lw品论天涯网

附:文心一言给出满分的原因2lw品论天涯网


2lw品论天涯网

·科大讯飞讯飞星火:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:57.22lw品论天涯网

·月之暗面Kimi:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:55.22lw品论天涯网

附:讯飞星火给出低分的原因2lw品论天涯网


2lw品论天涯网

·百川智能百小应:2lw品论天涯网


2lw品论天涯网

其余五款大模型打分如下:2lw品论天涯网


2lw品论天涯网

综合得分:562lw品论天涯网

从测试以及评分结果来看,在所有六款大模型之中,文心一言综合打分最高,给友商文章平均打出了58的高分。其中还有两次给了满分。2lw品论天涯网

而讯飞星火打分最低,给友商文章平均只给出了53.2的分数。2lw品论天涯网

那么,这些作文,你给多少分?2lw品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]