人工智能

别怪AI胡说八道 是评测标准出了大问题

字号+作者:网易科技 来源:网易科技 2025-10-30 14:36 评论(创建话题) 收藏成功收藏本文

当你发现聊天机器人ChatGPT在一本正经地胡说八道时,别急着嘲笑它——这正是我们人类自己埋下的祸根。最新研究揭示了令人震惊的真相:人工智能(AI)产生幻觉'...

当你发现聊天机器人ChatGPT在一本正经地胡说八道时,别急着嘲笑它——这正是我们人类自己埋下的祸根。最新研究揭示了令人震惊的真相:人工智能(AI)产生幻觉不是技术故障,而是系统性的训练缺陷。当前主流的AI评测标准存在致命缺陷:猜对得1分,沉默或猜错都得0分。KbL品论天涯网

在这种规则下,不懂装懂的AI永远比诚实说“不知道”的AI得分更高。这就好比考试时,蒙答案的学生永远比交白卷的学生成绩好。在这样的环境下,AI学会了“宁可胡说,不可不说”。KbL品论天涯网


KbL品论天涯网

研究人员用数学证明了AI不可能完美:它的胡说八道率至少是判断错误率的两倍。就像你知道49个同学的生日,对猜第50个毫无帮助——有些问题就是无解。KbL品论天涯网

更讽刺的是,修复这个问题可能会毁掉整个行业。目前只有5%的用户愿意为ChatGPT付费,如果它整天说“我不知道”,用户会立刻转向那些更“自信”的竞争对手。在AI公司烧钱竞赛的当下,用户留存是生命线,没有公司敢率先打破这个默契。KbL品论天涯网

研究者呼吁改革评测标准,让AI学会说“我不知道”。但这个看似简单的改变却面临重重阻碍。最终我们面临一个悖论:如果AI永远不承认无知,它就会持续胡说八道;如果它太过诚实,又会失去实用价值。在这个两难选择中,我们需要的不是更聪明的AI,而是更明智的训练方式。KbL品论天涯网

毕竟,真正的智能不仅在于知道多少,更在于清楚自己不知道什么。KbL品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]