号称“地球上最聪明人工智能”的Grok3也翻车了,答不对9.11和9.9谁大,不少网友也是看笑了。一些媒体测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”
遗憾的是,号称目前最聪明的Grok3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。
不过对此马斯克并不以为然,其公开回应称,当前的Grok3仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反馈使用问题。
在媒体看来,尽管在官方PPT中,Grok3在大模型竞技场ChatbotArena中看似“遥遥领先”,但实际上其与DeepSeekR1和GPT4.0的差距仅为1%到2%。
在发布会上,马斯克宣称Grok3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】