人工智能

测试发现马斯克的新AI模型不如OpenAI

字号+作者:凤凰网科技 来源:凤凰网科技 2025-02-19 15:22 评论(创建话题) 收藏成功收藏本文

埃隆·马斯克(ElonMusk)在周一发布了旗下xAI公司的最新大模型Grok3,号称“地表最强AI”。然而,据《商业内幕》报道,初步测试显示,尽管Grok3性能出众,但是在'...

埃隆·马斯克(ElonMusk)在周一发布了旗下xAI公司的最新大模型Grok3,号称“地表最强AI”。然而,据《商业内幕》报道,初步测试显示,尽管Grok3性能出众,但是在一些重要指标上依旧落后于OpenAI的模型。k8W品论天涯网

k8W品论天涯网

马斯克声称,新Grok3模型在数学、科学和编程关键指标测试上超越了OpenAI的旗舰模型GPT-4o,以及来自谷歌、DeepSeek和Anthropic的AI竞品。k8W品论天涯网

一些AI研究人员和专家对Grok3进行了初步测试,但是结果喜忧参半。计算机科学家安德烈·卡帕西(AndrejKarpathy)是OpenAI的联合创始人,曾领导特斯拉的AI业务,他提前体验Grok3。k8W品论天涯网

还差点火候k8W品论天涯网

卡帕西周一在X上发帖称,Grok3成功完成了从训练论文中查找复杂信息等任务,推理能力是“最先进的”,并强调了它解决复杂编码问题的能力。然而,与OpenAI的o1-pro模型一样,它在解决“棘手”的井字棋棋盘时遇到了困难。“我的总体印象是,这个模型的能力大约与o1-pro相当,领先DeepSeek-R1。当然我们还需要进行实际、真实的评估来进一步判断。”卡帕西称。k8W品论天涯网

对于Grok3新推出的深度搜索工具,卡帕西表示,它的深度搜索能力“大致相当于Perplexity公司的深度搜索功能,虽然很棒,但还没有达到OpenAI最近发布的深度搜索功能,后者依旧感觉更全面和可靠”。k8W品论天涯网

宾夕法尼亚大学沃顿商学院专门研究AI的教授伊桑·莫利克(EthanMollick)表示,尽管xAI的技术进步迅速,但Grok3并不是明显的领跑者。“这是一个非常稳定可靠的前沿模型,但无法让你停止使用当前的前沿模型。”莫利克在领英上发帖称。k8W品论天涯网

莫利克指出,尽管Grok3在某些基准测试上超过了一些OpenAI模型,但它并没有明显超越OpenAI的o3。他表示,虽然Grok3是一个稳定可靠的模型,但OpenAI在行业合作和企业采用方面仍然保持着强大优势。“我不确定Grok是否有很大机会成功。”他写道。k8W品论天涯网

几何智能(GeometricIntelligence)创始人、长期批评AI炒作的加里·马库斯(GaryMarcus)对于Grok3的质疑声更大。“马斯克承诺Grok3将是史上最聪明的AI。剧透一下:它并不是。”马库斯在自媒体平台Substack上称。k8W品论天涯网

马库斯表示,Grok3发布会是在“照搬”之前的技术演示。尽管Grok3在技术上有所进步,但与OpenAI模型相比,其表现并没有带来“颠覆性变化”。k8W品论天涯网

他认为,OpenAI目前不需要担心Grok3。“奥特曼可以暂时松一口气。Grok3没有取得什么重大突破。”马库斯表示。他还补充说,OpenAI在算力获取和研究规模方面的主导地位仍然是该公司的一个重要护城河。(作者/箫雨)k8W品论天涯网

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。k8W品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

26
扫二维码添加收藏返回顶部