人工智能

AI大模型搜索之战开启,胜出黑马竟是ta?

字号+作者: 来源:新智元公众号 2024-04-09 13:40 评论(创建话题) 收藏成功收藏本文

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。【新智元导读】距离AI「杀死」搜索引擎,到底还差几步?几天前,ChatGPT突然'...

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。eVJ品论天涯网

【新智元导读】距离AI「杀死」搜索引擎,到底还差几步?eVJ品论天涯网

几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。eVJ品论天涯网

就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样,如今LLM的迅猛发展似乎也标志着互联网即将进入Gen AI时代。eVJ品论天涯网

图片eVJ品论天涯网

ChatGPT、Gemini、Copilot等AI工具,让我们在线查询和消费的信息的方式,正在发生翻天覆地的变化。eVJ品论天涯网

Perplexity和You.com,已经将自己定位为下一代搜索产品。连谷歌和必应,都押注AI是搜索的未来。eVJ品论天涯网

那么问题来了,AI大模型真的能取代搜索引擎吗?eVJ品论天涯网

理论上,当然存在这种可能。但前提是能够做到以下两点:eVJ品论天涯网

1. 对于用户的问题,能否找到相关、可信的来源,从而给出准确的答复。eVJ品论天涯网

2. 对于用户有时效性的问题,能否找到最新的来源。eVJ品论天涯网

现在国内的各个大模型产品,能完成这两项任务吗?eVJ品论天涯网

话不多说,让我们把这些AI拉出来遛遛,在各种搜索任务上,来一番实测PK。eVJ品论天涯网

LLM VS 搜索引擎eVJ品论天涯网

此次参与搜索竞赛的,不仅有老牌搜索引擎,还有国外很火的模型A,以及国内主流的大模型选手B、C、D。eVJ品论天涯网

赛事第一项,考核的就是时效性。eVJ品论天涯网

我们先来问一个既隐含时间信息,表述又比较模糊的问题:「百度接下来会举办什么发布会么?」eVJ品论天涯网

显然,传统搜索引擎既不能准确定位时间信息,也无法直接理解基于自然语言的提问。eVJ品论天涯网

小试一下就知道,传统搜索会帮你删减一些它认为「不关键」的关键词。eVJ品论天涯网

图片eVJ品论天涯网

而模型A很快就找到了5个新闻地址,但由于无法识别当前的时间信息,结果把百度去年举办的活动搬了出来。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

模型B的答案要更加完善,但同样没搞清楚时间,给出的是往届发布会的信息。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

模型C准确识别出了小编提问的时间是在4月7日。eVJ品论天涯网

然后很轻松地将搜索的时间点卡在7日之后,并具体列出了接下来百度即将召开的三个会议。eVJ品论天涯网

不过,没有参考连接这一点,有些遗憾。eVJ品论天涯网

图片eVJ品论天涯网

相比之下,模型D的答案就比较惊艳了。eVJ品论天涯网

它不仅回答准确,而且最大的亮点是,在联网搜索后给出了参考链接,能够溯源验证信息。eVJ品论天涯网

图片eVJ品论天涯网

内容虽然相对简洁,但精确回答了问题,也引用了完整的参考文献eVJ品论天涯网

PK赛的第二项,就是总结的完整度。eVJ品论天涯网

清明假期的一匹黑马,就是宫崎骏的动漫电影《你想活出怎样的人生》了,刚刚票房已破了8.55亿元。电影到底讲什么了呢?eVJ品论天涯网

传统搜索引擎只会搜什么,给什么,呈现了观影评分、网友评价,却无法对影片进行总结。eVJ品论天涯网

图片eVJ品论天涯网

模型A则从主题内涵和评价分歧两方面进行了分析,似乎更有条理。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

不过,这里的参考链接「2」直接对应的是「知乎登录验证」,也不知道模型A最后是怎么绕过去的?eVJ品论天涯网

图片eVJ品论天涯网

模型B则给出了3篇参考文章,以及更加丰富的回答。eVJ品论天涯网

但遗憾的是,它搞错了主角的名字——原著是叫「小哥白尼」,在电影中则是「牧真人」。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

同样,模型C也把主角在原著和电影里的名字给搞混了。eVJ品论天涯网

图片eVJ品论天涯网

模型D在熟读3篇文章之后,从影片的主旨核心,叙事风格进行了总结。eVJ品论天涯网

图片eVJ品论天涯网

经过小编的验证,所有参考链接也都可进入查询。eVJ品论天涯网

图片eVJ品论天涯网

综合能力如何?eVJ品论天涯网

从上面的PK中不难看出,模型D可以说是几位选手里最有潜力的存在。eVJ品论天涯网

不过,正如文章开篇所提到的,大模型如果想「接替」搜索引擎,就必须能够针对用户的问题找到实时且正确的来源,并给出准确的回答。eVJ品论天涯网

时效性eVJ品论天涯网

首先,在时效性方面,选手D可以精准地搜出事件发生的时间。eVJ品论天涯网

比如,「探索一号」科考船圆满完成首次中国-印度尼西亚爪哇海沟联合深潜科考航次任务的时间是3月28日。eVJ品论天涯网

图片eVJ品论天涯网

相关性eVJ品论天涯网

而在准确性方面,选手D的表现尤为出色。eVJ品论天涯网

它不仅根据非常简短的搜索词「NAKAKITA招聘」,找到对应的官网。eVJ品论天涯网

而且还能准确地判断出问题中的关键「招聘」,并对网站内容进行详细的搜索。然后,进一步给出了正确的结论——官网上没有与招聘相关的内容。eVJ品论天涯网

图片eVJ品论天涯网

当然,除了搜索能力之外,大模型到底好不好用,还需要全方位地考察一下才行——eVJ品论天涯网

文档解析eVJ品论天涯网

话不多说,接下来我们就加大难度。eVJ品论天涯网

首先,上传一个文档,要求画出折线图,显示连板变化,数据在文件中,x轴是日记,在开始画的位置写上股票名称,每次发生变化都要写。eVJ品论天涯网

图片eVJ品论天涯网

原始数据eVJ品论天涯网

如此细节的要求,它都一一做到了,丝毫不差。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

然后,再要求在另一份表格中空白的单元格中都填上1,它也圆满完成了。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

更多功能eVJ品论天涯网

此外,选手D在图片生成、图片描述、文字提取等多模态领域的表现,也十分出色。eVJ品论天涯网

图片eVJ品论天涯网

而最近大热的智能体功能,它甚至可以完美支持PC、App和小程序三个入口。eVJ品论天涯网

到这里,我们就可以揭秘选手D的身份了,它就是——智谱清言。eVJ品论天涯网

来自国内唯一一家全模型产品线对标OpenAI的企业智谱AI。eVJ品论天涯网

大模型取代搜索引擎,可能性多高?eVJ品论天涯网

众所周知,大模型相比于传统搜索引擎有着更强的问题分析、归纳总结、理解和推理能力,让我们不必再去研究需要使用哪些「关键词」才能找到自己想要的内容。eVJ品论天涯网

但卡脖子的地方在于,大模型训练数据的时效性。eVJ品论天涯网

ChatGPT虽然打开了认知,让AI模型更像大模型了,但它还并未用到实时搜索。eVJ品论天涯网

而国内的这些模型,则给了我们更多希望。eVJ品论天涯网

当大模型工具能够整合先进的数据抓取和整理能力时,就能形成全新的搜索引擎链条:eVJ品论天涯网

首先AI会根据提问进行需求分析-网页搜索–答案归纳,然后通过自然语言对话的方式直接回答问题,从而实现与用户更好地交互,而不仅仅提供一系列网站链接。eVJ品论天涯网

所以,现在AI大模型究竟离搜索引擎有多远呢,它们能杀死谷歌吗?eVJ品论天涯网

让我们从细处着眼。eVJ品论天涯网

当我在讨论搜索引擎的时候,我在讨论什么?eVJ品论天涯网

这里贡献一个冷知识:每年都有大量的人去谷歌搜索框中,输入「谷歌」两个字。eVJ品论天涯网

其实,并没有那么多人去谷歌上查找难以访问的科学信息,但用它查找邮箱、购物网站的人,要多出几个数量级。eVJ品论天涯网

或许,摆在这些潜在的谷歌杀手AI面前的问题,不是它们找到信息的能力,而是它们是否能做搜索引擎能做的一切。eVJ品论天涯网

1.网站导航eVJ品论天涯网

其实,搜索引擎的最主要工作,是把我们带到一个网站。eVJ品论天涯网

Google上所有排名靠前的查询,从「YouTube」到「Yahoo Mail」,都是导航查询。eVJ品论天涯网

但AI机器人往往会思考几秒钟,然后提供一堆公司信息,但可能并没有链接到Amazon之类的具体网站。eVJ品论天涯网

2.信息查询eVJ品论天涯网

对于体育比赛比分、现在几点了之类的实时信息,谷歌都做对了,而AI工具往往都会过时(原因如上文所示)。eVJ品论天涯网

并且,谷歌往往会有关于你特定位置、背景的信息,而AI机器人很多都没有。eVJ品论天涯网

当然,如果查找「一年有多少周」这种问题,AI产品往往会给我们惊喜。eVJ品论天涯网

谷歌会回答:52.1429周。eVJ品论天涯网

而Perplexity和智谱清言则给出更加全面的答案——不仅分别考虑到了平年和闰年的情况,而且还给出了计算过程,非常清晰易懂。eVJ品论天涯网

图片eVJ品论天涯网

图片eVJ品论天涯网

3. 探索性查询eVJ品论天涯网

「如何打领带」、「为什么会发明电锯」类似的问题,都属于探索性的查询。eVJ品论天涯网

这些问题往往没有单一答案,而是学习过程的开端。eVJ品论天涯网

就比如,你在谷歌查找一位歌手,或者NASA历史之类的问题,这时的你就是在探索。eVJ品论天涯网

这并不是人们使用谷歌的主要目的,但正是AI搜索工具大放异彩的时刻。eVJ品论天涯网

比如,针对「为什么发明电锯」这一问题,Perplexity就会给出电锯的医疗起源,并描述其技术演变过程,最终被伐木工人采用。eVJ品论天涯网

4. 参考链接引用eVJ品论天涯网

AI搜索工具最大的亮点之一,便是提供了引用来源的链接。eVJ品论天涯网

这意味着,如果用户在搜索结果中发现了一个特别感兴趣的事实,可以点击链接,进入原始出处获得进一步了解。eVJ品论天涯网

总之,当我们谈起搜索引擎,最大的问题恐怕不在于技术,而在于产品。eVJ品论天涯网

如果将以上问题一一解决,同时探索出合适的商业模式和结构,AI取代搜索引擎,应该就不远了。eVJ品论天涯网

那时,我们搜索时会出现的,不仅仅再是简单的链接罗列,而是一个开门见山的准确答案。eVJ品论天涯网

参考资料:eVJ品论天涯网

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-revieweVJ品论天涯网

https://chatglm.cn/main/alltoolsdetaileVJ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]