人工智能

大神卡帕西安利爆火AI应用 称“或是下一个ChatGPT”

字号+作者: 来源:量子位 2024-09-30 15:14 评论(创建话题) 收藏成功收藏本文

大神卡帕西墙裂推荐!甚至预言这个AI应用,有可能开启“和ChatGPT一样大的机会”。它就是来自Google的实验性AI产品,NotebookLM,背后由Google现在最强大的模'...

大神卡帕西墙裂推荐!甚至预言这个AI应用,有可能开启“和ChatGPT一样大的机会”。它就是来自Google的实验性AI产品,NotebookLM,背后由Google现在最强大的模型Gemini1.5Pro提供支持。oBg品论天涯网


oBg品论天涯网

最近这应用要多火就有多火,全因上线了一项新功能——oBg品论天涯网

上传文件(文字、音频、视频),AI不仅能帮忙用文字提炼要点,还可以通过音频概述(AudioOverview)功能,把文件转换成AI生成的对话播客,根据文档内容进行讨论。oBg品论天涯网

2个AI,用真人般的语音和口吻,围绕文件内容激情讨论,最后总结陈词。oBg品论天涯网

这真的很酷!oBg品论天涯网

而且不是卡帕西一个人在夸。逛了下互联网几大平台,网友们对NotebookLM普遍还是挺买账的。oBg品论天涯网

AI界的KOL@elvis也在卡帕西评论区留言:oBg品论天涯网

卡神称这“让人想起ChatGPT时刻”,绝对不是夸大其词!oBg品论天涯网

真正让多种模型联合工作,会解锁NotebookLM这样独特的内容格式和用户体验。oBg品论天涯网


oBg品论天涯网

NotebookLM怎么玩?oBg品论天涯网

玩法很简单,打开试玩页面,拖拽上传需要处理的文件。oBg品论天涯网

可以是Google文档,可以是网站和视频链接,甚至干脆粘贴一大段文本都可以。oBg品论天涯网

每个笔记本支持上传50个文件,每个文件内容上限500000个单词。oBg品论天涯网


oBg品论天涯网

这里我们上传了OpenAIo1的SystemCard文档,接下来就可以选择需要创建的内容。oBg品论天涯网

内置支持问答、小测验、目录、时间线、摘要等文字版功能,以及两个主持人的深度对话音频内容。oBg品论天涯网

如果有更个性化的需求也可以自己敲prompt。oBg品论天涯网


oBg品论天涯网

我们尝试用中文提问,结果AI是可以理解的。oBg品论天涯网

很可惜的是NotebookLM不支持用中文回答,即使刻意要求也不行。oBg品论天涯网


oBg品论天涯网

选择创建音频的话,视文档长度需要等待几分钟到十几分钟。oBg品论天涯网

趁这个时间来了解一下这背后的Gemini模型叭~oBg品论天涯网

NotebookLM由Gemini1.5Pro来支持,也就是Google家目前旗舰级大模型。oBg品论天涯网

Gemini1.5Pro支持超长128k上下文,这是能解读长文档的基础。oBg品论天涯网

在最近的一次升级中,Gemini1.5Pro数学和推理能力还反超OpenAIo1预览版。oBg品论天涯网


oBg品论天涯网

好了,刚才生成的音频也处理完毕,英语好的朋友可以来听听看。oBg品论天涯网

英语没那么好的朋友,也可以看看套娃AI转写、翻译出来的AI播客文字版,感受一下。oBg品论天涯网


oBg品论天涯网

单纯的上传文档,生成内容,还只是Notebook的实用玩法之一。oBg品论天涯网

还有人介绍了学生上课录音,回家用AI整理重点的玩法,也广受好评。oBg品论天涯网

(不是自己不听课了的意思)oBg品论天涯网

具体来说,可以遵循以下步骤:、oBg品论天涯网

上课时用手机录音;oBg品论天涯网

上课期间不需要用电脑,只需(纸笔)记下简短的重点;oBg品论天涯网

(下课后)把录音和笔记扫描上传到NotebookLM,让它根据录音细节扩写笔记。oBg品论天涯网

另外,还可以每周创建一份对所学内容重点的复习音频。oBg品论天涯网


oBg品论天涯网

一种与单纯Chat不同的交互范式oBg品论天涯网

其实,NotebookLM并不是出道即爆火。oBg品论天涯网

早在去年5月的GoogleI/O大会上它就已经出现了,不过那个时候,作为AI笔记本项目的它还叫ProjectTailwindoBg品论天涯网

到了去年7月,NotebookLM它才改成现在的名字。oBg品论天涯网

起初,只支持美国局部地区的用户食用;功能也还是围绕着基础的Chat模式展开。oBg品论天涯网


oBg品论天涯网

NotebookLM自动生成文档指南(来自Google官网)oBg品论天涯网

到了这个月11号,NotebookLM突然宣布面向全球玩家开放,并且新增了重磅功能,音频概述oBg品论天涯网

Google给的官方介绍是这样的:oBg品论天涯网

“新的音频概述功能,可以一键将文档、幻灯片、图表等转化为引人入胜的讨论。”oBg品论天涯网

因为交互形式很新、AI语音逼真、讨论起来真的很像真人播客,大家一下就玩嗨了。oBg品论天涯网


oBg品论天涯网

到这两天,NotebookLM不仅已经能够把Youtube视频作为输入,还已经支持超100种语言。oBg品论天涯网

现在,卡帕西的下场“示爱”,更为NotebookLM的热度添了一把火。oBg品论天涯网

如卡帕西所说,NotebookLM爆火最主要的原因,是它提供了一种与单纯Chat不同的交互范式。oBg品论天涯网

卡帕西表示,NotebookLM消除了大模型的两大享受障碍:oBg品论天涯网

第一点,聊天其实挺难的。oBg品论天涯网

有些人在日常生活中跟人交流都费尽心力,更别提要和Chatbot聊天,还得不停提问、追问。oBg品论天涯网

NotebookLM好就好在,生成的二AI播客,其中有一方就会处于提问、引导角色。oBg品论天涯网

咱把文档、音视频放进去,等待生成,美美听AI根据文件唠就是了。oBg品论天涯网

第二点,阅读不是件容易的事。oBg品论天涯网

信息爆炸的碎片化时代,挑个舒服的姿势,或者开车时候听别人讨论我需要的东西,比自己费劲吧啦搁那儿看容易得多。oBg品论天涯网

——哪怕看的是AI已经帮我们总结出来的凝练版本(哎,没错,咱就是这么懒!doge)。oBg品论天涯网

本着精益求精的精神,也有网友表示了对NotebookLM更上一层楼的期待。oBg品论天涯网

HyperbolicLabs的联创兼CTOYuchenJin试玩过后,总结了两个局限性:oBg品论天涯网

一个是它“看不到”,也就是没法处理文档里的图片信息。oBg品论天涯网

不过背后的Gemini是多模态的嘛,相比NotebookLM长眼睛不会太晚。oBg品论天涯网

另一个是用户无法引导AI播客的内容oBg品论天涯网

YuchenJin喂给它两条推文,它就生成了近13分钟的音频内容,但它默认听众是普通受众,所以讲了很多很基本的概念。oBg品论天涯网

如果能指定生成播客的目标群体,或者谈论主题、方向、角度,那真的是棒上加棒。oBg品论天涯网

OneMoreThingoBg品论天涯网

说时迟那时快,开发者搞出开源版的NotebookLM了!oBg品论天涯网

不过暂时只能喂给它PDF嗷。oBg品论天涯网


oBg品论天涯网

咱就是说,人类真有意思哈!oBg品论天涯网

以前在音频转文字方面费劲,追求把广播、会议录音啥的转成文字。oBg品论天涯网

现在又开始用大模型把文字转成播客了……oBg品论天涯网

有意思哇有意思哇(狗头)。oBg品论天涯网

参考链接:oBg品论天涯网

[1]https://notebooklm.google/oBg品论天涯网

[2]https://x.com/karpathy/status/1840112692910272898oBg品论天涯网

[3]https://x.com/omarsar0/status/1840145774874898506oBg品论天涯网

[4]https://x.com/Yuchenj_UW/status/1840203324571943403oBg品论天涯网

[5]https://github.com/gabrielchua/open-notebooklmoBg品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]