人工智能

ChatGPT版“Her”被玩疯:哭着读诗,中文表现也很亮

字号+作者: 来源:量子位 2024-08-01 16:19 评论(创建话题) 收藏成功收藏本文

上线仅仅一天,GPT-4o的高级语音功能(AdvancedVoiceMode)简直要被玩疯了。无数网友脑洞大开的疯狂测试,GPT-4o这边呢,不仅各种奇葩任务全盘接收,表现好到更是'...

上线仅仅一天,GPT-4o的高级语音功能(AdvancedVoiceMode)简直要被玩疯了。无数网友脑洞大开的疯狂测试,GPT-4o这边呢,不仅各种奇葩任务全盘接收,表现好到更是让不少人连连惊呼“Blowmymind”。例如有位网友要求GPT-4o用中文讲个故事,它的表现是这样的:vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

很多懂中文的网友看罢,纷纷表示不论是情绪还是整体的描述,GPT-4o的表现都比较OK。vCf品论天涯网

但也并非完美,例如它的语速略显慢了些,以及把“气”读成了“kì”vCf品论天涯网

还有更像人的例子,仔细听:vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

你没听错,GPT-4o在读美国女诗人EmiliyDickinson的作品时,她哭了vCf品论天涯网

(颇有种情到深处自然浓的感觉)vCf品论天涯网

这效果可把网友们吓得不轻,表示“毛骨悚然”。vCf品论天涯网


vCf品论天涯网

然而这还只是网友们疯狂测试的一隅,还有很多好玩的例子,我们继续往下看。vCf品论天涯网

数1-100,贼快vCf品论天涯网

如果让你用英文从1数到10,越快越好,你需要几秒?vCf品论天涯网

有网友就给GPT-4o提了这个要求,来感受下AI的语速:vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

当网友要求它以更快的速度读1-10时,“AI字幕”识别功能都失效了。vCf品论天涯网

而当GPT-4o被要求速读1-50时,我们还可以听到他还会像人一样有大口换气的动作。vCf品论天涯网

接下来,这位网友提出了更高的要求——速读1-100vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

虽然前期没有完全get网友的要求,但在他不断地引导之下,GPT-4o最终还是完成了速读1-100的任务。vCf品论天涯网

除此之外,在搞怪方面,GPT-4o学猫叫也是一绝:vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

(我们一起学猫叫,一起喵喵喵~)vCf品论天涯网

当然,以实时性多语种出圈的语音功能,网友定然也不会放过测试这项任务。vCf品论天涯网

主打一个随意打断、随意切换:vCf品论天涯网

乌尔都语→希伯来语→挪威语→摩洛哥达利加语→阿姆哈拉语→匈牙利语→格鲁吉亚语→克林贡语。vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

还有更加实用的功能。vCf品论天涯网

例如如果你在玩一款日本游戏,但却看不懂日文,那就直接让GPT-4o来帮忙就好了:vCf品论天涯网


vCf品论天涯网

视频地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6wvCf品论天涯网

好家伙,GPT-4o直接摇身一变,成了实时翻译官了。vCf品论天涯网

“自然的语音是关键”vCf品论天涯网

除了上面这些具体的案例,沃顿商学院教授EthanMollick也谈了谈他的感受。vCf品论天涯网

他将GPT-4o的高级语音功能总结为三点:vCf品论天涯网

  • 它和OpenAI当时演示的效果一样好。vCf品论天涯网

  • 它显然能够生成更多音频,但存在限制。vCf品论天涯网

  • 它令人毛骨悚然。大量无意识的线索让人感觉像是在与一个人交谈。vCf品论天涯网


  • vCf品论天涯网

    并且Ethan教授还认为,这种非常自然、拟人的语音,正是改变人类与AI交互性质的关键(虽然底层模型是我们用了很久的那个)。vCf品论天涯网

    但实际上,高级语音模式与ChatGPT现有的语音功能存在明显差异。vCf品论天涯网

    ChatGPT之前的语音处理方式依赖于三个不同的模型:首先是将语音信号转化为文字的模型,其次是GPT-4用于解析和回应用户指令,最后是将ChatGPT的输出文本转换为语音的模型。vCf品论天涯网

    相比之下,GPT-4o具备多模态能力,能够独立完成这些任务,无需其他模型的辅助,这大大减少了对话过程中的等待时间。vCf品论天涯网

    此外,OpenAI还强调GPT-4o能够识别并响应用户语音中的情感变化,例如能够感知到悲伤、兴奋等情绪。vCf品论天涯网


    vCf品论天涯网

    而随着越来越多网友晒出他们的测试结果,底下的吃瓜群众们是按耐不住了,纷纷表示希望OpenAI快点让更多人体验上。vCf品论天涯网

    那么你觉得用GPT-4o的高级语音功能,还能有什么更有意思的玩法?欢迎在评论区留言讨论~vCf品论天涯网


    vCf品论天涯网

    参考链接:vCf品论天涯网

    [1]https://x.com/CrisGiardina/status/1818469456269463810vCf品论天涯网

    [2]https://x.com/ManuVision/status/1818441972220104813vCf品论天涯网

    [3]https://x.com/emollick/status/1818790423319478384vCf品论天涯网

    [4]https://x.com/EthanSutin/status/1818405750760522232vCf品论天涯网

    [5]https://x.com/flowersslop/status/1818504414774046845vCf品论天涯网

    [6]https://x.com/CrisGiardinavCf品论天涯网

    [7]https://www.youtube.com/watch?v=cEhSo4ZPhpwvCf品论天涯网

    本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]