今年年初,OpenAI发布了高级语音模式的小幅更新,减少了打断并改善了口音。今天,OpenAI再次对高级语音模式进行了重大升级,使其听起来更加自然、更贴近人类。现在,语音回复的语调更加细腻,节奏更加自然(包括停顿和强调),并且能够更准确地表达某些情绪,例如同情和讽刺。
本次更新还引入了翻译功能。ChatGPT用户现在可以使用高级语音模式进行语言间翻译。只需命令ChatGPT开始翻译,它就会在整个对话过程中持续翻译,直到收到停止指令。此功能有效地取代了对专用语音翻译应用的需求。
目前,更新后的高级语音模式仅适用于ChatGPT付费用户。OpenAI还指出,此最新更新存在一些已知的限制,概述如下。
本次更新偶尔可能会导致音频质量略有下降,例如音调和音调出现意外变化,在某些语音选项中尤其明显。OpenAI期望能够逐步提升音频的一致性。
语音模式下的罕见幻觉仍然存在,有时会产生类似广告、胡言乱语或背景音乐的意外声音。
尽管仍然存在一些小的限制,但持续的改进表明未来人类和人工智能对话之间的界限将变得越来越模糊。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】