当地时间周一,美国科创公司OpenAI发表声明宣布,由于旗下聊天机器人ChatGPT的一款名为Sky的女性配音引发网友广泛质疑,公司正采取措施解决问题,同时正在暂停使用这款AI声音模板。
(来源:X)
需要说明的是,ChatGPT的语音模式其实是在去年9月底推出的,当初一共发布了5款配音,引发争议的Sky也在其中。当然,引爆争议的源头,还是OpenAI上周在发布会上引入的“实时语音对话”。
除了声音酷似外还有刻意“谄媚”嫌疑
在上周的发布会上,OpenAI发布了最新的GPT-4o模型。通过反应速度的倍增,使得ChatGPT的语音功能顺滑到类似于“实时对话”的程度——你可以时不时插嘴打断聊天机器人,仿佛就像是在与真人交流那样。而且ChatGPT也能分辨出说话者的语气,回应的情感也更加强烈。
(研究人员现场演示语音对话,来源:OpenAI春季更新)
或许是为了庆祝人机交互的跨越式进步,OpenAI首席执行官山姆·奥尔特曼在发布会结束后,马上发了一个单词——her,指的是科幻爱情电影《Her》的场景正在成为现实。在那部2013年的电影中,讲述了一个人类与人工智能助手陷入复杂恋情的故事。
(来源:X)
也是因为这个比喻,令不少网友意识到了另一个问题:OpenAI找的配音,是不是与好莱坞知名女演员、饰演过漫威宇宙英雄“黑寡妇”,以及给《Her》里面人工智能助手配音的斯嘉丽·约翰逊(ScarlettJohansson)非常相近。
(斯嘉丽·约翰逊资料图,来源:社交媒体)
除了声音外,OpenAI的新对话功能也引发了深一层的争议:除了与主持人进行互动外,ChatGPT似乎额外展现了“讨好”对话者的倾向性。例如在展示多模态对话功能时,聊天机器人会感叹“哇,你穿的衣服真是相当有型”。而在受到赞美时,ChatGPT还会说“别这样,你让我脸红了”。
有网友一针见血地指出:这让人感觉像是给男性写的女性角色。
由于发布会篇幅限制,同时新的语音模式还未向付费用户推送,目前并不知道ChatGPT在语音模式下是否会有讨好女性用户的一面。
对于这些争议,OpenAI也在周日发布了一篇长文,虽然没有回应对话“谄媚”的问题,但明确对语音像女演员一事给予坚决否认。
OpenAI揭秘:这些语音是怎么来的
在《ChatGPT的语音是怎么选出来的》一文中,OpenAI披露,在去年9月推出语音模式前,公司进行了为期5个月的筹备,最终从400多份申请中挑选出了5个声音。
OpenAI斩钉截铁地表示,人工智能的语音不应该刻意模仿名人的独特声音——Sky的声音并不是在模仿斯嘉丽·约翰逊,而是属于另一个专业女演员,这是她自然说话的声音。OpenAI也表示,为了保护配音演员的隐私,公司无法对外公开他们的名字。
OpenAI透露,在2023年初为了让ChatGPT“说话”,公司与一系列知名的选角导演、制片人合作定下了选拔“ChatGPT配音演员”的标准,例如:
有不同背景或能说多种语言的演员;
一种听起来有“永恒”(timeless)感觉的声音;
一种平易近人、能激发信任的声音;
一种音色丰富,且温暖、引人入胜、充满自信、魅力十足的声音;
自然且易于听取。
OpenAI介绍称,在2023年5月,选角机构发布了招募配音演员的通知,在不到一周的时间内,总共收到超过400份申请,有来自专业配音演员,还有一些影视演员。
为了参加试镜,演员们被要求录制一份ChatGPT回复的剧本,涵盖的问题包括正念、头脑风暴旅行计划,以及与用户“日常一天”有关的对话文本。
通过海选,OpenAI确定了一份14人的初选名单。接下来公司与每位演员讨论了AI语音交互和公司的愿景,包括技术能力、局限性、涉及风险以及已经实施的保障措施。之后OpenAI的内部团队基于产品和研究的角度,最终选择了5个声音。这些演员在去年6月和7月期间飞往旧金山展开录音。
OpenAI也在公告中强调,每位配音演员都获得了“高于市场最高水平”的报酬,只要ChatGPT持续使用他们的声音,这种待遇就会持续下去。
公司表示,计划在未来几周里向付费用户提供GPT-4o新语音模式的访问权限。未来也将给ChatGPT引入更多的声音,以更好地匹配用户的不同兴趣和偏好。
相关文章:
“寡姐”斯嘉丽称OpenAI未经同意刻意模仿其声音
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】