合成播音可以乱真
【法国《科学生活》月刊10月号文章】题:电脑合成系统“教”图像说话
荧屏上,一个女播音员正在读一篇……她自己根本就不知道内容的文章!女播音员确实在那里,她嘴部的动作就像是真的,声音也与嘴形对得上———但事实上,这些镜头都是电脑合成的。
为了达到逼真效果,麻省理工学院的研究员托尼·伊扎特首先让播音员读一篇文章,拍下一段15分钟的录像。然后他从拍下的镜头中挑选出46个代表嘴部典型动作的图像,根据这些图像可以建立起嘴唇动作的模型。在这个基础上,电脑系统能够很快模拟出说话时的嘴部动作。最初拍摄的录像甚至还可以使电脑系统通过比较真实图像与虚拟图像来完善模拟效果。之后剩下的工作就是将任意一篇文章交给电脑,由电脑制成相应的录像。但这样还不够,还得配音复制,或者利用一个声音合成系统将声音与图像结合起来。
为了弄清楚模拟讲话与讲话机理的某些方面而进行的研究可以在电影行业或电子游戏领域一展身手,但也可被用于恶意宣传和假消息的传播。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】