人工智能

OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车

字号+作者: 来源:新智元公众号 2024-03-17 09:38 评论(创建话题) 收藏成功收藏本文

声明:本文来自于微信公众号新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。【新智元导读】最近,OpenAI CTO Murati接受采访时,对Sora训练数据语焉不详'...

声明:本文来自于微信公众号新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。340品论天涯网

【新智元导读】最近,OpenAI CTO Murati接受采访时,对Sora训练数据语焉不详、支支吾吾的表现,已经成了全网热议的话题。毕竟,要是一个处理不好,OpenAI就又要陷入巨额赔偿金的诉讼之中了。340品论天涯网

最近,OpenAI CTO在采访中大翻车的表现,已经在网上掀起了轩然大波。Sora再陷版权争议!340品论天涯网

前几天Murati接受华尔街日报采访时,被问及Sora训练数据的这段视频,已经在全网爆火,引起网友热议。340品论天涯网

准备好,WSJ女记者要放大招了——「Sora是用什么数据训练的?」340品论天涯网

Murati接下来的表现,十分值得玩味。340品论天涯网

她眨了数次眼睛,目光闪烁,思考几秒之后略带迟疑地给出了一个官方味十足的答案——340品论天涯网

「我们使用的是公开可用的数据,以及经过许可的数据。」340品论天涯网

记者继续出招:「所以,你们是用了YouTube上的视频吗?」340品论天涯网

Murati的反应亮了。她撇了撇嘴,眼神茫然地望向空中,犹豫了几秒后只得承认——340品论天涯网

「关于这个情况,我不太确定。」340品论天涯网

记者步步紧逼:「那Facebook和Instagram上的视频呢?」340品论天涯网

Murati的表情仿佛已经在崩溃的边缘——340品论天涯网

「你知道,如果这些数据可以公开使用……对……可以公开使用的话……可能是用了这些数据,但我不确定,真的不太确定。」然后她无奈地伸开双手,表示差不多得了。340品论天涯网

但记者还在发问:「Shutterstock呢?我知道你们公司和他们有合作。」340品论天涯网

Murati摇了摇头,表示,「关于使用数据的细节,我是不会详细说的,但我们用的数据肯定是公开的,或者许可使用的。」340品论天涯网

仓促上阵的Murati肯定没想到,记者会准备得如此充分,让她几乎直接掉在坑里。如果处理不够得当,OpenAI极有可能会继续吃官司。340品论天涯网

图片340品论天涯网

网友形容Murati的窘迫表现340品论天涯网

有人预言:Murati的反应绝对会被做成表情包,全网热转。340品论天涯网

图片340品论天涯网

训练AI模型数据所面临的巨大版权争议,是这一年多全球相关人士讨论最多的话题。340品论天涯网

如今,ChatGPT让OpenAI的估值暴涨到了800亿美元;而Sora又几乎要颠覆动辄上百亿票房的好莱坞影视行业 。340品论天涯网

然而这些收益却进了OpenAI的腰包,而做出关键贡献的数据所有者,却分文无收,甚至反而被掀了饭碗。340品论天涯网

OpenAI被纽约时报起诉、ChatGPT被怒喷应当「销毁」的故事,会再一次上演吗?340品论天涯网

网友:她的微表情在说谎340品论天涯网

这段采访的视频一出,业内人士和网友都震惊了。340品论天涯网

有网友锐评道,这个采访看起来很愚蠢,整个对话仿佛是下面这个样子——340品论天涯网

你是坏人吗?340品论天涯网

不是。340品论天涯网

你是坏人吧?340品论天涯网

呃……不是吧?不是。340品论天涯网

你到底是坏人吗?340品论天涯网

听着,我不是坏人。340品论天涯网

图片340品论天涯网

还有网友展开了微表情分析,认为Murati很有可能是在说谎。340品论天涯网

图片340品论天涯网

科技专栏作家Brian Merchant批评道,Murati的表现「要么是对自己公司的产品惊人的无知,要么就是在谎言——无论哪种可能,都非常可怕!」340品论天涯网

图片340品论天涯网

的确,对于一个AI公司CTO来说,她的表现是完全不合格的。340品论天涯网

图片340品论天涯网

那么问题来了,如果是后一种可能,Murati为什么要撒谎呢?340品论天涯网

如果她意识到自己需要撒谎来掩盖某些事实,那就说明,她心里明白OpenAI的做法是在违法的边缘试探。340品论天涯网

图片340品论天涯网

而在未来,当OpenAI被法官问话时,这很可能就会给OpenAI埋下一个大坑。340品论天涯网

图片340品论天涯网

「看起来,OpenAI要面临一场大型诉讼了」340品论天涯网

目前,OpenAI正面临着好几场由作家和纽约时报发起的诉讼,后者声称,他们受版权保护的作品未经许可,就被OpenAI用来训练ChatGPT等模型。340品论天涯网

与此同时,外媒纷纷发表文章,嘲讽Murati在采访中表现出的样子太不专业。340品论天涯网

图片340品论天涯网

图片340品论天涯网

CTO的这个表现,对官司缠身的OpenAI可真不算个好消息。340品论天涯网

如果CTO都无法坚定地回答,现在公司旗下最热门新模型的训练数据来自哪里,那也就证明了,OpenAI高层甚至对这个问题根本就没关注。340品论天涯网

据WSJ报道,在采访结束后,Murati证实,Shutterstock上的视频确实包含在Sora的训练集中。340品论天涯网

不过,网上有海量的视频内容,OpenAI从Shutterstock得到的,恐怕也只是Sora训练数据池中的一小滴水而已。340品论天涯网

图片340品论天涯网

其实,这件事情之所以能引起轩然大波,也是因为它直接指向了问题的本质——在公共领域的数据,所属权到底属于个人,还是完全共有?340品论天涯网

从前,数据飞轮还没能给LLM加速到日进斗金的程度时,这个问题没有放到台面上讨论过。而现在,它背后代表了巨大的利益。340品论天涯网

也有一些人为Murati和OpenAI辩护。340品论天涯网

他们认为,既然你把东西发到了网上,就应该默认它属于公共资产。如果你不想公开,那就应该让它们保持私密。340品论天涯网

图片340品论天涯网

也就是说,一旦事情在公共场合发生,它就属于整个人类。340品论天涯网

图片340品论天涯网

这么说来,我们在往网上发东西时,都得时刻小心翼翼了。340品论天涯网

一家价值数十亿美元的AI公司,很可能会把你随手拍的家人朋友的视频,用作生成式AI模型的养料,获得惊人的利润。340品论天涯网

对于这个数据监管的争议,斯坦福教授Christopher Manning表示,目前最合适的AI监管办法之一,就是要求模型厂商记录下他们使用过的所有训练数据。340品论天涯网

图片340品论天涯网

欧洲议会刚刚通过的AI法案,也同样强调了这一点。340品论天涯网

图片340品论天涯网

Sora最新一波演示出炉!340品论天涯网

虽然在之前的采访里已经提到,Sora生成的视频还有很多bug,但这些不断被放出的演示,依然在不断惊艳世人。340品论天涯网

比如瓷器店里的公牛。340品论天涯网

图片340品论天涯网

扛着摄像机的女记者忽然变成了机器人。(x340品论天涯网

图片340品论天涯网

拿着手机的小美人鱼,旁边是她的蟹助手。340品论天涯网

图片340品论天涯网

还拉着Runway对比了一波,生成两个镜头前的女记者。340品论天涯网

Sora还在不断掀起飓风340品论天涯网

其实,Sora的传奇故事,才刚刚揭开序幕。340品论天涯网

一个月前,曾给《死侍2》做特效的44岁视觉艺术家Greg Pilon,突然感觉:自己的行业似乎面临着末日的钟声。340品论天涯网

他见到Sora的第一眼,就有这种强烈的感觉。340品论天涯网

无人机拍摄的海岸、一个男人在巴黎咖啡馆深沉地思考人生的画面、一个在迪斯科舞厅跳舞的袋鼠……这些惊艳的场景也令他恐惧。340品论天涯网

图片340品论天涯网

Sora的先进程度,已经远超任何视频AI。340品论天涯网

Pilon曾以为,粗糙的AI要威胁自己的生计,且得等几年,但Sora却表明:被淘汰的危机已经近在眼前。340品论天涯网

「我现在觉得,两年后,我可能就会被取代了。」340品论天涯网

虽然Sora还未发布,但仅仅是一些demo,就已经引起了好莱坞和游戏界的巨大轰动。340品论天涯网

电影

前段时间最刷屏的新闻之一,就是好莱坞大导Tyler Perry在Sora刚刚发布一周后,取消8亿美元工作室扩建计划的消息。340品论天涯网

图片340品论天涯网

对此,导演Scott Mann也认为,Sora将「给我们的行业带来自电影摄影机发明以来最大的变革。」340品论天涯网

2018年,Mann参与创立了Flawless,来开发AI电影制作工具。340品论天涯网

他们最受瞩目的产品,能够解决电影编辑中的配音问题——这不仅可以节省昂贵的重拍费用,还可以用AI调整演员的嘴型来与另一种语言同步,从而帮助电影顺利地进入国际市场。340品论天涯网

在最近的作品《Fall》中,他就利用Flawless对其中的30多处粗口进行了配音处理。因此,电影达到了PG-13级别,扩大了受众范围。340品论天涯网

在300万美元的预算下,《Fall》的票房收入达到将近2200万美元,回报近7倍。340品论天涯网

不过,Flawless的工作,或许很快就能由Sora完成了。340品论天涯网

而给《权力的游戏》和《吸血鬼日记》做特效的视觉工程师Pilon也发现,Sora很可能在几分钟内,完成他曾经要花费数月才能完成的工作。340品论天涯网

「没有人预料到它会进展得这么快,」Pilon说。「我们曾认为可能还需十年的技术,现在看来仅需几年。」340品论天涯网

游戏

视频游戏公司Midwest Games的创始人Ben Kvalo也表示,自己行业中的某些员工,的确会被AI淘汰。340品论天涯网

与艺术家们擅长的特定风格不同,生成式AI能够创造出任何风格,或尝试全新的风格。340品论天涯网

而那些与视频游戏开发者合作,为游戏初期角色和场景勾勒草图的概念艺术家,很可能会因此失去工作。340品论天涯网

不过,小规模的开发团队,却可能从中受益。340品论天涯网

他们本来请不起概念艺术家,现在却可以做出视觉上更高水平的游戏项目,从而大赚一笔了。340品论天涯网

图片340品论天涯网

而有朝一日,生成式AI也将达到一个新高度——让游戏能够搭载「有意识」的NPC。340品论天涯网

现在的游戏中,NPC还停留在说简单台词、做基本动作的阶段,如果AI能让他们自发对话、即兴行动,故事情节会更丰富。340品论天涯网

图片340品论天涯网

广告

而在广告领域,许多业内人士也坚信,AI模型比大家预料更早地淘汰员工。340品论天涯网

不同于电影和游戏制作中缓慢而独具匠心的创作过程,广告行业更看重迅速构思创意提案,尽可能多地采用不同视觉风格,以及根据客户需求快速调整方向的能力。340品论天涯网

(Add)ventures的高级副总裁Scott Maiocchi,已经用上Midjourney和Stable Diffusion了。340品论天涯网

商业影片导演Justin Poirier,也开始用生成式AI来创建情感氛围板了。340品论天涯网

之前,当他需要向客户展示动画艺术潜在的样子时,他需要花费数小时寻找灵感图片。340品论天涯网

他相信,未来品牌很可能会采用AI视频作为辅助画面,而无需去Getty或Shutterstock筛选海量的视频。340品论天涯网

毕竟,不少每个项目都有预算去用无人机航拍城市天际线的,一旦AI视频成熟,这种画面几秒内就能得到。340品论天涯网

图片340品论天涯网

3个月诞生10个类Sora应用340品论天涯网

人们是不是对Sora有些恐慌过度了?有这种可能。340品论天涯网

虽然Sora的展示很惊艳,但它也是一次巧妙的营销——对于OpenAI来说,不断提升公司形象、吸引更多员工和资本,也是无可厚非的。340品论天涯网

毕竟,运行Sora还会面临巨大的成本问题,这会给它的颠覆性影响加个封印。340品论天涯网

不过,现在市面上的玩家可不仅仅是Sora一家。340品论天涯网

Runway和Pika Labs这样的初创公司,也能做出15到16秒的AI视频。而且它们已经分别获得了2.36亿美元和5500万美元的资金340品论天涯网

以色列初创公司Lightricks,也发布了文本到视频的全流程平台LTX Studio。340品论天涯网

前软件工程师、哈佛大学AI与商业课程教授Mike Grandinetti预测道:「从现在开始到6月,我们将看到10个以上类Sora应用的发布。」340品论天涯网

AI在电影、游戏、广告这些行业还会掀起怎样的飓风,让我们拭目以待吧。340品论天涯网

参考资料:340品论天涯网

https://www.reddit.com/r/MachineLearning/comments/1belin7/n_ooops_openai_cto_mira_murati_on_which_data_was/340品论天涯网

https://www.theinformation.com/articles/the-sora-saga-has-only-just-started?rc=epv9gi340品论天涯网

https://futurism.com/video-openai-cto-sora-training-data340品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]