人工智能

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了

字号+作者: 来源:量子位 2024-09-12 14:34 评论(创建话题) 收藏成功收藏本文

让AI视频中任意主体保持一致!就在刚刚,人人都可轻松做到了。而且只需一张图片,就能实现。您看到的每一段马斯克视频,都来自同一张照片。想玩的话,只需要用上'...

让AI视频中任意主体保持一致!就在刚刚,人人都可轻松做到了。而且只需一张图片,就能实现。您看到的每一段马斯克视频,都来自同一张照片。22r品论天涯网



22r品论天涯网


22r品论天涯网

想玩的话,只需要用上清华系AI视频玩家生数科技旗下Vidu的最新功能,主体参照(SubjectConsistency)。22r品论天涯网

该功能能够实现对任意主体的一致性生成,让视频生成更加稳定,也更加可控。22r品论天涯网


22r品论天涯网

“现在生成AI视频内容,想要做到‘言出法随’其实还很难,不确定性让视频内容对运镜、光效等的精细控制还是得不断抽卡。”生数科技CEO唐家渝表示,“角色一致性只能让人脸保持一致,而主体参照让主体整体造型都能保持一致,给了更大的创作空间。”22r品论天涯网

这是继今年7月,生数Vidu面向全球用户上线文生视频与图生视频能力(单视频最长生成8s)后的再次更新。22r品论天涯网

这次功能上新依然非常友好:22r品论天涯网

面向用户免费开放,注册即可体验。22r品论天涯网

仅需一张图片实现主体可控22r品论天涯网

先来看看Vidu是怎么定义这个新功能的。22r品论天涯网

主体参照:允许用户上传任意主体的一张图片,然后由Vidu够锁定该主体形象,通过描述词任意切换场景,输出主体一致的视频。22r品论天涯网

划重点:任意主体。22r品论天涯网

也就是说,无论是人还是动物,无论是真人还是动漫形象or虚构主体,无论是家具还是商品,都能通过这个功能在视频生成中实现一致性和可控性。22r品论天涯网

目前,所有的视频大模型中,仅有Vidu率先支持这种玩法。22r品论天涯网

不必光说不练,我们来看看真实效果。22r品论天涯网

人物主体22r品论天涯网

首先来看看以人物为主体。22r品论天涯网

上传一张87版《红楼梦》林妹妹的定妆照:22r品论天涯网


22r品论天涯网

以画面中林妹妹为主体,利用主体参照功能,生成两条视频。22r品论天涯网

突然,林妹妹上台演讲了:22r品论天涯网


22r品论天涯网

又一眨眼,妹妹已经坐在星爸爸喝咖啡了:22r品论天涯网


22r品论天涯网

当然啦,真人可以作为生成视频的主体参照,虚拟角色/动漫人物同样可以。22r品论天涯网

比如输入一张漫画女孩:22r品论天涯网


22r品论天涯网

生成视频效果是酱紫的:22r品论天涯网


22r品论天涯网

这里附上一些官方给的小tips:22r品论天涯网

如需重点保持主体面容一致,需仅截取单一主体的清晰面容图22r品论天涯网

如需重点保持主体半身一致(面容+上半身服饰),仅需截取单一主体的清晰半身图22r品论天涯网

如需重点保持主体全身一致(全身特征),仅需截取单一主体的清晰全身图22r品论天涯网

动物主体22r品论天涯网

谁能不爱可爱狗狗!22r品论天涯网


22r品论天涯网

把这张照片丢给Vidu,就能实现狗狗走草地上,一步一步靠近你。22r品论天涯网

镜头后拉和主体运动幅度表现都还不错。22r品论天涯网


22r品论天涯网

商品主体22r品论天涯网

当把商品作为需要参照的主体时,在生成的视频中,商品外观和细节能在不同于图片的场景中保持一致。22r品论天涯网

就像下面这样:22r品论天涯网


22r品论天涯网

沙发所在的场景,说变就变。22r品论天涯网

上面还能睡一个盖了毯子的小女孩,遮挡住沙发原有部分。22r品论天涯网


22r品论天涯网

需要注意的是,当前版本仅支持单一主体的可控。22r品论天涯网

如果上传的图片有多个人物/物体,需要框选出单一主体进行生成。22r品论天涯网

BeLike:22r品论天涯网


22r品论天涯网

不再“两步走”了22r品论天涯网

无论是制作短视频、动画作品还是广告片,“主体一致、场景一致、风格一致”都是共同的追求。22r品论天涯网

因此,AI视频生成内容想要有叙事效果,就需要不断往三个一致方面尽力靠拢。22r品论天涯网

尤其是就现实情况而言,实际的视频创作,内容往往围绕特定的对象展开——这往往也是视频生成内容最容易变形、崩坏的一点,尤其在涉及复杂动作和交互的情况下。22r品论天涯网

挠头,脑阔痛。22r品论天涯网

业界首先想到的办法是先AI生图、再图生视频。22r品论天涯网

说人话,就是用Midjourney、SD什么的,生成分镜镜头画面,让每张图里的主体保持一致,然后再进行图生视频,最后把每个视频片段拼接剪辑。22r品论天涯网

但一听就发现了,这样搞,无论是保持AI画图的一致性,还是后期拼拼剪剪,工作量都很大。22r品论天涯网

生数Vidu“主体参照”跟这个思路的不一样之处,就是不再两步走了。22r品论天涯网

而是通过“上传主体图+输入场景描述词”的方式,直接生成视频素材。22r品论天涯网

最后,我们来厘清以及区分三个概念:22r品论天涯网

图生视频(ImagetoVideo)22r品论天涯网

角色一致性(CharactertoVideo)22r品论天涯网

主体参照(SubjectConsistency)22r品论天涯网

图生视频基本是现在AI视频生成的基操了。22r品论天涯网

它把输入的图片作为视频首帧,然后基于首帧画面的连续生成。22r品论天涯网

Bug是无法直接输出目标场景,限制了视频内容的多样性和场景的自由度。22r品论天涯网

角色一致性,主要集中在人物形象上起效果。22r品论天涯网

它能保证人物面部特征在动态视频中保持一致,但一般来说“一致性”只顾脸,不顾整体形象。22r品论天涯网

主体参照,面向任意主体。22r品论天涯网

同时在面向人物主体时,既可选择保持面部一致,也可选择保持人物整体形象的高度一致。22r品论天涯网

最后附上生数科技视频试玩链接,感兴趣的朋友可趁排队人不多,赶紧冲一波!22r品论天涯网

毕竟,免费的就是香,对吧(doge)。22r品论天涯网

体验直通车:www.vidu.studio22r品论天涯网

22r品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]