人工智能

姗姗来迟的Sora 一来就乱杀了

字号+作者:差评 来源:差评 2024-12-11 08:49 评论(创建话题) 收藏成功收藏本文

磨磨蹭蹭了快一年,OpenAI终于舍得把Sora这盘菜端上来了。这不,咱们还在做梦的时候,Sora就已经那能用了,登录网址Sora.com,订阅会员抢先体验。反正从昨天晚上'...

磨磨蹭蹭了快一年,OpenAI终于舍得把Sora这盘菜端上来了。这不,咱们还在做梦的时候,Sora就已经那能用了,登录网址Sora.com,订阅会员抢先体验。反正从昨天晚上折腾到今天,国内外各大媒体疯狂报道,有不少老哥已经把Sora生成的视频发到了网上,那叫一个热闹。sby品论天涯网


sby品论天涯网

可能哥几个也好奇,这个传说中的Sora到底有多少斤两,跟国内的视频生成模型相比,谁又会更胜一筹?sby品论天涯网

本来吧,这个问题世超可以在第一时间替大伙儿解答,会员账号早早就薅到手了。结果谁能想到,Sora的服务器被挤爆了,现在进都进不去……sby品论天涯网

不过说实在的,光是发布会上对Sora具体功能的展示,硬货就够多的了。sby品论天涯网


sby品论天涯网

所以今天世超就先拿发布会上的“餐前甜点”,给大伙儿开开胃,看看Sora跟之前咱们体验过的那些视频生成模型到底有啥区别。sby品论天涯网

首先在产品形态上,世超觉得,Sora就更接近一个拥有完整工作流程的生产力工具。sby品论天涯网

这次发布的SoraTurbo支持文字、图片和视频三种生成方式,能够生成最高分辨率1080p、时长20秒的视频,支持宽屏、竖屏和方形比例。sby品论天涯网


sby品论天涯网

但这些东西其实都挺常规的,最让世超觉得惊艳的地方,还是Sora把AI生成的能力融入到了视频创作的每一个环节中。sby品论天涯网

就比如Storyboard故事板功能,大伙儿可以简单理解成,给一段视频添加不同的分镜。sby品论天涯网

咱直接来看官方的例子,一共440帧的视频,前114帧的场景prompt是“一片广阔的红色景观,远处停靠着一艘宇宙飞船”。sby品论天涯网


sby品论天涯网

接着可以继续发挥想象力,把114-324帧的场景变成“从宇宙飞船内部向外看,一位太空牛仔站在画面中央”。sby品论天涯网


sby品论天涯网

最后用“宇航员眼睛的特写镜头,眼睛被针织面料制成的面罩框柱”的prompt,结束这段视频。sby品论天涯网


sby品论天涯网

这些“分镜”在哪个时间点添加,添加什么内容,都可以由用户自己决定。sby品论天涯网

而在故事板的基础上,咱们又可以把生成好的视频用Re-cut(在线重新剪辑)功能,继续调整一波。sby品论天涯网

这种剪辑,跟咱们理解的这裁一段那剪一截还不太一样。在视频的时间轴上,你可以把不满意的部分都剪掉,剩下来的活儿就可以扔给Re-cut功能,让它帮你把空白的地方再重新补全。sby品论天涯网


sby品论天涯网

这还没完啊。sby品论天涯网

Sora还有一个Remix功能,那才叫一个酷炫。sby品论天涯网

用prompt“毛茸茸的猛犸在沙漠中行走”生成一段视频,看起来也没啥特别的对吧。sby品论天涯网


sby品论天涯网

有意思的地方来了,如果你想把视频里的猛犸象给换了,比如换成机器人,ok,Remix功能就能派上用场了。sby品论天涯网


sby品论天涯网

硅基生物无痕替换碳基生物,而且从替换后的视频效果里也能看出来,机器人的步态、沙漠背景,几乎没有出现太大的畸变,画面稳定性和主体一致性整体都在线。sby品论天涯网

当然这只是官方给的案例,咱们也别太局限,大胆点儿把沙漠变成大海,也不是不行。sby品论天涯网

另外,Sora的发布会上还介绍了Loop(循环)和Blend(视频融合)两个功能。sby品论天涯网

一个能让视频实现首尾视频帧的丝滑衔接,让视频一直循环。sby品论天涯网

还有一个,则是把两个视频无缝合并成一个视频。sby品论天涯网

怎么个无缝法呢,用雪花飘落和花瓣飘落的视频作为例子,大伙儿一看就明白了。sby品论天涯网


sby品论天涯网

除此之外,Sora还有个Style-Presets的功能,其实说白了就是换换风格。同样都是两头猛犸象在雪地行走,但你可以把初始版换成黑白电影,或者纸板风和胶片档案风。sby品论天涯网

相信看到这儿,大伙儿应该多少能品出来,Sora跟现在市面上很多视频生成应用的区别了吧?sby品论天涯网

咱没有拉踩的意思,也没有非要分个高下。单纯从客观地角度来说,Sora已经做到了一个视频生成模型理想状态下,相对完整的产品形态。sby品论天涯网


sby品论天涯网

生成功能,不过是Sora最最基本的一块砖,没有了不行,但由一块块砖搭起来的大厦,肯定会更引人注目。sby品论天涯网

而之前咱们上手体验到的一些视频生成模型,大多只专注在生成效果这个单一维度上,魔改玩玩还可以,但要当真正的生产力工具,还差点意思。sby品论天涯网

其次,在最直观的生成效果上,Sora虽说有瑕疵,但总体上瑕不掩瑜。sby品论天涯网


sby品论天涯网

看看外网老哥们在X上发的视频,世超是真馋了。sby品论天涯网

先用Midjourney生成图片,再把prompt喂给Sora,这清晰度,这稳定性,老人脸上的皱纹都不带动一下的,还有眼神里透出来的“严肃和焦虑”,也让Sora悟到了。sby品论天涯网

prompt:镜头聚焦在茂密茂盛的森林中一位饱经风霜的老人。他的脸上沾满了蓝漆和泥巴,深深的皱纹表明他一生都在荒野中度过。背景是一片模糊的绿色和棕色,捕捉到了未驯化环境的本质。这名男子严肃而焦虑的目光暗示着一种生存、坚韧和与自然的深厚联系,为场景增添了一种神秘感和紧张感。sby品论天涯网

sby品论天涯网

还有这个金毛冲浪,狗狗重心往下压的时候,冲浪板的方向也在跟着往下,而且水面也因为金毛的这个动作掀起了一阵浪花。sby品论天涯网

sby品论天涯网

该说不说,Sora对物理规律的掌握,可比年初的时候好太多了。sby品论天涯网

等世超能用上了,高低也给咱火锅也安排一次。sby品论天涯网

不过,也有一些网友用Sora跟咱们国内的视频生成应用,对比了一把。sby品论天涯网

同样的prompt,打眼这么一看真看不出来太大差距,非要说的话,就是Sora版的头发更柔顺一些。sby品论天涯网

问题是KLING免费就能用。。拿这个视频对比,就显得开200美元/月Sora会员的有点冤种了。sby品论天涯网

sby品论天涯网

在一些网友的测试里,Sora生成的视频还会出现手部不够自然的情况。sby品论天涯网

包括昨晚的发布会上,Sora也小小翻车了一下。sby品论天涯网

工作人员输入了“鹤把头扎进水中,叼起一条小鱼”的提示词,结果视频中的白鹤,压根就没叼到鱼。sby品论天涯网

最后,可能是大伙儿不太关注到的一个点,Sora对AI生成的安全性考虑。sby品论天涯网

之前不是老有人嚷嚷AI为祸人间,看图片看视频,现在都分不清到底是人干的还是AI生成的了。sby品论天涯网


sby品论天涯网

所以这次Sora生成的视频都带有C2PA元数据,C2PA咱们之前专门写文章唠过,感兴趣的差友可以翻出来看看。它最大的特点就是可以溯源,内容是谁创作的、历史的修改记录,这些都会被记录下来。sby品论天涯网

总的来说,这次Sora的亮相还是带来了不少惊喜,特别是在产品形态上,视频创作的完整工作流提供了一个更新的视角。sby品论天涯网

不是我说,国内视频生成下一步要往哪卷,应该有方向了吧。sby品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]