人工智能

超越Sora!AI视频模型StreamingT2V可生成120秒超长视频

字号+作者: 来源:站长之家 2024-03-26 14:05 评论(创建话题) 收藏成功收藏本文

划重点:⭐ StreamingT2V技术实现了长视频生成的突破,可生成高度一致且长度可扩展的视频。⭐ 该技术核心构架包括条件注意力模块(CAM)和外观保持模块(APM),'...

划重点:v3N品论天涯网

⭐ StreamingT2V技术实现了长视频生成的突破,可生成高度一致且长度可扩展的视频。v3N品论天涯网

⭐ 该技术核心构架包括条件注意力模块(CAM)和外观保持模块(APM),确保视频连续性和视觉质量。v3N品论天涯网

⭐ 实现方法分为初始化、Streaming T2V生成和Streaming Refinement三个阶段,提高了视频生成的质量和分辨率。v3N品论天涯网

站长之家(ChinaZ.com)3月26日 消息:近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。v3N品论天涯网

image.pngv3N品论天涯网

StreamingT2V技术的核心构架包括条件注意力模块(CAM)和外观保持模块(APM)。CAM利用短期记忆单元确保视频连续性,而APM作为长期记忆单元保持视频中对象或场景的一致性。这两个模块的结合,使得生成的视频不仅动态连贯,而且视觉效果高质量。在测试中,研究人员用Streaming T2V生成1200帧,长达2分钟的视频。v3N品论天涯网

具体实现方法分为三个阶段:初始化、Streaming T2V生成和Streaming Refinement。在初始化阶段,利用文本到视频模型创造视频的前16帧;接着进入Streaming T2V阶段,通过自回归技术生成后续帧,保证视频内容连贯性;最后,在Streaming Refinement阶段对生成的视频进行优化,提高画质和动态效果。v3N品论天涯网

特色亮点包括:v3N品论天涯网

从文本描述生成2分钟的视频v3N品论天涯网

创建具有复杂动态运动的视频v3N品论天涯网

确保长视频中的时间一致性v3N品论天涯网

该技术的出现标志着AI视频生成的新突破,不仅可以生成1200帧甚至无限长的视频,而且内容过渡自然平滑,丰富多样。与此同时,StreamingT2V技术的不断完善和提升也将进一步推动AI视频生成领域的发展,为视频内容创作提供更多可能性。v3N品论天涯网

项目入口:https://top.aibase.com/tool/streamingt2vv3N品论天涯网

论文地址:https://arxiv.org/abs/2403.14773v3N品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章