财经

我国自研视频大模型全球上线

字号+作者: 来源:科技日报 2024-08-05 00:00 评论(创建话题) 收藏成功收藏本文

我国自研视频大模型全球上线'...

科技日报讯 (记者崔爽)记者8月3日获悉,亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。ltJ品论天涯网

Vidu是北京生数科技有限公司(以下简称“生数科技”)联合清华大学发布的自研长时长、高一致性、高动态性视频大模型。据介绍,此次面向全球上线,Vidu在基础功能外新增动漫风格、角色一致性等功能。生数科技有关负责人表示,Vidu实现了业界最快实测推理速度,仅需30秒就能生成一段4秒片段。目前Vidu无需申请,用户直接使用邮箱注册即可上手体验。ltJ品论天涯网

今年初,文生视频大模型Sora在全球引发广泛关注。目前业界对视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态一致性。Vidu较好平衡了这三方面的表现。它能准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。ltJ品论天涯网

此外,Vidu在构图、叙事和光影等方面,能达到接近电影级效果。Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG(计算机图形学)特效等。ltJ品论天涯网

(责任编辑:王婉莹)ltJ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]