声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:白鲸出海,授权站长之家转载发布。
3月5日,两位华人创业者苗亦舒和王子宇建立的 AI 初创公司推出了搭载自研 AI 模型的视频生成工具 Haiper。
题图来源:Haiper
Haiper 的两位创始人都获得了牛津大学机器学习方向的博士学位,在该领域拥有丰富的知识和实践经验。苗亦舒曾供职于 TikTok,王子宇则在谷歌和 DeepMind 担任过研究员。
Haiper 于2022年正式成立,一开始的方向是 AI3D 建模。而根据创始人的说法,团队在半年前决定将创业方向改为 AI 视频生成,半年时间,他们推出了 Haiper 的测试版。
目前,Haiper 已经完成了两轮融资,总融资额达到1920万美金。最近的一轮融资额为1380万美元,由 Octopus Ventures 领投,5Y Capital 跟投。
完全免费的视频生成工具
与其他视频生成产品采用订阅付费模式不同,Haiper 目前完全免费,用户只需访问 Haiper 官网就可以使用。
图片来源:Haiper 官网
但是,目前 Haiper 只能生成最长2秒的高清视频,和最长4秒的标清视频。目前 Pika、runway、Stable Video 等主流产品直接生成的视频最长4秒,可扩展到16秒,但 Sora 则能生成最长60秒的视频,但目前只有 Demo。
除了视频生成功能外,Haiper 还提供视频卡通化、照片卡通化、重绘视频等功能,未来还将引入扩展视频功能。
对于付费问题,创始人苗亦舒表示,目前 Haiper 的视频生成功能还不太成熟,实行付费订阅模式还“为时尚早”,公司的计划是,保持免费模式,并专注于建立社区生态。而在 ToB 方面,Haiper 已经与京东等企业合作,对商业场景进行探索。
Haiper(上)与Sora(下)在相同提示词下生成的视频
最终目标,构建通用AI模型
目前,Haiper 专注在面向 C 端用户的网站视频生成产品,但创始人透露,他们希望开发一个使用场景更广泛的视频生成模型。公司已经私下联系了一些开发者来测试 Haiper 的 API,并根据开发者的反馈来优化 AI 模型。此外,Haiper 还考虑将其模型开源,让更多的用户来优化模型,探索更丰富的使用场景。
对于下一阶段的目标,Haiper 团队表示,目前 AI 视频生成正在达到一个拐点,模型需要提高质量和准确性,以解决恐怖谷问题。
恐怖谷(Uncanny Valley)是指当人们看到人工智能
生成的拟真性较高的人物形象时,会产生厌恶的感觉
这要求模型不仅要理解大量视频和图像形式的训练素材,还要理解现实世界的物理规律和其中的信息交互方式,例如光线、运动、纹理和不同对象之间的交互。例如,AI 需要了解雨滴撞击物体表面时会如何飞溅,或者风吹过人脸时头发如何移动。这也是目前 Haiper 技术攻关的重点方向。
而未来,创始人苗亦舒表示,Haiper 的目标是建立一个具有完整感知能力的通用 AI 模型,而当前开发的视觉基础模型将使 AI 能够深入理解世界,并在生成的视频中更好地复制现实世界,为通用模型打下基础。
虽然理想很美好,但经过去年一整年的发展,AI 视频生成赛道其实也变得非常拥挤。OpenAI 的 Sora 在技术上一骑绝尘,已经融资超过2.3亿美金的 Runway 已经拥有了不少用户,占据了先手。此外,谷歌、Meta、Stability AI 等一众明星企业也都推出了自己的视频生成模型。Haiper 作为一款新产品想要切入市场,并在未来实现商业化,其实并不容易。
但是根据 a16z 的评论文章,目前人工智能视频工具大概只达到了类似当时 GPT-2的发展水平。也就是说,目前 AI 视频工具已经在技术上有所突破,但仍缺乏适用于普通用户的应用场景。
而如果 Haiper 能在视频拟真技术上有所突破,真正找到能够落地的应用场景,实现差异化。那么切入市场,甚至超越 Sora 等其他同类产品,也并非不可能。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】