人工智能

World Labs的人工智能可从单张照片生成交互式3D场景

字号+作者:cnBeta.COM 来源:cnBeta 2024-12-03 03:13 评论(创建话题) 收藏成功收藏本文

WorldLabs是一家由人工智能先驱李飞飞创办的初创公司,该公司发布了其首个项目:一个人工智能系统,可从单张图像生成类似于视频游戏的3D场景。很多人工智能'...

WorldLabs是一家由人工智能先驱李飞飞创办的初创公司,该公司发布了其首个项目:一个人工智能系统,可从单张图像生成类似于视频游戏的3D场景。很多人工智能系统都能将照片转化为三维模型和环境。但是,WorldLabs的场景是独特的,因为它们是互动的,而且是可修改的。nfo品论天涯网

世界实验室在一篇博文中写道:"[我们的技术]可以让您进入任何图像,并以三维方式进行探索。除了输入图像之外,一切都会生成"。nfo品论天涯网

nfo品论天涯网

WorldLabs的系统将图像转换为可探索的交互式3D场景。图片来源:世界实验室nfo品论天涯网

任何人只要有键盘和鼠标,就可以在WorldLabs网站上的演示中探索人工智能生成的场景,这些场景看起来令人印象深刻--虽然有点卡通。它们是在浏览器中实时渲染的,有一个可控摄像头,可调节模拟景深(DoF)。景深效果越强,背景物体就越模糊。nfo品论天涯网

WorldLabs的系统是新兴人工智能类别"世界模型"的一部分。这些模型可以模拟游戏和3D环境,但存在伪造和一致性问题。例如,初创公司Decart的Minecraft仿真世界模型Oasis分辨率较低,很快就会"忘记"关卡的布局。nfo品论天涯网

相比之下,WorldLabs的方法可以确保场景在生成后保持不变,并遵守基本的物理定律,这意味着它们具有实体感和深度。nfo品论天涯网

WorldLabs的系统还可以在场景中应用交互效果和动画,如改变物体的颜色和动态照明背景。nfo品论天涯网

nfo品论天涯网

由WorldLabs系统生成的场景。图片来源:世界实验室nfo品论天涯网

"大多数生成式人工智能工具都是制作图片或视频等2D内容,"WorldLabs写道。"三维生成则提高了控制和一致性。这将改变我们制作电影、游戏、模拟器和其他物理世界数字表现形式的方式"。nfo品论天涯网

现在,当然还有改进的余地。WorldLabs的场景并不是完全可探索的--你的移动被限制在一个很小的区域内。偶尔也会出现渲染错误,例如物体以不自然的方式混合在一起。但世界实验室表示,这只是一个"早期预览"。nfo品论天涯网

这家初创公司在博客中写道:"我们正在努力改进生成世界的大小和保真度,并尝试让用户与之互动的新方法。"nfo品论天涯网

nfo品论天涯网

WorldLabs网站上的部分演示。效果可实时应用于场景。图片来源:WorldLabsnfo品论天涯网

WorldLabs于今年早些时候成立,已募集了2.3亿美元的风险投资,投资者包括AndreessenHorowitz(a16z)、AshtonKutcher、英特尔资本、AMDVentures和埃里克-施密特(EricSchmidt)。该公司的估值超过10亿美元,希望能在2025年推出首款产品。nfo品论天涯网

除互动场景外,WorldLabs还计划开发对艺术家、设计师、开发人员、电影制作人和工程师等专业人士有用的工具。它的目标客户包括视频游戏开发商和电影制片厂。nfo品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]