以Meta的新模型为例,V-JEPA2能够识别出从桌子上滚落的球会掉到地上,也能判断视线之外的物体并未凭空消失。
人工智能一直是Meta首席执行官马克·扎克伯格(MarkZuckerberg)关注的重点领域,因为公司正面临来自OpenAI、微软和谷歌等参与者的竞争。知情人士向CNBC透露,Meta计划向人工智能公司ScaleAI投资140亿美元,并聘请其首席执行官亚历山大·王(AlexandrWang)以加强自身AI战略。
Meta强调,V-JEPA2模型在送货机器人和自动驾驶汽车等机器上的应用优势明显。这类设备需要能够实时理解周围环境,才能在物理世界中顺利导航。
Meta称,与依赖大量标注数据或视频素材的传统方法不同,V-JEPA2在简化的“潜在空间”(latentspace)中进行推理,从而理解物体如何运动、互动和反馈。
Meta首席AI科学家杨立昆(YannLeCun)周三在巴黎VivaTech大会的视频演讲中表示:“让机器理解物理世界,与让它们理解语言有本质区别。”
他补充道:“世界模型就像现实的抽象数字孪生体,AI可以借此理解世界、预测自身行为的后果,从而制定实现特定任务的行动方案。”
AI领域的下一个风口?
近期,研究者的关注点已不再局限于生成式AI应用背后的大语言模型(如OpenAI的ChatGPT和GoogleGemini),世界模型因此在AI社区引发了极大关注。
去年9月,知名AI研究员李飞飞为其新创业公司WorldLabs融资2.3亿美元,目标是打造更好理解物理世界结构的“大型世界模型”(largeworldmodels)。
与此同时,谷歌旗下DeepMind团队也在开发名为Genie的世界模型。据称,该模型能够实时模拟游戏和三维环境。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】