人工智能

Yann LeCun:生成模型不适合处理视频,AI 理解视频得在抽象空间中进行预测

字号+作者: 来源:站长之家 2024-01-23 14:38 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com) 1月23日 消息:根据图灵奖得主、Meta 首席 AI 科学家在世界经济论坛上的讲话,生成模型不适合处理视频,AI得在抽象空间中进行预测。'...

站长之家(ChinaZ.com) 1月23日 消息:根据图灵奖得主、Meta 首席 AI 科学家在世界经济论坛上的讲话,生成模型不适合处理视频,AI得在抽象空间中进行预测。在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。z3M品论天涯网

斯坦福大学教授指出了理解因果关系对于构建未来AI系统的重要性。z3M品论天涯网

Yann LeCun认为,适合用来处理视频的模型并不是我们现在大范围应用的生成模型,新的模型应该学会在抽象的表征空间中预测,而不是在像素空间中。z3M品论天涯网

3_1705891276262_ai2023_a_note_that_reads_2024_is_a_year_of_AI_explosion_5bff7947-27c0-499d-87f9-e9d5833c4b34.pngz3M品论天涯网

图源备注:图片由AI生成,图片授权服务商Midjourneyz3M品论天涯网

视频预测的难题主要在于像素空间的复杂性,以及对于物体摆放方式和运动轨迹的预测。这些具体的像素空间预测都很困难,导致传统生成模型在视频处理中效果不佳。视频输入需要新的架构来处理,以在抽象表征空间中进行预测。z3M品论天涯网

AI系统需要在抽象表征空间中进行预测,而不是在具体的像素空间,同时也需要理解因果关系。当前模型中缺失的重要能力是理解因果关系,尤其在与物质世界的交互中更为重要。z3M品论天涯网

为了解决视频处理中的难题,需要创造新的科学方法和技术,使AI系统能够像人类一样利用信息。这将需要一些科学和技术上的突破,对于在制造业、生物学等领域进行常识推理都具有重要意义。z3M品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]