数十年来,各组织一直在构建复杂的数据集,并不断探索不同的方法来教授系统执行新任务。在部署能够快速适应和学习的技术方面,我们似乎正处于实现真正突破的边缘。去年,我们看到了大量引人入胜的研究。就拿卡内基梅隆大学在今年6月展示的VRB(视觉机器人桥)来说,该系统能够将从YouTube视频中学到的知识应用到不同的环境中,因此程序员不必考虑每一种可能的变化。
上个月,Google的DeepMind机器人团队展示了RT-2(机器人变形金刚2),令人印象深刻。该系统能够抽象出执行任务时的细枝末节。在所举的例子中,让机器人扔掉一个垃圾,并不需要程序员教机器人识别特定的垃圾、捡起来并扔掉,就能完成一项看似简单(至少对人类而言)的任务。
CMU本周重点介绍的其他研究将其工作与人类的早期学习进行了比较。具体来说,机器人人工智能代理被比作三岁的幼儿。从上下文来看,学习水平分为两类--主动学习和被动学习。
在这种情况下,被动学习是指通过向系统播放视频或在上述数据集上进行训练,教它执行任务。主动学习则如其所言--去执行一项任务并不断调整,直到正确为止。
RoboAgent由CMU和MetaAI(没错,就是那个Meta)联合开发,它将这两种学习方式结合在一起,就像人类一样。在这里,这意味着通过互联网观察正在执行的任务,并通过远程遥控机器人的方式进行主动学习。据该团队介绍,该系统能够从一个环境中吸取经验,并将其应用到另一个环境中,这与上文提到的VRB系统类似。
CMU机器人研究所的ShubhamTulsiani说:"具有这种学习能力的代理让我们更接近于一种通用机器人,它可以在不同的未知环境中完成各种任务,并随着积累更多经验而不断发展。RoboAgent可以使用有限的域内数据快速训练机器人,同时主要依靠互联网上大量可用的免费数据来学习各种任务。这可以让机器人在家庭、医院和其他公共场所等非结构化环境中发挥更大的作用"。
所有这一切中最酷的一点是,该数据集是开源的,可以普遍访问。它还可以与现成的机器人硬件一起使用,这意味着研究人员和公司都可以利用并建立一个不断增长的机器人数据和技能库。
机器人研究所的阿比纳夫-古普塔(AbhinavGupta)说:"与其他公司相比,RoboAgents的技能复杂性要丰富得多。我们已经展示了比现实世界中任何单一机器人代理所能实现的更多样化的技能,其效率和对未知场景的泛化规模都是独一无二的。"
在构建和部署多用途机器人系统方面,这一切都大有可为,有望最终成为通用机器人。我们的目标是创造出一种技术,能够超越我们在提到工业机器人时往往会想到的高度结构化环境中的重复性机器。当然,实际应用和扩展说起来容易做起来难。
说到这些机器人学习方法,我们更接近于起步阶段,但对于新兴的多用途系统来说,我们正在经历一个令人兴奋的时期。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】