Google和特拉维夫大学的一些人创建了一个名为GameNGen的新游戏引擎,它完全由神经模型(又称人工智能)实时驱动。其要点是,他们训练了一个强化学习代理(RL-agent)来玩《毁灭战士》。这个RL代理会一遍又一遍地玩游戏,同时记录并存储每次的游戏过程,学习如何不被射杀、吃掉或以其他方式死亡,同时也学习如何与环境进行简单的互动。
其次是扩散模型--这实际上是一种学习模型,在对数据进行去噪处理以恢复图像昔日的光彩之前,通过许多步骤用噪声破坏原本完美的图像,这使它在预测和创建图像方面非常出色。在这个特殊的案例中,它是一个游戏引擎,能够根据前一帧预测下一帧的游戏内容。
通常情况下,纹理、精灵、模型、着色器、预制件等都保存在本地,并在每个关卡开始时加载。每个关卡还会预载独特的物理交互。
扩散器模型可以预测并绘制下一帧的画面,例如,武器发射时的样子、发射的目标,以及霰弹对击中物体的物理影响。再加上一些用户输入,现在你就拥有了一款AI生成的游戏。游戏是实时生成和交互的,没有预加载或缓存。本例中使用的是DOOM,但任何游戏都可以使用。甚至是还不存在的游戏。理论上,如果给GameNGen一些参数,它也可以自己制作游戏。
所有这些都是通过单个张量处理单元(TPU)实现的--TPU类似于处理图形的GPU,但专为人工智能设计,用于大容量、低精度的计算处理--能够达到20fps。这与现代游戏的60fps基准相去甚远,但正如每项新技术一样,它只会不断进步。1993年的老式版本最高运行速度为35fps。
在单TPU设置下,内存成为一个问题,人工智能模型只能"记住"大约三秒钟的游戏时间,然后在用户闯关时"忘记"。 虽然人工智能能够推断出大部分数据,比如你的弹药数量和你是否已经打过地图上的某个特定区域,但由于上下文长度只有三秒钟左右,有时会导致错误。
另一个值得注意的事实是,仅仅依靠RL代理进行训练也有其缺陷;与使用RL代理试图获得最高分和找到FPS游戏中经常隐藏的所有秘密地点不同,训练RL代理的目的是从普通人可能的游戏方式中收集数据。在训练过程中,RL代理可以访问其之前执行的32次操作。
根据GameNGen发布的白皮书,"我们的代理即使在训练结束后,仍然无法探索所有的游戏地点和交互,从而在这些情况下导致错误的行为"。
一直以来,电子游戏都是由编写了数百万行代码的人来制作的。GameNGen是第一个依靠神经模型的游戏;恕我直言,它可能会改变游戏规则。
从最初在DOS上发布,到由人工智能运行生成......30多年前,谁能想到这样的事情?生成式人工智能游戏引擎是未来的趋势吗?我们是否只需拥有一个连接到网络的游戏机,然后给它一些提示,就能开始玩完全按照我们的口味定制的独特游戏?
希望了解更多,请点击这里查看完整的白皮书(PDF)。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】