人工智能

Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利

字号+作者: 来源:站长之家 2023-11-24 17:08 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com) 11 月 24 日消息:在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一'...

站长之家(ChinaZ.com) 11 月 24 日消息:在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。3T5品论天涯网

谷歌,google3T5品论天涯网

与此前的 AlphaZero 算法不同,后者只能解决完全信息游戏(如国际象棋和围棋),而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍,实现在多种游戏中的胜利。3T5品论天涯网

此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行,但随后几位团队成员于 2022 年 1 月离开 Google,并在今年 1 月 Google 解散了剩余的大部分团队成员。3T5品论天涯网

Finbarr Timbers,目前在 Midjourney 研究实验室工作,同时也是该研究的作者之一,解释说:「我们的算法能够基于游戏规则进行推理。例如,它学习所有这些游戏(国际象棋、扑克、围棋或苏格兰场),仅仅通过规则,而不需要更多信息。」他继续说道:「由此,它可以确定您应该采取的行动,以及您是否获胜。」3T5品论天涯网

「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说:「『遗憾』意味着『如果你进行了最优玩法,你本可以做得多好,减去你实际玩得有多好』。」3T5品论天涯网

研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础,使其在大多数情况下找到最优策略。3T5品论天涯网

「游戏学习者」算法作为一款由人工智能驱动的游戏算法,在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础,还能够随着计算资源的增加而提高性能。3T5品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]