人工智能

中科院和汪军团队发布 大模型玩星际争霸秀到起飞

字号+作者: 来源:站长之家 2023-12-29 09:17 评论(创建话题) 收藏成功收藏本文

要点:1、中国科学院自动化研究所与伦敦大学学院合作,将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。2、团队通过LLM理解与分析能力来提高星际AI的'...

要点:AXu品论天涯网

1、中国科学院自动化研究所与伦敦大学学院合作,将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。AXu品论天涯网

2、团队通过LLM理解与分析能力来提高星际AI的长期战略规划与可解释性决策。AXu品论天涯网

3、在测试中,LLMagent涌现出了超越AlphaStar的危险预测和兵种转型能力,以及前期快攻、前期侦察等类人策略。AXu品论天涯网

站长之家(ChinaZ.com) 12月29日 消息:面对星际争霸II这一巨大挑战,团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架,将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语义动作,而微观操作则交由一套固定的规则式方法处理。LLMagent能够在全新的战场上与游戏内置的AI展开较量。AXu品论天涯网

image.pngAXu品论天涯网

论文地址:https://arxiv.org/pdf/2312.11865.pdfAXu品论天涯网

项目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftIIAXu品论天涯网

在星际争霸II的战场上,进行有效决策需要及时处理大量复杂信息,进行合理的战略分析与长期规划,最终制定宏观战略决策。团队创新性地提出了「ChainofSummarization」方法。AXu品论天涯网

该方法通过单帧总结和多帧总结,提高了LLM在复杂环境中的理解和决策能力。在验证ChainofSummarization方法的有效性方面,团队选择了GPT-3.5-turbo-16k作为LLM。结果表明:ChainofSummarization不仅将LLM与游戏端的交互速度提升了十倍,还显著增强了模型对游戏情境的理解及决策能力。AXu品论天涯网

团队精心设计了一套复杂的提示词系统,包括游戏状态总结,状态分析,策略建议,最终决策。模型能够全面理解游戏的当前局势,分析敌我双方的策略,并提出具有战略深度的建议,最终做出多步的合理决策。这极大地提高了LLM的实时决策能力和长期规划能力,也极大提升了决策的可解释性。AXu品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]