PokéLLMon是首个在战术战斗游戏中实现人类水平性能的LLM体现代理。它融合了三种关键策略:1)基于上下文的强化学习,即时利用从战斗中提取的文本描述反馈,迭代地优化其生成策略;2)知识增强生成,利用外部知识对抗幻觉,使代理能够及时和正确地行动;3)具有自一致性的动作生成,以减轻当代理面对强大对手并希望避免战斗时的惊慌切换现象。与人类玩家在线对战展示了PokéLLMon的人类级别战斗性能和策略,在梯队比赛中取得49%的胜率,在邀请赛中取得56%的胜率。此外,我们揭示了其对人类玩家的消耗战略和欺骗技巧的脆弱性。
点击前往PokéLLMon官网体验入口
需求人群:用于与人类玩家进行在线 Pokémon 战斗
使用场景示例:
在PokéLLMon网站上与其他玩家进行实时 Pokémon 对战。与朋友一起体验PokéLLMon的人类级别战斗性能。通过PokéLLMon学习战术战斗游戏的优秀策略。产品特色:
基于上下文的强化学习知识增强生成自一致性动作生成在线与人类玩家对战人类级别战斗性能和策略
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】