英雄联盟如何指挥团战?
英雄联盟是一个多人游戏,需要默契的团队合作。在瞬息万变的战斗中,如何做出正确的决定非常重要。最近,数据分析师菲利普·奥斯本(Philip Osborne)提出了一种利用人工智能技术提高英雄联盟团队决策水平的方法,并将其开放。该方法不仅参考了大量真实游戏的统计结果,还考虑了当前玩家的喜好。
该项目由三部分组成,旨在将MOBA游戏《英雄联盟》的战斗建模为马尔可夫决策过程,然后应用强化学习来寻找最佳决策,这也考虑到了玩家的偏好,超越了简单的“记分牌”统计。
作者在Kaggle上传了模型的各个部分,让大家更好的了解数据处理流程和模型结构:
第一部分:/Osborne/lol-ai-model-Part-1-initial-EDA-and-first-MDP第二部分:/Osborne/lol-ai-model-Part-2-重新设计-带金MDP-diff第三部分:
目前这个项目还在进行中,我们希望在游戏中展示复杂的机器学习方法能做什么。这个游戏的分数不仅仅是一个简单的“记分牌”统计结果,如下图所示:
动机和目标
英雄联盟是一个团队竞争电子游戏。每场比赛有两队(每队五人)进行招兵和杀人的比赛。获得优势会让玩家比对手更强(装备更好,升级更快),如果一方优势持续增加,获胜几率也会增加。所以后续的打法和比赛的走向取决于之前的打法和战局,最后一方会摧毁对方的基地,从而赢得比赛。
像这样基于先例建模并不新鲜;多年来,研究人员一直在思考如何将这种方法应用到篮球和其他运动中。本文更详细地解释了如何映射反馈。
如何收集反馈决定了我们的模型能有多成功。在我看来,这样做的最终目的是为玩家的下一步决策提供最好的实时建议。这样,玩家可以从根据游戏数据计算出的几个最佳决策(根据获胜情况排名)中进行选择。可以在多个游戏中跟踪玩家的选择,进一步了解和理解玩家的喜好。这也意味着我们不仅可以跟踪决策的结果,还可以预测玩家的意图(比如玩家试图拆塔却被杀),甚至可以为更高级的分析提供信息。
当然,这样的想法可能会引起团队成员的分歧,也可能会让游戏不那么精彩。但我认为这种想法可能对低级别或常规级别的玩家有利,因为他们很难清晰地传达自己的游戏决策。这也可能有助于识别“巨蟹座”球员,因为球队希望通过投票制度统一意见,然后就可以看出“巨蟹座”球员是否没有按照球队计划行事,忽视了队友。
实时游戏环境中的模型推荐投票系统示例