选择字号

基于深度强化学习的多代理马尔科夫游戏

分享到: 分享到QQ空间

深度强化学习在许多复杂的决策问题中都有很好的表现,然而在许多场景下,多代理互动问题带来了对强化学习的挑战。多代理场景作为深度强化学习中的另一个挑战,提出了一种基于最小最大的深度Q学习算法,在决策过程相比于传统方法中,该算法可以应对对手的变化并且做出更好的回应。通过研究对机器人足球的游戏实验的深入分析,进一步展示了该算法的能力,并且展示了该算法可以很好地应用于其他多代理场景。(本文共计4页)       [继续阅读本文]

下载阅读本文     订阅本刊   
如何获取本文>>          如何获取本刊>> 

相关文章推荐

电脑编程技巧与维护杂志2018年第12期
电脑编程技巧与维护
主办:信息产业商会
出版:电脑编程技巧与维护杂志编辑部
出版周期:月刊
出版地:北京市

本期目录