{$cfg_webname}
主页 > 外文翻译 > 其他翻译 >

基于ADP与MCTS算法的五子棋

来源:56doc.com  资料编号:5D24961 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D24961
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 帮助
资料介绍

基于ADP与MCTS算法的五子棋(中文7900字,英文PDF)
摘要
受AlphaGo核心思想的启发,我们将自适应动态规划(ADP)方法训练的神经网络与运用于五子棋的蒙特卡罗树搜索(MCTS)算法相结合。MCTS算法基于蒙特卡罗模拟方法,经过大量模拟并生成游戏搜索树。 我们展开该树并搜索其中叶节点的结果。结果,我们获得了MCTS获胜率。ADP和MCTS方法分别用于估算获胜率。我们对这两个中奖率进行加权,以选择最大一个的作用位置。实验结果表明,该方法可以有效地消除神经网络评价函数的“短视”缺陷。使用我们提出的方法,游戏的最终预测结果更准确,并且它优于基于ADP算法的五子棋。
关键词:自适应动态规划; 蒙特卡洛树搜索;五子棋
 

基于ADP与MCTS算法的五子棋

 

推荐资料