解读AlphaGo背后的人工智能技术

被引:26
作者
刘知青
吴修竹
机构
[1] 北京邮电大学软件学院
关键词
AlphaGo; 深度学习; 价值网络; 策略网络;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
随着人工智能在各个领域的应用,越来越多的问题通过人工智能得到更优的解决,但是围棋因其本身的复杂度一直是人工智能领域的难解之题.AlphaGo团队利用了人工智能中的一个重要分支—深度学习训练了一款围棋人工智能程序,并在2016年3月与职业九段选手李世石的对弈中以4:1的比分获胜,受到了大众的广泛关注.本文介绍了AlphaGo这一程序背后的复杂的网络构造以及不同网络的优缺点.
引用
收藏
页码:1685 / 1687
页数:3
相关论文
共 3 条
[1]   深度强化学习综述:兼论计算机围棋的发展 [J].
赵冬斌 ;
邵坤 ;
朱圆恒 ;
李栋 ;
陈亚冉 ;
王海涛 ;
刘德荣 ;
周彤 ;
王成红 .
控制理论与应用, 2016, 33 (06) :701-717
[2]   阿法狗围棋系统的简要分析 [J].
田渊栋 .
自动化学报, 2016, 42 (05) :671-675
[3]  
Monte Carlo and quasi-Monte Carlo methods[J] . Russel E. Caflisch.Acta Numerica . 1998