共 10 条
[6]
最优控制理论与应用[M]. 高等教育出版社 , 张洪钺,王青编著, 2006
[7]
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[8]
马尔可夫决策过程引论[M]. 西安电子科技大学出版社 , 胡奇英,刘建庸著, 2000
[10]
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)

