LEARNING FROM DELAYED REWARDS

被引:379
作者
KROSE, BJA
机构
关键词
D O I
10.1016/0921-8890(95)00026-C
中图分类号
TP [自动化技术、计算机技术];
学科分类号
0812 ;
摘要
引用
收藏
页码:233 / 235
页数:3
相关论文
empty
未找到相关数据