基于多步回溯Q(λ)学习的互联电网随机最优CPS控制

被引:15
作者
余涛 [1 ]
周斌 [1 ,2 ]
陈家荣 [2 ]
机构
[1] 华南理工大学电力学院
[2] 香港理工大学电机工程学系
基金
广东省自然科学基金;
关键词
自动发电控制; 控制性能标准; 多步Q(λ)学习; 非马尔可夫环境; 随机最优控制;
D O I
10.19595/j.cnki.1000-6753.tces.2011.06.028
中图分类号
TM732 [电力系统的运行];
学科分类号
080802 ;
摘要
针对非马尔可夫环境下火电占优的互联电网AGC控制策略,引入随机最优控制中Q(λ)学习的"后向估计"原理,可有效解决火电机组大时滞环节带来的延时回报问题。本文以CPS1/CPS2滚动平均值为状态输入,将CPS评价指标与松弛目标根据线性加权原则转化为MDP奖励函数,从长期的角度提出一种在线反馈学习结构的随机最优CPS控制。统计性仿真试验表明,所提CPS控制具有较强的适应性和动态性能,在保证CPS合格率基础上能有效减少调度端的平均发令次数和反调次数。同时,该策略提供了一种可通过修正松弛因子在线调整AGC系统的"松弛度",可降低发电成本及机组磨损,从而实现CPS松弛控制。
引用
收藏
页码:179 / 186
页数:8
相关论文
共 9 条
[1]   Q-LEARNING [J].
WATKINS, CJCH ;
DAYAN, P .
MACHINE LEARNING, 1992, 8 (3-4) :279-292
[2]   基于Q学习的互联电网动态最优CPS控制 [J].
余涛 ;
周斌 ;
陈家荣 .
中国电机工程学报, 2009, 29 (19) :13-19
[3]   基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略 [J].
李滨 ;
韦化 ;
农蔚涛 ;
李林峰 ;
吴阿琴 ;
阳育德 .
中国电机工程学报, 2008, (25) :56-61
[4]   基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[5]   考虑控制性能标准的AGC机组经济补偿研究 [J].
贾德香 ;
程浩忠 ;
熊虎岗 ;
范宏 ;
陈明 ;
马鸿杰 .
中国电机工程学报, 2007, (31) :52-56
[6]   互联电网AGC分层控制与CPS控制策略 [J].
高宗和 ;
滕贤亮 ;
涂力群 .
电力系统自动化, 2004, (01) :78-81
[7]  
最优控制理论与应用.[M].张洪钺;王青编著;.高等教育出版社.2006,
[8]  
强化学习理论及应用.[M].张汝波编著;.哈尔滨工程大学出版社.2001,
[9]  
马尔可夫决策过程引论.[M].胡奇英;刘建庸著;.西安电子科技大学出版社.2000,