基于Q学习的互联电网动态最优CPS控制

被引:38
作者
余涛 [1 ]
周斌 [1 ]
陈家荣 [2 ]
机构
[1] 华南理工大学电力学院
[2] 香港理工大学电机工程系
基金
广东省自然科学基金;
关键词
自动发电控制; Q学习; 马尔可夫决策过程; 控制性能标准; 最优控制;
D O I
10.13334/j.0258-8013.pcsee.2009.19.015
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 ;
摘要
控制性能标准(control performance standard,CPS)下互联电网自动发电控制(automatic generation control,AGC)系统是一个典型的不确定随机系统,应用基于马尔可夫决策过程(Markov decision process,MDP)理论的Q学习算法可有效地实现控制策略的在线学习和动态优化决策。将CPS值作为包含AGC的电力系统"环境"所给的"奖励",依靠Q值函数与CPS控制动作形成的闭环反馈结构进行交互式学习,学习目标为使CPS动作从环境中获得的长期积累奖励值最大。提出一种实用的半监督群体预学习方法,解决了Q学习控制器在预学习试错阶段的系统镇定和快速收敛问题。仿真研究表明,引入基于Q学习的CPS控制可显著增强整个AGC系统的鲁棒性和适应性,有效提高了CPS的考核合格率。
引用
收藏
页码:13 / 19
页数:7
相关论文
共 10 条
[1]   基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略 [J].
李滨 ;
韦化 ;
农蔚涛 ;
李林峰 ;
吴阿琴 ;
阳育德 .
中国电机工程学报, 2008, (25) :56-61
[2]   基于CPS统计信息自学习机理的AGC自适应控制 [J].
余涛 ;
陈亮 ;
蔡广林 .
中国电机工程学报, 2008, (10) :82-87
[3]   基于CPS的AGC控制策略研究 [J].
唐跃中 ;
张王俊 ;
张健 ;
陈明 .
电网技术, 2004, (21) :75-79
[4]   互联电网AGC分层控制与CPS控制策略 [J].
高宗和 ;
滕贤亮 ;
涂力群 .
电力系统自动化, 2004, (01) :78-81
[5]   学习方法整定电力系统非线性控制器参数 [J].
张采 ;
周孝信 ;
蒋林 ;
吴青华 .
中国电机工程学报, 2000, (04) :2-6
[6]  
最优控制理论与应用[M]. 高等教育出版社 , 张洪钺,王青编著, 2006
[7]  
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[8]  
马尔可夫决策过程引论[M]. 西安电子科技大学出版社 , 胡奇英,刘建庸著, 2000
[9]   A reinforcement learning approach to automatic generation control [J].
Ahamed, TPI ;
Rao, PSN ;
Sastry, PS .
ELECTRIC POWER SYSTEMS RESEARCH, 2002, 63 (01) :9-26
[10]  
Technical Note: Q-Learning[J] . Christopher J.C.H. Watkins,Peter Dayan.Machine Learning . 1992 (3)