(录用定稿)网络首发时间:2019-12-11 10:33:51

复杂过程工业控制一直是控制应用领域研究的前沿问题。浓密机作为一种复杂大型工业设备广泛用于冶金、采矿等领域。由于其在运行过程中具有多变量、非线性、高时滞等特点,浓密机的底流浓度控制技术一直是学界、工业界的研究难点与热点。本文提出了一种基于强化学习技术的浓密机在线控制算法。该算法在传统启发式动态规划(Heuristic dynamic programming,HDP)算法的基础上,设计融合了评价网络与模型网络的双网结构,并提出了基于短期经验回放的方法用于增强评价网络的训练准确性,实现了对浓密机底流浓度的稳定控制,并保持控制输入稳定在设定范围之内。最后,通过浓密机仿真实验的方式验证了算法的有效性,实验结果表明本文提出的方法在时间消耗、控制精度上优于其他算法。

国家重点基础研究发展计划(No.2016YFB0700500); 国家自然科学基金(No.61572075,No.61702036,No.61873299)资助;

自适应动态规划; 强化学习; 最优控制; 浓密机控制; 神经网络;

10.16383/j.aas.c190348

TH69;TP273

中国知网独家网络首发,未经许可,禁止转载、摘编。

自动化学报

Acta Automatica Sinica

ISSN:0254-4156

中文核心期刊

38162806K
在线咨询 用户反馈