策略迭代：一类强化学习优化控制方法

发布者：曹玲玲发布时间：2025-04-17浏览次数：10

报告人：罗彪教授中南大学

报告时间：2025年4月20日（周日）10:00-11:00

报告地点：东南大学九龙湖校区计算机楼513室

报告摘要：本报告将详细的分析一类强化学习优化控制方法：策略迭代。对于连续时间系统，分别针对线性系统、仿射非线性系统及非仿射非线性系统，分析策略迭代方法的起源和发展历程、从理论上分析了策略迭代方法与逐次逼近法的等价性。

报告人简介：罗彪，中南大学自动化学院教授、博士生导师、国家优秀青年科学基金获得者、湖南省科技创新领军人才、湖南省杰出青年科学基金获得者、IEEE Senior Member。近年来在IEEE TPAMI、Automatica、AAAI、IEEE TNNLS、IEEE TCYB、自动化学报等领域顶级学术期刊与会议上发表学术论文100余篇。2014-2018年在中国科学院自动化研究所任助理研究员、副研究员。现担任中国自动化学会（CAA）自适应动态规划与强化学习专业委员会副主任；现/曾担任国际期刊《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Emerging Topics in Computational Intelligence》、《Artificial Intelligence Review》、《Neurocomputing》与《Journal of Industrial & Management Optimization》副主编；获得中国自动化学会自然科学二等奖（1/2），亚太神经网络学会（APNNS）青年科学家奖。目前研究兴趣主要有：智能控制/决策/博弈、深度学习、强化学习。

导航

策略迭代：一类强化学习优化控制方法