报告人:罗彪 教授 中南大学
报告时间:2025年4月20日(周日)10:00-11:00
报告地点:东南大学九龙湖校区计算机楼513室
报告摘要:本报告将详细的分析一类强化学习优化控制方法:策略迭代。对于连续时间系统,分别针对线性系统、仿射非线性系统及非仿射非线性系统,分析策略迭代方法的起源和发展历程、从理论上分析了策略迭代方法与逐次逼近法的等价性。
报告人简介:罗彪,中南大学自动化学院教授、博士生导师、国家优秀青年科学基金获得者、湖南省科技创新领军人才、湖南省杰出青年科学基金获得者、IEEE Senior Member。近年来在IEEE TPAMI、Automatica、AAAI、IEEE TNNLS、IEEE TCYB、自动化学报等领域顶级学术期刊与会议上发表学术论文100余篇。2014-2018年在中国科学院自动化研究所任助理研究员、副研究员。现担任中国自动化学会(CAA)自适应动态规划与强化学习专业委员会副主任;现/曾担任国际期刊《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Emerging Topics in Computational Intelligence》、《Artificial Intelligence Review》、《Neurocomputing》与《Journal of Industrial & Management Optimization》副主编;获得中国自动化学会自然科学二等奖(1/2),亚太神经网络学会(APNNS)青年科学家奖。目前研究兴趣主要有:智能控制/决策/博弈、深度学习、强化学习。