为进一步活跃学术氛围,引导广大学生的专业兴趣,6月27日晚上19:00,人工智能学院通过线上方式举办人工智能论坛第14期“多智能体马尔可夫博弈及纳什均衡求解”,主讲人为中国科学院自动化研究所副研究员朱圆恒,报告由人工智能学院郭磊副教授主持。
报告伊始,郭磊副教授介绍了本次报告的主题、中国科学院自动化研究所副研究员朱圆恒的个人简介、学术成就和研究领域等。随后,朱圆恒老师围绕近年来越来越多关注的马尔可夫博弈问题展开论述,解释了单智能体和多智能体的区别,并讲述了包括合作类型、对抗类型、合作-对抗混合类型的博弈问题分类。接着,朱老师分析和探讨了求解马尔可夫博弈及其纳什均衡的主要办法,讲解了神经网络虚拟自博弈、PSRO框架及其应用,梳理了现有方法的不足。然后,朱老师讲解了一种基于强化学习的学习方法,适合于任意数量玩家参与的马尔可夫博弈以及对应的纳什均衡求解,并通过理论分析和典型示例,表明其方法的有效性。之后,朱老师讲述了连续时间学习动力学和经验策略优化。最后,朱老师对此次报告做了简单总结,展望了围绕虚拟游戏上的博弈对抗来解决现实世界实体问题的下一目标,并热心回答了与会师生的疑问。
本次报告内容丰富,通过中国科学院自动化研究所副研究员朱圆恒老师的讲解,与会师生了解了多智能体马尔可夫博弈及纳什均衡求解。后续,人工智能学院将持续开展人工智能论坛活动,为丰富学院学术氛围,促进学术交流提供平台。