成电讲堂

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
加拿大阿尔伯塔大学LI YUXI博士举办线上系列讲座
文:梁一天 来源:软件学院 时间:2022-07-26 321

  7月7日-8日,由信息与软件工程学院举办的《Introduction to Reinforcement Learning and Its Application》系列线上讲座举行,本次讲座邀请到来自加拿大阿尔伯塔大学的LI YUXI博士,深入探讨强化学习的应用及其相关的知识。两天的讲座共三课,分别围绕强化学习(Reinforcement Learning)及其应用、马尔可夫决策过程和基于动态规划的规划过程进行讲解

7481DD90EFF34B9BFD3396855A8_711AD9C3_194

  LI YUXI博士在第一课中,结合三篇论文介绍了强化学习的基本框架、重要组成部分以及其中的相关示例。他讲到,强化学习问题在信息论、博弈论、自动控制等领域有得到讨论,被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能,可以在围棋和电子游戏中达到人类水平。第二课中,LI YUXI博士详细介绍了强化学习的常见模型-标准的马尔可夫决策过程(Markov Decision Process, MDP)。第三课中,LI YUXI博士则介绍了基于动态规划的规划过程,他提出强化学习理论侧重在线学习并试图在探索-利用(exploration-exploitation)间保持平衡。

  在为期两天的讲座中,同学们踊跃参与,与LI YUXI博士提问交流,LI YUXI博士则对同学们的问题一一予以解答。


  相关链接:

  LI YUXI,加拿⼤阿尔伯塔大学计算机科学博士。在arXiv上发表《深度强化学习综述》,获900余次引用。近期在arXiv上发表《深度强化学习:机遇与挑战》Deep Reinforcement Learning: Opportunities and Challenges。两次担任Machine Learning Journal特刊客座主编, 领衔组织ICML 2019、2021 workshops,在NeurIPS、AIStats、INFOCOM等发表多篇论文,多次担任AAAI 2019-2022,ACM Computing Surveys, Communications of ACM, PAMI, TKDD等审稿员。在加拿⼤创办人工智能公司attain.ai。


编辑:赵海玲  / 审核:林坤  / 发布:林坤