学术沙龙：面向物理世界强化学习的一些研究进展电子科技大学成电新闻网

分享到微信 ×

打开微信“扫一扫”
即可将网页分享至朋友圈

学术沙龙：面向物理世界强化学习的一些研究进展

文：教师发展中心来源：计算机学院党委教师工作部、人力资源部（教师发展中心）时间：2018-10-11 4746

本次“学术沙龙”教师发展中心邀请南京大学俞扬副教授，与我校师生分享他在强化学习方面的研究及进展。具体安排如下，欢迎感兴趣的师生参加：

　　一、主　题：面向物理世界强化学习的一些研究进展

　　二、时　间：2018年10月15日（周一）10:00-11:00

　　三、地　点：清水河校区宾诺咖啡

　　四、主讲人：南京大学俞扬副教授

　　五、主持人：计算机科学与工程学院（网络空间安全学院）　徐增林教授

　　六、交流内容：

　　强化学习旨在通过环境交互来学习最优策略，在计算机围棋、Atari等游戏上获得成功，是实现自主智能的主要途径之一，最近受到高度关注。由于面临未知环境，经典强化学习需要不断地探索环境、在环境中试错，从而学习高回报策略，因此依赖大量自主环境交互数据。从现有成功案例来看，强化学习突出表现的案例仍以虚拟环境为主，例如游戏、棋类等，可在计算机中高速推演来快速获得百万级以上的数据。而在物理环境中进行强化学习，产生如此大量的数据将造成高昂的时间和经济开销，因此在现实应用中发挥强化学习的能力还面临很大的障碍。为促进强化学习在现实应用中落地，我们尝试从多个角度提高强化学习方法的样本利用效率、降低样本需求，并在真实的商品推荐应用、以及大规模游戏星际争霸II上进行了尝试。

　　七、主讲人简介：

　　俞扬，博士，南京大学副教授。主要研究领域为机器学习、强化学习，目前研究集中于提升强化学习样本利用效率。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位，获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所（LAMDA）从事教学与科研工作。发表论文40余篇，包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS等，获得5项国际论文和竞赛奖，入选2018年IEEE Intelligent Systems杂志评选的AI's 10 to Watch，获2018 PAKDD Early Career Award，受邀在IJCAI’18作关于强化学习的Early Career 报告。

　　八、主办单位：人力资源部教师发展中心

　　　　承办单位：计算机科学与工程学院（网络空间安全学院）

　　　　　　　　　　　　　　　　　　　　　人力资源部教师发展中心

　　　　　　　　　　　　　　　　　　　　　　　2018年10月10日