讲座题目:强化学习简介
报告人:张戎(软件工程师,腾讯)
报告时间:2017年11月10日14:00—15:00
报告地点:经管院B127
主办单位:数理经济与数理金融系
摘要:本次讲座将会介绍
(1)强化学习:Markov决策过程,如何求解强化学习问题。
(2)深度学习:卷积神经网络,循环神经网络。
(3)强化学习与深度学习的结合:如何使用 DQN 来玩 Flappy Bird 等简单游戏。
简介:张戎博士,2009年毕业于南京大学数学系,获本科学位。2015年毕业于新加坡国立大学,获博士学位,后加入腾讯从事机器学习相关工作。目前主要工作方向:研究数据挖掘与机器学习在推荐系统,业务安全系统,智能运维系统上的使用。调研量子计算的前沿理论。