全部 强化学习理论与实践(DECON113)
Reinforcement Learning
学时:48    学分:3
开课院系: 经贸学院
教学对象:本科生
课程性质:必修

课程简介

这是一门为数字经济专业本科生开始的新课,之前没有开设过。课程主要是围绕动态规划问题展开,把强化学习作为求解动态规划问题的一种操作方法。通过学习贝尔曼方程,了解马尔科夫决策过程的求解算法。把数据科学中的函数近似技术引入动态决策问题,把动态问题放入泛函空间的策略搜索中,寻求探索和利用的平衡。课程一方面涉及动态规划原理,另一方面涉及使用PyTorch来实现动态规划求解。多智能体决策和不完备信息动态规划会作为高等课题做初步介绍。

查看全部

课程团队

朱胜豪 主讲
国际经济贸易学院

先修课程

《机器学习方法》

教材或参考书

作者(译者): 王琦、杨毅远、江季
书名: 《强化学习教程》
出版社: 人民邮电出版社
出版日期: 2022年3月

选课答疑

查看全部

同类课程

文学选读(意)
外语学院意大利语系  徐映
中国经济金融概论
金融学院  陈涛