Reinforcement Learning
post by ISH GIRWAN

Courses/Tutorials

Books

Blogs

I think you can take the UC Berkeley course instead of David Silver's course as it's more up to date. Additionally you can check Arthur Juliani's blog series, it's really good.

相关课程

Calculus One, Coursera, Jim Fowler 
Calculus Two, Coursera, Jim Fowler
Multivariable Calculus, Khan Academy, Grant Sanderson
Linear Algebra, MIT, Prof. Gilbert Strang (so mechanical..)
Coding the Matrix, Brown University, Philip Klein
Introduction to Probability, The Science of Uncertainty Edx, MIT, Joh Tsitsiklis
微积分, coursera, 吉姆·福勒
微积分, coursera, 吉姆·福勒
多元微积分, 汗学院, grant sanderson
线性代数, 麻省理工学院教授 吉尔伯特·斯特朗(所以机械..)
编码矩阵, 布朗大学, 菲利普·克莱因
介绍概率, 不确定的科学, 麻省理工学院, joh tsitsiklis

以下是比较旧的RL Course by David Silver

UCL Course on RL
http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

Advanced Topics  2015 (COMPM050/COMPGI13)

Reinforcement Learning

Contact: d.silver@cs.ucl.ac.uk

Video-lectures available here

Lecture 1: Introduction to Reinforcement Learning

Lecture 2: Markov Decision Processes

Lecture 3: Planning by Dynamic Programming

Lecture 4: Model-Free Prediction

Lecture 5: Model-Free Control

Lecture 6: Value Function Approximation

Lecture 7: Policy Gradient Methods

Lecture 8: Integrating Learning and Planning

Lecture 9: Exploration and Exploitation

Lecture 10: Case Study: RL in Classic Games

Easy21 assignment

Discussion and announcements: http://groups.google.com/group/csml-advanced-topics

Previous RL exam questions and answers

最新文章

  1. 在asp.net WebForms中使用路由Route
  2. word20161205
  3. 做HDU1010 带出来一个小问题
  4. VS2010遇到_WIN32_WINNT宏定义问题
  5. iOS异步图片加载优化与常用开源库分析
  6. Linux下Oracle11G RAC报错:在安装oracle软件时报file not found一例
  7. Qt ImageProvider 的使用
  8. UVA699 dfs and map
  9. C++ 头文件系列(forward_list)
  10. Java多线程推荐使用的停止方法和暂停方法
  11. sql group句子
  12. 基于Spring Cloud的微服务入门教程
  13. Linux新增用户过程详解
  14. 怎么在父窗口调用它页面的iframe里面数据,进行操作?
  15. R基本图形示例及代码(持续收集)
  16. MySQL主从复制备份
  17. Binary Search-483. Smallest Good Base
  18. iOS swift项目IM实现,从长连接到数据流解析分析之Socket
  19. AI逻辑实现-取舍行为树还是状态机
  20. python https协议和InsecurePlatformWarning问题

热门文章

  1. [JavaScript]如何实现一个JS脚本能在browser和NodeJs里都是用
  2. DataGrip 使用--方法-..../
  3. apache 日志分割
  4. P1111 修复公路(并查集)
  5. hdu 6288(二分法加精度处理问题)
  6. spring boot——常用注解
  7. Mybatis学习笔记11 - 动态sql之trim标签
  8. Oracle基础篇--03DML语言
  9. java 开发体系参考学习
  10. formatter easyui 重命名