Bacis-Algorithm-of-RL

该项目记录自己学习RL过程和对每个算法的理解，持续更新。

（每一个算法都会在附上代码的同时加上自己对原理的理解。其中大部分的原理讲解来自于李宏毅老师的蘑菇书--EasyRL,代码部分自己实现)

1.第一次更新 REINFORCE 2022.5.16

2.第二次更新 DQN 2022.5.28

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
基于价值函数的强化学习算法/基于价值函数的思想来源与逐步推导		基于价值函数的强化学习算法/基于价值函数的思想来源与逐步推导
强化学习与马尔可夫链		强化学习与马尔可夫链
DQN.ipynb		DQN.ipynb
LICENSE		LICENSE
README.md		README.md
REINFORCE.ipynb		REINFORCE.ipynb

Provide feedback