- 应广大学员的要求,我们提供了课程配套代码的(lesson3-lesson5)的动态图框架版本, lesson1-lesson2不涉及神经网络,可沿用上级目录中的代码。
lesson3
:基于神经网络方法求解RL- dqn:使用 DQN 算法解决 CartPole 问题。
- homework:使用 DQN 算法解决 MountainCar 问题。
lesson4
:基于策略梯度求解RL- policy_gradient:使用 PG 算法解决 CartPole 问题。
- homework: 使用 PG 算法解决 Atari 游戏里的 Pong 环境。
lesson5
:连续动作空间上求解RL- ddpg:使用 DDPG 算法解决连续动作版本的 CartPole 问题。
- homework:使用 DDPG 算法解决四轴飞行器的悬停问题。
- Python 3.6/3.7/3.8
- paddlepaddle==2.2.0
- parl==2.0.3
- gym==0.18.0
- atari-py==0.2.6 (仅 lesson4 的 homework 需要安装)
- rlschool==0.3.1 (仅 lesson5 的 homework 需要安装)
可以直接安装本目录下的 requirements.txt
来完成以上依赖版本的适配。
pip install -r requirements.txt
进入每个示例对应的代码文件夹中,运行
python train.py