Reinforcement Learning

Implementation and report on a Reinforcement Learning problem solved by Deep RL.

Link to the Report.

Additionally, the Report is saved in the folder report along with the meeting log and the distribution of the work.

Running Experiments for Hyperparameter Tunning

Running these below mentioned scripts creates a new directory inside experiments with algorithm and the hyperparameters as the directory name, example sarsa_adagrad/ep0.1_be0.2_ga0.3_et0.4/

measurements_sarsa.sh
measurements_sarsa_adagrad.sh
measurements_q_learning.sh
measurements_ex_replay.sh

In addition to this, the hyperparameters are saved in a text file hyperparam.txt and the plots are also saved inside this directory.

Experience replay: in ex_replay.py incremental version is stored. Once the episode is finished we take the batch fromthe database and unfold it backwards recalculating Q values. In Assignement - default.py mini batch version is realized.

Name		Name	Last commit message	Last commit date
Latest commit History 141 Commits
Reward scheme (-1)-0-1		Reward scheme (-1)-0-1
Reward scheme 0--0.1-1		Reward scheme 0--0.1-1
Reward scheme 0-0-1		Reward scheme 0-0-1
Reward scheme 0-0.1-1		Reward scheme 0-0.1-1
Reward scheme 1-0.1-0		Reward scheme 1-0.1-0
experiments		experiments
plotting		plotting
report		report
.gitignore		.gitignore
Assignment - default parameters.ipynb		Assignment - default parameters.ipynb
Chess_env.py		Chess_env.py
README.md		README.md
chess_student.py		chess_student.py
degree_freedom_king1.py		degree_freedom_king1.py
degree_freedom_king2.py		degree_freedom_king2.py
degree_freedom_queen.py		degree_freedom_queen.py
ex_replay.py		ex_replay.py
generate_game.py		generate_game.py
measurements_ex_replay.sh		measurements_ex_replay.sh
measurements_q_learning.sh		measurements_q_learning.sh
measurements_sarsa.sh		measurements_sarsa.sh
measurements_sarsa_adagrad.sh		measurements_sarsa_adagrad.sh
q_learning.py		q_learning.py
sarsa.py		sarsa.py
sarsa_adagrad.py		sarsa_adagrad.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement Learning

Running Experiments for Hyperparameter Tunning

SARSA vs. Q-Learning

Number of Steps per Episode

Reward

Loss

SARSA vs. Q-Learning vs. SARSA Adagrad vs. Q-Learning with Expererience Replay

Number of Steps per Episode

Reward

Loss

About

Releases

Packages

Contributors 3

Languages

amohap/reinforcement-learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning

Running Experiments for Hyperparameter Tunning

SARSA vs. Q-Learning

Number of Steps per Episode

Reward

Loss

SARSA vs. Q-Learning vs. SARSA Adagrad vs. Q-Learning with Expererience Replay

Number of Steps per Episode

Reward

Loss

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages