rlbook

Code for my walkthrough of: Reinforcement Learning An Introduction by Richard Sutton and Andrew Barto (http://incompleteideas.net/book/the-book.html)

Setup

Install uv (for linux below):

curl -LsSf https://astral.sh/uv/install.sh | sh

or with pip

# With pip.
pip install uv

Link to instructions for other OS's

Install the rlbook environment via uv:

uv sync

Run commands using the rlbook environment via uv:

uv run run.py

or by first activating the rlbook venv (this is my preferred workflow):

source ./venv/bin/activate

(Optional) Setup wandb for experiment tracking

Sign up for an account at wandb: https://app.wandb.ai/login?signup=true

Copy the api key from: https://wandb.ai/authorize

Login to wandb via:

wandb login

Quickstart

Algorithm implementations are located in the /src directory while the scaffolding code/notebooks for recreating/exploring Sutton & Barto are segmented into the experiments/ directory.

e.g. for recreating Figure 2.3, navigate to /experiments/ch2_bandits/ and run:

python run.py -m run.steps=1000 run.n_runs=2000 +bandit.epsilon=0,0.01,0.1 +bandit.random_argmax=true experiment.tag=fig2.2 experiment.upload=true

Figure 2.3 (rlbook): The +bandit.random_argmax=true flag was used to switch over to an argmax implementation that randomizes between tiebreakers rather than first occurence used in the default numpy implementation to better align with the original example. Link to wandb artifact

Further details on experimental setup and results can be found at corresponding chapter README's.

Chapter Links

Chapter 2: Multi-armed Bandits

Name		Name	Last commit message	Last commit date
Latest commit History 194 Commits
.github		.github
experiments/ch2_bandits		experiments/ch2_bandits
src/rlbook		src/rlbook
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
requirements-dev.lock		requirements-dev.lock
requirements.lock		requirements.lock
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rlbook

Setup

Install uv (for linux below):

Install the rlbook environment via uv:

(Optional) Setup wandb for experiment tracking

Quickstart

Chapter Links

About

Releases

Packages

Languages

License

joseph-jnl/rlbook

Folders and files

Latest commit

History

Repository files navigation

rlbook

Setup

Install uv (for linux below):

Install the rlbook environment via uv:

(Optional) Setup wandb for experiment tracking

Quickstart

Chapter Links

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages