Ce cours a pour objectif d'initier les étudiants à l'apprentissage par renforcement.
L'apprentissage par renforcement est une branche de l'intelligence artificielle qui consiste à apprendre les actions à réaliser, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.
10 min
Pour bien apprendre pendant ces travaux pratiques il est conseillé d'avoir les éléments suivants sur sa machine:
- python (version >= 3.10)
- un accès à un terminal
- pour les utilisateurs
Windows
, l'utilisation dewsl
est fortement recommandée
- pour les utilisateurs
- un éditeur de texte. Il existe des environnements de développements très performants que vous serez amené à utiliser en entreprise. Pourquoi ne pas les utiliser dès à présent ?
Visual Studio Code
,PyCharm
,SublimeText
, ...
Si votre environnement de travail est près. Vous pouvez commencer le TP n°1 sur les processus de décision de Markov.
Ce cours a été réalisé par David Albert, @blavad
Si vous souhaitez réutiliser ces supports, veuillez inclure la mention d'attribution suivante de façon claire et visible.
Ce support utilise Travaux Pratiques d'apprentissage par renforcement, développé par David Albert @blavad, disponible à https://github.com/blavad/rl.