Apprentissage par Essais et Erreurs
Découvrez comment les agents apprennent en testant et en s’améliorant.
Progression Guidée
Avancez pas à pas vers une compréhension claire du renforcement.
Mettre en Pratique
Observer des exemples concrets d’agents qui s’améliorent par expérience.
À Propos du Cours
Ce cours vous initie à l’apprentissage par renforcement (RL), une branche fascinante de l’intelligence artificielle où les machines apprennent par essais, erreurs et récompenses. Pas besoin de prérequis : tout est expliqué de manière progressive et concrète. Vous découvrirez comment un agent prend des décisions dans un environnement, comment il s’améliore en fonction des retours, et comment ces principes s’appliquent à des domaines variés comme la robotique, les jeux ou la gestion intelligente de ressources.
Rencontrez Votre Formateur, Expert en IA
Bienvenue ! Je suis le Dr Haythem Rehouma, titulaire d’un doctorat en informatique avec une spécialisation approfondie en intelligence artificielle. En tant qu’enseignant et chercheur passionné, je me consacre aux domaines de l’IA, de l’apprentissage automatique et des systèmes intelligents. Fort de plusieurs années d’expérience académique et pratique, mon objectif est de proposer des parcours d’apprentissage stimulants et enrichissants pour tous les apprenants. Ce cours reflète pleinement ma passion pour le partage des connaissances et la promotion d’une culture d’apprentissage continu.
Programme du Cours
-
1
Module 0 — Motivation & Vision
-
(Included in full purchase)
Table des matières - Reinforcement Learning pour Débutants
-
(Included in full purchase)
Chapitre 0.1 - Pourquoi le Reinforcement Learning ?
-
(Included in full purchase)
Quiz du Module 0
-
(Included in full purchase)
-
2
Module 1 — Découvrir le Reinforcement Learning
-
(Included in full purchase)
Chapitre 1.1 - Qu'est-ce que le Reinforcement Learning ?
-
(Included in full purchase)
Chapitre 1.2 - Agent, Environnement, Actions
-
(Included in full purchase)
Chapitre 1.3 - Récompenses et Punitions
-
(Included in full purchase)
Chapitre 1.4 - Installer votre laboratoire RL
-
(Included in full purchase)
Chapitre 1.5 - Vocabulaire RL ultra-vulgarisé
-
(Included in full purchase)
Quiz du Module 1
-
(Included in full purchase)
-
3
Module 2 — Premiers agents intelligents
-
(Included in full purchase)
Chapitre 2.1 - Q-Learning
-
(Included in full purchase)
Chapitre 2.2 - Exploration vs Exploitation
-
(Included in full purchase)
Chapitre 2.3 -Votre premier agent
-
(Included in full purchase)
Quiz du Module 2
-
(Included in full purchase)
-
4
Module 3 — Algorithmes avancés
-
(Included in full purchase)
Chapitre 3.1 -Deep Q-Network (DQN)
-
(Included in full purchase)
Chapitre 3.2 -Policy Gradient
-
(Included in full purchase)
Chapitre 3.3 -Actor-Critic
-
(Included in full purchase)
Quiz du Module 3
-
(Included in full purchase)
-
5
Module 4 — Projets spectaculaires
-
(Included in full purchase)
Chapitre 4.1 -IA qui joue aux jeux vidéo
-
(Included in full purchase)
Chapitre 4.2 -Robot qui apprend à marcher
-
(Included in full purchase)
Chapitre 4.3 -Trading Bot intelligent
-
(Included in full purchase)
Chapitre 4.4 -Portfolio RL
-
(Included in full purchase)
Quiz du Module 4
-
(Included in full purchase)
-
6
Chapitre 00 - Introduction et Installation
-
(Included in full purchase)
Pr sentation du cours et pourquoi le RL ?
-
(Included in full purchase)
Installer Python, Gymnasium et PyTorch
-
(Included in full purchase)
Premier environnement Gymnasium (FrozenLake)
-
(Included in full purchase)
-
7
Chapitre 01 - Fondamentaux du Reinforcement Learning
-
(Included in full purchase)
RL vs supervis vs non-supervis
-
(Included in full purchase)
Agent, environnement, tat, action, r compense
-
(Included in full purchase)
Politique, valeur et fonction Q
-
(Included in full purchase)
Exploration vs exploitation (dilemme epsilon)
-
(Included in full purchase)
-
8
Chapitre 02 - Processus de Decision Markovien
-
(Included in full purchase)
Processus de D cision Markovien (MDP) expliqu
-
(Included in full purchase)
Équation de Bellman intuitive
-
(Included in full purchase)
Value Iteration et Policy Iteration
-
(Included in full purchase)
R soudre FrozenLake avec Value Iteration
-
(Included in full purchase)
-
9
Chapitre 03 - Q-Learning Classique
-
(Included in full purchase)
Q-Learning : intuition et formule
-
(Included in full purchase)
Impl menter une Q-table en Python
-
(Included in full purchase)
Strat gie epsilon-greedy
-
(Included in full purchase)
Entra ner un agent sur Taxi-v3
-
(Included in full purchase)
-
10
Chapitre 04 - SARSA et Variantes
-
(Included in full purchase)
SARSA : la cousine on-policy de Q-Learning
-
(Included in full purchase)
Q-Learning vs SARSA : quand utiliser quoi
-
(Included in full purchase)
Expected SARSA et Double Q-Learning
-
(Included in full purchase)
Le probl me du Cliff-Walking
-
(Included in full purchase)
-
11
Chapitre 05 - Deep Q-Networks
-
(Included in full purchase)
Pourquoi un r seau de neurones ?
-
(Included in full purchase)
Architecture DQN avec PyTorch
-
(Included in full purchase)
Replay buffer et target network
-
(Included in full purchase)
R soudre CartPole avec DQN
-
(Included in full purchase)
-
12
Chapitre 05 - Methodes de Monte Carlo
-
(Included in full purchase)
Prediction de Monte Carlo
-
(Included in full purchase)
Controle de Monte Carlo
-
(Included in full purchase)
Avantages et limites
-
(Included in full purchase)
-
13
Chapitre 06 - Apprentissage par differences temporelles (TD)
-
(Included in full purchase)
TD(0)
-
(Included in full purchase)
Avantages du TD
-
(Included in full purchase)
TD(lambda)
-
(Included in full purchase)
-
14
Chapitre 06 - Policy Gradient et REINFORCE
-
(Included in full purchase)
Value-based vs Policy-based
-
(Included in full purchase)
Th or me du Policy Gradient
-
(Included in full purchase)
REINFORCE : impl mentation pas pas
-
(Included in full purchase)
-
15
Chapitre 07 - Acteur-Critique et A2C
-
(Included in full purchase)
Architecture Acteur-Critique
-
(Included in full purchase)
Advantage Actor-Critic (A2C)
-
(Included in full purchase)
Introduction PPO (Proximal Policy Optimization)
-
(Included in full purchase)
-
16
Chapitre 07 - Q-Learning et SARSA
-
(Included in full purchase)
SARSA
-
(Included in full purchase)
Exploration vs exploitation
-
(Included in full purchase)
Comparaison et applications
-
(Included in full purchase)
-
17
Chapitre 08 - Approximation de fonctions
-
(Included in full purchase)
Approximation lineaire
-
(Included in full purchase)
Introduction aux reseaux de neurones
-
(Included in full purchase)
Approximation non lineaire
-
(Included in full purchase)
-
18
Chapitre 08 - Environnements et Stable-Baselines3
-
(Included in full purchase)
Stable-Baselines3 : tour d'horizon
-
(Included in full purchase)
Entra ner PPO sur LunarLander en 5 lignes
-
(Included in full purchase)
Cr er son propre environnement Gymnasium
-
(Included in full purchase)
-
19
Chapitre 09 - Projet Final LunarLander
-
(Included in full purchase)
Pr sentation du projet et environnement
-
(Included in full purchase)
Témoignages des Participants
Découvrez les retours de celles et ceux qui ont suivi le cours. Leur expérience met en avant la simplicité, la clarté et l’efficacité de l’apprentissage par renforcement expliqué pas à pas.
Ce cours m’a enfin permis de comprendre le renforcement sans être noyé dans les maths. Les exemples concrets rendent tout clair.
Étudiant en informatique
Une approche simple et progressive. Même sans bagage technique, j’ai pu suivre et appliquer les notions.
Autodidacte passionné d’IA
Prêt à Transformer Votre Avenir?
Rejoignez Notre Communauté d'Apprentissage Aujourd'hui et Faites Décoller Votre Carrière en IA!