AI Placeholder

Découvrez comment une machine apprend par essais, erreurs et récompenses.

Apprentissage par Essais et Erreurs

Découvrez comment les agents apprennent en testant et en s’améliorant.

Progression Guidée

Avancez pas à pas vers une compréhension claire du renforcement.

Mettre en Pratique

Observer des exemples concrets d’agents qui s’améliorent par expérience.

À Propos du Cours

Ce cours vous initie à l’apprentissage par renforcement (RL), une branche fascinante de l’intelligence artificielle où les machines apprennent par essais, erreurs et récompenses. Pas besoin de prérequis : tout est expliqué de manière progressive et concrète. Vous découvrirez comment un agent prend des décisions dans un environnement, comment il s’améliore en fonction des retours, et comment ces principes s’appliquent à des domaines variés comme la robotique, les jeux ou la gestion intelligente de ressources.

Rencontrez Votre Formateur, Expert en IA

Bienvenue ! Je suis le Dr Haythem Rehouma, titulaire d’un doctorat en informatique avec une spécialisation approfondie en intelligence artificielle. En tant qu’enseignant et chercheur passionné, je me consacre aux domaines de l’IA, de l’apprentissage automatique et des systèmes intelligents. Fort de plusieurs années d’expérience académique et pratique, mon objectif est de proposer des parcours d’apprentissage stimulants et enrichissants pour tous les apprenants. Ce cours reflète pleinement ma passion pour le partage des connaissances et la promotion d’une culture d’apprentissage continu.

Programme du Cours

19 Chapters · 67 Lessons

1
Module 0 — Motivation & Vision
1. (Included in full purchase)
  Table des matières - Reinforcement Learning pour Débutants
2. (Included in full purchase)
  Chapitre 0.1 - Pourquoi le Reinforcement Learning ?
3. (Included in full purchase)
  Quiz du Module 0
2
Module 1 — Découvrir le Reinforcement Learning
1. (Included in full purchase)
  Chapitre 1.1 - Qu'est-ce que le Reinforcement Learning ?
2. (Included in full purchase)
  Chapitre 1.2 - Agent, Environnement, Actions
3. (Included in full purchase)
  Chapitre 1.3 - Récompenses et Punitions
4. (Included in full purchase)
  Chapitre 1.4 - Installer votre laboratoire RL
5. (Included in full purchase)
  Chapitre 1.5 - Vocabulaire RL ultra-vulgarisé
6. (Included in full purchase)
  Quiz du Module 1
3
Module 2 — Premiers agents intelligents
1. (Included in full purchase)
  Chapitre 2.1 - Q-Learning
2. (Included in full purchase)
  Chapitre 2.2 - Exploration vs Exploitation
3. (Included in full purchase)
  Chapitre 2.3 -Votre premier agent
4. (Included in full purchase)
  Quiz du Module 2
4
Module 3 — Algorithmes avancés
1. (Included in full purchase)
  Chapitre 3.1 -Deep Q-Network (DQN)
2. (Included in full purchase)
  Chapitre 3.2 -Policy Gradient
3. (Included in full purchase)
  Chapitre 3.3 -Actor-Critic
4. (Included in full purchase)
  Quiz du Module 3
5
Module 4 — Projets spectaculaires
1. (Included in full purchase)
  Chapitre 4.1 -IA qui joue aux jeux vidéo
2. (Included in full purchase)
  Chapitre 4.2 -Robot qui apprend à marcher
3. (Included in full purchase)
  Chapitre 4.3 -Trading Bot intelligent
4. (Included in full purchase)
  Chapitre 4.4 -Portfolio RL
5. (Included in full purchase)
  Quiz du Module 4
6
Chapitre 00 - Introduction et Installation
1. (Included in full purchase)
  Pr sentation du cours et pourquoi le RL ?
2. (Included in full purchase)
  Installer Python, Gymnasium et PyTorch
3. (Included in full purchase)
  Premier environnement Gymnasium (FrozenLake)
7
Chapitre 01 - Fondamentaux du Reinforcement Learning
1. (Included in full purchase)
  RL vs supervis vs non-supervis
2. (Included in full purchase)
  Agent, environnement, tat, action, r compense
3. (Included in full purchase)
  Politique, valeur et fonction Q
4. (Included in full purchase)
  Exploration vs exploitation (dilemme epsilon)
8
Chapitre 02 - Processus de Decision Markovien
1. (Included in full purchase)
  Processus de D cision Markovien (MDP) expliqu
2. (Included in full purchase)
  Équation de Bellman intuitive
3. (Included in full purchase)
  Value Iteration et Policy Iteration
4. (Included in full purchase)
  R soudre FrozenLake avec Value Iteration
9
Chapitre 03 - Q-Learning Classique
1. (Included in full purchase)
  Q-Learning : intuition et formule
2. (Included in full purchase)
  Impl menter une Q-table en Python
3. (Included in full purchase)
  Strat gie epsilon-greedy
4. (Included in full purchase)
  Entra ner un agent sur Taxi-v3
10
Chapitre 04 - SARSA et Variantes
1. (Included in full purchase)
  SARSA : la cousine on-policy de Q-Learning
2. (Included in full purchase)
  Q-Learning vs SARSA : quand utiliser quoi
3. (Included in full purchase)
  Expected SARSA et Double Q-Learning
4. (Included in full purchase)
  Le probl me du Cliff-Walking
11
Chapitre 05 - Deep Q-Networks
1. (Included in full purchase)
  Pourquoi un r seau de neurones ?
2. (Included in full purchase)
  Architecture DQN avec PyTorch
3. (Included in full purchase)
  Replay buffer et target network
4. (Included in full purchase)
  R soudre CartPole avec DQN
12
Chapitre 05 - Methodes de Monte Carlo
1. (Included in full purchase)
  Prediction de Monte Carlo
2. (Included in full purchase)
  Controle de Monte Carlo
3. (Included in full purchase)
  Avantages et limites
13
Chapitre 06 - Apprentissage par differences temporelles (TD)
1. (Included in full purchase)
  TD(0)
2. (Included in full purchase)
  Avantages du TD
3. (Included in full purchase)
  TD(lambda)
14
Chapitre 06 - Policy Gradient et REINFORCE
1. (Included in full purchase)
  Value-based vs Policy-based
2. (Included in full purchase)
  Th or me du Policy Gradient
3. (Included in full purchase)
  REINFORCE : impl mentation pas pas
15
Chapitre 07 - Acteur-Critique et A2C
1. (Included in full purchase)
  Architecture Acteur-Critique
2. (Included in full purchase)
  Advantage Actor-Critic (A2C)
3. (Included in full purchase)
  Introduction PPO (Proximal Policy Optimization)
16
Chapitre 07 - Q-Learning et SARSA
1. (Included in full purchase)
  SARSA
2. (Included in full purchase)
  Exploration vs exploitation
3. (Included in full purchase)
  Comparaison et applications
17
Chapitre 08 - Approximation de fonctions
1. (Included in full purchase)
  Approximation lineaire
2. (Included in full purchase)
  Introduction aux reseaux de neurones
3. (Included in full purchase)
  Approximation non lineaire
18
Chapitre 08 - Environnements et Stable-Baselines3
1. (Included in full purchase)
  Stable-Baselines3 : tour d'horizon
2. (Included in full purchase)
  Entra ner PPO sur LunarLander en 5 lignes
3. (Included in full purchase)
  Cr er son propre environnement Gymnasium
19
Chapitre 09 - Projet Final LunarLander
1. (Included in full purchase)
  Pr sentation du projet et environnement

Témoignages des Participants

Découvrez les retours de celles et ceux qui ont suivi le cours. Leur expérience met en avant la simplicité, la clarté et l’efficacité de l’apprentissage par renforcement expliqué pas à pas.

”

Ce cours m’a enfin permis de comprendre le renforcement sans être noyé dans les maths. Les exemples concrets rendent tout clair.

Karim B.

Étudiant en informatique

”

Une approche simple et progressive. Même sans bagage technique, j’ai pu suivre et appliquer les notions.

Julien T.

Autodidacte passionné d’IA

”

Ce cours m’a enfin permis de comprendre le renforcement sans être noyé dans les maths. Les exemples concrets rendent tout clair.

Karim B.

Étudiant en informatique

”

Une approche simple et progressive. Même sans bagage technique, j’ai pu suivre et appliquer les notions.

Julien T.

Autodidacte passionné d’IA

Prêt à Transformer Votre Avenir?

Rejoignez Notre Communauté d'Apprentissage Aujourd'hui et Faites Décoller Votre Carrière en IA!

Inscrivez-vous Maintenant

Apprentissage par renforcement sans prérequis

Apprentissage par Essais et Erreurs

Progression Guidée

Mettre en Pratique

À Propos du Cours

Rencontrez Votre Formateur, Expert en IA

Programme du Cours

Module 0 — Motivation & Vision

Module 1 — Découvrir le Reinforcement Learning

Module 2 — Premiers agents intelligents

Module 3 — Algorithmes avancés

Module 4 — Projets spectaculaires

Chapitre 00 - Introduction et Installation

Chapitre 01 - Fondamentaux du Reinforcement Learning

Chapitre 02 - Processus de Decision Markovien

Chapitre 03 - Q-Learning Classique

Chapitre 04 - SARSA et Variantes

Chapitre 05 - Deep Q-Networks

Chapitre 05 - Methodes de Monte Carlo

Chapitre 06 - Apprentissage par differences temporelles (TD)

Chapitre 06 - Policy Gradient et REINFORCE

Chapitre 07 - Acteur-Critique et A2C

Chapitre 07 - Q-Learning et SARSA

Chapitre 08 - Approximation de fonctions

Chapitre 08 - Environnements et Stable-Baselines3

Chapitre 09 - Projet Final LunarLander

Témoignages des Participants

Prêt à Transformer Votre Avenir?