L'apprentissage par renforcement est un type d'apprentissage basé sur l'interaction avec un environnement, où un agent apprend à maximiser des récompenses à travers ses actions. Ce document aborde les concepts clés de l'apprentissage par renforcement, y compris les méthodes et algorithmes, et fournit des exemples d'applications pratiques telles que l'optimisation et les jeux. Le cours couvre également des sujets avancés comme les processus de décision markoviens et les algorithmes de bandits manchots.