Le document présente une introduction à l'apprentissage par renforcement, en expliquant ses concepts fondamentaux, son formalismes et ses principaux algorithmes. Il décrit comment l'interaction avec l'environnement permet à un agent d'apprendre en maximisant des récompenses à long terme, à l'aide de différentes méthodes telles que la méthode de Monte-Carlo et le Q-learning. En outre, il aborde les applications pratiques et les performances des algorithmes d'apprentissage par renforcement.