Nos formations : https:///www.jedha.co
Cette fois c'est le football qui est mis à l'honneur pour le projet Machine Learning visant à optimiser sa stratégie de paris ! Coupe du monde, UEFA : à vos paris !
5. Fonctionnement des paris sportifs
Trois possibilités pour chaque rencontre
Une cote associée à chaque possibilité
Le gain est égal à : Mise * Cote jouée
❑ Victoire équipe domicile – Home
❑ Victoire équipe visiteuse – Away
❑ Match nul – Draw
❑ Home – 4.21
❑ Away – 3.86
❑ Draw – 1.74
❑ Exemple : 10 € (mise) * 3.86 (cote Away)
❑ Un gain de 38.6 € si l’équipe visiteuse gagne
6. Objectifs
Approximer le résultat d’une rencontre
Déterminer une stratégie de paris
❑ Paris simples (un pari = une rencontre)
Rewards additifs : Gain = Mise * Cote
❑ Paris multiples (un pari = plusieurs rencontres)
Rewards multiplicatifs : Gain = Mise * Ensemble des cotes
8. Le champ d’étude retenu
Premières et Deuxièmes divisions
Premières divisions
Saisons
2017 / 2018
2018 / 2019
2019 / 2020
Les données de la saison
2019 / 2020 s’arrêtent
(volontairement)
au 31/10/2019
Un total de 10 600 rencontres de championnat
9. Les variables retenues
Pour chaque rencontre, le dataset comprend :
❑ Les cotes pour chacune des issues possibles : Home / Away / Draw
❑ L’état de forme des deux équipes au moment du coup d’envoi :
▪ Matchs remportés à domicile / extérieur
▪ Nombre de buts marqués à domicile / extérieur
▪ Arbitre de la rencontre, stade où se joue le match
▪ Etc.
Au total, 55 variables pour chacune des 10 600 rencontres
11. Approximer le résultat de la rencontre
Un réseau de neurones qui prend en compte :
❑ Des données textuelles
❑ Des données chiffrées
Il est composé de :
❑ Une couche d’entrée
❑ Une première couche d’Embedding (vectorise les séquences de texte)
❑ Couches de GRU (ex : pour le nom des arbitres) et de LSTM (pour les dates)
❑ Deux couches de Dense (avec un Dropout à hauteur de 15%)
❑ Une couche de sortie (activation Softmax) qui renvoie trois probabilités pour
l’issue de la rencontre :
▪ Home
▪ Away
▪ Draw
13. Un test grandeur nature
Après la phase d’entraînement du réseau de neurones, une prédiction
non comprise dans le dataset lui a été soumise :
59 rencontres
jouées le 02/11
39
correctement
prédites
1 € « misé »
sur chaque
rencontre
Une précision
de 66 %
Un « gain »
total de
107,65 €
Une
« rentabilité »
de 82 %
Le pur hasard aurait estimé 33 % de prédictions justes (1 / 3 possibilités)
15. Définir une stratégie de Hedging
Mobiliser l’Apprentissage par renforcement (Reinforcement Learning)
❑ L’environnement est constitué des prévisions
issues du Réseau de neurones
❑ Les actions correspondent aux choix de paris
possibles (Home, Away, Draw)
❑ Les sommes engendrées / perdues serviront à
optimiser les choix futurs par des Rewards
positifs / négatifs
❑ La stratégie définie par l’agent aura pour but de
thésauriser les gains engendrés à chaque étape
16. « J'ai dépensé beaucoup d'argent dans la boisson, les filles et les
voitures de sport. Et le reste, je l'ai gaspillé. »
Quand les sportifs se font
philosophes de l’argent…