Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli

•

0 j'aime•249 vues

Nos formations : https:///www.jedha.co Cette fois c'est le football qui est mis à l'honneur pour le projet Machine Learning visant à optimiser sa stratégie de paris ! Coupe du monde, UEFA : à vos paris !

Données & analyses

Data Science
Bootcamp
Mohamed Zebli 
Optimiser sa stratégie de paris sportifs
grâce à la Data Science : une application
concrète au football

« Le football est un jeu qui se joue à onze contre onze, et à la fin,
c’est l’Allemagne qui gagne. »

Sommaire
Quel problème ?
Quelles données ?
Quel modèle ?
Quels résultats ?
Quels développements futurs ?

Quel problème ?

Fonctionnement des paris sportifs
Trois possibilités pour chaque rencontre
Une cote associée à chaque possibilité
Le gain est égal à : Mise * Cote jouée
❑ Victoire équipe domicile – Home
❑ Victoire équipe visiteuse – Away
❑ Match nul – Draw 
 
 
❑ Home – 4.21
❑ Away – 3.86
❑ Draw – 1.74 
 
❑ Exemple : 10 € (mise) * 3.86 (cote Away)
❑ Un gain de 38.6 € si l’équipe visiteuse gagne

Objectifs
Approximer le résultat d’une rencontre
Déterminer une stratégie de paris
❑ Paris simples (un pari = une rencontre)
Rewards additifs : Gain = Mise * Cote
❑ Paris multiples (un pari = plusieurs rencontres)
Rewards multiplicatifs : Gain = Mise * Ensemble des cotes

Quelles données ?

Le champ d’étude retenu
Premières et Deuxièmes divisions
Premières divisions
Saisons
2017 / 2018
2018 / 2019
2019 / 2020
 
Les données de la saison
2019 / 2020 s’arrêtent
(volontairement)
au 31/10/2019
Un total de 10 600 rencontres de championnat

Les variables retenues
Pour chaque rencontre, le dataset comprend :
❑ Les cotes pour chacune des issues possibles : Home / Away / Draw
❑ L’état de forme des deux équipes au moment du coup d’envoi :  
 
 
▪ Matchs remportés à domicile / extérieur
▪ Nombre de buts marqués à domicile / extérieur
▪ Arbitre de la rencontre, stade où se joue le match
▪ Etc.  
 
 Au total, 55 variables pour chacune des 10 600 rencontres

Quel modèle ?

Approximer le résultat de la rencontre
Un réseau de neurones qui prend en compte :
❑ Des données textuelles
❑ Des données chiffrées  
 
 
 
 
 
Il est composé de :
❑ Une couche d’entrée
❑ Une première couche d’Embedding (vectorise les séquences de texte)
❑ Couches de GRU (ex : pour le nom des arbitres) et de LSTM (pour les dates)
❑ Deux couches de Dense (avec un Dropout à hauteur de 15%)
❑ Une couche de sortie (activation Softmax) qui renvoie trois probabilités pour
l’issue de la rencontre :
 ▪ Home
▪ Away
▪ Draw

Quels résultats ?

Un test grandeur nature
Après la phase d’entraînement du réseau de neurones, une prédiction
non comprise dans le dataset lui a été soumise :
59 rencontres
jouées le 02/11
39
correctement
prédites
1 € « misé »
sur chaque
rencontre
Une précision
de 66 %
Un « gain »
total de
107,65 €
Une
« rentabilité »
de 82 %
Le pur hasard aurait estimé 33 % de prédictions justes (1 / 3 possibilités)

Quels développements
futurs ?

Définir une stratégie de Hedging
Mobiliser l’Apprentissage par renforcement (Reinforcement Learning)
❑ L’environnement est constitué des prévisions
issues du Réseau de neurones
❑ Les actions correspondent aux choix de paris
possibles (Home, Away, Draw)
❑ Les sommes engendrées / perdues serviront à
optimiser les choix futurs par des Rewards
positifs / négatifs
❑ La stratégie définie par l’agent aura pour but de
thésauriser les gains engendrés à chaque étape

« J'ai dépensé beaucoup d'argent dans la boisson, les filles et les
voitures de sport. Et le reste, je l'ai gaspillé. » 
Quand les sportifs se font
philosophes de l’argent…

Data Science
Bootcamp
Merci pour votre attention

Recommandé

Exemples whilesalmazen

DataScientist Job : Between Myths and Reality.pdf

DataScientist Job : Between Myths and Reality.pdf

DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal

L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp

Générer une image à partir d'un texte - Fullstack Paris #5

Générer une image à partir d'un texte - Fullstack Paris #5

Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp

Recommander des films - Andreea - Fullstack Lyon #1

Recommander des films - Andreea - Fullstack Lyon #1

Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp

Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack

Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack

Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp

Slide portes ouvertes

Slide portes ouvertes

Slide portes ouvertesJedha Bootcamp

Recommandé

Exemples whilesalmazen

DataScientist Job : Between Myths and Reality.pdf

DataScientist Job : Between Myths and Reality.pdf

DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal

L'IA face à l'épreuve du covid-19 - Jedha x Kardinal

L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp

Générer une image à partir d'un texte - Fullstack Paris #5

Générer une image à partir d'un texte - Fullstack Paris #5

Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp

Recommander des films - Andreea - Fullstack Lyon #1

Recommander des films - Andreea - Fullstack Lyon #1

Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp

Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack

Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack

Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp

Slide portes ouvertes

Slide portes ouvertes

Slide portes ouvertesJedha Bootcamp

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha ParisJedha Bootcamp

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha LyonJedha Bootcamp

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéoJedha Bootcamp

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un clientJedha Bootcamp

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data ScienceJedha Bootcamp

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data ScienceJedha Bootcamp

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?Jedha Bootcamp

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtJedha Bootcamp

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistJedha Bootcamp

Contenu connexe

Plus de Jedha Bootcamp

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha ParisJedha Bootcamp

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha LyonJedha Bootcamp

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéoJedha Bootcamp

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un clientJedha Bootcamp

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data ScienceJedha Bootcamp

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data ScienceJedha Bootcamp

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?Jedha Bootcamp

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtJedha Bootcamp

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistJedha Bootcamp

Plus de Jedha Bootcamp (20)

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha Paris

Workshop Data Visualisation - Jedha Paris

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha Lyon

Les applications du Deep Learning - Jedha Lyon

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data Science

Optimiser ses publicités grâce à la Data Science

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessi

Connaître son audience grâce à la Data - Parisa MAjlessi

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéo

Automatiser la classification d'un jeu vidéo

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data Science

Prédire les ventes d'un hôtel grâce à la Data Science

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un client

Le Groupe PSA - Déterminer le renouvellement d'un client

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data Science

Prédire le taux de churn grâce à la Data Science

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data Science

Prédire les retards d'avions avec la Data Science

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?

Quelles start-ups recommander aux grands groupes ?

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist

Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli

1. Data Science Bootcamp Mohamed Zebli  Optimiser sa stratégie de paris sportifs grâce à la Data Science : une application concrète au football

2. « Le football est un jeu qui se joue à onze contre onze, et à la fin, c’est l’Allemagne qui gagne. » 

3. Sommaire Quel problème ? Quelles données ? Quel modèle ? Quels résultats ? Quels développements futurs ?

4. Quel problème ?

5. Fonctionnement des paris sportifs Trois possibilités pour chaque rencontre Une cote associée à chaque possibilité Le gain est égal à : Mise * Cote jouée ❑ Victoire équipe domicile – Home ❑ Victoire équipe visiteuse – Away ❑ Match nul – Draw      ❑ Home – 4.21 ❑ Away – 3.86 ❑ Draw – 1.74    ❑ Exemple : 10 € (mise) * 3.86 (cote Away) ❑ Un gain de 38.6 € si l’équipe visiteuse gagne    

6. Objectifs Approximer le résultat d’une rencontre Déterminer une stratégie de paris ❑ Paris simples (un pari = une rencontre) Rewards additifs : Gain = Mise * Cote ❑ Paris multiples (un pari = plusieurs rencontres) Rewards multiplicatifs : Gain = Mise * Ensemble des cotes    

7. Quelles données ?

8. Le champ d’étude retenu Premières et Deuxièmes divisions Premières divisions Saisons 2017 / 2018 2018 / 2019 2019 / 2020   Les données de la saison 2019 / 2020 s’arrêtent (volontairement) au 31/10/2019 Un total de 10 600 rencontres de championnat

9. Les variables retenues Pour chaque rencontre, le dataset comprend : ❑ Les cotes pour chacune des issues possibles : Home / Away / Draw ❑ L’état de forme des deux équipes au moment du coup d’envoi :       ▪ Matchs remportés à domicile / extérieur ▪ Nombre de buts marqués à domicile / extérieur ▪ Arbitre de la rencontre, stade où se joue le match ▪ Etc.      Au total, 55 variables pour chacune des 10 600 rencontres

10. Quel modèle ?

11. Approximer le résultat de la rencontre Un réseau de neurones qui prend en compte : ❑ Des données textuelles ❑ Des données chiffrées             Il est composé de : ❑ Une couche d’entrée ❑ Une première couche d’Embedding (vectorise les séquences de texte) ❑ Couches de GRU (ex : pour le nom des arbitres) et de LSTM (pour les dates) ❑ Deux couches de Dense (avec un Dropout à hauteur de 15%) ❑ Une couche de sortie (activation Softmax) qui renvoie trois probabilités pour l’issue de la rencontre :  ▪ Home ▪ Away ▪ Draw     

12. Quels résultats ?

13. Un test grandeur nature Après la phase d’entraînement du réseau de neurones, une prédiction non comprise dans le dataset lui a été soumise : 59 rencontres jouées le 02/11 39 correctement prédites 1 € « misé » sur chaque rencontre Une précision de 66 % Un « gain » total de 107,65 € Une « rentabilité » de 82 % Le pur hasard aurait estimé 33 % de prédictions justes (1 / 3 possibilités)

14. Quels développements futurs ?

15. Définir une stratégie de Hedging Mobiliser l’Apprentissage par renforcement (Reinforcement Learning) ❑ L’environnement est constitué des prévisions issues du Réseau de neurones ❑ Les actions correspondent aux choix de paris possibles (Home, Away, Draw) ❑ Les sommes engendrées / perdues serviront à optimiser les choix futurs par des Rewards positifs / négatifs ❑ La stratégie définie par l’agent aura pour but de thésauriser les gains engendrés à chaque étape  

16. « J'ai dépensé beaucoup d'argent dans la boisson, les filles et les voitures de sport. Et le reste, je l'ai gaspillé. »  Quand les sportifs se font philosophes de l’argent…

17. Data Science Bootcamp Merci pour votre attention