SlideShare une entreprise Scribd logo
1  sur  17
Télécharger pour lire hors ligne
Data Science
Bootcamp
Mohamed Zebli

Optimiser sa stratégie de paris sportifs
grâce à la Data Science : une application
concrète au football
« Le football est un jeu qui se joue à onze contre onze, et à la fin,
c’est l’Allemagne qui gagne. »

Sommaire
Quel problème ?
Quelles données ?
Quel modèle ?
Quels résultats ?
Quels développements futurs ?
Quel problème ?
Fonctionnement des paris sportifs
Trois possibilités pour chaque rencontre
Une cote associée à chaque possibilité
Le gain est égal à : Mise * Cote jouée
❑ Victoire équipe domicile – Home
❑ Victoire équipe visiteuse – Away
❑ Match nul – Draw





❑ Home – 4.21
❑ Away – 3.86
❑ Draw – 1.74



❑ Exemple : 10 € (mise) * 3.86 (cote Away)
❑ Un gain de 38.6 € si l’équipe visiteuse gagne 



Objectifs
Approximer le résultat d’une rencontre
Déterminer une stratégie de paris
❑ Paris simples (un pari = une rencontre)
Rewards additifs : Gain = Mise * Cote
❑ Paris multiples (un pari = plusieurs rencontres)
Rewards multiplicatifs : Gain = Mise * Ensemble des cotes




Quelles données ?
Le champ d’étude retenu
Premières et Deuxièmes divisions
Premières divisions
Saisons
2017 / 2018
2018 / 2019
2019 / 2020


Les données de la saison
2019 / 2020 s’arrêtent
(volontairement)
au 31/10/2019
Un total de 10 600 rencontres de championnat
Les variables retenues
Pour chaque rencontre, le dataset comprend :
❑ Les cotes pour chacune des issues possibles : Home / Away / Draw
❑ L’état de forme des deux équipes au moment du coup d’envoi : 





▪ Matchs remportés à domicile / extérieur
▪ Nombre de buts marqués à domicile / extérieur
▪ Arbitre de la rencontre, stade où se joue le match
▪ Etc. 




Au total, 55 variables pour chacune des 10 600 rencontres
Quel modèle ?
Approximer le résultat de la rencontre
Un réseau de neurones qui prend en compte :
❑ Des données textuelles
❑ Des données chiffrées 











Il est composé de :
❑ Une couche d’entrée
❑ Une première couche d’Embedding (vectorise les séquences de texte)
❑ Couches de GRU (ex : pour le nom des arbitres) et de LSTM (pour les dates)
❑ Deux couches de Dense (avec un Dropout à hauteur de 15%)
❑ Une couche de sortie (activation Softmax) qui renvoie trois probabilités pour
l’issue de la rencontre :

▪ Home
▪ Away
▪ Draw





Quels résultats ?
Un test grandeur nature
Après la phase d’entraînement du réseau de neurones, une prédiction
non comprise dans le dataset lui a été soumise :
59 rencontres
jouées le 02/11
39
correctement
prédites
1 € « misé »
sur chaque
rencontre
Une précision
de 66 %
Un « gain »
total de
107,65 €
Une
« rentabilité »
de 82 %
Le pur hasard aurait estimé 33 % de prédictions justes (1 / 3 possibilités)
Quels développements
futurs ?
Définir une stratégie de Hedging
Mobiliser l’Apprentissage par renforcement (Reinforcement Learning)
❑ L’environnement est constitué des prévisions
issues du Réseau de neurones
❑ Les actions correspondent aux choix de paris
possibles (Home, Away, Draw)
❑ Les sommes engendrées / perdues serviront à
optimiser les choix futurs par des Rewards
positifs / négatifs
❑ La stratégie définie par l’agent aura pour but de
thésauriser les gains engendrés à chaque étape


« J'ai dépensé beaucoup d'argent dans la boisson, les filles et les
voitures de sport. Et le reste, je l'ai gaspillé. »

Quand les sportifs se font
philosophes de l’argent…
Data Science
Bootcamp
Merci pour votre attention

Contenu connexe

Plus de Jedha Bootcamp

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data ScienceJedha Bootcamp
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientJedha Bootcamp
 
Prédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data SciencePrédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data ScienceJedha Bootcamp
 
Prédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data SciencePrédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data ScienceJedha Bootcamp
 
Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Jedha Bootcamp
 
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtStarbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtJedha Bootcamp
 
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistDesign & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistJedha Bootcamp
 

Plus de Jedha Bootcamp (20)

Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
 
Prédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data SciencePrédire les ventes d'un hôtel grâce à la Data Science
Prédire les ventes d'un hôtel grâce à la Data Science
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un client
 
Prédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data SciencePrédire le taux de churn grâce à la Data Science
Prédire le taux de churn grâce à la Data Science
 
Prédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data SciencePrédire les retards d'avions avec la Data Science
Prédire les retards d'avions avec la Data Science
 
Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?Quelles start-ups recommander aux grands groupes ?
Quelles start-ups recommander aux grands groupes ?
 
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôtStarbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
Starbucks Coffee - Déterminer l'emplacement idéal d'un entrepôt
 
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data ScientistDesign & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
Design & Data : Optimiser grâce à l'A/B TEST - Romain, Data Scientist
 

Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli

  • 1. Data Science Bootcamp Mohamed Zebli
 Optimiser sa stratégie de paris sportifs grâce à la Data Science : une application concrète au football
  • 2. « Le football est un jeu qui se joue à onze contre onze, et à la fin, c’est l’Allemagne qui gagne. »

  • 3. Sommaire Quel problème ? Quelles données ? Quel modèle ? Quels résultats ? Quels développements futurs ?
  • 5. Fonctionnement des paris sportifs Trois possibilités pour chaque rencontre Une cote associée à chaque possibilité Le gain est égal à : Mise * Cote jouée ❑ Victoire équipe domicile – Home ❑ Victoire équipe visiteuse – Away ❑ Match nul – Draw
 
 
 ❑ Home – 4.21 ❑ Away – 3.86 ❑ Draw – 1.74
 
 ❑ Exemple : 10 € (mise) * 3.86 (cote Away) ❑ Un gain de 38.6 € si l’équipe visiteuse gagne 
 

  • 6. Objectifs Approximer le résultat d’une rencontre Déterminer une stratégie de paris ❑ Paris simples (un pari = une rencontre) Rewards additifs : Gain = Mise * Cote ❑ Paris multiples (un pari = plusieurs rencontres) Rewards multiplicatifs : Gain = Mise * Ensemble des cotes 
 

  • 8. Le champ d’étude retenu Premières et Deuxièmes divisions Premières divisions Saisons 2017 / 2018 2018 / 2019 2019 / 2020 
 Les données de la saison 2019 / 2020 s’arrêtent (volontairement) au 31/10/2019 Un total de 10 600 rencontres de championnat
  • 9. Les variables retenues Pour chaque rencontre, le dataset comprend : ❑ Les cotes pour chacune des issues possibles : Home / Away / Draw ❑ L’état de forme des deux équipes au moment du coup d’envoi : 
 
 
 ▪ Matchs remportés à domicile / extérieur ▪ Nombre de buts marqués à domicile / extérieur ▪ Arbitre de la rencontre, stade où se joue le match ▪ Etc. 
 
 
Au total, 55 variables pour chacune des 10 600 rencontres
  • 11. Approximer le résultat de la rencontre Un réseau de neurones qui prend en compte : ❑ Des données textuelles ❑ Des données chiffrées 
 
 
 
 
 
 Il est composé de : ❑ Une couche d’entrée ❑ Une première couche d’Embedding (vectorise les séquences de texte) ❑ Couches de GRU (ex : pour le nom des arbitres) et de LSTM (pour les dates) ❑ Deux couches de Dense (avec un Dropout à hauteur de 15%) ❑ Une couche de sortie (activation Softmax) qui renvoie trois probabilités pour l’issue de la rencontre : 
▪ Home ▪ Away ▪ Draw
 
 

  • 13. Un test grandeur nature Après la phase d’entraînement du réseau de neurones, une prédiction non comprise dans le dataset lui a été soumise : 59 rencontres jouées le 02/11 39 correctement prédites 1 € « misé » sur chaque rencontre Une précision de 66 % Un « gain » total de 107,65 € Une « rentabilité » de 82 % Le pur hasard aurait estimé 33 % de prédictions justes (1 / 3 possibilités)
  • 15. Définir une stratégie de Hedging Mobiliser l’Apprentissage par renforcement (Reinforcement Learning) ❑ L’environnement est constitué des prévisions issues du Réseau de neurones ❑ Les actions correspondent aux choix de paris possibles (Home, Away, Draw) ❑ Les sommes engendrées / perdues serviront à optimiser les choix futurs par des Rewards positifs / négatifs ❑ La stratégie définie par l’agent aura pour but de thésauriser les gains engendrés à chaque étape 

  • 16. « J'ai dépensé beaucoup d'argent dans la boisson, les filles et les voitures de sport. Et le reste, je l'ai gaspillé. »
 Quand les sportifs se font philosophes de l’argent…