SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
Machine Learning et
trading Bitcoin
Christian Gandon
Jedha Full Stack Promo#2
Proposition
Une application qui
devine les creux et
pics des cours afin
d’automatiser un
trading tactique de
Bitcoin
Approche
Court-terme :
A chaque minute, j’essaie de deviner si je
suis dans un creux ou un pic pour les 100
prochaines minutes.
Simple :
si creux = j’achète
si pic = je vends
Je n’essaie pas d’évaluer la valorisation future
Données :
Cours BTC/USD minute par minute sur Q1.2019:
● valo open/close,
● volume transactions,
● deal initié par acheteur ou vendeur.
Machine Learning = trading star?
Oui!
Si elle avait été productive sur Avril 2019,
l’application aurait généré un profit de 12,8%
(vs. croissance naturelle du BTC de 7,5%)
creux:
2 sur 3 sont
corrects
(66%)
pics:
3 sur 5 sont
corrects
(60%)
● Pour éliminer les faux positifs il faut se limiter à très peu de deals, i.e. les quelques
pics/creux avec les certitudes de prédictions >90%
● Le 1er trimestre a été croissant, n’a pas été testée en marché descendant
...Mais:
Matrices de confusion
Creux Pics
pred yes 21 11 23 15
pred no 2102 5357 1772 5681
true
yes
true
no
true
yes
true
no
L’outil
Données
collectées
par API
Données
assemblées
et préparées
LSTM:100n
Dense:8n
1sortie2n
Creux?
Pic?
1 réseau de
neurones
https://github.com/cgandon
Mes apprentissages
● Collecte de données:
○ boucles sur API des places d’échanges
○ concaténation en fichiers plats
○ Simple, gratuit… easy.
● Préparation des données:
○ Pour LSTM, chaque observation doit contenir l’historique de la série
temporelle. Attention au volume et au temps de calcul!
○ Ne pas suivre toutes les hypothèses en même temps. Dérouler une
hypothèse jusqu’au bout, puis ensuite faire varier les paramètres.
● Entraînement du réseau:
○ 48h sur un laptop pour 1000 epoch...
○ ...vs 3h sur une machine virtuelle GPU (Paperspace.com: 2euros/heure)
○ Optimisation du training avec gestion différenciée du batch_size pour le
training et le test (requiert un export/import des poids)
Prochaines étapes
● Enrichir:
○ Traiter les séries temporelles comme des images (en cours)
○ Interpréter les sentiments des tweets et news (en cours)
○ Ajouter les tendances moyen terme
○ Ajouter les cours d’autres places de marché
● Automatiser:
○ La collecte de données et l'entraînement continu du modèle
○ L’exécution des achats/ventes réels
○ Inclure des seuils de sécurité en cas d’erreur de prédiction
Fin
Merci de votre attention
Ressources
Même avec des prédictions à 100% sur Q1.2019:
● la médiane du gain par trade aurait été négative (-4eur)...
● ...mais le gain moyen aurait été positif (+9eur)
● => en effet, on perd souvent un peu mais on gagne quelques fois beaucoup.
A noter:
Distribution des gains si tous les
pics et creux sont bien détectés: Zoom sur les 50%
Références:
Prédiction de cours avec LSTM:
● https://towardsdatascience.com/predicting-stock-price-with-lstm-13af86a74944
● https://towardsdatascience.com/predicting-ethereum-prices-with-long-short-term-memory-lstm-2a5465d3fd
Optimisation de Batch_size sur LSTM:
● https://machinelearningmastery.com/use-different-batch-sizes-training-predicting-python-keras/
Stacked LSTM:
● https://machinelearningmastery.com/stacked-long-short-term-memory-networks/
Classification de séries temporelles avec conversion des courbes en images:
● https://forums.fast.ai/t/share-your-work-here/27676/367
● https://medium.com/analytics-vidhya/encoding-time-series-as-images-b043becbdbf3

Contenu connexe

Similaire à Savoir quand vendre ou acheter du Bitcoin grâce à la Data Science - Christian Gandon

Robot de trading automatique
Robot de trading automatiqueRobot de trading automatique
Robot de trading automatiquehaythemrekik1
 
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...Game Camp France
 
Tracking et Analytics comme avantage compétitif
Tracking et Analytics comme avantage compétitifTracking et Analytics comme avantage compétitif
Tracking et Analytics comme avantage compétitifBruno Guyot
 
Opportunity Management workshop
Opportunity Management workshopOpportunity Management workshop
Opportunity Management workshopDoria Hamelryk
 
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019Bruno Guyot
 
Guillaume Morissette - Big Data PME
Guillaume Morissette - Big Data PMEGuillaume Morissette - Big Data PME
Guillaume Morissette - Big Data PMEWeb à Québec
 
Etude de cas_vsm_2013_imi
Etude de cas_vsm_2013_imiEtude de cas_vsm_2013_imi
Etude de cas_vsm_2013_imiasalmi4
 
Simbound Simulation pour Cours de Digital Marketing
Simbound Simulation pour Cours de Digital MarketingSimbound Simulation pour Cours de Digital Marketing
Simbound Simulation pour Cours de Digital MarketingAtraki
 
Meet up - qu'on me donne l'envie de Groomer
Meet up - qu'on me donne l'envie de GroomerMeet up - qu'on me donne l'envie de Groomer
Meet up - qu'on me donne l'envie de GroomerAlexandre Quach
 

Similaire à Savoir quand vendre ou acheter du Bitcoin grâce à la Data Science - Christian Gandon (11)

Robot de trading automatique
Robot de trading automatiqueRobot de trading automatique
Robot de trading automatique
 
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...
Penser son game concept pour le long terme - Alexandre Besenval - Game Camp F...
 
Tracking et Analytics comme avantage compétitif
Tracking et Analytics comme avantage compétitifTracking et Analytics comme avantage compétitif
Tracking et Analytics comme avantage compétitif
 
Opportunity Management workshop
Opportunity Management workshopOpportunity Management workshop
Opportunity Management workshop
 
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019
Google Analytics - Des bases actionnables en 45min - LEC Geneve 2019
 
Guillaume Morissette - Big Data PME
Guillaume Morissette - Big Data PMEGuillaume Morissette - Big Data PME
Guillaume Morissette - Big Data PME
 
Etude de cas_vsm_2013_imi
Etude de cas_vsm_2013_imiEtude de cas_vsm_2013_imi
Etude de cas_vsm_2013_imi
 
Simbound Simulation pour Cours de Digital Marketing
Simbound Simulation pour Cours de Digital MarketingSimbound Simulation pour Cours de Digital Marketing
Simbound Simulation pour Cours de Digital Marketing
 
Meet up - qu'on me donne l'envie de Groomer
Meet up - qu'on me donne l'envie de GroomerMeet up - qu'on me donne l'envie de Groomer
Meet up - qu'on me donne l'envie de Groomer
 
Juste à temps (Just in time)
Juste à temps (Just in time)Juste à temps (Just in time)
Juste à temps (Just in time)
 
E commerce-se lancer
E commerce-se lancerE commerce-se lancer
E commerce-se lancer
 

Plus de Jedha Bootcamp

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Jedha Bootcamp
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp
 

Plus de Jedha Bootcamp (20)

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdf
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
 

Savoir quand vendre ou acheter du Bitcoin grâce à la Data Science - Christian Gandon

  • 1. Machine Learning et trading Bitcoin Christian Gandon Jedha Full Stack Promo#2
  • 2. Proposition Une application qui devine les creux et pics des cours afin d’automatiser un trading tactique de Bitcoin
  • 3. Approche Court-terme : A chaque minute, j’essaie de deviner si je suis dans un creux ou un pic pour les 100 prochaines minutes. Simple : si creux = j’achète si pic = je vends Je n’essaie pas d’évaluer la valorisation future Données : Cours BTC/USD minute par minute sur Q1.2019: ● valo open/close, ● volume transactions, ● deal initié par acheteur ou vendeur.
  • 4. Machine Learning = trading star?
  • 5. Oui! Si elle avait été productive sur Avril 2019, l’application aurait généré un profit de 12,8% (vs. croissance naturelle du BTC de 7,5%) creux: 2 sur 3 sont corrects (66%) pics: 3 sur 5 sont corrects (60%)
  • 6. ● Pour éliminer les faux positifs il faut se limiter à très peu de deals, i.e. les quelques pics/creux avec les certitudes de prédictions >90% ● Le 1er trimestre a été croissant, n’a pas été testée en marché descendant ...Mais: Matrices de confusion Creux Pics pred yes 21 11 23 15 pred no 2102 5357 1772 5681 true yes true no true yes true no
  • 8. Mes apprentissages ● Collecte de données: ○ boucles sur API des places d’échanges ○ concaténation en fichiers plats ○ Simple, gratuit… easy. ● Préparation des données: ○ Pour LSTM, chaque observation doit contenir l’historique de la série temporelle. Attention au volume et au temps de calcul! ○ Ne pas suivre toutes les hypothèses en même temps. Dérouler une hypothèse jusqu’au bout, puis ensuite faire varier les paramètres. ● Entraînement du réseau: ○ 48h sur un laptop pour 1000 epoch... ○ ...vs 3h sur une machine virtuelle GPU (Paperspace.com: 2euros/heure) ○ Optimisation du training avec gestion différenciée du batch_size pour le training et le test (requiert un export/import des poids)
  • 9. Prochaines étapes ● Enrichir: ○ Traiter les séries temporelles comme des images (en cours) ○ Interpréter les sentiments des tweets et news (en cours) ○ Ajouter les tendances moyen terme ○ Ajouter les cours d’autres places de marché ● Automatiser: ○ La collecte de données et l'entraînement continu du modèle ○ L’exécution des achats/ventes réels ○ Inclure des seuils de sécurité en cas d’erreur de prédiction
  • 10. Fin Merci de votre attention
  • 12. Même avec des prédictions à 100% sur Q1.2019: ● la médiane du gain par trade aurait été négative (-4eur)... ● ...mais le gain moyen aurait été positif (+9eur) ● => en effet, on perd souvent un peu mais on gagne quelques fois beaucoup. A noter: Distribution des gains si tous les pics et creux sont bien détectés: Zoom sur les 50%
  • 13. Références: Prédiction de cours avec LSTM: ● https://towardsdatascience.com/predicting-stock-price-with-lstm-13af86a74944 ● https://towardsdatascience.com/predicting-ethereum-prices-with-long-short-term-memory-lstm-2a5465d3fd Optimisation de Batch_size sur LSTM: ● https://machinelearningmastery.com/use-different-batch-sizes-training-predicting-python-keras/ Stacked LSTM: ● https://machinelearningmastery.com/stacked-long-short-term-memory-networks/ Classification de séries temporelles avec conversion des courbes en images: ● https://forums.fast.ai/t/share-your-work-here/27676/367 ● https://medium.com/analytics-vidhya/encoding-time-series-as-images-b043becbdbf3