H2O est un outil d'analyse prédictive open source
La présentation a été donnée à Devoxx France 2016
La video https://www.youtube.com/watch?v=pA3eZQzkzwo
H2O , Le machine learning sans coder ou presque - Devoxx france 2016
1. #DevoxxFR @cfalguiere
Devoxx France 2016
Claude Falguière
@cfalguiere
1
https://github.com/cfalguiere/H2ODemo/blob/master/h2o-devoxx-2016.pdf
www.h2o.ai
H2O
Le Machine Learning sans coder
… ou presque
2. #DevoxxFR @cfalguiere 2
Open Source Math & Machine learning for Big Data!
!
importer et parser des sources
manipuler les dataframes
ajuster un modèle prédictif
calculer une prédiction
sauver les modèles et les réutiliser
10. #DevoxxFR @cfalguiere
Menu pour
générer les
cellules et
autres
actions
H2O Flow
10
Les cellules contiennent
Une instruction H2O
ou du texte
ou du code R ou Python
L’ensemble des
cellules constitue
un Flow
12. #DevoxxFR @cfalguiere 12
Jeu préparé !
classe, sexe, adulte/enfant!
avec équipage
Distributed Random ForestDistributed Random Forest
Jeu détaillé !
avec en plus âge, poids, bateau, destination !
passagers seulement
Deep Learning
16. #DevoxxFR @cfalguiere
Clusters
16
Peut constituer son propre cluster
Ou fonctionner sur des clusters Spark
ou Hadoop existants
Versions spécifiques Hadoop
Sparkling Water pour Spark
Même mode de fonctionnement
18. #DevoxxFR @cfalguiere 18
H2O Flow est attractif
Utilisation très facile du cluster Hadoop
Essayer des modèles très rapidement
!
Conclusion
Compléter
avec l’API!
Combiner les modèles
Intégrer la préparation des données
Industrialiser
Prise en
main facile!