David Joubert - Workshop Azure ML - Azure Data Factory - Global Azure Bootcamp 2016 Paris
1. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
1
Industrialisez vos
expérimentations Azure Machine
Learning avec Azure Data Factory
(Workshop)
David Joubert (@dj_uber)
3. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
Azure Machine Learning
Accessible depuis un navigateur Web, aucune
installation nécessaire
Solution collaborative. Création d’espaces de
travail permettant un travail d’équipe depuis
n’importe quel endroit
Création d’expérimentations visuelles de bout
en bout
Solution extensible. Support de R et Python
4. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
AzureData Factory
Son rôle : faire communiquer les services de données
Azure
Créer, planifier, orchestrer et gérer des pipelines
de données
Visualiser la lignée des données
Connecter des sources de données On-Premise
ou cloud
Monitorer les pipelines de données
Automatiser la gestion des ressources cloud
5. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
• Qu’est-ce que cela signifie ?
Industrialisation Azure Machine Learning
Niveau 1
Niveau 2
Interroger mon algorithme pour
faire des prédictions
Ré-entrainer mon algorithme pour
améliorer mes prédictions
6. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
Workflow de l’industrialisation
Mise à jour
du web
service
Copie de
données
Algorithme
d’
entrainement
Algorithme
de
prédiction
7. Global Azure Bootcamp#GlobalAzure @AZUGFR PARIS - FRANCE
• Création de l’expérimentation Azure Machine Learning
• Industrialisation Niveau 1 avec Azure Data Factory
• Industrialisation Niveau 2 avec Azure Data Factory
7
https://onedrive.live.com/redir?resid=6CB545F4B56AE417!26679
&authkey=!AIw5OgI3em5fBM8&ithint=folder%2ccsv
Azure Machine Learning :
Dans Azure, interface web.
Avantage, c’est graphique, déploiement simplifié de web service pour l’utiliser
Support de R et python pour les data scientist qui connaissent déjà ces langages.
Azure Data Factory
Attention, contrairement à ce qu’on entend ce n’est pas un ETL, il permet de faire communiquer les services de données Azure et de lancer des calculs/analyses (HDInsight, Machine Learning)
Avantage : l’existence des taches machine learning (analyse predictive par lot et mise à jour d’algorithme), communication entre blob storage, table azure SQL
Il y a 2 niveaux d’industrialisation :
Le 1er niveau est évident et souvent mis en œuvre,