SlideShare une entreprise Scribd logo
@EmmanuelFrenod - @djeepy1
Data Science : Méthodologie,
Outillage et Application
Emmanuel Frenod -Jean-Pierre Riehl
Merci beaucoup à nos sponsors!
Thank you to all our sponsors!
Join the conversation
#MSCloudSummit
@MSCloudSummit
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Qui sommes nous ?
Jean-Pierre Riehl
Practice Manager Data & BI
MVP Data Platform
Local Group Leader– GUSS
@djeepy1
http://blog.djeepy1.net
Emmanuel Frenod
Directeur Scientifique
@emmanuelfrenod
http://www.see-d.fr/
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Data Science
Data science, also known as data-driven science, is an
interdisciplinary field about scientific processes and systems to
extract knowledge or insights from data in various forms, either
structured or unstructured, which is a continuation of some of the
data analysis fields such as statistics, machine learning, data mining,
and predictive analytics.
Définition Wikipedia
MÉTHODOLOGIE
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Méthodologies existantes
• CRISP-DM
• KDD
• SEMMA par SAS©
• Cortana Analytics Process (CAP)
par Microsoft© (deprecated)
Processus “Data Science”
TDSP : Team Data Science Process
https://github.com/Azure/Microsoft-TDSP
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Team Data Science Process
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Processus “Data Science”
Source : AZEO Data Science Process
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Business Understanding
Approche technique
Développement
Approche scientifique
Modélisation
Approche métier
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Data Understanding
Buzz words :
Data Crunching
Data Wrangling
Statistique descriptive : remise en
cause d’idées reçues
Regard agnostique sur les données
Nettoyage et préparation des
données
Objectif :
Featurization
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Modeling
Données
Connaissance
Modèles mathématiques
et statistiques
Aide à la décision
Information
Reporting
BI Traditionnelle
Statistique descriptive
Advanced
Analytics
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Advanced Analytics : Extraire depuis les données une connaissance de
haute valeur (prévision, information non évidente, etc.) en utilisant des
modèles mathématiques et/ou statistiques sophistiqués et des
mécanismes d’apprentissage automatique (Machine Learning).
Modèle mathématique et/ou statistique sophistiqué : Un ensemble
d’équations reliant des objets mathématiques avancés (des fonctions,
des densités de probabilités, des séries temporelles, des graphes
(arbres, grilles, réseaux, etc.), des hyper-surfaces, des maillages, des
vecteurs, des matrices, etc.)
OUTILLAGE
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Outillage de la comprehension des données
Langage R
RTVS (R Tools for Visual
Studio)
R + SQLServer
IDEAR
Azure Machine Learning
HDInsight (Books)
VM Data Science
Power BI
Quick Insights
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
R /
RTVS
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP : IDEAR
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Power BI
Quick Insights
APPLICATION
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Mise en œuvre
par l’équipe See-d sur un problème de
pricing chez un transporteur
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP a été mise en œuvre
par l’équipe See-d sur un
problème de pricing
Gains de marge
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La problématique du Pricing
Question de notre client :
ses clients paient-ils le prix
optimum ?
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Business Understanding
Apports de See-d à cette
compréhension
Compréhension du business
par See-d
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Business Understanding
• Des membres de l’équipe See-d ont fait le parcours d’intégration
des personnes recrutées chez le client
• Echanges fréquents avec
– Les chefs de quai
– Le marketing
– La DSI
– La Direction du commerce
• Apport de See-d
– Formalisation des questions
– Un regard sans a priori sur l’activité et les données
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Compréhension des données
Statistique descriptive :
remise en cause d’idées
reçues
Regard agnostique sur les
données
Nettoyages des données
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Table de positions
Une position : toutes les informations
concernant un transport : date, jour, type, poids,
client, prix, etc.
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Date Jour Heure
départ
Heure
arrivée
poids … … Prix Prix/tonne … …
Position 1
Position 2
Position 3
…
…
Position n
…
…
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Date Jour Heure
départ
Heure
arrivée
poids … … Prix Prix/tonne … …
Position 1
Position 2
Position 3
…
…
Position n
…
…
Explicatives Conséquences
STATISTIQUE DESCRIPTIVE
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très faibles
• Prix très forts
• Grande variabilité des prix pour un poids donné
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très élevés
• Prix très faibles
• Grande variabilité des prix pour un poids donné
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très faibles
• Prix très forts
• Grande variabilité des prix pour un poids donné
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Passage en €/tonne
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
log
€
𝑡𝑜𝑛𝑛𝑒
= − log 𝐾𝑔 + 12,09
Poids (kg) €/tonne
30 5 936,1
40 4 452,1
50 3 561,6
70 2 544,0
100 1 780,8
200 890,4
300 593,6
500 356,2
800 222,6
1 500 118,7
3 000 59,4
5 000 35,6
10 000 17,8
20 000 8,9
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS34
Poids (kg) €/tonne
30 5 936,1
40 4 452,1
50 3 561,6
70 2 544,0
100 1 780,8
200 890,4
300 593,6
500 356,2
800 222,6
1 500 118,7
3 000 59,4
5 000 35,6
10 000 17,8
20 000 8,9
Règle utilisée pour calculer le
prix au forfait
100 kg
Tendance cohérente: pente = -1 (Tarifs Généraux)
Pas cohérent
log
€
𝑡𝑜𝑛𝑛𝑒
= − log 𝐾𝑔 + 12,09
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS35
Poids (kg) €/tonne
30 5 936,1
40 4 452,1
50 3 561,6
70 2 544,0
100 1 780,8
200 890,4
300 593,6
500 356,2
800 222,6
1 500 118,7
3 000 59,4
5 000 35,6
10 000 17,8
20 000 8,9
Règle utilisée pour calculer le
prix au forfait
100 kg
log
€
𝑡𝑜𝑛𝑛𝑒
= − log 𝐾𝑔 + 12,09
Tendance cohérente: pente négative quasi nulle
Pas cohérent
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Données
Connaissance
Aide à la
décision
Modèles
mathématiques
et statistiques
Information
• Reporting
• BI Traditionnelle
• Statistique
descriptive
Point crucial
pour la pleine
valorisation
des données
Modélisation mathématique et statistique
Advanced Analytics
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Implémentation, déploiement
Création de modèles
spécifiques, tests
Recherche parmi le modèles
existants, tests
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Classifications statistiques
croisées clients / positions
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ?
Le coeur de l′
outil repose sur des classes de positions qui se ressemblent
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Ensemble de positions
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Le coeur de l′
outil repose sur des classes de positions qui se ressemblent
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Ensemble de positions
Que se cache-t-il derrière l’application développée ?
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Les méthodes classiques de classification ne sont pas adaptées …
• utilisation d’une hybrid clustering (CLara : Clustering of Large Application)
• Partition around medoids : construction de 50 classes
• Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward
criterion : construction de n classes
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Les méthodes classiques de classification ne sont pas adaptées …
• utilisation d’une hybrid clustering (CLara : Clustering of Large Application)
• Partition around medoids : construction de 50 classes
• Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward
criterion : construction de n classes avec choix de n sur l’interprétation
par See-d d’un critère de minimisation de la perte de la variance
inter-classe (2 classes ne seront pas regroupées si elles sont
jugées trop différentes)
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
L’interprétation des différentes classifications obtenues selon les différents uplets
de caractéristiques testés est la clé de l’obtention d’une typologie de positions
utilisables dans l’outil :
• Exemple : le poids moyen d’une palette n’a pas d’utilité (en l’occurrence)
• Une caractéristique utilisée pour la construction des classes doit être facilement
accessible ensuite via le système d’information du client car cette
caractéristique est utilisée, entre autres, pour classer les nouvelles
positions.
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
Pour ce faire See-d a construit un modèle de classement :
• Qui est performant i.e. faire tomber une nouvelle position dans la bonne classe avec
une forte probabilité, via les random forest
• Ceci grâce au bon choix par le statisticien des variables prédicteurs (fort pouvoir de
prédiction ET disponibilité via le SI du client)
La mise à jour de l’application se fait par l’alimentation avec les nouvelles
positions à fréquence régulière
Nouvelle position 1, nouvelle position 2 , …., nouvelle position p
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
Couleur
Vert
Jaune
Rouge
Taille
Taille Forme
Petit
MoyenGros
Taille
PetitMoyen
Goût
Acide
Sucré
Pastèque
Pomme
Raisin
Rond
Raisin
Citron
Long
Banane
Raisin Cerise
Petit
Moyen
Pomme
1/ Arbre de Décision – Exemple 1
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
Val(Col2)
< 3
3 < …< 7
>7
Val(Col1) +
4 * Val(Col4)
Val(Col1) +
2 * Val(Col4)
Val(Col5)
> 1710 < …< 17< 10
Val(Col1) +
3 * Val(Col4)
> 11<11
Val(Col5) -
Val(Col7)
> 100< 100
Classe 1
Classe 2
Classe 3
> 5
Classe 2
Classe5
> 5
Classe 4
Classe 6 Classe 2
< 12
> 12
Classe 2
2/ Arbre de Décision – Exemple avec un tableau comme le notre
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
3/ Connaissant les classes trouver l’arbre qui les donne
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
3/ Connaissant les classes trouver l’arbre qui les donne
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
4/ Connaissant les classes trouver l’arbre qui les donne au mieux
pour une extraction de 80%
de lignes
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La matérialisation de l’outil via une Web App est le produit fini, utilisable, et
est très importante mais ne constitue que la face émergée de l’outil statistique
…
Que se cache-t-il derrière l’application développée ?
C
l.
1
Cla
sse
2
…
C
l.
n
Ensemble de positions
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Déploiement d’applications
Une application qui répond
exactement aux besoins,
demandes et attentes
Du sur-mesure également
dans le déploiement
Une méthode de travail qui
facilite le
déploiement
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Déploiement d’applications
• Impliquer fortement les équipes terrain
– Facilite le déploiement
– Les outils développés sont attendus
• Déployer les outils
– Que vous désire le client
– Dans l’environnement que souhaite le client
– Selon la méthode que souhaite le client
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Conclusions
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Données
Connaissance
Aide à la
décision
Modèles
mathématiques
et statistiques
Information
• Reporting
• BI Traditionnelle
• Statistique
descriptive
Point crucial
pour la pleine
valorisation
des données
Conclusions
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données
#MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Conclusions
Demande une expertise de haut
niveau :
• Docteurs - Ingénieurs
• Mathématiques - Statistique
• Modélisation
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données
http://bit.ly/MSCSevalJ2
Evaluez les sessions…
…et tentez de gagner une
Surface Pro 4
Merci Beaucoup! Thank you!
Join the conversation
#MSCloudSummit
@MSCloudSummit

Contenu connexe

Tendances

Data Science
Data ScienceData Science
Data Science
Soft Computing
 
Data Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big DataData Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big Data
Vincent Lagorce
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
Jean-Michel Franco
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
Soft Computing
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assurance
Betito Yan
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
Hassan Lâasri
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
OuailChoukhairi
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
Quentin Ambard
 
Introduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence ArtificielleIntroduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence Artificielle
Medhi Corneille Famibelle*
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
Micropole Group
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
arnaudm
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
Cynapsys It Hotspot
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
Yassine Badri
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
Vincent de Stoecklin
 
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Touria Engohan
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
Mouna Torjmen
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
Affinity Engine
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
Chloé Marty
 

Tendances (20)

Data Science
Data ScienceData Science
Data Science
 
Data Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big DataData Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big Data
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assurance
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Introduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence ArtificielleIntroduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la BIG DATA et l'Intelligence Artificielle
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 

En vedette

Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
Jean-Pierre Riehl
 
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Jean-Pierre Riehl
 
Pourquoi les CFO devraient s'intéresser à Power BI
Pourquoi les CFO devraient s'intéresser à Power BIPourquoi les CFO devraient s'intéresser à Power BI
Pourquoi les CFO devraient s'intéresser à Power BI
Sophie Marchand, M.Sc., CPA, CGA, MVP
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
Vincent de Stoecklin
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data Science
Soft Computing
 
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
Soft Computing
 
Bi crm presentation - Using Business Intelligence to Improve Customer Relations
Bi crm presentation - Using Business Intelligence to Improve Customer RelationsBi crm presentation - Using Business Intelligence to Improve Customer Relations
Bi crm presentation - Using Business Intelligence to Improve Customer Relations
Vispi Munshi
 
Avec Power BI, engagez le dialogue avec votre CRM
Avec Power BI, engagez le dialogue avec votre CRMAvec Power BI, engagez le dialogue avec votre CRM
Avec Power BI, engagez le dialogue avec votre CRM
Microsoft Technet France
 
Big Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache ZeppelinBig Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache Zeppelin
Bruno Bonnin
 
SCT - Installation Backup & Restore
SCT - Installation Backup & RestoreSCT - Installation Backup & Restore
SCT - Installation Backup & Restore
SCT TELECOM
 
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Le_GFII
 
Explorez vos données avec apache zeppelin
Explorez vos données avec apache zeppelinExplorez vos données avec apache zeppelin
Explorez vos données avec apache zeppelin
Bruno Bonnin
 
Qlik view centre de contact
Qlik view centre de contact Qlik view centre de contact
Qlik view centre de contact
Ysance
 
Hadoop @ eBay: Past, Present, and Future
Hadoop @ eBay: Past, Present, and FutureHadoop @ eBay: Past, Present, and Future
Hadoop @ eBay: Past, Present, and Future
Ryan Hennig
 
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
Marius Zaharia
 
Big Data Management For Dummies Informatica
Big Data Management For Dummies InformaticaBig Data Management For Dummies Informatica
Big Data Management For Dummies InformaticaFiona Lew
 
Conjoncture septembre 2013 trendeo
Conjoncture septembre 2013 trendeoConjoncture septembre 2013 trendeo
Conjoncture septembre 2013 trendeo
Trendeo
 
L'emploi et l'investissement en france en 2014 par trendeo
L'emploi et l'investissement en france en 2014 par trendeoL'emploi et l'investissement en france en 2014 par trendeo
L'emploi et l'investissement en france en 2014 par trendeo
Trendeo
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
Soft Computing
 
Crm business intelligence
Crm business intelligenceCrm business intelligence
Crm business intelligenceArchana Tiwari
 

En vedette (20)

Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017
 
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
 
Pourquoi les CFO devraient s'intéresser à Power BI
Pourquoi les CFO devraient s'intéresser à Power BIPourquoi les CFO devraient s'intéresser à Power BI
Pourquoi les CFO devraient s'intéresser à Power BI
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data Science
 
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
 
Bi crm presentation - Using Business Intelligence to Improve Customer Relations
Bi crm presentation - Using Business Intelligence to Improve Customer RelationsBi crm presentation - Using Business Intelligence to Improve Customer Relations
Bi crm presentation - Using Business Intelligence to Improve Customer Relations
 
Avec Power BI, engagez le dialogue avec votre CRM
Avec Power BI, engagez le dialogue avec votre CRMAvec Power BI, engagez le dialogue avec votre CRM
Avec Power BI, engagez le dialogue avec votre CRM
 
Big Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache ZeppelinBig Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache Zeppelin
 
SCT - Installation Backup & Restore
SCT - Installation Backup & RestoreSCT - Installation Backup & Restore
SCT - Installation Backup & Restore
 
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
 
Explorez vos données avec apache zeppelin
Explorez vos données avec apache zeppelinExplorez vos données avec apache zeppelin
Explorez vos données avec apache zeppelin
 
Qlik view centre de contact
Qlik view centre de contact Qlik view centre de contact
Qlik view centre de contact
 
Hadoop @ eBay: Past, Present, and Future
Hadoop @ eBay: Past, Present, and FutureHadoop @ eBay: Past, Present, and Future
Hadoop @ eBay: Past, Present, and Future
 
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics
 
Big Data Management For Dummies Informatica
Big Data Management For Dummies InformaticaBig Data Management For Dummies Informatica
Big Data Management For Dummies Informatica
 
Conjoncture septembre 2013 trendeo
Conjoncture septembre 2013 trendeoConjoncture septembre 2013 trendeo
Conjoncture septembre 2013 trendeo
 
L'emploi et l'investissement en france en 2014 par trendeo
L'emploi et l'investissement en france en 2014 par trendeoL'emploi et l'investissement en france en 2014 par trendeo
L'emploi et l'investissement en france en 2014 par trendeo
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
 
Crm business intelligence
Crm business intelligenceCrm business intelligence
Crm business intelligence
 

Similaire à Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris 2017

MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
Sébastien Paulet
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
NetSecure Day
 
Le CLOUD, c'est quoi ? - Mois du numérique 2017
Le CLOUD, c'est quoi ? - Mois du numérique 2017Le CLOUD, c'est quoi ? - Mois du numérique 2017
Le CLOUD, c'est quoi ? - Mois du numérique 2017
Cyril Marsaud
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
Excelerate Systems
 
Exploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDMExploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDM
Jean-Michel Franco
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
Excelerate Systems
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Hélène Etienne
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
Jean-Michel Franco
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft
 
Colloque Big Data Martinique 2017
Colloque Big Data Martinique 2017Colloque Big Data Martinique 2017
Colloque Big Data Martinique 2017
omsrp
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
OCTO Technology
 
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
Denodo
 
Pilotage & Performance 2012
Pilotage & Performance 2012Pilotage & Performance 2012
Pilotage & Performance 2012
Business & Decision
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
ORSYS
 
Offre onepoint - Data science et big data
Offre onepoint  - Data science et big data Offre onepoint  - Data science et big data
Offre onepoint - Data science et big data
GroupeONEPOINT
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMY
Technofutur TIC
 
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
AnDaolVras
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
Excelerate Systems
 
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Micropole Group
 

Similaire à Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris 2017 (20)

MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
MSCloudSummit Paris 2017 - lean, agile et scrum sur sharepoint et o365 - séba...
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
 
Le CLOUD, c'est quoi ? - Mois du numérique 2017
Le CLOUD, c'est quoi ? - Mois du numérique 2017Le CLOUD, c'est quoi ? - Mois du numérique 2017
Le CLOUD, c'est quoi ? - Mois du numérique 2017
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
Exploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDMExploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDM
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
 
Colloque Big Data Martinique 2017
Colloque Big Data Martinique 2017Colloque Big Data Martinique 2017
Colloque Big Data Martinique 2017
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
 
Pilotage & Performance 2012
Pilotage & Performance 2012Pilotage & Performance 2012
Pilotage & Performance 2012
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
 
Offre onepoint - Data science et big data
Offre onepoint  - Data science et big data Offre onepoint  - Data science et big data
Offre onepoint - Data science et big data
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMY
 
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
 

Plus de Jean-Pierre Riehl

SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
Jean-Pierre Riehl
 
Club Power BI - Partage et Collaboration avec Power BI
Club Power BI - Partage et Collaboration avec Power BIClub Power BI - Partage et Collaboration avec Power BI
Club Power BI - Partage et Collaboration avec Power BI
Jean-Pierre Riehl
 
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.024HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
Jean-Pierre Riehl
 
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
Jean-Pierre Riehl
 
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
Jean-Pierre Riehl
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
Jean-Pierre Riehl
 
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
Jean-Pierre Riehl
 
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Jean-Pierre Riehl
 
Gateways to Power BI, Connect PowerBI.com to your On-Prem Data
Gateways to Power BI, Connect PowerBI.com to your On-Prem DataGateways to Power BI, Connect PowerBI.com to your On-Prem Data
Gateways to Power BI, Connect PowerBI.com to your On-Prem Data
Jean-Pierre Riehl
 
Partage et Collaboration avec Power BI
Partage et Collaboration avec Power BIPartage et Collaboration avec Power BI
Partage et Collaboration avec Power BI
Jean-Pierre Riehl
 
Azure Data Factory, Mouvement de données hybride
Azure Data Factory, Mouvement de données hybrideAzure Data Factory, Mouvement de données hybride
Azure Data Factory, Mouvement de données hybride
Jean-Pierre Riehl
 
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Cortana Analytics, de nouveaux patterns pour vos plateformes de données Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Jean-Pierre Riehl
 
From Personal BI to Managed BI with Power BI
From Personal BI to Managed BI with Power BIFrom Personal BI to Managed BI with Power BI
From Personal BI to Managed BI with Power BI
Jean-Pierre Riehl
 
Deep Dive DMG (september update)
Deep Dive DMG (september update)Deep Dive DMG (september update)
Deep Dive DMG (september update)
Jean-Pierre Riehl
 
Deep Dive Data Management Gateway - SQLSaturday Edinburgh
Deep Dive Data Management Gateway - SQLSaturday EdinburghDeep Dive Data Management Gateway - SQLSaturday Edinburgh
Deep Dive Data Management Gateway - SQLSaturday Edinburgh
Jean-Pierre Riehl
 
Power BI 365
Power BI 365Power BI 365
Power BI 365
Jean-Pierre Riehl
 
Deep Dive Data Management Gateway
Deep Dive Data Management GatewayDeep Dive Data Management Gateway
Deep Dive Data Management Gateway
Jean-Pierre Riehl
 
TechDays 2015 - La gouvernance des données
TechDays 2015 - La gouvernance des donnéesTechDays 2015 - La gouvernance des données
TechDays 2015 - La gouvernance des données
Jean-Pierre Riehl
 
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
Jean-Pierre Riehl
 
Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?
Jean-Pierre Riehl
 

Plus de Jean-Pierre Riehl (20)

SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
 
Club Power BI - Partage et Collaboration avec Power BI
Club Power BI - Partage et Collaboration avec Power BIClub Power BI - Partage et Collaboration avec Power BI
Club Power BI - Partage et Collaboration avec Power BI
 
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.024HOP French 2017 - Azure Data Lake, le Big Data 2.0
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
 
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...
 
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
 
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...
 
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
 
Gateways to Power BI, Connect PowerBI.com to your On-Prem Data
Gateways to Power BI, Connect PowerBI.com to your On-Prem DataGateways to Power BI, Connect PowerBI.com to your On-Prem Data
Gateways to Power BI, Connect PowerBI.com to your On-Prem Data
 
Partage et Collaboration avec Power BI
Partage et Collaboration avec Power BIPartage et Collaboration avec Power BI
Partage et Collaboration avec Power BI
 
Azure Data Factory, Mouvement de données hybride
Azure Data Factory, Mouvement de données hybrideAzure Data Factory, Mouvement de données hybride
Azure Data Factory, Mouvement de données hybride
 
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Cortana Analytics, de nouveaux patterns pour vos plateformes de données Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
 
From Personal BI to Managed BI with Power BI
From Personal BI to Managed BI with Power BIFrom Personal BI to Managed BI with Power BI
From Personal BI to Managed BI with Power BI
 
Deep Dive DMG (september update)
Deep Dive DMG (september update)Deep Dive DMG (september update)
Deep Dive DMG (september update)
 
Deep Dive Data Management Gateway - SQLSaturday Edinburgh
Deep Dive Data Management Gateway - SQLSaturday EdinburghDeep Dive Data Management Gateway - SQLSaturday Edinburgh
Deep Dive Data Management Gateway - SQLSaturday Edinburgh
 
Power BI 365
Power BI 365Power BI 365
Power BI 365
 
Deep Dive Data Management Gateway
Deep Dive Data Management GatewayDeep Dive Data Management Gateway
Deep Dive Data Management Gateway
 
TechDays 2015 - La gouvernance des données
TechDays 2015 - La gouvernance des donnéesTechDays 2015 - La gouvernance des données
TechDays 2015 - La gouvernance des données
 
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...
 
Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?
 

Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris 2017

  • 1. @EmmanuelFrenod - @djeepy1 Data Science : Méthodologie, Outillage et Application Emmanuel Frenod -Jean-Pierre Riehl
  • 2. Merci beaucoup à nos sponsors! Thank you to all our sponsors! Join the conversation #MSCloudSummit @MSCloudSummit
  • 3. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Qui sommes nous ? Jean-Pierre Riehl Practice Manager Data & BI MVP Data Platform Local Group Leader– GUSS @djeepy1 http://blog.djeepy1.net Emmanuel Frenod Directeur Scientifique @emmanuelfrenod http://www.see-d.fr/
  • 4. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Data Science Data science, also known as data-driven science, is an interdisciplinary field about scientific processes and systems to extract knowledge or insights from data in various forms, either structured or unstructured, which is a continuation of some of the data analysis fields such as statistics, machine learning, data mining, and predictive analytics. Définition Wikipedia
  • 6. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Méthodologies existantes • CRISP-DM • KDD • SEMMA par SAS© • Cortana Analytics Process (CAP) par Microsoft© (deprecated) Processus “Data Science” TDSP : Team Data Science Process https://github.com/Azure/Microsoft-TDSP
  • 7. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Team Data Science Process
  • 8. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Processus “Data Science” Source : AZEO Data Science Process
  • 9. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS TDSP: Business Understanding Approche technique Développement Approche scientifique Modélisation Approche métier
  • 10. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS TDSP: Data Understanding Buzz words : Data Crunching Data Wrangling Statistique descriptive : remise en cause d’idées reçues Regard agnostique sur les données Nettoyage et préparation des données Objectif : Featurization
  • 11. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS TDSP: Modeling Données Connaissance Modèles mathématiques et statistiques Aide à la décision Information Reporting BI Traditionnelle Statistique descriptive Advanced Analytics
  • 12. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Modélisation mathématique et statistique Advanced Analytics : Extraire depuis les données une connaissance de haute valeur (prévision, information non évidente, etc.) en utilisant des modèles mathématiques et/ou statistiques sophistiqués et des mécanismes d’apprentissage automatique (Machine Learning). Modèle mathématique et/ou statistique sophistiqué : Un ensemble d’équations reliant des objets mathématiques avancés (des fonctions, des densités de probabilités, des séries temporelles, des graphes (arbres, grilles, réseaux, etc.), des hyper-surfaces, des maillages, des vecteurs, des matrices, etc.)
  • 14. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Outillage de la comprehension des données Langage R RTVS (R Tools for Visual Studio) R + SQLServer IDEAR Azure Machine Learning HDInsight (Books) VM Data Science Power BI Quick Insights
  • 15. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS R / RTVS
  • 16. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS TDSP : IDEAR
  • 17. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Power BI Quick Insights
  • 19. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Mise en œuvre par l’équipe See-d sur un problème de pricing chez un transporteur
  • 20. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS TDSP a été mise en œuvre par l’équipe See-d sur un problème de pricing Gains de marge
  • 21. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS La problématique du Pricing Question de notre client : ses clients paient-ils le prix optimum ?
  • 22. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Business Understanding Apports de See-d à cette compréhension Compréhension du business par See-d
  • 23. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Business Understanding • Des membres de l’équipe See-d ont fait le parcours d’intégration des personnes recrutées chez le client • Echanges fréquents avec – Les chefs de quai – Le marketing – La DSI – La Direction du commerce • Apport de See-d – Formalisation des questions – Un regard sans a priori sur l’activité et les données
  • 24. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Compréhension des données Statistique descriptive : remise en cause d’idées reçues Regard agnostique sur les données Nettoyages des données
  • 25. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS La table de données Table de positions Une position : toutes les informations concernant un transport : date, jour, type, poids, client, prix, etc.
  • 26. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS La table de données Date Jour Heure départ Heure arrivée poids … … Prix Prix/tonne … … Position 1 Position 2 Position 3 … … Position n … …
  • 27. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS La table de données Date Jour Heure départ Heure arrivée poids … … Prix Prix/tonne … … Position 1 Position 2 Position 3 … … Position n … … Explicatives Conséquences
  • 29. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Identification de sujets de questionnement et/ou d’étonnement : • Des tendances linéaires • Problèmes dans les faibles poids : • Prix très faibles • Prix très forts • Grande variabilité des prix pour un poids donné
  • 30. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Identification de sujets de questionnement et/ou d’étonnement : • Des tendances linéaires • Problèmes dans les faibles poids : • Prix très élevés • Prix très faibles • Grande variabilité des prix pour un poids donné
  • 31. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Identification de sujets de questionnement et/ou d’étonnement : • Des tendances linéaires • Problèmes dans les faibles poids : • Prix très faibles • Prix très forts • Grande variabilité des prix pour un poids donné
  • 32. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Passage en €/tonne
  • 33. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS log € 𝑡𝑜𝑛𝑛𝑒 = − log 𝐾𝑔 + 12,09 Poids (kg) €/tonne 30 5 936,1 40 4 452,1 50 3 561,6 70 2 544,0 100 1 780,8 200 890,4 300 593,6 500 356,2 800 222,6 1 500 118,7 3 000 59,4 5 000 35,6 10 000 17,8 20 000 8,9
  • 34. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS34 Poids (kg) €/tonne 30 5 936,1 40 4 452,1 50 3 561,6 70 2 544,0 100 1 780,8 200 890,4 300 593,6 500 356,2 800 222,6 1 500 118,7 3 000 59,4 5 000 35,6 10 000 17,8 20 000 8,9 Règle utilisée pour calculer le prix au forfait 100 kg Tendance cohérente: pente = -1 (Tarifs Généraux) Pas cohérent log € 𝑡𝑜𝑛𝑛𝑒 = − log 𝐾𝑔 + 12,09
  • 35. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS35 Poids (kg) €/tonne 30 5 936,1 40 4 452,1 50 3 561,6 70 2 544,0 100 1 780,8 200 890,4 300 593,6 500 356,2 800 222,6 1 500 118,7 3 000 59,4 5 000 35,6 10 000 17,8 20 000 8,9 Règle utilisée pour calculer le prix au forfait 100 kg log € 𝑡𝑜𝑛𝑛𝑒 = − log 𝐾𝑔 + 12,09 Tendance cohérente: pente négative quasi nulle Pas cohérent
  • 36. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Données Connaissance Aide à la décision Modèles mathématiques et statistiques Information • Reporting • BI Traditionnelle • Statistique descriptive Point crucial pour la pleine valorisation des données Modélisation mathématique et statistique Advanced Analytics
  • 37. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Modélisation mathématique et statistique Implémentation, déploiement Création de modèles spécifiques, tests Recherche parmi le modèles existants, tests
  • 38. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Modélisation mathématique et statistique Classifications statistiques croisées clients / positions
  • 39. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? Le coeur de l′ outil repose sur des classes de positions qui se ressemblent Cl. 1 Classe 2 … Cl. n La construction de ces classes est le challenge ∶ - car le nombre de positions est très élevé - car il faut choisir les caractéristiques des positions - car il faut choisir le nombre de classes Ensemble de positions
  • 40. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Le coeur de l′ outil repose sur des classes de positions qui se ressemblent Cl. 1 Classe 2 … Cl. n La construction de ces classes est le challenge ∶ - car le nombre de positions est très élevé - car il faut choisir les caractéristiques des positions - car il faut choisir le nombre de classes Ensemble de positions Que se cache-t-il derrière l’application développée ?
  • 41. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Cl. 1 Classe 2 … Cl. n La construction de ces classes est le challenge ∶ - car le nombre de positions est très élevé - car il faut choisir les caractéristiques des positions - car il faut choisir le nombre de classes Les méthodes classiques de classification ne sont pas adaptées … • utilisation d’une hybrid clustering (CLara : Clustering of Large Application) • Partition around medoids : construction de 50 classes • Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward criterion : construction de n classes Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
  • 42. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Cl. 1 Classe 2 … Cl. n La construction de ces classes est le challenge ∶ - car le nombre de positions est très élevé - car il faut choisir les caractéristiques des positions - car il faut choisir le nombre de classes Les méthodes classiques de classification ne sont pas adaptées … • utilisation d’une hybrid clustering (CLara : Clustering of Large Application) • Partition around medoids : construction de 50 classes • Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward criterion : construction de n classes avec choix de n sur l’interprétation par See-d d’un critère de minimisation de la perte de la variance inter-classe (2 classes ne seront pas regroupées si elles sont jugées trop différentes) Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
  • 43. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Cl. 1 Classe 2 … Cl. n La construction de ces classes est le challenge ∶ - car le nombre de positions est très élevé - car il faut choisir les caractéristiques des positions - car il faut choisir le nombre de classes L’interprétation des différentes classifications obtenues selon les différents uplets de caractéristiques testés est la clé de l’obtention d’une typologie de positions utilisables dans l’outil : • Exemple : le poids moyen d’une palette n’a pas d’utilité (en l’occurrence) • Une caractéristique utilisée pour la construction des classes doit être facilement accessible ensuite via le système d’information du client car cette caractéristique est utilisée, entre autres, pour classer les nouvelles positions. Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
  • 44. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Cl. 1 Classe 2 … Cl. n Pour ce faire See-d a construit un modèle de classement : • Qui est performant i.e. faire tomber une nouvelle position dans la bonne classe avec une forte probabilité, via les random forest • Ceci grâce au bon choix par le statisticien des variables prédicteurs (fort pouvoir de prédiction ET disponibilité via le SI du client) La mise à jour de l’application se fait par l’alimentation avec les nouvelles positions à fréquence régulière Nouvelle position 1, nouvelle position 2 , …., nouvelle position p Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
  • 45. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? - Random Forest Couleur Vert Jaune Rouge Taille Taille Forme Petit MoyenGros Taille PetitMoyen Goût Acide Sucré Pastèque Pomme Raisin Rond Raisin Citron Long Banane Raisin Cerise Petit Moyen Pomme 1/ Arbre de Décision – Exemple 1
  • 46. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? - Random Forest Val(Col2) < 3 3 < …< 7 >7 Val(Col1) + 4 * Val(Col4) Val(Col1) + 2 * Val(Col4) Val(Col5) > 1710 < …< 17< 10 Val(Col1) + 3 * Val(Col4) > 11<11 Val(Col5) - Val(Col7) > 100< 100 Classe 1 Classe 2 Classe 3 > 5 Classe 2 Classe5 > 5 Classe 4 Classe 6 Classe 2 < 12 > 12 Classe 2 2/ Arbre de Décision – Exemple avec un tableau comme le notre
  • 47. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? - Random Forest A1*Val(Col c1) + …+ A10*Val(Col c10) < S1 S2 < …< S3 > S4 > S7S5 < …< S6< S5 > S10< S10 > S11< S11 Classe 1 Classe 2 Classe 3 > S8 Classe 2 Classe5 > S8 Classe 4 Classe 6 Classe 2 < S9 > S9 Classe 2 3/ Connaissant les classes trouver l’arbre qui les donne A11*Val(Col c11) + …+ A30*Val(Col c30) A31*Val(Col c31) + …+ A37*Val(Col c37) A38*Val(Col c38) + …+ A50*Val(Col c50) A51*Val(Col c51) + …+ A60*Val(Col c60) A61*Val(Col c61) + …+ A67*Val(Col c67)
  • 48. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? - Random Forest A1*Val(Col c1) + …+ A10*Val(Col c10) < S1 S2 < …< S3 > S4 > S7S5 < …< S6< S5 > S10< S10 > S11< S11 Classe 1 Classe 2 Classe 3 > S8 Classe 2 Classe5 > S8 Classe 4 Classe 6 Classe 2 < S9 > S9 Classe 2 3/ Connaissant les classes trouver l’arbre qui les donne A11*Val(Col c11) + …+ A30*Val(Col c30) A31*Val(Col c31) + …+ A37*Val(Col c37) A38*Val(Col c38) + …+ A50*Val(Col c50) A51*Val(Col c51) + …+ A60*Val(Col c60) A61*Val(Col c61) + …+ A67*Val(Col c67)
  • 49. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Que se cache-t-il derrière l’application développée ? - Random Forest A1*Val(Col c1) + …+ A10*Val(Col c10) < S1 S2 < …< S3 > S4 > S7S5 < …< S6< S5 > S10< S10 > S11< S11 Classe 1 Classe 2 Classe 3 > S8 Classe 2 Classe5 > S8 Classe 4 Classe 6 Classe 2 < S9 > S9 Classe 2 4/ Connaissant les classes trouver l’arbre qui les donne au mieux pour une extraction de 80% de lignes A11*Val(Col c11) + …+ A30*Val(Col c30) A31*Val(Col c31) + …+ A37*Val(Col c37) A38*Val(Col c38) + …+ A50*Val(Col c50) A51*Val(Col c51) + …+ A60*Val(Col c60) A61*Val(Col c61) + …+ A67*Val(Col c67)
  • 50. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS La matérialisation de l’outil via une Web App est le produit fini, utilisable, et est très importante mais ne constitue que la face émergée de l’outil statistique … Que se cache-t-il derrière l’application développée ? C l. 1 Cla sse 2 … C l. n Ensemble de positions
  • 51. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Déploiement d’applications Une application qui répond exactement aux besoins, demandes et attentes Du sur-mesure également dans le déploiement Une méthode de travail qui facilite le déploiement
  • 52. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Déploiement d’applications • Impliquer fortement les équipes terrain – Facilite le déploiement – Les outils développés sont attendus • Déployer les outils – Que vous désire le client – Dans l’environnement que souhaite le client – Selon la méthode que souhaite le client
  • 53. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Conclusions Avec une expertise rare en Advanced Analytics Une équipe qui maîtrise toute la chaine du traitement des données
  • 54. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Données Connaissance Aide à la décision Modèles mathématiques et statistiques Information • Reporting • BI Traditionnelle • Statistique descriptive Point crucial pour la pleine valorisation des données Conclusions Avec une expertise rare en Advanced Analytics Une équipe qui maîtrise toute la chaine du traitement des données
  • 55. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS Conclusions Demande une expertise de haut niveau : • Docteurs - Ingénieurs • Mathématiques - Statistique • Modélisation Avec une expertise rare en Advanced Analytics Une équipe qui maîtrise toute la chaine du traitement des données
  • 56. http://bit.ly/MSCSevalJ2 Evaluez les sessions… …et tentez de gagner une Surface Pro 4
  • 57. Merci Beaucoup! Thank you! Join the conversation #MSCloudSummit @MSCloudSummit

Notes de l'éditeur

  1. CRISP-DM : Cross Industry Standard Process for Data Mining SEMMA : Sample, Explore, Modify, Model, and Assess