Les journées
SQL Server 2014
Un événement organisé par GUSS
Les journées
SQL Server 2014
Un événement organisé par GUSS
Data mining
Avec SSAS et Azure ML
Patrice Harel
Merci à nos sponsors
4
5
Objectifs
Architecture
Data mining
Avec SSAS
Avec Azure ML
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
5
6
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
De ce dont nous allons discuter
– Concepts généraux du data min...
7
Accident de la route (2006-2011), data.gouv.fr
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Catégorie de
rou...
8
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Pour les besoins de la session
Fichiers
plats
SSIS SQL SSAS
Min...
9
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Data mining Machine Learning
Appliquer des algorithmes de reche...
10
Se poser les bonnes questions, définir ses objectifs
– Quels facteurs de risques sont les plus importants?
– En fonctio...
11
Scinder la source de données en deux
– Un échantillon de travail
– Un échantillon de validation
Analyses descriptives, ...
12
Cycle de développement
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Choix du sujet,
définition des
objectif...
13
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
La problématique : Puis-je prédire, en fonction des
caractéris...
14
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Objets SSAS DM
Structure
Model
Case / Nested
Other Content Typ...
15
Objets AML
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Experiment
Des trucs
Data Set
Encore des trucs
Model
16
ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON
SSAS AML
Intégration à une chaîne décisionnell...
#JSS2014
Prochain SlideShare
Chargement dans…5
×

JSS2014 – Azure ML et Data Mining SSAS

520 vues

Publié le

Session des Journées SQL Server 2014 - Patrice Harel
---
L’objectif sera de comparer les comportements entre les résultats des modèles AML et ceux de SSAS.

Publié dans : Données & analyses
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
520
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

JSS2014 – Azure ML et Data Mining SSAS

  1. 1. Les journées SQL Server 2014 Un événement organisé par GUSS
  2. 2. Les journées SQL Server 2014 Un événement organisé par GUSS Data mining Avec SSAS et Azure ML Patrice Harel
  3. 3. Merci à nos sponsors
  4. 4. 4
  5. 5. 5 Objectifs Architecture Data mining Avec SSAS Avec Azure ML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML 5
  6. 6. 6 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML De ce dont nous allons discuter – Concepts généraux du data mining – La mise en place avec AS (basique) – La mise en place avec Azur ML (basique) Ce que nous n’aborderons pas en détail – Comment choisir son(ses) algorithme(s) – Le processus itératif – Le reporting – Les performances Avec un cadre, un format différent
  7. 7. 7 Accident de la route (2006-2011), data.gouv.fr POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Catégorie de route Luminosité Type d’agglomération Organisme gouvernemental Conditions atmosphériques Type de collision Informations géographiques (commune, …) Situation de l’accident Régime de circulation Nombre de voies de circulation Catégorie du véhicule Nombre de morts Nombre de blessés Nombre d’hospitalisés …
  8. 8. 8 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Pour les besoins de la session Fichiers plats SSIS SQL SSAS Mining SSAS DM AML
  9. 9. 9 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Data mining Machine Learning Appliquer des algorithmes de recherche de modèles (patterns) sur d’importants volume de données Se réfère à la partie algorithme du data mining Trouver des relations supplémentaires, faire de la prédiction, intelligible pour un humain « Désigne les ajustements d’un système par lui-même dans le sens ou ce système pourra effectuer une même tâche une seconde fois mais de manière plus efficace » Né des besoins sur les bases de données Né des besoins en intelligence artificielle Exploitent des données
  10. 10. 10 Se poser les bonnes questions, définir ses objectifs – Quels facteurs de risques sont les plus importants? – En fonction des paramètres, déterminer si il y aura des morts/blessés – Définir la variable à expliquer, les variables explicatives – Définir la population cible Par rapport à la BI - Vient en complément - Mettre à disposition des données utiles - Utiliser les statistiques descriptives POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  11. 11. 11 Scinder la source de données en deux – Un échantillon de travail – Un échantillon de validation Analyses descriptives, analyses prédictives – Clustering, Séquence – Analyse discriminante, régression logistique/linéaire POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  12. 12. 12 Cycle de développement POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Choix du sujet, définition des objectifs Inventaire des données disponibles Extraire, transformer, corriger et rassembler les données Statistiques descriptives Choix de l’algorithme Validation du modèle, déploiement Fiabilité (aberration) Disponibilité/Quantité Pondération Pertinence Corrélation (trop ou trop peu) Par itérations En fonction des objectifs Quelle cible? Quels informations pour expliquer? Sur quelle période?
  13. 13. 13 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML La problématique : Puis-je prédire, en fonction des caractéristiques d’un accident si il y aura ou non des morts/hospitalisés? Création d’une nouvelle variable : EstGrave
  14. 14. 14 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Objets SSAS DM Structure Model Case / Nested Other Content Type Key Data Source Inputs / Outputs Algorithm
  15. 15. 15 Objets AML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Experiment Des trucs Data Set Encore des trucs Model
  16. 16. 16 ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON SSAS AML Intégration à une chaîne décisionnelle classique Interface de développement Ouverture, souplesse Performances Avenir (pour Microsoft) Avenir (pour la cause)
  17. 17. #JSS2014

×