JSS2014 – Azure ML et Data Mining SSAS

507 vues

Publié le

Session des Journées SQL Server 2014 - Patrice Harel
---
L’objectif sera de comparer les comportements entre les résultats des modèles AML et ceux de SSAS.

Publié dans : Données & analyses
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
507
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

JSS2014 – Azure ML et Data Mining SSAS

  1. 1. Les journées SQL Server 2014 Un événement organisé par GUSS
  2. 2. Les journées SQL Server 2014 Un événement organisé par GUSS Data mining Avec SSAS et Azure ML Patrice Harel
  3. 3. Merci à nos sponsors
  4. 4. 4
  5. 5. 5 Objectifs Architecture Data mining Avec SSAS Avec Azure ML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML 5
  6. 6. 6 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML De ce dont nous allons discuter – Concepts généraux du data mining – La mise en place avec AS (basique) – La mise en place avec Azur ML (basique) Ce que nous n’aborderons pas en détail – Comment choisir son(ses) algorithme(s) – Le processus itératif – Le reporting – Les performances Avec un cadre, un format différent
  7. 7. 7 Accident de la route (2006-2011), data.gouv.fr POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Catégorie de route Luminosité Type d’agglomération Organisme gouvernemental Conditions atmosphériques Type de collision Informations géographiques (commune, …) Situation de l’accident Régime de circulation Nombre de voies de circulation Catégorie du véhicule Nombre de morts Nombre de blessés Nombre d’hospitalisés …
  8. 8. 8 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Pour les besoins de la session Fichiers plats SSIS SQL SSAS Mining SSAS DM AML
  9. 9. 9 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Data mining Machine Learning Appliquer des algorithmes de recherche de modèles (patterns) sur d’importants volume de données Se réfère à la partie algorithme du data mining Trouver des relations supplémentaires, faire de la prédiction, intelligible pour un humain « Désigne les ajustements d’un système par lui-même dans le sens ou ce système pourra effectuer une même tâche une seconde fois mais de manière plus efficace » Né des besoins sur les bases de données Né des besoins en intelligence artificielle Exploitent des données
  10. 10. 10 Se poser les bonnes questions, définir ses objectifs – Quels facteurs de risques sont les plus importants? – En fonction des paramètres, déterminer si il y aura des morts/blessés – Définir la variable à expliquer, les variables explicatives – Définir la population cible Par rapport à la BI - Vient en complément - Mettre à disposition des données utiles - Utiliser les statistiques descriptives POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  11. 11. 11 Scinder la source de données en deux – Un échantillon de travail – Un échantillon de validation Analyses descriptives, analyses prédictives – Clustering, Séquence – Analyse discriminante, régression logistique/linéaire POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  12. 12. 12 Cycle de développement POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Choix du sujet, définition des objectifs Inventaire des données disponibles Extraire, transformer, corriger et rassembler les données Statistiques descriptives Choix de l’algorithme Validation du modèle, déploiement Fiabilité (aberration) Disponibilité/Quantité Pondération Pertinence Corrélation (trop ou trop peu) Par itérations En fonction des objectifs Quelle cible? Quels informations pour expliquer? Sur quelle période?
  13. 13. 13 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML La problématique : Puis-je prédire, en fonction des caractéristiques d’un accident si il y aura ou non des morts/hospitalisés? Création d’une nouvelle variable : EstGrave
  14. 14. 14 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Objets SSAS DM Structure Model Case / Nested Other Content Type Key Data Source Inputs / Outputs Algorithm
  15. 15. 15 Objets AML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Experiment Des trucs Data Set Encore des trucs Model
  16. 16. 16 ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON SSAS AML Intégration à une chaîne décisionnelle classique Interface de développement Ouverture, souplesse Performances Avenir (pour Microsoft) Avenir (pour la cause)
  17. 17. #JSS2014

×