Gouvernance des données                Jean-Pierre RIEHL        Practice Manager SQL/BI                            @AzeoTn...
Jean-Pierre Riehl  Membre du Board  http://blog.djeepy1.net  @djeepy1            MVP SQL Server            MCSA : SQL Serv...
Rejoignez la Communauté
Data DelugeExplosion des données, variété destypes, vélocité, Big Data, etc.Capteurs, logs, Open Data, Web 2.0,données géo...
L’importance de la donnée                            Valeur
La réalité du terrain     Trouver             Accéder                  Partager       Enrichir                            ...
Pas de compromisBI d‟entreprise           BI d„équipe             BI personnelle• Industrialisée          • Partagée      ...
Du bon usage…                                                   ContrôleContrôlé                            EDW• Données g...
Une plate-forme pour gérer ?                                                                                          Exce...
« D’ici 2015, les sociétés qui construirontdes     systèmes     de     gestion     del’information surpasseront de 20% leu...
Outils(Utilisateurs + Données ) x      = Valeur                            IT
Gouverner v. t.« Diriger la conduite de choses ou de personnes »
Approche #1L’OPEN BAR
Open Bar• Liberté totale• Aucune contrainteMais…• Pas de contrôle• Pas de synergie
Open BarPour contrebalancer• Silos• Diviser pour régner• Hub & Communautés                        …Principe de subsidiarité
Approche #2Magasin de données
Magasin de donnéesCréer un point d‟accès central auxdonnées   Enterprise Data WarehouseUtiliser des patterns existantes• L...
Approche #3Data Lifecycle Management
Data Lifecycle Management             Traçabilité / Sécurité                                       Archivage              ...
Approche #4Workflows
Workflows                    Sandox        Crée                             Publie                Approuve       Dérive   ...
Workflows : applicationsPowerPivot / Power View          Reporting ServicesSources : Toutes                 Sources : Tout...
Un Système de Gestion del’Information
Un Système de Gestion de l’Information                     Addin PowerPivot                    Autres                     ...
SELF-SERVICE ETL
Self-Service ETL                                         Report     SQL                                         Builder   ...
DATA EXPLORER (ALPHA)
Synthèse (…et bonnes pratiques)
SynthèseUne démarche agile  –   on libère la créativité des utilisateurs  –   on leur fournit des guides  –   on surveille...
Bonnes pratiquesMettez à disposition les outils, formez, accompagnezles utilisateursMettez des guides, définissez des proc...
Bonnes pratiquesImportance du process de décision  – Engagement de toutes les parties  – Arbitrage de process   Souvent p...
Libérez les données, libérez les
Bonnes pratiquesOptimisez les process en permanenceSurveillez les usages   – Sources de données   – Utilisation des proces...
Donnez votre avis !                   Depuis votre smartphone, sur :                    http://notes.mstechdays.fr    De n...
Développeurs                                                         Pros de l‟IT http://aka.ms/generation-app       Forme...
Prochain SlideShare
Chargement dans... 5
×

Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Explorer

368

Published on

Maîtriser les données est l'une des clés de la réussite des entreprises. C'est pourquoi l'EIM (Enterprise Information Management) est devenu un challenge dans nos systèmes d'information. Pour cela, il faut des outils et des processus. Pour les outils, SQL Server nous met à disposition SSIS, DQS et MDS qui, ensemble, permettent une bonne gestion des données de l'entreprise. Pour les processus, il faut maintenant adopter une réelle gouvernance pour piloter les usages et garantir la qualité des données. Data Explorer, actuellement en version Preview offre aux utilisateurs le moyen de créer leurs propres mashup de données. Nettoyage, transformation, enrichissement, cet outil permet de préparer facilement ses données avant de les utiliser dans les outils de BI personnelle comme PowerPivot et Power View. Data Explorer est un ETL en mode Self-Service, la brique qui manquait dans la plate-forme SQL Server.

Published in: Technologies
0 commentaires
0 mentions J'aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Be the first to like this

Aucun téléchargement
Vues
Total des vues
368
Sur Slideshare
0
À partir des ajouts
0
Nombre d'ajouts
0
Actions
Partages
0
Téléchargements
27
Commentaires
0
J'aime
0
Ajouts 0
No embeds

No notes for slide
  • Intro Office / B2B / LOB / entreprise
  • 85% de nouveaux typesx10 tous les 5 ansTous les éditeurs nous disent qu’ils savent gérer cela (PDW, Hadoop, etc.)
  • Bad Data = Bad Business // L’inverse est vraiLa donnée est un actif de l'entreprise.Mais un actif mal exploité. A qui appartient la donnée ? Plus la société est grande, plus la donnée est éclatée
  • What’s the problem ?Trouver : où se trouve l’informationAccéder : ai-je accès à cette informationEnrichir, Qualifier: la valeur ajoutée que je mets dans ces donnéesNettoyer, conformer : rendre fiable ces donnéesSécuriser : empêcher que des personnes non accréditées accèdent à aux donnéesPartager :
  • Mêmes problématiques à tous les étagesPas de compromis : tout centraliser ou tout libérer
  • Ca, c’est la plate-forme qui existe.On peut citer également Data Explorer et Azure Data Market, OData
  • Comment fait-on ?Il faut conjuguer tous ces aspects.
  • Le premier pas vers une bonne gouvernance, c’est de conjuguer les efforts,c’est de travailler en équipe, de collaborerVoyons quelques approches.
  • L'approche DataWarehouse semble y répondre mais elle est utilisée depuis des années et ne semble pas tout résoudre.Pourquoi ?Patterns : système de référencement; la bibliothécaire; les achats, l’inventaire, etc.
  • acquisition : importation/création qualification : nettoyage, enrichissementvalidation : consolidation : mise à dispositionAnalysearchivage / purge /décommisionnementtracabilité/Sécurité
  • Exemples de workflow de gouvernance des données:-création de rapport, dérivation de rapports et Datasets partagés-réutilisation de modèle powerpivot-création de modèle PowerPivot --> il faut un chef d'orchestre et des métriques
  • La transformation des données a posterioriPour les dev on a l'ETLMais pour notre Information Worker ?
  • -tsv-append-union-source web-exploitation avec PowerPivot & PowerView
  • 1. La nature a horreur du vide, si vous ne mettez pas la solution dans les mains de l’utilisateur, il en inventera une2. La confiance n'exclut pas une certaine forme de contrôle
  • Notation
  • Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Explorer

    1. 1. Gouvernance des données Jean-Pierre RIEHL Practice Manager SQL/BI @AzeoTnT http://azeo.com
    2. 2. Jean-Pierre Riehl Membre du Board http://blog.djeepy1.net @djeepy1 MVP SQL Server MCSA : SQL Server 2012 MCITP : Business Intelligence Developer 2008 MCITP : Database Administrator 2008 MCPD : Enterprise Application Microsoft Certified Trainer Pure-Player Microsoft • Practice Collaboration • Practice SQL/BI • Practice Infrastructure • Practice Développementhttp://www.azeo.com
    3. 3. Rejoignez la Communauté
    4. 4. Data DelugeExplosion des données, variété destypes, vélocité, Big Data, etc.Capteurs, logs, Open Data, Web 2.0,données géographiques, etc.
    5. 5. L’importance de la donnée Valeur
    6. 6. La réalité du terrain Trouver Accéder Partager Enrichir Sécuriser Qualifier Conformer Offline Archiver Nettoyer Performances Dédoublonner
    7. 7. Pas de compromisBI d‟entreprise BI d„équipe BI personnelle• Industrialisée • Partagée • Centrée sur un document• Contexte d‟entreprise • Données restreintes • Créée par un utilisateur• Données DataWarehouse • Utilisation avancée • Réactivité
    8. 8. Du bon usage… ContrôleContrôlé EDW• Données gérées• Reporting “Statique” Dashboard &• Contenu Push ScorecardsDurée de vie courte Collaboration• Partage d’équipe• Reporting adhoc Sites projetA la main de l’utilisateur• Pas de contrôle• Personnel / Privé Dossiers personnels My Sites Devices
    9. 9. Une plate-forme pour gérer ? Excel SQL Server SQL Server Data Quality SQL Server SGBD Services Master Data PowerPivot Services Power View Qualité Master Data Management SQL Server Analysis Services Tableaux de bord Modèles SharePoint SQL Server SQL Server SQL ServerStreamInsight CEP Integration Services Data ETL Warehouse SQL Server Reporting Services
    10. 10. « D’ici 2015, les sociétés qui construirontdes systèmes de gestion del’information surpasseront de 20% leursconcurrents » Gartner
    11. 11. Outils(Utilisateurs + Données ) x = Valeur IT
    12. 12. Gouverner v. t.« Diriger la conduite de choses ou de personnes »
    13. 13. Approche #1L’OPEN BAR
    14. 14. Open Bar• Liberté totale• Aucune contrainteMais…• Pas de contrôle• Pas de synergie
    15. 15. Open BarPour contrebalancer• Silos• Diviser pour régner• Hub & Communautés …Principe de subsidiarité
    16. 16. Approche #2Magasin de données
    17. 17. Magasin de donnéesCréer un point d‟accès central auxdonnées Enterprise Data WarehouseUtiliser des patterns existantes• Logistique• Bibliothèque
    18. 18. Approche #3Data Lifecycle Management
    19. 19. Data Lifecycle Management Traçabilité / Sécurité Archivage Partage
    20. 20. Approche #4Workflows
    21. 21. Workflows Sandox Crée Publie Approuve Dérive Améliore Découverte Hub de données Modèles, OData, Rapports, DWH, MDM, etc.
    22. 22. Workflows : applicationsPowerPivot / Power View Reporting ServicesSources : Toutes Sources : ToutesDérivation : Dérivation :• Autres modèles • Autres rapports• Rapports • DataSet partagés / Report PartsEdition : PowerPivot Edition : Report BuilderSandbox : SharePoint / My Site Sandbox : SharePoint / My SiteApprobation : SharePoint Approbation : SharePointNormalisation : SSAS Tabulaire Normalisation : BIDS
    23. 23. Un Système de Gestion del’Information
    24. 24. Un Système de Gestion de l’Information Addin PowerPivot Autres Addin MDS sources Site Collection Site Col Discovery Power Excel Pivot Services … DWH Workflows Modèles SSRS Ferme SharePoint
    25. 25. SELF-SERVICE ETL
    26. 26. Self-Service ETL Report SQL Builder Legacy Azure Restit. Power View Façonnage Nettoyage Formatage Agrégation Règles métiers …
    27. 27. DATA EXPLORER (ALPHA)
    28. 28. Synthèse (…et bonnes pratiques)
    29. 29. SynthèseUne démarche agile – on libère la créativité des utilisateurs – on leur fournit des guides – on surveille ce quils font – on optimise les chemins des données
    30. 30. Bonnes pratiquesMettez à disposition les outils, formez, accompagnezles utilisateursMettez des guides, définissez des process – Faites les respecter – Faites les vivre
    31. 31. Bonnes pratiquesImportance du process de décision – Engagement de toutes les parties – Arbitrage de process  Souvent porté par la Direction GénéraleRôle de Data Steward
    32. 32. Libérez les données, libérez les
    33. 33. Bonnes pratiquesOptimisez les process en permanenceSurveillez les usages – Sources de données – Utilisation des processMonitoring, Audit & Scripting
    34. 34. Donnez votre avis ! Depuis votre smartphone, sur : http://notes.mstechdays.fr De nombreux lots à gagner toutes les heures !!! Claviers, souris et jeux Microsoft… Merci de nous aider à améliorer les TechDayshttp://notes.mstechdays.fr
    35. 35. Développeurs Pros de l‟IT http://aka.ms/generation-app Formez-vous en ligne www.microsoftvirtualacademy.com http://aka.ms/evenements- developpeurs Retrouvez nos évènements http://aka.ms/itcamps-france Les accélérateurs Faites-vous accompagnerWindows Azure, Windows Phone, gratuitement Windows 8 Essayer gratuitement nos http://aka.ms/telechargements solutions IT La Dev‟Team sur MSDN Retrouver nos experts L’IT Team sur TechNet http://aka.ms/devteam Microsoft http://aka.ms/itteam
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×