Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Azure Data Lake est LA technologie "big data" maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l'été dernier dans Azure et s'enrichit mois après mois.
ADL, concrètement, c'est quoi ? C'est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...Jean-Pierre Riehl
--session donnée dans le cadre du SQLSaturday Toulouse 2017--
Discover Azure Date Lake through a complete demo : how to get insights from tons of text, photos and videos ? From different media files and raw data, we will analyze sentiment of characters and get valuable information in a Power BI dashboard, using Cognitive Services, CNTK, .NET and U-SQL.
This session will mainly showcase Azure Data Lake and U-SQL language. But demos will involve different tools like Azure Data Factory for data supply chain and orchestration, Azure SQL Datawarehouse for corporate data and also Azure Machine Learning and Power BI.
Even if this session is demo-driven, we won't omit to present you concepts and features of Azure Data Lake.
24HOP French 2017 - Azure Data Lake, le Big Data 2.0Jean-Pierre Riehl
--session donnée dans le cadre du 24 Hours of PASS en français, édition 2017--
Azure Data Lake est LA technologie « big data » maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l’été dernier dans Azure et s’enrichit mois après mois.
ADL, concrètement, c’est quoi ? C’est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Dans cette session, vous découvrirez Azure Data Lake et toutes les possibilités qui s’ouvrent à vous
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Jean-Pierre Riehl
-- session présentée dans le cadre du MS Cloud Summit Paris 2017 avec Emmanuel Frenod --
L’approche Data Science des données révolutionne l’analyse traditionnelle. La façon d’appréhender les questions, la méthodologie à suivre ainsi que l’outillage à utiliser sont différents de la BI traditionnelle. Nous aborderons dans cette session ces différences et pointeront les bonnes pratiques de la Data Science avec les outils Microsoft au travers d’un cas d’utilisation concret. Ce « retour d’expérience » expliquera, en illustrant le propos à travers des applications réalisées pour des entreprises de transport, des réparateurs et des grossistes en bâtiment, comment la Data Science aide à la mise au point des prix pendant leur négociation
Vélib est un service public à grande échelle de location de vélos sur la région parisienne en France. Lancé le 15 juillet 2007, le service propose aujourd’hui environ 14 500 vélos et 1230 stations sur Paris. Grâce à la suite Azure Cortana Analytics Suite, nous allons mettre en place une solution d’analyse des données de ces Vélib de façon à répondre à 2 problématiques :
- Obtenir une analyse descriptive en temps réel du réseau Vélib
- Mettre à disposition une analyse prédictive permettant de prédire la disponibilité du nombre de vélos et de stations disponibles pour une station donnée.
Dans la présentation nous montrerons comment nous avons mis en place la solution dans le Cloud Azure à l’aide des services suivants :
- Azure Event Hubs
- Azure Stream Analytics
- Azure Data Factory
- Azure Machine Learning
- Azure SQL Database
- Power BI
Oxalide MorningTech #1 - BigData
1er MorningTech @Oxalide, animé par Ludovic Piot (@lpiot), le 15 décembre 2016.
Pour cette 1ère édition du Morning Tech nous vous proposons une overview sur un des thèmes du moment : le Big Data.
Au delà de ce buzz word nous aborderons :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et nous finirons par un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles
Subject: Oxalide's 1st MorningTech talk about BigData.
Date: 15-dec-2016
Speakers: Ludovic Piot (@lpiot, @oxalide)
Language: french
Lien SpeakerDeck : https://speakerdeck.com/lpiot/oxalide-morningtech-number-1-bigdata
Lien SlideShare : https://www.slideshare.net/LudovicPiot/oxalide-morningtech-1-bigdata
YouTube Video capture: https://youtu.be/7O85lRzvMY0
Main topics:
* Les grands enjeux du BigData
** les 3 V du Gartner : volume, variété, vélocité
* Le stockage des données
** datalake
** les technos
* L'ingestion des données
** ETL
** datastream
** les technos
* Les enjeux du compute
** map-reduce
** spark
** lambda architecture
* Démo d'une plateforme BigData sur AWS
* L'intelligence artificielle
** datascience exploratoire et notebooks,
** machine learning,
** deep learning,
** data pipeline
** les technos
* Pour aller plus loin
** La gouvernance des données
** La dataviz
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Azure Data Lake est LA technologie "big data" maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l'été dernier dans Azure et s'enrichit mois après mois.
ADL, concrètement, c'est quoi ? C'est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...Jean-Pierre Riehl
--session donnée dans le cadre du SQLSaturday Toulouse 2017--
Discover Azure Date Lake through a complete demo : how to get insights from tons of text, photos and videos ? From different media files and raw data, we will analyze sentiment of characters and get valuable information in a Power BI dashboard, using Cognitive Services, CNTK, .NET and U-SQL.
This session will mainly showcase Azure Data Lake and U-SQL language. But demos will involve different tools like Azure Data Factory for data supply chain and orchestration, Azure SQL Datawarehouse for corporate data and also Azure Machine Learning and Power BI.
Even if this session is demo-driven, we won't omit to present you concepts and features of Azure Data Lake.
24HOP French 2017 - Azure Data Lake, le Big Data 2.0Jean-Pierre Riehl
--session donnée dans le cadre du 24 Hours of PASS en français, édition 2017--
Azure Data Lake est LA technologie « big data » maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l’été dernier dans Azure et s’enrichit mois après mois.
ADL, concrètement, c’est quoi ? C’est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Dans cette session, vous découvrirez Azure Data Lake et toutes les possibilités qui s’ouvrent à vous
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Jean-Pierre Riehl
-- session présentée dans le cadre du MS Cloud Summit Paris 2017 avec Emmanuel Frenod --
L’approche Data Science des données révolutionne l’analyse traditionnelle. La façon d’appréhender les questions, la méthodologie à suivre ainsi que l’outillage à utiliser sont différents de la BI traditionnelle. Nous aborderons dans cette session ces différences et pointeront les bonnes pratiques de la Data Science avec les outils Microsoft au travers d’un cas d’utilisation concret. Ce « retour d’expérience » expliquera, en illustrant le propos à travers des applications réalisées pour des entreprises de transport, des réparateurs et des grossistes en bâtiment, comment la Data Science aide à la mise au point des prix pendant leur négociation
Vélib est un service public à grande échelle de location de vélos sur la région parisienne en France. Lancé le 15 juillet 2007, le service propose aujourd’hui environ 14 500 vélos et 1230 stations sur Paris. Grâce à la suite Azure Cortana Analytics Suite, nous allons mettre en place une solution d’analyse des données de ces Vélib de façon à répondre à 2 problématiques :
- Obtenir une analyse descriptive en temps réel du réseau Vélib
- Mettre à disposition une analyse prédictive permettant de prédire la disponibilité du nombre de vélos et de stations disponibles pour une station donnée.
Dans la présentation nous montrerons comment nous avons mis en place la solution dans le Cloud Azure à l’aide des services suivants :
- Azure Event Hubs
- Azure Stream Analytics
- Azure Data Factory
- Azure Machine Learning
- Azure SQL Database
- Power BI
Oxalide MorningTech #1 - BigData
1er MorningTech @Oxalide, animé par Ludovic Piot (@lpiot), le 15 décembre 2016.
Pour cette 1ère édition du Morning Tech nous vous proposons une overview sur un des thèmes du moment : le Big Data.
Au delà de ce buzz word nous aborderons :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et nous finirons par un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles
Subject: Oxalide's 1st MorningTech talk about BigData.
Date: 15-dec-2016
Speakers: Ludovic Piot (@lpiot, @oxalide)
Language: french
Lien SpeakerDeck : https://speakerdeck.com/lpiot/oxalide-morningtech-number-1-bigdata
Lien SlideShare : https://www.slideshare.net/LudovicPiot/oxalide-morningtech-1-bigdata
YouTube Video capture: https://youtu.be/7O85lRzvMY0
Main topics:
* Les grands enjeux du BigData
** les 3 V du Gartner : volume, variété, vélocité
* Le stockage des données
** datalake
** les technos
* L'ingestion des données
** ETL
** datastream
** les technos
* Les enjeux du compute
** map-reduce
** spark
** lambda architecture
* Démo d'une plateforme BigData sur AWS
* L'intelligence artificielle
** datascience exploratoire et notebooks,
** machine learning,
** deep learning,
** data pipeline
** les technos
* Pour aller plus loin
** La gouvernance des données
** La dataviz
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de donnéesGUSS
Cette session, destinée aux débutants de SQL Server ou à toutes personnes qui veulent en connaître plus, présentera les différents composants de SQL Server, à savoir le moteur de bases de données et ses diverses fonctionnalités mais aussi les outils qui peuvent constituer une plate-forme décisionnelle. Session présentée lors du SQLSaturday Paris 2014
Au delà de ce buzz word :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles.
Session des Journées SQL Server 2014 - Philippe Geiger & Grégory Boge
----
Dans cette session de découverte de StreamInsight, nous discuterons de ce que sont les événements complexes et comment StreamInsight les traite via quelques exemples simples.
Panorama comparatif des outils de reporting et Dashboarding Microsoft : Excel, SSRS et Power View. Les plus de chacun de ces outils de reporting pour répondre à tous vos besoins.
Speakers : Stéphane Vivien (GFI Informatique), Michael Nokhamzon (GFI Informatique), Laurent Miltgen-Delinchamp (Cumulos)
L'offre Deagital vous propose d'améliorer la qualité de la donnée de votre Historian / Data Lake par la qualification fonctionnelle des données (mesures). Ce document présente le contenu de l'offre et les raisons de choisir Deagital.Bonne lecture, José Torres, Deagital
Lors de la session, nous verrons :
– Des scénarios d’usage
– Comment utiliser Storm et HBase pour analyser de grandes volumétries de données en temps réel
– Comment utiliser le service Azure Stream Analytics pour analyser en temps réel des évènements complexes
Au programme, plein de démos concrètes d’utilisation de l’analyse en temps réel d’évènements fréquents.
http://guss.pro/2014/10/26/jss2014-big-data-real-time/
Projet Jaspersoft BI pour une société multi-enseignesAudaxis
Pendant un séminaire organisé avec l'éditeur Jaspersoft, Audaxis a présenté un de ses projets BI allant de la conception de l'environnement à la construction du datawarehouse au développement des tableaux de bord personnalisés.
Grâce à Jaspersoft, Laser Loyalty, société spécialisée dans les offres marketing multi-enseignes de fidélisation clients dispose d'un reporting automatique pour une amélioration de la performance et des prises de décision.
Session des Journées SQL Server 2014 - Romain Casteres & Benjamin Guinebertière
----
Lors de la session, nous verrons :
– Des scénarios d’usage
– Comment utiliser Storm et HBase pour analyser de grandes volumétries de données en temps réel
– Comment utiliser le service Azure Stream Analytics pour analyser en temps réel des évènements complexes
Au programme, plein de démos concrètes d’utilisation de l’analyse en temps réel d’évènements fréquents.
Point de vue expert: la stratégie “ comptoir des données”Denodo
Watch full webinar here: https://bit.ly/3CS93vx
François Bouteyre, directeur conseil chez Sopra Steria Next illustre en quelques minutes les attentes, besoins, contraintes datas des métiers.
Pendant cette session, le Directeur Conseil de Sopra Steria revient sur les points d’incompréhensions et de tensions des métiers avec les experts data.
Suite aux échecs successifs des approches traditionnelles, François Bouteyre propose une nouvelle voie pour soutenir les métiers.
En visionnant cette session vidéo, vous allez apprendre:
- à mieux appréhender les concepts de “comptoir des données”
- comment le data mesh, la data fabric et la data virtualization sont compatibles
- comment les entreprises modernes peuvent passer à l’échelle
SQLSaturday Paris 2014 - Bien choisir sa plate-forme de donnéesGUSS
Cette session, destinée aux débutants de SQL Server ou à toutes personnes qui veulent en connaître plus, présentera les différents composants de SQL Server, à savoir le moteur de bases de données et ses diverses fonctionnalités mais aussi les outils qui peuvent constituer une plate-forme décisionnelle. Session présentée lors du SQLSaturday Paris 2014
Au delà de ce buzz word :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles.
Session des Journées SQL Server 2014 - Philippe Geiger & Grégory Boge
----
Dans cette session de découverte de StreamInsight, nous discuterons de ce que sont les événements complexes et comment StreamInsight les traite via quelques exemples simples.
Panorama comparatif des outils de reporting et Dashboarding Microsoft : Excel, SSRS et Power View. Les plus de chacun de ces outils de reporting pour répondre à tous vos besoins.
Speakers : Stéphane Vivien (GFI Informatique), Michael Nokhamzon (GFI Informatique), Laurent Miltgen-Delinchamp (Cumulos)
L'offre Deagital vous propose d'améliorer la qualité de la donnée de votre Historian / Data Lake par la qualification fonctionnelle des données (mesures). Ce document présente le contenu de l'offre et les raisons de choisir Deagital.Bonne lecture, José Torres, Deagital
Lors de la session, nous verrons :
– Des scénarios d’usage
– Comment utiliser Storm et HBase pour analyser de grandes volumétries de données en temps réel
– Comment utiliser le service Azure Stream Analytics pour analyser en temps réel des évènements complexes
Au programme, plein de démos concrètes d’utilisation de l’analyse en temps réel d’évènements fréquents.
http://guss.pro/2014/10/26/jss2014-big-data-real-time/
Projet Jaspersoft BI pour une société multi-enseignesAudaxis
Pendant un séminaire organisé avec l'éditeur Jaspersoft, Audaxis a présenté un de ses projets BI allant de la conception de l'environnement à la construction du datawarehouse au développement des tableaux de bord personnalisés.
Grâce à Jaspersoft, Laser Loyalty, société spécialisée dans les offres marketing multi-enseignes de fidélisation clients dispose d'un reporting automatique pour une amélioration de la performance et des prises de décision.
Session des Journées SQL Server 2014 - Romain Casteres & Benjamin Guinebertière
----
Lors de la session, nous verrons :
– Des scénarios d’usage
– Comment utiliser Storm et HBase pour analyser de grandes volumétries de données en temps réel
– Comment utiliser le service Azure Stream Analytics pour analyser en temps réel des évènements complexes
Au programme, plein de démos concrètes d’utilisation de l’analyse en temps réel d’évènements fréquents.
Point de vue expert: la stratégie “ comptoir des données”Denodo
Watch full webinar here: https://bit.ly/3CS93vx
François Bouteyre, directeur conseil chez Sopra Steria Next illustre en quelques minutes les attentes, besoins, contraintes datas des métiers.
Pendant cette session, le Directeur Conseil de Sopra Steria revient sur les points d’incompréhensions et de tensions des métiers avec les experts data.
Suite aux échecs successifs des approches traditionnelles, François Bouteyre propose une nouvelle voie pour soutenir les métiers.
En visionnant cette session vidéo, vous allez apprendre:
- à mieux appréhender les concepts de “comptoir des données”
- comment le data mesh, la data fabric et la data virtualization sont compatibles
- comment les entreprises modernes peuvent passer à l’échelle
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO Technology
En cette année 2024 qui s’annonce sous le signe de la complexité, avec :
- L’explosion de la Gen AI
-Un contexte socio-économique sous tensions
- De forts enjeux sur le Sustainable et la régulation IT
- Une archipélisation des lieux de travail post-Covid
Découvrez les Tech trends incontournables pour délivrer vos produits stratégiques.
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...OCTO Technology
par Claude Camus (Coach agile d'organisation @OCTO Technology) et Gilles Masy (Organizational Coach @OCTO Technology)
Les équipes infrastructure, sécurité, production, ou cloud, doivent consacrer du temps à la modernisation de leurs outils (automatisation, cloud, etc) et de leurs pratiques (DevOps, SRE, etc). Dans le même temps, elles doivent répondre à une avalanche croissante de demandes, tout en maintenant un niveau de qualité de service optimal.
Habitué des environnements développeurs, les transformations agiles négligent les particularités des équipes OPS. Lors de ce comptoir, nous vous partagerons notre proposition de valeur de l'agilité@OPS, qui embarquera vos équipes OPS en Classe Business (Agility), et leur fera dire : "nous ne reviendrons pas en arrière".
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Laurent Speyser
(Conférence dessinée)
Vous êtes certainement à l’origine, ou impliqué, dans un changement au sein de votre organisation. Et peut être que cela ne se passe pas aussi bien qu’attendu…
Depuis plusieurs années, je fais régulièrement le constat de l’échec de l’adoption de l’Agilité, et plus globalement de grands changements, dans les organisations. Je vais tenter de vous expliquer pourquoi ils suscitent peu d'adhésion, peu d’engagement, et ils ne tiennent pas dans le temps.
Heureusement, il existe un autre chemin. Pour l'emprunter il s'agira de cultiver l'invitation, l'intelligence collective , la mécanique des jeux, les rites de passages, .... afin que l'agilité prenne racine.
Vous repartirez de cette conférence en ayant pris du recul sur le changement tel qu‘il est généralement opéré aujourd’hui, et en ayant découvert (ou redécouvert) le seul guide valable à suivre, à mon sens, pour un changement authentique, durable, et respectueux des individus! Et en bonus, 2 ou 3 trucs pratiques!
3. #SQLSatParis – SQLSaturday Paris 2018Un événement
Joël Crest
Practice Leader
Data & Business Intelligence
@joelcrest
www.bonjourjoel.com
Speaker
4. #SQLSatParis – SQLSaturday Paris 2018Un événement
Agenda
1. Comment est stockée la donnée ?
2. Préparation de la donnée
3. Relations
4. Time Intelligence
6. #SQLSatParis – SQLSaturday Paris 2018Un événement
Qu'est-ce qu'un Data Model ?
• L'ensemble des tables et des relations exposées
dans un outil analytique / BI
• La structure des tables va définir leur rôle
• Les relations entre les données vont définir le
mode de propagation du contexte de filtre
7. #SQLSatParis – SQLSaturday Paris 2018Un événement
Qu'est-ce qu'un "bon" Data Model ?
• Réutilisable
• Evolutif
• Performant
• Lisible
• Simplifie l'écriture du code DAX
8. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• Moteur de stockage de SSAS, Power Pivot, Power
BI
• Moteur In-Memory
• Base de données orientée colonnes
• Nom officiel : "xVelocity In-Memory Analytics
Engine"
9. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• BD orientée lignes
ID Produit Sous-Catégorie Catégorie Couleur Prix
unitaire
Libellé
IPXII Smartphone Technologie Or 10000€ iPhoneXII
MKK Téléviseur Technologie Noir 3000€ Mon4K
PS6 Console de jeux Loisir Bronze 2000€ PS6
10. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• BD orientée lignes = accès horizontal
IPXII Smartphone Technologie Or 10000€ iPhoneXII
MKK Téléviseur Technologie Noir 3000€ Mon4K
PS6 Console de jeux Loisir Bronze 2000€ PS6
ID Produit Sous-Catégorie Catégorie Couleur Prix
unitaire
Libellé
11. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• BD orientée lignes = accès horizontal
• Les données d'une même ligne sont stockées
ensemble
• L'accès à la ligne est réalisé via une table d'index
IPXII Smartphone Technologie Or 10000€ iPhoneXII
12. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
BD orientée colonnes
ID Produit Sous-Catégorie Catégorie Couleur Prix
unitaire
Libellé
IPXII Smartphone Technologie Or 10000€ iPhoneXII
MKK Téléviseur Technologie Noir 3000€ Mon4K
PS6 Console de jeux Loisir Bronze 2000€ PS6
13. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• BD orientée colonnes = accès vertical
ID Produit
IPXII
MKK
PS6
Sous-Catégorie
Smartphone
Téléviseur
Console de jeux
Catégorie
Technologie
Technologie
Loisir
Couleur
Or
Noir
Bronze
Prix
unitaire
10000€
3000€
2000€
Libellé
iPhoneXII
Mon4K
PS6
14. #SQLSatParis – SQLSaturday Paris 2018Un événement
VertiPaq
• BD orientée colonnes = accès vertical
• Le stockage des données d'une même
colonne est optimisé
• L'accès aux données d'une même ligne
est plus long
Couleur
Or
Noir
Bronze
16. #SQLSatParis – SQLSaturday Paris 2018Un événement
Pourquoi optimiser la RAM ?
• Les accès RAM sont plus rapide que I/O sur disque
• On peut appliquer des process de compression /
decompression à la volée
17. #SQLSatParis – SQLSaturday Paris 2018Un événement
Cardinalité
Taille
XL
L
L
M
M
M
S
L
Order ID
0005210C
0000002M
0002313X
0030187Z
0932104F
1093842X
0000340S
0230293C
18. #SQLSatParis – SQLSaturday Paris 2018Un événement
Compression de données
• La donnée va être encodée
• Deux techniques d'encodage
• Dictionary Encoding
• RLE = Run Length Encoding (encodage par plage)
20. #SQLSatParis – SQLSaturday Paris 2018Un événement
Dictionary Encoding
ID Taille
1 XL
2 L
3 M
4 S
Taille
1
2
2
3
3
3
4
2
21. #SQLSatParis – SQLSaturday Paris 2018Un événement
Dictionary Encoding
• Le type de données n'est pas important
• La cardinalité est importante
ID Taille
1 XL
2 L
3 M
4 S
22. #SQLSatParis – SQLSaturday Paris 2018Un événement
Run Length Encoding
Taille Index Longueur
XL 1 1
L 2 2
M 4 3
S 7 1
L 8 1
Taille
XL
L
L
M
M
M
S
L
23. #SQLSatParis – SQLSaturday Paris 2018Un événement
Run Length Encoding
Taille Index Longueur
XL 1 1
L 2 3
M 5 3
S 8 1
Taille
XL
L
L
L
M
M
M
S
24. #SQLSatParis – SQLSaturday Paris 2018Un événement
Run Length Encoding
• L'ordre de tri est important
Taille Index Longueur
XL 1 1
L 2 3
M 5 3
S 8 1
27. #SQLSatParis – SQLSaturday Paris 2018Un événement
Tables de dimensions
• Ce sont les "lookup tables"
• A "dénormaliser" si possible (produit, catégorie,
sous-catégorie)
28. #SQLSatParis – SQLSaturday Paris 2018Un événement
Tables de faits
• Contrôler les relations "devinées" par Power BI
29. #SQLSatParis – SQLSaturday Paris 2018Un événement
Principes
• Tables de dimensions
• Nombre réduit de lignes
• Nombre de colonnes important
• Tables de faits :
• Nombre important de lignes (plusieurs millions)
• Nombre réduit de colonnes
30. #SQLSatParis – SQLSaturday Paris 2018Un événement
Table de mesure
• Regroupement de mesures dans une ou plusieurs
tables
• Permet d'éviter les aggregations par défaut
• Offre plus de lisibilité à l'utilisateur
• Les mesures n'appartiennent pas à une table précise
31. #SQLSatParis – SQLSaturday Paris 2018Un événement
Règles d'or à appliquer
• Tables de dimensions
• Dénormaliser les dimensions liées les unes aux autres
• Tables de faits
• Supprimer les colonnes inutiles
• Supprimer les colonnes de grande cardinalité (clés primaires de la table de fait)
• Trier la table
• Toutes les tables
• Supprimer les aggregations par défaut
• Typer la donnée (dans l'éditeur Power Query)
• Donner un nom "métier" aux tables et colonnes
• Créer des tables de mesures
34. #SQLSatParis – SQLSaturday Paris 2018Un événement
Relation "one-to-many"
• Le côté "one" est la table de dimension
• Le côté "many" est la table de faits
(ou une table de
dimension dans le cas
d'un modèle en flocon)
35. #SQLSatParis – SQLSaturday Paris 2018Un événement
Relation "many-to-many" ?
• Livre : un ou plusieurs auteurs
• Auteur : un ou plusieurs livres
36. #SQLSatParis – SQLSaturday Paris 2018Un événement
Relation "many-to-many" ?
• Non gérée par Power BI
• La solution : utiliser une table intermédiaire
(bridge)
• exemple : auteur / livre
• ID auteur / ID livre
37. #SQLSatParis – SQLSaturday Paris 2018Un événement
Bi-directional cross-filtering
• Oui mais pas dans tous les cas !
• Plus le modèle est complexe, plus dangereuse est
l'utilisation du bi-directional cross-filtering
• Éviter si relation avec table de dates
• Eviter si relation entre table de faits et table de
dimension liée à une autre table de faits
42. #SQLSatParis – SQLSaturday Paris 2018Un événement
Table de dates
• Table de dimension particulière
• Dans tout modèle de données, la table Date a une
importance car elle garantit que la période
concernée peut être filtrée sur des dates
adjacentes
43. #SQLSatParis – SQLSaturday Paris 2018Un événement
Table de dates
• Par défaut, Power BI crée à la volée autant de table
de dates qu'il y a de champs de type date dans le
modèle de données
44. #SQLSatParis – SQLSaturday Paris 2018Un événement
Table de dates
• Toutes les fonctions Time Intelligence acceptent en
paramètre une table contenant une colonne Date
• Les fonctions Time Intelligence remplacent le filtre de
date existant par la plage de dates calculée
45. #SQLSatParis – SQLSaturday Paris 2018Un événement
Pourquoi a-t-on besoin d'une table Date ?
• Le premier cas, le résultat est l'intersection de
DATESYTD avec le contexte de filtre
• Dans le second cas (table Date), le contexte de filtre
est redéfini : ALL(Calendrier[Date]) est
automatiquement ajouté
46. #SQLSatParis – SQLSaturday Paris 2018Un événement
Marquer une table en tant que table Date
• Dans l'interface Power BI
• Sélectionner l'option Marquer comme table de dates
• Choisir une colonne (type Date, valeurs adjacentes)
• La colonne choisie est validée (ou rejetée) lors de la
sélection