#JSS2014
Les journées
SQL Server 2014
Un événement organisé par GUSS
#JSS2014
Les journées
SQL Server 2014
Un événement organisé par GUSS
Session Q&A : Construire
son modèle de données
Galla ...
#JSS2014
Merci à nos sponsors
#JSS2014#JSS2014
Les évaluations des sessions,
c’est important !!
…Et en plus on peut gagner
des cadeaux
#JSS2014
http://GUSS.Pro/jss
#JSS2014
Galla Pupel
Consultante en Business Intelligence
CGI Business Consulting
@GallaPupel
Jean-Pierre Riehl
Responsabl...
#JSS2014
INTRODUCTION
Q&A
#JSS2014
1. L'importance d'avoir un bon modèle de données
 Normaliser son modèle de données
 Affuter son modèle de donné...
#JSS2014
Microsoft Power BI for Office 365
Partager Trouver
Q&A
MobilitéAnalyser VisualiserDécouvrir
#JSS2014
Créer son
modèle de
données
dans
PowerPivot
Publier son
classeur sur
son site
Power BI et
l’activer
Poser des
que...
#JSS2014
L'importance
d'avoir un bon modèle
de données
#JSS2014
Préparer ses données
– Nettoyer en amont
– Structurer et modéliser
– Optimiser (typage, tri, comportement des col...
#JSS2014
Normaliser
son modèle de données
#JSS2014
Créer de nouvelles tables pour les entités multi-colonnes
 Unités distinctes dans une table
 Splitter ces unité...
#JSS2014
Pivoter les Property bags
 Colonnes « fourre-tout »
 Pivoter en colonne car Q&A fonctionne seulement quand une ...
#JSS2014
Union pour éviter le partitionnement
 Partitionnement des valeurs sur plusieurs colonnes
 Consolider les donnée...
#JSS2014
Splitter les colonnes formatées
 Colonnes contenant plusieurs sous-informations
 Splitter les valeurs des colon...
#JSS2014
De-normaliser pour éliminer les relations inactives
 Plus d’une relation entre deux tables
 Q&A utilise seuleme...
#JSS2014
Affuter
son modèle de données
#JSS2014
Lier les tables
 Fondement d’un bon modèle de données
 Power View et Q&A ne peuvent deviner les liaisons
Epurer...
#JSS2014
Renommer les tables et colonnes
 Être le plus précis possible
Trier ses données
 Trier une colonne par une autr...
#JSS2014
Ne pas agréger tous les champs
 Power View agrège par défaut
Mesures implicites vs Mesures explicites
Affuter so...
#JSS2014
Définir les Champs par défaut
 Ces colonnes seront affichées par défaut
Définir les Libellés par défaut
 Impact...
#JSS2014
Ajouter des synonymes aux tables et colonnes
Fonctionnalité spécifique à Q&A
 Avoir plusieurs terminologie pour ...
#JSS2014
#JSS2014
Q&A
 Correspondance sur la base de la structure du modèle
 Compréhension générale de la syntaxe anglaise
 Comm...
#JSS2014
Structuration
de la recherche :
Comment Q&A
interprète ce que vous écrivez ?
#JSS2014
• Mots clés de recherche :
– Colonnes et tables
– Valeurs des données
– Relations
• Implicites
• Explicites
– Uti...
#JSS2014
Phrasing:
Comment ces
interprétations
peuvent être améliorées ?
#JSS2014
Phrasing
• La relation entre les choses
• Descriptions des relationsQuoi ?
• Phrasing ajouté automatiquement
• Ph...
#JSS2014
Quels sont les types de Phrasing ?
 Un nom (substantif) désigne les catégories d'êtres, de choses et les concept...
#JSS2014
Attribute Phrasings : Which venues have categories ?
Phrasing : Venues have categories
Name Phrasings : Which cat...
#JSS2014
Monitorer le Phrasing
 Tableau de bord
 Ajouter des synonymes
 Ajouter le Phrasing
 Suivre les usages
#JSS2014
#JSS2014
Des règles à respecter en amont pour faciliter l’analyse :
Modélisation
Couche sémantique
Q&A comprend nativement...
#JSS2014
Questions
#JSS2014
• Demystifying Power BI Q&A
http://blogs.msdn.com/b/powerbi/archive/2014/03/12/demystifying-power-bi-q-amp-a-
par...
#JSS2014#JSS2014
Prochain SlideShare
Chargement dans…5
×

JSS2014 – Power View, Power Q&A : avoir un bon modèle

589 vues

Publié le

Session des Journées SQL Server 2014 - Galla Pupel
---
Power Q&A permet d’interroger vos modèles en langage naturel. Mais comment bien construire son modèle ? Comment bien configurer la sémantique pour une utilisation optimum ?
Nommage, typage, métadonnées, synonymes, phrasings…nous aborderons tous les concepts qui permettront à vos modèles de répondre à vos questions..

Publié dans : Données & analyses
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
589
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Présentation 3'
  • On parlait des speakers, il y a une chose qui leur tient à cœur !
  • On parlait des speakers, il y a une chose qui leur tient à cœur !
  • Jusqu’à présent vous avez surement déjà vu des démo de Power BI Q&A et vous avez peut-être même déjà joué avec.

    Donc à ce niveau, vous pensez probablement une de ces deux choses :
    Soit vous êtes conquis, vous êtes émerveillé par l’intelligence du système, et vous êtes convaincu que le moteur peut répondre sans effort à presque toutes les questions sur n’importe quelle données
    Ou, vous ne pensez pas qu’une chose pareille est possible, que c’est trop beau pour être vrai, et pour vous c’est certain que Q&A ne fonctionne que sur des modèle ultra travaillés par une armée de doctorant qui ont analysés le modèle pendant des années afin de le rendre le plus performant possible.

    Enfaite, la vérité est entre les deux.


    Nous allons vous apprendre pourquoi optimiser votre modèle de base bénéfique à la fois pour la construction et la consommation de Power View ainsi que pour Q & A .
    Dans cette session, nous verrons ce que vous pouvez espérer que Q&A comprenne et les choses que vous pouvez faire pour élargir sa compréhension, et améliorer ses réponses.
    Présentation de création des règle de phrasing, qui sont utilisées pour réduire l’ambiguité et introduire les termes complexes.

    Cette session a pour objectif de montrer comment les données peuvent être préparées afin de les délivrer de la meilleure manière possible
    Cette session, au travers d’explications et de démonstration montrera comment les différents outils de Power Bi permettent de préparer son modèle de données.
    Présentation des possibilités et des fonctionnalités de chaque outil qui vous aideront à déterminer quels sont les prérequis à mettre en œuvre afin de faciliter l’analyse.

    Vise Q&A mais aussi PowerView

  • Introduction 5’’
    L'importance d'avoir un bon modèle de données 20’’
    Normaliser son modèle de données
    Affuter son modèle de données
    + demo
    Structuration de la recherche15
    Comment Q&A interprète ce que vous écrivez ?
    Phrasing 15
    Comment ces interprétation peuvent être améliorées ?
    démo
    CCL 5
  • Where am I ?
    Q&A c’est ici mais c’est un tout

    Prérequis : Office 365


    Power BI est une plateforme de business intelligence self-service accessible via Excel et Office 365. Les utilisateurs peuvent identifier et analyser leurs données via une l’interface intuitive qu’est Excel. Les données peuvent être hébergées et partagées dans l’organisation mais aussi dans le “Cloud”.

    Le Power BI Sites est un portail de collaboration destiné à partager ses documents.
    Partager, et interagir avec les rapports présents dans l’espace collaboratif Power BI sites.
    Centre d’administration Power BI qui permet de gérer l’infrastructure du Power BI sites
    Partage et gestion des requêtes

    Récupérer et façonner les données
    Analyser les données
    Construire des tableaux de bord
    Partager et consommer les données
  • Slide visuel qui focus sur Power View et Power Q&A (remplace l'agenda)

    Vision de Microsoft : une démarche universelle
    Offrir un accès simple à tous les types de données d’où qu’elles viennent : Analyser et afficher ses résultats à partir de données présentes (ou non) dans l’entreprise
    Donner l’accès aux données à tout le monde grâce à des outils puissants et familiers : Partager ses rapports et ses jeux de données aux travers de l’organisation et les tenir à jour
    Poser des questions directement sur ses données via le “natural language search” (Q&A)
    Accéder et rester connecté à ses données et rapports via son mobile
  • Vision de Microsoft : une démarche universelle
    Offrir un accès simple à tous les types de données d’où qu’elles viennent : Analyser et afficher ses résultats à partir de données présentes (ou non) dans l’entreprise
    Donner l’accès aux données à tout le monde grâce à des outils puissants et familiers : Partager ses rapports et ses jeux de données aux travers de l’organisation et les tenir à jour
    Poser des questions directement sur ses données via le “natural language search” (Q&A)
    Accéder et rester connecté à ses données et rapports via son mobile
  • OK, alors avant de paniquer, je ne vais pas vous dire, refaites tout votre modèle afin qu’il ressemble à la 6e forme normal ou quoi.
    Mais il y’a des structures, des modèles qui sont tordus, compliqués, et que Q&A ne vas pas être capable de comprendre.

    Mais en faisant des normalisation basiques de structure sur votre modèle, l’utilisation de Power View sera meilleure et les résultats de Q&A seront plus précis.
    La règle de base, générale à suivre est la suivante :
    Chaque chose unique dont l’utilisateur parle doit représenter exactement un seul objet du modèle (table ou colonnes)
    Donc si les utilisateurs parlent des clients, il ne doit y’avoir qu’un objet nommé client. Et si les utilisateurs parlent des ventes, il ne doit y avoir qu’un seul objet vente.
    Simple non ? Peu importe la structure des données avec laquelle vous démarrer, vous pouvez le faire.
    Power Query vous permet de mettre en forme vos données, alors que d’autres transformations simples peuvent être faites avec les colonnes calculées de Power Pivot

    Expliquer Dataset : Foursquare djeepy

  • Si vous avez plusieurs colonnes qui interagissent comme une unité distinct à l’intérieur d’une table plus grande.
    Ces colonnes devront être splitté dans leur propre table 

    Cela va rendre plus facile l’analyse des questions des checks indépendamment de la catégorie ou de la géographié, and améliorer aussi la façon de représenter les données

    Le fait de le transformer en entité propre, techniquement cela lui donne plus d’options, plus d’objets associés.

    Attention vient en contradiction avec le modèle classique de tabulaire, qui auurait tendance à dire de tout rassembler dans une seule et unique table
  • Les property bags, Les colonnes fourre tout
    Restructurer pour avoir une seule colonne par propriété.
    Property bag peuvent servir à gérer beaucoup de propriétés, mais ils souffrent d’énormémment de limitation que ni PowerView ni Q&A ne sera capable de contourner.
    Par exemple sur une dimension geography du client avec CustomerID property, et les valeurs des colonnes ou chaque ligne représente une propriété différente du client, (e.g age, marital status, city) .
    En utilisant la signification de la colonne value, qui se base sur le contenu de la colonne propriété, il devient possible à Q&A de comprendre la plupart des requêtes qui y réfère. Par exemple la question suivante : « montre moi l'âge de chaque client » peut fonctionner, car il est interprété de la façon suivante : « montre les clients quand la propriété est age ».
    Cependant la structure du modèle ne supportera pas des questions plus complexe tel que : la moyenne d'Age des clients de Chicago.
    Q&A fonctionne seulement quand chaque colonne a une seule signification
  • Si vous avez partitionné vos données dans plusieurs tables, ou si vous les avez pivotés les valeurs dans plusieurs colonne, beaucoup d’opérations classiques seront difficiles ou impossible à réaliser pour vos utilisateurs.
    Par exemple une table partitionnée avec les ventes de 2000 à 2010 et les ventes de 2011 à 2020.
    Si vos rapports doivent respecter ces décennies vous pouvez les laisser tel quel dans Power View
    Cependant dans Q&A vos utilisateurs vont espérer pouvoir poser des questions de type : Total des ventes par années. Mais pour ça, vous aurez besoin d’unir vos données dans une seule et unique table power pivot.

    Similarly, consider a typical pivoted value column: a BookTour table containing Author, Book, City1, City2, and City3 columns. With a structure like this, even simple questions like “count books by city” cannot be interpreted correctly. For this to work, you should create a separate BookTourCities table, which unions the city values into a single column.
  • Si la source de données contient des colonnes formatées, Power View et Q&A ne seront pas capables d’atteindre les données contenues à l’intérieur
    Par exemple, avec une adresse complète il est important de scinder les colonnes

    Cela peut vous aider dans plusieurs cas,
    Par exemple sur les colonnes de Nom, prénom il est préconisé de les scinder dans le cas ou dans Q&A les utilisateurs posent des questions en utilisant une parti du nom
    Autre exemple pour les colonnes de dates, ajouter années et mois afin que les utilisateurs puissent poser des questions en groupant sur l’année et/ou le mois

    De la même façon si votre source de données contient une colonne avec plusieurs valeurs à l’intérieur, il est important de la spliter.
  • Denormalisation.

    La seule exception au « Normalization is better » c’est lorsque vous avez plus d’une liaison entre deux tables.
    Par exemple si vous avez une table « vol » avec à la fois SourceCityId et destinationCity Id columns, ces deux id reliés à la table ville, une des deux liaisons doit être marquées comme inactive.
    Q&A utilise seulement les liaisons actives, du coup vous ne pourrez pas poser des questions sur la source et la destination, selon lequel vous choisissez.
    Si à la place vous dénormalisez le nom de la vile dans la table « vol » vous serez alors capable de poser des question comme :
    Donne mois les avions pour demain qui ont pour depart Seattle et comme destination San Francisco

    Mais finalement tous des prof de la BI => Bonnes pratiques de modélisation BI
  • Règles de modélisations qui vont permettre à votre PowerView & Q&A de restituteur correctement l’information
    Cependant il y’a encore une couche liée à la sémantique.
    Nous allons voir l’Enrichissement et les bonne pratique qui vont permettre au moteur Q&A de pouvoir comprendre correctement ce que l’utilisateur lui demande
    Affutage modèle de données


    -> pour chaque, montrer l'impact dans Power View

    Bonus track : bonnes pratiques d'import de Power Query ??




  • Si vous oubliez les relations entre vos tables dans voter modèle, ni power view ou Q&A ne sera capable de deviner comment joindre les tables entre elles, si vous posez une question.
    Par exemple vous ne pouvez demander “ les ventes totales pour les clients de seatlles” si il n’y a pas de relations entre les tables de commande et de clients
  • Renommer les tables et les colonnes
    Si les tables et les colonnes sont mal renseignées, même Power View aura du mal à fonctionner. Et cela est d’autant plus vrai pour Q&A.
    Par exemple si vous avez une table nommé DataCustomer qui contient la liste de vos clients, vous devrez poser la question suivante : List the DataCustomer in Chicago, au lieu de list the customers in Chicago. Ce qui n’est pas intuitif.
    Les tables et les colonnes doivent refléter le contenu au plus proche.
    Eviter les DIMCustomer, FACCustomer
    Corriger les types de données;
    Lorsque vous importez des données, elles peuvent avoir des types incorrects.
    Principalement les dates et les nombres qui peuvent être importés comme des string (champs texte) et qui ne seront pas correctement compris par PowerView et Q&A
    Il est important de mettre le bon type dans power pivot

    Trier par
    La propriété trier par colonne permet de trier les colonnes, par une autre colonne.
    Par exemple trier les colonnes de mois en lettre, par les colonnes de mois en chiffre.
    Ou pour les tailles :Shirt Size column to sort by the underlying size number (XS, S, M, L, XL) rather than alphabetically (L, M, S, XL, XS).

  • Marquer les années comme, ne pas sommer.
    Power View agrège de façon agressive les colonnes numérique par défaut.
    Par exemple, les questions de type Total des ventes par années, peut résulter un total des ventes par le total des années.
    Si il y’a d’autres colonnes pour lesquelles vous ne souhaitez pas voir ce comportement : années, mois, jour, colonnes ID.




  • Choisir les champs par défaut
    Sélectionner des colonnes qui seront affichées par défaut lorsque des questions seront posées sur une table.
    Par exemple si vous voulez voir les commandes de la semaine dernière, vous ne voulez pas voir les 30 colonnes de votre table de commande

    Définir les libellés par défaut
    Le libellé par défaut est utilisé par Power View pour sélectionner les éléments dans les filtres.
    C’est également le cas pour Q&A quand il va décider quel style de graphique ou histogramme pour présenter le résultat.
    Par exemple « Count orders by customer » vous montrera un résultat tabulaire si le défaut label n’est pas mis en place.
    Si vous mettez le champ Customer Name comme colonne par défaut alors le résultat sera visualisable dans un diagramme à barre.
    A noter que pour certaines tables, notamment les tables de fait, de mesures, vous aurez uniquement les champs par défaut et non les labels par défaut

    Catégorie de données
    Pour les dates et les colonnes de type géographique.
    Les catégories apportent une connaissance supplémentaire de la sémantique, en plus du type de données.
    Par exemple une colonne entier, peut être marqué comme une année, ou un code postal.
    Ces informations sont utilisées pour Q&A pour deux choses :
    La visualisation qui sera choisi
    La compréhension de la question
    Premièrement Q&A utilise les informations des catégories afin d’aider au choix du visuel. Par exemple, il va reconnaitre que les colonnes avec des dates ou du temps pour la catégorie sont des bons clients pour l’axe horizontal d’un line graph, ou l’axe de visualisation d’un bubble chat.
    Et que les colonnes contenant des données géographiques peuvent apparaitre correctement sur une carte

    Deuxièmement, Q&A fait des suppositions sur la façon dont les utilisateurs sont susceptibles de parler des colonnes de date et de géographie, cela lui permet de comprendre certains types de questions.
    Par exemple, le when (quand) de When Jean-Pierre est-il allé au restaurant ? Est presque certain de mapper sur une colonne de date
    Et Count customers in Brown sera plus probable d’être une ville qu’une couleur de cheveux.

    Note que des données tel que L’année, ont besoin d’etre entré comme custom category

  • Synonymes aux tables et colonnes;
    C’est la seule étape qui est spécifique à Q&A, plus que PowerView en général.
    Les utilisateurs utilisent souvent une variété de terminologie pour se référer à la même chose. Exemple : Ventes totales, le total des ventes.
    Power Pivot permet de créer ces synonymes et de les ajouter aux tables et colonnes au sein du modèle.
    Surtout ne pas sous-estimer l’importance de cette étape !
    Même si vous pensez que vos tables et colonnes ont les meilleurs noms, les utilisateurs de Q&A vont poser des questions en utilisant le vocabulaire qui leur vient en premier, ils ne vont pas le prendre d’une liste prédéfinis de colonnes. Le maximum de synonymes vous pouvez ajouter, mieux c’est.

    Attention cependant.
    Il faut être conscient que vous introduisez une ambiguïté quand vous ajouter le même synonyme à plus d’une colonne ou table !
    Q&A utilisera le contexte, quand cela est possible, pour choisir entre deux synonymes ambiguë. Mais toutes les questions n’ont pas suffisamment de contexte.

    Par exemple lorsque vos utilisateurs demandes : ‘Count the customers’, si vous avez trois objets avec le synonyme Customer dans votre modèle, ils ne pourront pas avoir la réponse qu’ils cherchent. Faites attention à ce que le synonyme principal soit unique.


  • Q&A est essentiellement un moteur de compréhension du langage naturel basé sur des techniques traditionnelles de recherche et de filtrage , rehaussés avec :
    Correspondance sur la base de la structure du modèle : capacités de recherche de mots clés dépendant du contexte pour les données et les métadonnées .
    Compréhension générale de la syntaxe anglaise
    Pré- commandes intégré de business intelligence : il dispose d'un ensemble de connaissances intégré pour comment filtrer , trier des données , agrégées , groupe et d'affichage
    La customisation des connaissances spécifiques au domaine

    Ces capacités de base peuvent être appliquées à toutes les données de modèle Power Pivot.
    Cependant, indépendamment de l'intelligence construite dans le système , il y’a des limites claires aux capacités de tout système d'interpréter les données et les questions relatives.
    Par exemple, Q&A ne pourra pas vous dire pourquoi les ventes n’ont pas augmenté l’année dernière ! (et il ne sert pas non plus le café)

    Mais au lieu de dire ce qu’il ne fait pas, nous allons nous pencher sur ce qu’il fait.

    Activer son classeur sur le Power BI Site
    Ajouter des featured questions
  • Heureusement, le moteur Q&A a des capacités de langage naturel qui fonctionnent sur tous les modèles Power Pivot .
    Premièrement, il a des capacités de recherche de mots clés dépendant du contexte pour les données et les métadonnées .
    Deuxièmement, il dispose d'un ensemble de connaissances intégré pour comment filtrer , trier des données , agrégées , groupe et d'affichage

    Bien que Q & A travailleront certainement mieux contre les modèles qui ont été optimisés pour Power View et le meilleur contre les modèles annotés avec les règles de phrasé , ces deux capacités primaires se appliquent à tous les modèles .
  • Nous avons vu les capacités basiques de Q&A, et comment nous pouvions optimiser notre modèle afin d’en prendre les avantages.
    Ceux qui ont une courte capacité d'attention ont cessé de suivre depuis longtemps, je peux donc vous révéler en toute sécurité à ceux d'entre vous qui restent les incantations secrètes qui sont maintenant disponibles afin de faire passer vos modèles au niveau suivant ..

    Qu’est ce que c’est ?
    Le Phrasing c’est tout simplement, comment est-ce que vous parler des relations entre les choses.
    Par exemple, pour décrire les relations entre les clients et les produits, vous pouvez dire, les clients achètent les produits.
    Ou pour décrire les relations entre les clients et leur numéro de téléphone, vous pouvez dire, les clients ont un numéro de téléphone.

    Ces phrasés sont possibles dans une variété de formes et de tailles différentes.
    Certaines correspondent directement au modèle sémantique, d’autres relatent les colonnes et leur relation avec les tables dont elles font parties.
    D'autres concernent plusieurs tables et colonnes dans des relations complexes . Dans tous les cas , ils décrivent comment les choses sont liées en utilisant des termes de tous les jours .
    D’où vient le Phrasing ?
    Certains Phrasing ont été ajouté au modèle automatiquement, basé sur la structure d modèle et sur des suppositions basées sur le nom des colonnes.
    Par exemple beaucoup de colonnes seront liées aux tables les contenant avec un Phrasing simple comme « les produits ont des descriptions »
    Les relations du modèle ont pour Phrasing par défaut les deux directions, commandes ont des produits, les produits ont des commandes.
    Certaines relations de modèles peuvent , en fonction de leurs noms de colonnes , obtenir un phrasé de défaut plus complexe comme " les commandes sont expédiées vers les villes « 
    Il y’a plein de façons avec lesquelles vos utilisateurs parlent des choses que nous ne pouvons pas deviner
    Pour ceux , vous pouvez ajouter vos propres phrasés manuellement.

    Pourquoi ajouter du Phrasing ?
    La première raison pour ajouter du Phrasing est pour définir un nouveau terme.
    Par exemple, si vous voulez demander à Q&A ‘List les plus vieux clients” vous devez d’abord apprendre à Q&A ce que vieux signifie.
    Donc vous pouvez ajouter un Phrasing de type : les vieux clients sont les clients avec le plus d’ancienneté

    La seconde raison, est de résoudre les ambiguïté.
    Les mots clés basiques de recherche ne peuvent pas comprendre lorsque les mots ont plus d’un sens.
    Par exemple, “Flight to Chicago”, n’a pas la même signification que “flight from Chicago”, mais Q&A ne sait pas ça, jusqu’a ce que vous lui appreniez avec le Phrasing :
    “flights are from departure cities” and “flights are to arrival cities”. De la même façon, the distinction between “cars that John sold to Mary” and “cars that John bought from Mary” will only be understood once you add the phrasings “customers buy cars from employees” and “employees sell customers cars”. La dernière raison pour ajouter un phrasé est d'améliorer l’affichage des données.
    Plutôt que de dire Show customers and their products, il serait plus clair de dire « show customers and products they bought »
    lutôt que de Q & A écho de nouveau à vous " Montrer les clients et leurs produits " , il serait plus clair se il se agissait de dire " Afficher les clients et les produits qu'ils ont acheté " ou " Afficher les clients et les produits qu'ils ont examinées " , selon la façon dont bien entendu la question . Ajout personnalisés phrasés permet retraitements soit plus explicite et sans ambiguïté

    Quels sont les types de Phrasing?
    Pour comprendre les différents types de Phrasing, vous devez vous remémorer vos cours de grammaire , quand vous aviez 10 ans ?
    Pour ceux qui ont été traumatisée par madame michu, je vais vous donner un cours rapide et indolore

    Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts
    Exemples: voiture, Jean-Pierre, soleil.

    Un verbe est une action, ou un état
    Exemples: Hatch, éclater , dévorer , éjecter

    Un adjective est un mot qui décrit un nom et le modifie
    Exemples: puissants, magique, sympas, rouge

    Une préposition est un mot utilisé devant un nom afin de le relier à un substantif précédent, verbe ou un adjectif
    Exemples: of, for, near, from (, de, pour, sur, dans, avec, en, par, parmi, )

    Ouvre les yeux c’est fini.

  • Quels sont les types de Phrasing?
    Pour comprendre les différents types de Phrasing, vous devez vous remémorer vos cours de grammaire , quand vous aviez 10 ans ?
    Pour ceux qui ont été traumatisée par madame michu, je vais vous donner un cours rapide et indolore

    Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts
    Exemples: voiture, Jean-Pierre, soleil.

    Un verbe est une action, ou un état
    Exemples: Hatch, éclater , dévorer , éjecter

    Un adjective est un mot qui décrit un nom et le modifie
    Exemples: puissants, magique, sympas, rouge

    Une préposition est un mot utilisé devant un nom afin de le relier à un substantif précédent, verbe ou un adjectif
    Exemples: of, for, near, from (, de, pour, sur, dans, avec, en, par, parmi, )

    Ouvre les yeux c’est fini.

  • Les types de phrase

    Attribute Phrasings (verbe avoir)
    C’est le cheval de bataille de Q & A , utilisé lors une chose agit comme un attribut d'une autre chose .
    Ils sont simples,
    They’re simple, straightforward and perform most of the heavy lifting when a subtler, more detailed phrasing hasn’t been defined.
    Attribute Phrasing sont descrit en utilisant le verbe basic have (avoir) Products have categories et automatiquement permet les questions
    Attribute phrasings are described using the basic verb “have” (e.g. “products have categories”), and automatically also allow questions to be asked using “of” and “for” (e.g. “categories of products”, “orders for products”) and possessive (e.g. “John’s orders”). Attribute phrasings are used in questions such as this:
    Which customers have orders?
    Show orders that have chai
    List customers with orders
    What is the category of each product?
    Count Robert King's orders
    The overwhelming majority of attribute phrasings needed in your model will be automatically generated, based on table/column containment and model relationships, so you typically won’t need to create them yourself.


    Name Phrasings
    Name phrasings are key for tables in your model which represent things that have names. For example, a “product names are names of products” phrasing is essential for being able to use product names in questions. While a name phrasing also enables “named” as a verb (e.g. “List customers named John Smith”), it is most important when used in conjunction with other phrasings, to allow a name value to be used to refer to a particular table row. For example, in “Customers that bought chai”, Q&A can tell that the value “chai” is referring to a product rather than merely a product name. Name phrasings are used in questions such as this:
    Which employees are named Robert King
    Who is named Ernst Handel
    What did Robert King buy?
    Assuming you used a sensible naming convention for name columns in your model (e.g. “Name” or “ProductName” rather than “PrdNm”), the majority of name phrasings needed in your model will be automatically generated, so you usually won’t need to create them yourself.

    Adjective Phrasings
    Adjective phrasings define new adjectives used describe things in your model. For example, a “happy customers are customers where rating > 6” phrasing is needed to ask questions like “list the happy customers in Des Moines”. There are several forms of adjective phrasings, for use in different situations.
    Simple adjective phrasings define a new adjective based on a condition, such as “discontinued products are products where status = D”. Simple adjective phrasings are used in questions such as this:
    Which products are discontinued?
    List the discontinued products
    Products that are backordered
    Measurement adjective phrasings define a new adjective based on a numeric value that indicates the extent to which the adjective applies, such as “long rivers are rivers with large lengths”. Measurement adjective phrasings are used in questions such as this:
    List the long rivers
    Which rivers are the longest?
    How long is the Rio Grande?
    Dynamic adjective phrasings define a set of new adjectives based on values in a column in the model, such as “colors describe products”. Dynamic adjective phrasings are used in questions such as this:
    List the red products
    Which products are green?
    Count issues that are active

    Noun Phrasings
    Noun phrasings define new nouns that describe subsets of things in your model. For example, a “flops are movies where net profit < 0” phrasing is needed to ask questions like “count the flops by year”. There are two forms of noun phrasings, for use in different situations.
    Simple noun phrasings define a new noun based on a condition, such as “contractors are employees where full time = false”. Simple noun phrasings are used in questions such as this:
    Which employees are contractors?
    Count the contractors in Portland
    Dynamic noun phrasings define a set of new nouns based on values in a column in the model, such as “jobs define subsets of employees”. Dynamic noun phrasings are used in questions such as this:
    List the cashiers in Chicago
    Which employees are baristas?

    Preposition Phrasings
    Preposition phrasings are used to describe how things in your model are related via prepositions. For example, a “cities are in countries” phrasing improves understanding of questions like “count the cities in Washington”. Some preposition phrasings are created automatically when a column is recognized as a geographical entity. Preposition phrasings are used in questions such as this:
    Count the customers in New York
    List the books about linguistics
    Which city is John Galt in?
    How many books are by Stephen Pinker?


    Verb Phrasings
    Verb phrasings are used to describe how things in your model are related via verbs. For example, a “customers buy products” phrasing improves understanding of questions like “who bought cheese?” and “what did John buy?” Verb phrasings are the most flexible of all of the types of phrasings, often relating more than two things to each other, such as in “employees sell customers products”. Verb phrasings are used in questions such as this:
    Who sold what to whom?
    Which employee sold chai to John?
    How many customers were sold chai by Mary?
    List the products that Mary sold to John.
    Which discontinued products were sold to Chicago customers by Boston employees?
    Verb phrasings can also contain prepositional phrases, thereby adding to their flexibility, such as in “athletes win medals at competitions” or “customers are given refunds for products”. Verb phrasings with prepositional phrases are used in questions such as this:
    How many athletes won a gold medal at the Visa Championships?
    Which customers were given a refund for cheese?
    At which competition did Danell Leyva win a gold medal?
    Some verb phrasings are created automatically when a column is recognized as containing both a verb and a preposition.
    When All Else Fails
    There’s one additional feature that will be available to you for when phrasings aren’t enough: Global Synonyms. A global synonym is a simple textual replacement which is applied to any question prior to Q&A trying to understand it. This can be used in some cases where there exists no phrasing type applicable for the kind of question you are trying to enable.
    For example, with this global synonym:  “how do you make” means “recipe for”
    Then this question: How do you make a Shirley Temple?
    Would be answered as if you asked: Recipe for a Shirley Temple?

  • Outil pour le data steward
  • J’espère que cette session vous a donné les billes pour comprendre ce que peut faire Q&A, et comment vous pouvez améliorer votre modèle en amont dans votre power pivot ou ensuite dans le Power Bi site avec l’aide des Phrasing.
    L’objectif de cette session était de vous apporter une boite à outil, une to do list avec l’ensemble des éléments qui vous sont nécessaire pour appréhender Q&A.
    Au fil du temps , la maîtrise générale de Q&A va continuer à croître , tout comme sa capacité à apprendre la linguistiques sur votre modèle .
    Pour l'instant , imaginez que Q&A est au niveau élémentaire, plein d'enthousiasme et avec une excellente intuition pour la langue , mais limitée à la fois dans l'expérience de vie et le vocabulaire .
    Plus vous lui enseignez des choses, meilleur il fera ses devoirs .C’est un principe de machine learning
  • JSS2014 – Power View, Power Q&A : avoir un bon modèle

    1. 1. #JSS2014 Les journées SQL Server 2014 Un événement organisé par GUSS
    2. 2. #JSS2014 Les journées SQL Server 2014 Un événement organisé par GUSS Session Q&A : Construire son modèle de données Galla Pupel Jean-Pierre Riehl
    3. 3. #JSS2014 Merci à nos sponsors
    4. 4. #JSS2014#JSS2014 Les évaluations des sessions, c’est important !! …Et en plus on peut gagner des cadeaux
    5. 5. #JSS2014 http://GUSS.Pro/jss
    6. 6. #JSS2014 Galla Pupel Consultante en Business Intelligence CGI Business Consulting @GallaPupel Jean-Pierre Riehl Responsable Data & Business Intelligence – AZEO MVP SQL Server Membre du Board GUSS
    7. 7. #JSS2014 INTRODUCTION Q&A
    8. 8. #JSS2014 1. L'importance d'avoir un bon modèle de données  Normaliser son modèle de données  Affuter son modèle de données 2. Structuration de la recherche  Comment Q&A interprète ce que vous écrivez ? 3. Phrasing  Comment ces interprétations peuvent être améliorées ? Agenda
    9. 9. #JSS2014 Microsoft Power BI for Office 365 Partager Trouver Q&A MobilitéAnalyser VisualiserDécouvrir
    10. 10. #JSS2014 Créer son modèle de données dans PowerPivot Publier son classeur sur son site Power BI et l’activer Poser des questions et obtenez des réponses Philosophie de Q&A
    11. 11. #JSS2014 L'importance d'avoir un bon modèle de données
    12. 12. #JSS2014 Préparer ses données – Nettoyer en amont – Structurer et modéliser – Optimiser (typage, tri, comportement des colonnes) Conséquences sur l’analyse, la restitution – Facilité de compréhension des utilisateurs – Facilité d’assimilation par les outils (Power View, Q&A) • Meilleures suppositions • Lever les ambiguïtés (Q&A) Comment avoir un bon modèle de données
    13. 13. #JSS2014 Normaliser son modèle de données
    14. 14. #JSS2014 Créer de nouvelles tables pour les entités multi-colonnes  Unités distinctes dans une table  Splitter ces unités dans leur propre table. Normaliser son modèle de données
    15. 15. #JSS2014 Pivoter les Property bags  Colonnes « fourre-tout »  Pivoter en colonne car Q&A fonctionne seulement quand une colonne = une signification Normaliser son modèle de données
    16. 16. #JSS2014 Union pour éviter le partitionnement  Partitionnement des valeurs sur plusieurs colonnes  Consolider les données dans une seule colonne, facilite l’agrégation dans Q&A Normaliser son modèle de données
    17. 17. #JSS2014 Splitter les colonnes formatées  Colonnes contenant plusieurs sous-informations  Splitter les valeurs des colonnes afin de les analyser en tant que valeur Créer une nouvelle table pour les colonnes avec plusieurs valeurs Normaliser son modèle de données
    18. 18. #JSS2014 De-normaliser pour éliminer les relations inactives  Plus d’une relation entre deux tables  Q&A utilise seulement les liaisons actives Normaliser son modèle de données
    19. 19. #JSS2014 Affuter son modèle de données
    20. 20. #JSS2014 Lier les tables  Fondement d’un bon modèle de données  Power View et Q&A ne peuvent deviner les liaisons Epurer le modèle  Masquer les colonnes inutiles  Eviter le « bruit » Affuter son modèle de données : Base
    21. 21. #JSS2014 Renommer les tables et colonnes  Être le plus précis possible Trier ses données  Trier une colonne par une autre  Exemple : Libellés de mois, tailles (S,M,XL) Typer les données correctement  Attention aux dates et aux nombres Affuter son modèle de données : Base
    22. 22. #JSS2014 Ne pas agréger tous les champs  Power View agrège par défaut Mesures implicites vs Mesures explicites Affuter son modèle de données : Avancé
    23. 23. #JSS2014 Définir les Champs par défaut  Ces colonnes seront affichées par défaut Définir les Libellés par défaut  Impact sur la visualisation  Tables de fait n’ont pas de labels par défaut Catégories de données  Impact sur la visualisation qui sera associée  Impact sur la compréhension de la question Affuter son modèle de données : Avancé
    24. 24. #JSS2014 Ajouter des synonymes aux tables et colonnes Fonctionnalité spécifique à Q&A  Avoir plusieurs terminologie pour une même chose  Plus de synonymes Attention  Un objet = Une signification  Ne pas créer d’ambiguïté Affuter son modèle de données : Avancé
    25. 25. #JSS2014
    26. 26. #JSS2014 Q&A  Correspondance sur la base de la structure du modèle  Compréhension générale de la syntaxe anglaise  Commandes intégrées de business intelligence  La customisation des connaissances spécifiques au domaine
    27. 27. #JSS2014 Structuration de la recherche : Comment Q&A interprète ce que vous écrivez ?
    28. 28. #JSS2014 • Mots clés de recherche : – Colonnes et tables – Valeurs des données – Relations • Implicites • Explicites – Utilisation du contexte • Commandes : – Tri – Filtre d’égalité – Plage de données de filtre – Agrégation et regroupement – Visualisation explicites Comment Q&A interprète ce que vous écrivez ? demo
    29. 29. #JSS2014 Phrasing: Comment ces interprétations peuvent être améliorées ?
    30. 30. #JSS2014 Phrasing • La relation entre les choses • Descriptions des relationsQuoi ? • Phrasing ajouté automatiquement • Phrasing ajouté manuellementComment ? • Définir de nouveaux termes • Résoudre les ambiguïtés • Améliorer la pertinence des questions Pourquoi ?
    31. 31. #JSS2014 Quels sont les types de Phrasing ?  Un nom (substantif) désigne les catégories d'êtres, de choses et les concepts Exemples: voiture, soleil, le SQL.  Un verbe est une action, ou un état Exemples: supprimer, éclater, dévorer, éjecter.  Un adjectif est un mot qui décrit un nom et le modifie Exemples: puissants, magique, rouge.  Une préposition est un mot utilisé devant un nom afin de le relier à un substantif, verbe ou un adjectif précédent Exemples: of, for, per, from, to Phrasing
    32. 32. #JSS2014 Attribute Phrasings : Which venues have categories ? Phrasing : Venues have categories Name Phrasings : Which categorie named Cubana Café ? Phrasing : venue is the name of categories Adjective Phrasings : Which cities are swag ? Phrasing : swag city has large somme de total user Noun Phrasings : Which venues are Noman’sland ? Phrasing : Noman'sland is venue where somme de total user < 2 Preposition Phrasings : Which cities are in France ? Phrasing : City is in Country Verb Phrasings : Where did djeepy travel last week ? Phrasing : djeepy checkin travels in city Type de Phrasing
    33. 33. #JSS2014 Monitorer le Phrasing  Tableau de bord  Ajouter des synonymes  Ajouter le Phrasing  Suivre les usages
    34. 34. #JSS2014
    35. 35. #JSS2014 Des règles à respecter en amont pour faciliter l’analyse : Modélisation Couche sémantique Q&A comprend nativement un « bon » modèle sémantique … … Mais il est possible de l’aider grâce aux Synonymes & Phrasings Conclusion
    36. 36. #JSS2014 Questions
    37. 37. #JSS2014 • Demystifying Power BI Q&A http://blogs.msdn.com/b/powerbi/archive/2014/03/12/demystifying-power-bi-q-amp-a- part-1.aspx Ressources
    38. 38. #JSS2014#JSS2014

    ×