Livre Blanc SAS - EBG 30 cas concrets de Datavisualisation / Dataviz

5 293 vues

Publié le

Livre Blanc SAS - EBG 30 cas concrets de Datavisualisation / Dataviz

Publié dans : Technologie
0 commentaire
7 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
5 293
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1 189
Actions
Partages
0
Téléchargements
188
Commentaires
0
J’aime
7
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Livre Blanc SAS - EBG 30 cas concrets de Datavisualisation / Dataviz

  1. 1. datavizcas concretspour comprendre la data visualization30
  2. 2. datavizLa data visualization : encore un terme commercial à la mode ou bien une réalité dans les entreprises ? Pour le savoir, nous avons mené l’enquête auprès d’un vaste panel de sociétés, tous secteurs confondus (industrie, médias, transport, distribution, services, etc.). Résultat : plus de 30 entreprises nous ont décrit, non pas les avantages théoriques de la représentation visuelle des données, mais des projets concrets, produisant déjà des résultats. Leurs retours d’expérience, comme il se doit richement illustrés, et des mises en perspective d’experts, vous aideront à comprendre ce qu’est la "dataviz" et comment en tirer parti dans votre métier.
  3. 3. 4 6 7 16 32 44 58 59 73 75 77 80 82 84 87 96 117 122 123 127 130 132 introduction 1. la dataviz et vous : présentations 1.1 définition(s) de la dataviz 1.2 à quoi sert la dataviz ? 1.3 une innovation ou une révolution ? 1.4 à qui s’adresse la dataviz ? 2. les bénéfices de la data visualization 2.1 2.1 la dataviz facilite la compréhension des données 2.2 2.2 la dataviz améliore la communication 2.3 2.3 la dataviz optimise et accélere la prise de decision 2.42.4 la dataviz contribue à la motivation des collaborateurs 2.5 2.5 la dataviz favorise l’innovation 3 3. caractéristiques des projets dataviz 3.1 3.1 des projets rapides et légers 3.23.2 impact de la dataviz sur les relations entre l’IT et les métiers 3.33.3 facteurs clés de succès 3.4 3.4 écueils à éviter 4. perspectives 4.14.1 le futur des projets 4.24.2 tentative de prospective conclusion contributeurs page sommaire
  4. 4. 5 1.1 définition(s) de la dataviz fig 1 - sommaire comprendre la data visualization au travers de 30 cas concrets introduction contributeurs conclusion 1 .1 4 .1 1.2 6 16 32 44 58 7275778082 87 96 117 123 127 130 132 1.3 1.4 2 .1 3 .1 2.22.32.42.5 3.2 3.3 3.4 4.2 4146
  5. 5. uand on s’arrête un peu sur le terme "données", on s’aperçoit qu’il est particulièrement ambigu. Qu’est-ce qui est ainsi donné dans l’entreprise ? Chiffres, indicateurs, tableaux… Il est vrai que les data sont aujourd’hui omniprésentes et apparaissent comme une évidence. Pourtant, elles sont très difficiles à appréhender, tel le sable disponible à profusion, mais qui toujours vous glisse entre les doigts. Les données qui s’offrent ainsi aux professionnels pour les guider dans leurs décisions sont de plus en plus nombreuses et variées. Mais comment ne pas être submergé et en faire un réel outil pour la réflexion et la prise de décision ? C’est face à cette nécessité que la data visualization apparaît comme une solution. La représentation des données sous forme d’images pourrait permettre de mieux les comprendre. Le monde des chiffres et celui des images sont a priori très éloignés. Mais comme souvent, c’est en abattant des a priori que l’on progresse. C’est ce qu’ont su faire les trente entreprises interrogées dans le cadre de cet ouvrage, qui font figure de pionnières dans l’usage concret de la data visualization. Elles vont nous guider, grâce à leurs expériences pratiques, pour découvrir ce qu’est la data visualization et comment s’en servir. Chemin faisant, des experts de SAS, mais aussi des acteurs et des observateurs du marché éclaireront certains aspects de la "dataviz", en les replaçant dans le contexte plus général de la Business Intelligence. Q introduction
  6. 6. La première partie de ce livre sera consacrée à un tour d’horizon de la data visualization. Nous tâcherons de la définir et examinerons ses origines. Nous verrons que ses usages sont multiples et qu’elle s’adresse à un vaste panel d’acteurs, dans des secteurs diversifiés. La deuxième partie s’attachera à mettre en lumière les bénéfices de la data visualization, notamment sous ses trois aspects de la découverte et de l’analyse des données, et de la communication de l’information. Nous verrons également comment elle se place par rapport à la business intelligence traditionnelle. En troisième lieu, nous examinerons la manière de mener un projet de data visualization. Nous passerons en revue les principaux critères de réussite et identifierons les chausse-trappes à éviter. Enfin, nous élargirons le spectre pour envisager le futur de la dataviz et la manière dont les entreprises utilisatrices interrogées ici prévoient de faire évoluer leurs usages. Prêts à embarquer et à découvrir la terra incognita des données ? Alors, hissez les voiles ! L’exploration commence. introduction 7
  7. 7. 1 1 la dataviz et vous : présentations 1
  8. 8. 9 1.1 définition(s) de la dataviz Qu’on l’écrive à l’américaine data visualization, en franglais "datavisualisation" ou familièrement sous son petit nom de "dataviz", la représentation graphique de données statistiques est incontestablement à la mode. Et comme tous les mots à la mode, elle devient un terme fourre-tout, dont on finit par ne plus très bien savoir ce qu’il signifie. Commençons donc par tenter une définition. Fort heureusement, dans cette gageure, nous ne serons pas seuls, car les contributeurs de l’ouvrage ont bien voulu nous prêter main-forte. SAS définit la data visualization comme "l’exploration visuelle et interactive et la représentation graphique des données, quelles qu’en soient la volumétrie (des small data aux big data), la nature ou la provenance. Elle permet aux utilisateurs métier de détecter des phénomènes ou des tendances invisibles de prime abord." 1.1 définition(s) de la dataviz
  9. 9. 11 Nos contributeurs se retrouvent assez bien dans cette vision, à en juger par leurs propres définitions : Nous considérons la Data Visualization comme un moyen de mettre à la disposition de l’utilisateur une information sous forme visuelle, de manière à en faciliter l’accès. Caroline Denil, Data Warehouse Program Manager, SPF Economie La Data Visualization est l’art de représenter visuellement, et ce pour favoriser la meilleure compréhension possible. Jérôme Tharaud, Responsable des études et développement, Prisma Media Nous avons mis en gras les termes qui nous paraissent les plus intéressants : "forme visuelle" aussi évident que cela puisse paraître, c’est le fondement de la dataviz : il s’agit de représenter les données de manière visuelle, graphique ; "faciliter l’accès" la représentation graphique n’est pas gratuite, elle est au service d’objectifs, dont le premier est de permettre d’accéder plus facilement à l’information véhiculée par les données. Il est en effet plus aisé et agréable de considérer un graphique qu’une série de chiffres. Ce que Guillaume Deschamps de STMicroelectronics formule ainsi : la dataviz "est un moyen de traduire un ensemble de données abstraites et sèches en une information que l’on puisse appréhender" ; "Data visualization" : petit florilège de définitions
  10. 10. 11 Nous définissons la Data Visualization comme le fait de visualiser des données pour mieux les exploiter et en tirer des insights qui, autrement, prendraient plus de temps. Elle permet d’avoir une compréhension plus rapide et meilleure. Charles du Réau, Consumer & Market Knowledge Director, Ubisoft La Data Visualisation est un système permettant, via le support de représentations graphiques, une prise de décision factuelle et plus rapide. Guillaume Deschamps, Engineering Data Analysis Manager, STMicroelectronics La Data Visualization est un outil au service du partage de l’information. Il­s’agit donc d’un procédé qui marque une rupture avec le reporting classique : un tableau se distribue... alors qu’un graphe se partage avec d’autres. François Nguyen, Directeur SI décisionnel et marketing relationnel, SFR "compréhension"  il s’agit de donner du sens aux données, pour en tirer de l’information ; "exploiter", "prise de décision" la dataviz ne permet pas seulement une compréhension intellectuelle, elle transforme un ensemble de données brutes en une information permettant d’agir ; "plus rapide" la dataviz accélère la compréhension, la décision et l’action que nous venons d’évoquer ; "partage de l’information" elle est également un mode de communication, permettant que les données ne restent pas cantonnées à l’univers de la BI ou de la statistique mais infusent toute l’organisation et deviennent un support de décision et de travail collaboratif. 1.1 définition(s) de la dataviz
  11. 11. 1 La DataViz n'est pas une fin en soi, c'est un moyen mis au service de la production de sens, au service d'une meilleure compréhension des phénomènes. Autrement dit, nous donnons aux Métiers la possibilité de mieux appréhender une réalité qu'ils connaissent déjà, en leur proposant de la considérer sous d’autres angles de vue. Maguelonne Chandesris, Responsable de l’équipe Statistique, Économétrie et Datamining, Direction Innovation & Recherche SNCF J’ai été Directrice de projet sur les KPI et j’ai donc conduit la rationalisation et l’optimisation des indicateurs de pilotage. Ce qui est important sur ce projet, qui sera à terme généralisé et déployé aux équipes de ventes, ce sont les leviers d’actions et l’aide à la décision qu’apporte la data visualization aux managers. En d’autres termes : Que puis-je faire pour performer ? Sur quels leviers intensifier les efforts pour obtenir rapidement des résultats concrets ? Sandrine Noail, Responsable Analyse et Pilotage Coliposte On voit donc que la data visualization répond à une approche très opérationnelle, comme le résument Maguelonne Chandesris, de SNCF Innovation et Sandrine Noail, de Coliposte : Un moyen, pas une fin en soi
  12. 12. 13 La valeur de la datavisualisation réside dans sa capacité à répondre à trois impératifs principaux : être interprétable, être pertinente et être novatrice. être interprétable Dans un contexte où le volume des données explose avec le développement exponentiel de l’usage d’internet et notamment de Google, les données dites "non structurées" connaissent la même évolution. Or une datavisualisation partant de ces données qui ne seraient pas interprétables, c’est-à-dire claires, ne servirait à rien. être pertinente La pertinence est liée au caractère interprétable. La datavisualisation doit permettre de répondre à des questions dans un contexte défini et visant des objectifs précis. être novatrice Enfin, la datavisualisation n’a d’intérêt que si elle apporte une information nouvelle, une originalité, si elle donne une perspective inédite sur un sujet. Dorina Ghiliotto-Young, Head of Innovation, Ingenico Pour terminer cette définition de la dataviz, il nous paraît intéressant de relever les trois caractéristiques principales qu’elle doit impérativement avoir, pour pouvoir justement être utilisable pratiquement : Les 3 caractéristiques de la data visualization 1.1 définition(s) de la dataviz
  13. 13. 1 Les prémices de la représentation graphique de données statistiques remontent aux travaux du statisticien écossais William Playfair (1759-1823). Il est l’inventeur d’outils qui nous paraissent désormais familiers : le graphique circulaire (le fameux "camembert"), le diagramme en bâtons, le diagramme linéaire. Surtout, il a mis au premier plan l’importance des graphiques pour représenter les données, à une époque où la tradition cartésienne des représentations sous formes de fonctions mathématiques régnait en maître. Playfair, au contraire, mettait en avant que le simple fait de coucher les données sous la forme de points et de formes sur un graphique pouvait nous aider à mieux les comprendre. Ironie de l’Histoire, Playfair, lui, est resté largement incompris par ses contemporains.1 Au XIXe siècle, le nom d’un autre précurseur se détache, Charles- Joseph Minard. Il est entré dans la postérité pour sa "carte figurative des pertes successives en hommes de l’armée française dans la campagne de Russie 1812-1813", publiée en 1869. Cette représentation réussit l’exploit de représenter en un seul schéma des données de nature aussi différente que des effectifs en hommes, des indications géographiques (distances, villes, cours d’eau), des températures et des directions (vers la Russie ou dans le sens opposé). 1. Ce paragraphe est inspiré de l’article d’Howard Wainer : "William Playfair" (version 3). StatProb: The Encyclopedia Sponsored by Statistics and Probability Societies. Freely available at http://statprob.com/encyclopedia/WilliamPLAYFAIR.html Brève histoire de la data visualization
  14. 14. 15 2. Sources : http://en.wikipedia.org/w/index.php?title=Box_plot&oldid=551581640 et http://fr.wikipedia.org/w/index.php?title=Bo%C3%AEte_%C3%A0_moustaches&oldid=90308055 Mais il fallut attendre les années 60 et les travaux du statisticien John Tukey, de l’université de Princeton, pour que la visualisation des données soit enfin reconnue à sa juste valeur. Entre autres apports, on lui doit notamment l’invention de la boîte à moustaches (aussi appelée diagramme en boîte, boîte de Tukey ou box plot). Cette représentation permet de représenter graphiquement des séries numériques au travers de cinq caractéristiques principales : la valeur minimale, le premier quartile (Q1), la médiane, le troisième quartile (Q3) et la valeur maximale. On y ajoute souvent la moyenne pour illustrer la dissymétrie d’une distribution lorsque médiane et moyenne ne sont pas confondues. La boîte à moustaches peut aussi faire figurer les données aberrantes.2 - Un exemple de "boîte à moustaches" utilisée dans l’industrie, chez STMicroelectronics : ` 1.1 définition(s) de la dataviz
  15. 15. 1 Dans les années 70, John Tukey a travaillé avec un professeur à Princeton, Edward Tufte, lors d’une série de séminaires sur la représentation graphique des données. Ces séminaires seront repris par Tufte dans un livre qui fera date en matière de data visualization, The visual display of quantitative information. Plus récemment, c’est au Suédois Hans Rosling que l’on doit la poussée d’enthousiasme pour la représentation graphique de données statistiques, grâce à son graphe à bulles animé. La conférence lors de laquelleil l’a présentée en 2006 a déjà été visionnée plus de 5 millions de fois sur le site TED.com.3 Hans Rosling à la conférence TED 3. http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html
  16. 16. 17 Le quartet d’Anscombe est une parfaite démonstration de ce qu’un graphique peut mieux rendre compte de la réalité derrière les données que les données elles-mêmes. Classiquement, il prend la forme de 4 ensembles de données X et Y, tels que ceux-ci : Déjà, si l’on se contente de regarder ces tableaux de chiffres, on a du mal à détecter quoi que ce soit. Quels phénomènes, quelles régularités peuvent-ils bien traduire ? Pour y voir plus clair, on peut effectuer certains calculs statistiques, pour déceler des propriétés. Et là, ô surprise, on s’aperçoit que les quatre ensembles ont des propriétés identiques ! On serait donc tenté de croire que les 4 ensembles représentent des données similaires. Pourtant, si on les place simplement sous forme de points sur un graphique à deux axes, on se rend compte qu’ils reflètent des réalités bien différentes ! La data visualization permet donc de se poser de nouvelles questions sur des séries de données dont les particularités passeraient autrement inaperçues. I II III IV Pourquoi un graphique parle mieux des données que les données elles-mêmes ? I II III IV 1.1 définition(s) de la dataviz
  17. 17. 11 Remarquons tout d’abord que la data visualization concerne un vaste éventail de secteurs d’activité. Si l’on s’en tient à notre panel, les domaines suivants sont représentés : • biens de consommation grand public (L’Oréal, Ubisoft) • services aux entreprises (Accenture) • industrie (Ingenico, Philips, Schlumberger, STMicroelectronics) • médias (BFM Business, France Télévisions, InfoPro, Prisma Media) • marketing et publicité (IFR-GfK, Lagardère Active, PagesJaunes, SM-Marketing Convergence) • recherche scientifique (IMEC) • service public (SPF Économie) • télécom (Alcatel-Lucent, Orange, SFR) • transport et logistique (Aéroports de Paris, ID Logistics, SNCF, Voyages-sncf.com) Toutes ces entreprises utilisent la data visualization soit pour faire mieux certaines choses qu’elles faisaient déjà (optimisation), soit pour enrichir leur activité de tâches à valeur ajoutée (innovation). Dans le registre de l’optimisation, la dataviz permet, par exemple, à Lagardère Active d’accélérer la production de ses états et à STMicroelectronics de rendre son processus de fabrication plus performant ; dans celui de l’innovation, PagesJaunes découvre et rectifie, grâce à la data visualization, les lacunes de son indexation, Voyages-sncf.com met sur le marché un nouveau service innovant (Mytripset), Alcatel Lucent imagine les applications mobiles de demain, etc. Dans les pages qui suivent, nous allons étudier plus particulièrement 5 cas d’usage illustrant cette double finalité d’optimisation et d’innovation : l’utilisation de la data visualization pour… > améliorer le pilotage de l'entreprise, > améliorer la relation client, > définir l’offre même de l’entreprise, > contribuer directement au business de cette dernière > donner du pouvoir aux citoyens. Maintenant que nous comprenons mieux ce qu’est la data visualization, examinons ses usages. Ce sera l’occasion, au passage, d’évoquer certaines des réalisations les plus pertinentes qui nous ont été présentées par les contributeurs à cet ouvrage. 1.2 à quoi sert la dataviz ?
  18. 18. 19 1.2 à quoi sert la dataviz ? > améliorer le pilotage de l’entreprise L’un des premiers usages de la data visualization est de contribuer à un pilotage plus efficace de l’activité et de la performance, orienté vers l’action. On retrouve là le côté très opérationnel de la démarche. Notre entreprise était bousculée par la concurrence. Nous devions utiliser des outils décisionnels plus modernes pour être capables d'anticiper les positions de nos concurrents et l’attrition sur notre portefeuille clients. Nous avons voulu faire de la datavisualisation un outil décisionnel, stratégique, utilisable par un manager de proximité pour piloter sa performance. Sandrine Noail, Responsable Analyse et Pilotage Coliposte La data visualization au service du pilotage de l’entreprise Nous voulions doter le board d’un véritable outil de pilotage, autrement dit d’un tableau de bord avec tous les indicateurs stratégiques pour permettre la prise de décision. L’objectif était de remettre les utilisateurs dans un processus de management et non pas dans un processus itératif d’analyse comme on peut le faire avec des bases de données ou des tableaux interactifs. Laurence Kerjean, Global Digital Manager, L’Oréal S’il fallait donc absolument trouver un élément déclencheur à notre démarche, ce serait bien ce véritable besoin commun d’améliorer les exigences du reporting classique que nous avions déjà, de manière à l’orienter vers le pilotage, l’action et la décision François Nguyen, Directeur SI décisionnel et marketing relationnel SFR
  19. 19. 1 Les principaux composants de l’infrastructure réseau d’un opérateur téléphonique ont un impact sur la qualité des appels et, plus globalement, sur la qualité de services et le revenu. Les switches jouent un rôle clef dans le routage des appels, l’analyse et la surveillance du trafic et la qualité de service des différents équipements sont primordiales. Ce graphique présente les indicateurs de trafic (volume d’appels et appels interrompus) pour différents constructeurs et équipements. Un exemple de data visualization dans le secteur des télécoms ≥ Analyse des appels par équipements - Source : SAS®
  20. 20. 21 Le cas du centre de recherche en micro et nanoélectro- nique flamand IMEC en fournit un exemple significatif. Nous utilisons SAS depuis des années pour des projets scientifiques. Il y a quelques années, nous avons commencé à l’utiliser aussi pour nos rapports d’entreprise. Nous avons commencé par un premier périmètre simple (les consommations téléphoniques de nos collaborateurs) puis nous avons ajouté de nouveaux domaines, l’un après l’autre, de manière à entrer progressivement toutes les informations dans l’environnement BI. Nous utilisons la solution principalement pour représenter les indicateurs que nous devons produire pour le gouvernement flamand, par exemple en ce qui concerne le nombre de publications réalisées par nos chercheurs, le nombre de nos doctorants ou encore nos activités donnant lieu à la création d’entreprises (spin-offs). Par ailleurs, nous produisons également des rapports pour visualiser nos plannings et notre performance en termes d’utilisation de nos ressources. Yves Daelmans, ICT Project Manager IMEC La data visualization comme outil de pilotage ≤ IMEC coût en téléphonie pour un employé 1.2 à quoi sert la dataviz ?
  21. 21. 11 ≥ talent magnet (répartition par nationalité des salariés chez IMEC pour un mois donné) ≥ récapitulatif sur 12 mois du temps passé par un employé par grands groupes de tâches
  22. 22. 23 Enfin, qui dit pilotage dit prise de recul. C’est ce que permet la data visualization, en complément d’autres outils à horizon plus court terme. Le sujet de la data visualization arrive chez L’Oréal à un moment où toutes les équipes digitales, aussi bien dans les marques que dans les pays, s’organisent pour avoir des tableaux de bord tactiques ; notre projet de tableau stratégique vient donc fédérer toutes les actions locales et nous permet d’avoir une réelle vision stratégique. Laurence Kerjean, Global Digital Manager, L’Oréal La dataviz ou la pensée visuelle au service de la stratégie ≤ Un tableau de bord stratégique chez L’Oréal 1.2 à quoi sert la dataviz ?
  23. 23. Notre activité s'articule autour de trois principaux canaux : les points de vente, les centres d'appels clients et notre boutique en ligne sur sfr.fr. Nous développons nos solutions dataviz dans l'optique d'optimiser la gestion de ces canaux. Nos efforts visent avant tout à améliorer le pilotage et la compréhension de nos KPI. En ce sens, nos projets sont très orientés "indicateurs d’activité"... Nos développements en data visualization s'attachent donc à rapprocher de nombreuses sources de données afin d’y trouver des relations et des causalités. François Nguyen, Directeur SI décisionnel et marketing relationnel SFR 11 > améliorer la relation client Le marketing et la gestion de la relation client sont deux fonctions de choix pour la data visualization, comme le montrent les exemples de SFR et de Lagardère Active. Visualiser les données clients pour améliorer le CRM multicanal
  24. 24. 25 Source:SAS® Dataviz et relation client multicanal ≥ Analyse des Centres de Relation Client La multiplication des canaux de communication est un challenge supplémentaire pour les Centres de Relation Client pour préserver la satisfaction client. Le volume et la complexité des données (souvent compartimentées en silos) entravent la capacité d’analyse pour accroître l’efficience et optimiser les coûts. Ce graphique présente les principaux indicateurs de performance (qualité de service, temps de prise en charge et taux d’abandon) avec un détail sur le taux de résolution au premier contact. Une bonne relation client passe aussi par une bonne connaissance de ces derniers : quels sont leurs caractéristiques et leurs comportements ? Comment les segmenter ? À ce titre, les capacités d’exploration dans les données permises par la data visualization trouvent tout leur sens. Nous y reviendrons dans la deuxième partie. Nous avons chez Lagardère Active une des plus grosses bases d’abonnés à nos magazines, avec près de 3 millions de clients. Nous souhaiterions étoffer les capacités d'analyse de notre CRM en y intégrant les outils de la dataviz afin de bénéficier d'une vision affinée de notre parc clients. Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire, Direction des Technologies Lagardère Active La dataviz pour mieux qualifier la base clients 1.2 à quoi sert la dataviz ?
  25. 25. 1 > mieux définir son offre À l’opposé du spectre, la data visualization fournit aux entreprises des outils pour mieux définir leurs offres. L’exploration des données recueillies sur les clients et la possibilité de tester différentes hypothèses s’avèrent particulièrement précieuses. ≥ Une dataviz pour représenter la consommation électrique des trains Les sources de données sont très diverses à la SNCF, constituant autant de champs d’applications possibles. Nos premiers travaux dataviz datent de 2010 et aujourd'hui, nous avons à notre actif plusieurs projets aboutis sur des thématiques diverses : information, régularité voyageurs et impacts économiques, yield management et aspects énergétiques. Maguelonne Chandesris, Responsable de l’équipe Statistique, Économétrie et Datamining, Direction Innovation & Recherche SNCF La dataviz pour faire évoluer l’offre de la SNCF dans différents domaines Application de la data visualization au yield management ≥
  26. 26. 27 > contribuer au business En définitive, c’est directement sur le business même d’une entreprise que la data visualization peut avoir un impact. Par exemple, Charles du Réau (Ubisoft) nous explique comment elle a permis à l’éditeur de jeux de mieux comprendre son marché : ≥ Le radar d’Ubisoft pour comparer ses marques à la concurrence Nous avons réalisé un projet permettant de comparer nos marques à celles de la concurrence selon plus d’une centaine de critères. Nous nous appuyons pour cela sur des données réalisées par un institut d'études externe sur des panels de milliers de joueurs. Là où avant nous ne pouvions comparer nos marques qu'à une "marque moyenne" théorique, nous pouvons désormais les comparer instantanément à l'ensemble des autres marques du panel, de manière graphique, selon des critères qui sont notés par les consommateurs.. Charles du Réau, Consumer & Market Knowledge Director, Ubisoft Mieux comprendre son positionnement concurrentiel 1.2 à quoi sert la dataviz ?
  27. 27. La géolocalisation associée à la dataviz est un atout marketing indéniable. Elle nous permet notamment de mettre en exergue nos zones de chalandise ou d'établir une cartographie des groupes et entreprises que nous ciblons. C'est sans conteste un instrument de poids que nous mettons au service de notre démarche d'analyse concurrentielle. Clément Delpirou, Associé, InfoPro Digital 1 Dans mon métier, le journalisme économique, j’ai deux sources d’information principales : d’une part les données chiffrées (études, rapports, bases de données, statistiques officielles) et les dépêches d’agences, qui sont de l’ordre du factuel et sont disponibles pour toute la profession ; d’autre part, les personnes que nous recevons sur le plateau, dont les propos, exclusifs, nous donnent une matière plus qualitative. L’intérêt d’outils d’analyse et d’exploration comme la data visualization est de procurer le même caractère exclusif et qualitatif que nous pouvons avoir dans les interviews, mais cette fois à partir de données. Autrement dit, dans la mouvance du datajournalisme, la data visualization est un moyen de repérer des sujets, d’offrir de nouveaux angles au journaliste pour traiter l’actualité, voire de créer l’événement. En ce sens, elle est un outil à forte valeur ajoutée pour la profession, amené à se développer. Emmanuel Lechypre, Éditorialiste, Responsable pôle Analyse et prévisions, BFM Business La data visualization, source de valeur et de différenciation Emmanuel Lechypre, quant à lui, nous explique comment la dataviz contribue directement à la proposition de valeur pour les journalistes et des médias tels que BFM Business :
  28. 28. 29 La dataviz peut également mettre en exergue les modifications dans le comportement de sa clientèle, de manière à s’y adapter au mieux. Il en va ainsi des investissements publicitaires des annonceurs sur les supports de Lagardère Active : Identifier immédiatement les reports d’achats de ses clients Nous avions pour projet de représenter l'investissement de nos annonceurs par thématique sous la forme d'un radar. Ce dernier pourrait notamment permettre de comparer les tendances d'une année N vs l'année N-1. La visualisation par annonceur donnerait également la possibilité d'obtenir une vision plus fine de l’évolution des investissements de ce dernier, c'est-à-dire des changements réalisés en termes d'orientation thématique (ex. : abandon d'une thématique d'une année sur l'autre) et de bénéficier d'un aperçu plus aiguisé des tendances. Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire, Direction des Technologies Lagardère Active 1.2 à quoi sert la dataviz ? ≥ Radars représentant l’investissement des annonceurs chez Lagardère Active
  29. 29. 1 Cette contribution au business peut s’exprimer très directement sur le modèle économique même de l’entreprise. Philippe Nieuwbourg prend l’exemple de la vente à distance pour nous le faire comprendre : Si on prend l’exemple de la vente à distance, des entreprises comme La Redoute ou 3 Suisses réalisent aujourd’hui la majeure partie de leur chiffre d’affaires en ligne. Or, si la Redoute n’avait aucun moyen de savoir quelles pages de son catalogue papier retenaient le plus l’attention de ses clients, ou combien de temps ils passaient en moyenne sur une page, elle peut désormais avoir ce genre d’information pour les visiteurs de son site e-commerce. Grâce aux logs de connexion, elle peut savoir quelles sont les pages les plus visitées, combien de temps un internaute passe sur une page, quel est son parcours d’une page à l’autre, etc. Tout ceci constitue potentiellement un trésor, à condition de savoir exploiter ces logs, les faire parler. La data visualization peut justement être un moyen d’extraire la valeur de ces logs. Philippe Nieuwbourg, Analyste-journaliste indépendant en informatique décisionnelle Quand la data visualization influe directement sur le modèle économique d’une entreprise
  30. 30. 31 > donner du pouvoir aux citoyens La data visualization trouve aussi son utilité en dehors des murs de l’entreprise. Elle peut contribuer à mieux informer le citoyen et donc à lui donner les moyens d’agir. Deux exemples que nous avons étudiés l’illustrent parfaitement : les dataviz mises à disposition du grand public par le Ministère belge de l’économie, via le Service Public Fédéral (SPF) Économie, et "le pariteur" mis en ligne par France Télévisions. Nos projets dataviz se présentent sous trois formes distinctes : • Be Stat, qui mobilise des données disponibles depuis plus de quatre ans, et permet la création de tableaux multidimensionnels (cubes SAS). Dans ce cadre, nous proposons une interface dynamique alliant Java et SAS, permettant au citoyen de réaliser lui-même son tableau, en choisissant les mesures à montrer, les dimensions selon lesquelles il souhaite voir les données et les filtres à appliquer aux données. Be Stat permet un export ultérieur des données, notamment aux formats CSV et PDF. • un dashboard orienté "économie", qui génère une vision statique de graphiques interchangeables, regroupés au sein d'un ensemble intitulé EcoZoom. Ces graphes sont susceptibles d’indiquer l’évolution des indices des prix du pétrole, par exemple. • un système de cartographie, ou de graphiques dynamiques, actuellement en phase de pilotage. C'est un système particulièrement efficace pour visualiser les densités (populations, prix...), lesquelles sont visibles par le biais de dégradés de couleurs. Nous en voyons une application probante dans la visualisation de l'évolution des prix de l'immobilier dans le temps. La mise en chantier de ces projets dataviz est pour nous l'occasion de présenter différemment les données que nous avons collectées et que nous utilisons déjà, afin de permettre aux citoyens de réaliser leurs propres analyses. Caroline Denil, Data Warehouse Program Manager SPF Économie Donner matière à penser aux citoyens 1.2 à quoi sert la dataviz ?
  31. 31. 1 Les projets de "dataviz citoyenne" peuvent prendre un tour plus militant. C’est le cas par exemple du "pariteur" de France Télévisions. Aujourd'hui, une femme touche 25% de moins qu'un homme dans le privé et 18% dans le public, poste pour poste et à temps de travail équivalent. C'est une moyenne calculée par l'Insee à partir de données statistiques de 2010 (DADS 2010, Déclaration Annuelle de Données Sociales) sur les salaires recensés par âge, par sexe, par région et par poste (nomenclature standardisée des postes). En s’appuyant sur ces données, France Télévisions Nouvelles Écritures et Francetv info ont réalisé une application Web et mobile inédite et ludique, "Le Pariteur", permettant d’évaluer sa propre disparité salariale : "et si j'étais payée comme un homme ?" "Combien gagnerait une femme à ma place ?" En quelques clics, le Pariteur vous donne la réponse. Une fois cette disparité salariale calculée, l’utilisateur peut communiquer cette information sous différentes formes et vers différentes cibles : via un "diplôme d'écart salarial" et des affiches à partager avec ses amis et collègues sur les réseaux sociaux ; ou via une lettre pré remplie et personnalisée à envoyer à son DRH ! Cette dataviz a été mise en ligne le 4 mars 2013 à l'adresse suivante : http://appli-parite.nouvelles-ecritures.francetv.fr/ Elle cumule à l’heure où sont écrites ces lignes plus de 100 000 visites. Surfant sur le mouvement de l’open data, cette Web app met à disposition des citoyens des données auxquelles ils n'ont pas facilement accès, et qui pourtant, sont publiques. C’est également un outil qui révèle le débat passionné et tabou autour de la parité salariale et, plus largement, autour de la question des droits des femmes. Un débat qui irradie l’ensemble de la société, avec au premier rang les 29 millions d’actifs (et d’actives) français. Antoine Allard, Chargé de communication & marketing Social Media France Télévisions Le "pariteur" de France Télévisions ≥
  32. 32. 33 Si l’on fait le bilan, les usages de la data visualization peuvent se regrouper en trois grandes catégories, comme nous l’explique Dorina Ghiliotto-Young, Head of Innovation chez Ingenico : Trois raisons principales expliquent le recours à la data visualization : • confirmer ou infirmer des hypothèses sur un marché La data visualization peut alors prendre la forme d’un dashboard, permettant de prendre une décision en ayant une vision globale du marché étudié. • éduquer En interne, Ingenico utilise notamment la datavisualisation pour des travaux de reporting ou des sessions de brainstorming. Elle peut être un bon complément de démarches créatives de type "gamification" car elle développe l'intuition. • explorer C'est l'aspect le plus futuriste de la datavisualisation, qui est certainement amené à se développer. La dataviz peut aider à construire des modèles prédictifs. On est alors dans le domaine de la data analysis. Dorina Ghiliotto-Young, Head of Innovation, Ingenico Pourquoi recourir à la data visualization ? 1.2 à quoi sert la dataviz ?
  33. 33. 11 La représentation graphique de données statistiques n’est pas, à proprement parler, nouvelle puisque, comme nous l’avons vu plus haut, on peut faire remonter son apparition au XVIIIe siècle. Forts de ce constat, les sceptiques auront beau jeu d’arguer que la dataviz n’est en rien une révolution. Toutefois, Claude- Henri Mélédo, cofondateur d’Aldecis - cabinet d’experts en tableaux de bord et en systèmes de pilotage d’organisations, nous faisait remarquer en entretien que le terme "révolution" contient en lui-même l’idée de retour. Et l’on peut fort bien soutenir que si l’utilisation des graphiques pour représenter les données n’est pas nouvelle en soi, nous y retournons aujourd’hui avec une puissance et des potentialités jamais atteintes. On peut donc dire que la data visualization introduit une rupture dans l’histoire de la business intelligence. Pour cela, elle s’appuie sur toute une série de changements majeurs, qu’elle fédère pour leur donner toute leur portée. On peut notamment citer les big data, les progrès dans la compréhension du fonctionnement du cerveau et la mise au point de nouveaux terminaux et de nouvelles interfaces d’accès à l’information. 1.3 une innovation ou une révolution ?
  34. 34. 35 1.3 une innovation ou une révolution ? > Les big data Les big data désignent à la fois le phénomène de l’explosion des quantités de données disponibles et les technologies pour les traiter. Il se distingue par trois caractéristiques principales souvent reprises sous l’expression des "3V" : le Volume des données, leur Variété et la Vitesse à laquelle elles sont produites. Depuis trois ans, plusieurs travaux ont bien mis en lumière ces dimensions. On peut penser, notamment, aux études Big Data Analytics (TDWI Research, août 2010), Big Data : The next frontier for innovation, competition, and productivity (McKinsey, juin 2011), ou encore The Deciding Factor: Big Data & Decision Making (Capgemini, juin 2012). SAS ajoute deux caractéristiques supplémentaires4 que sont la variabilité des données (avec des effets de pics ou de creux, de saisonnalité, dans la quantité de données produites) et leur complexité (par exemple, le nombre de sources dont elles proviennent, la diversité de leur nature – chiffres, schémas, ensembles de relations, texte - ou de leurs formats). D’après IDC, l’information totale produite chaque année par les entreprises a connu de 2007 à 2011 une croissance annuelle de 67%, passant de 75 exaoctets à 580 exaoctets . Mais cette progression n’est rien en regard de ce qui nous attend. La quantité d’information numérique créée ou répliquée annuellement (ce qu’IDC appelle l’univers numérique), va être multiplié par 44 en 2020 par rapport à son niveau de 2009, pour atteindre 35 zettaoctets . Nombre d'exaoctets produits/an Source IDC 2008 1 exaoctet = 1 milliard de gigaoctets 1 zettaoctet = 1 000 milliards de gigaoctets l'Univers numérique 2009/2020 Source IDC Digital Universe Study, sponsored by EMC, May 2010 4. http://www.sas.com/big-data/ La croissance exponentielle de la quantité de données Source : Qualité des données, quelle(s) vérité(s) pour les entreprises, EBG, 2012
  35. 35. 1 Ce genre de données peut à la limite être stocké et traité par des outils de BI traditionnels, mais ces derniers ne suffisent plus pour les comprendre. La data visualization permet de dépasser cette limitation, faisant intervenir un 4e "V", celui de Valeur. Ce que Philippe Nieuwbourg énonce en une formule : Les solutions de data visualization sont une réponse à la complexité rencontrée dans le traitement de grosses masses de données. En ce sens, la visualisation elle-même permet une analyse pointue, laquelle passe par la détection de patterns (ces schémas récurrents reflétant des tendances), impossibles à déceler par le biais des outils de reporting classique (ex. : tableau de bord Excel). Autrement dit, la dataviz permet d'explorer visuellement de grands volumes de données et de dégager des tendances qui ne sont pas forcément visibles à travers une simple énumération de chiffres. Frédérique Pain, Experience Strategy Director, Alcatel-Lucent Bell Labs La data visualization à la rescousse pour le traitement des big data x Visualisation = Valeur Vitesse + Volume + Variété
  36. 36. 37 Comme on le voit dans ces exemples, c’est l’analyse qui est au cœur de la création de valeur par les big data. C’est parce qu’elle permet l’analyse (et l’exploration) de ces quantités faramineuses de données que la data visualization permet de tirer la valeur des big data. Nous avons un challenge de big data, avec une information de plus en plus volumineuse et dont nous devons absolument adresser la complexité pour nous différencier ; nous avons aussi un challenge de big data dans l’usage, pour enrichir l’analyse. La visualisation doit permettre justement de tirer tout le profit de cette volumétrie disponible, en permettant l’émergence de questionnements nouveaux sur la donnée. Fabrice Benaut, CIO global IFR, Head of IS and Operations, IFR Monitoring Dans nos métiers, le terme "analytique" renvoie aux méthodes statistiques d’analyse des données : statistique descriptive, analyse prédictive, optimisation, prévision, théorie des tests... Quant à la business analytics, elle désigne l'application de l'analytique au monde de l'entreprise. Elle recourt plus particulièrement à des outils tels que le calcul de corrélations, de régressions, l'analyse en composantes principales, l'analyse factorielle, les réseaux de neurones... La business analytics concerne tous les métiers. Prenons simplement deux exemples. En étudiant la typologie des acheteurs et leurs comportements, une analyse prédictive permettra à une entreprise de marketing direct de calculer la probabilité pour un individu donné qu’un certain courrier déclenche un acte d'achat. Ainsi, la marque pourra sélectionner les personnes à qui elle enverra le courrier en question. Autre exemple : la commercialisation de nouveaux médicaments. De la mise au point d'une substance active à la mise sur le marché du médicament proprement dit, plusieurs cycles de tests sont effectués. Le but est de s'assurer que le nouveau produit apporte réellement un "plus", que ce soit en termes d'efficacité, de tolérance, de confort d'utilisation, etc. C'est alors la théorie des tests qui est mise à contribution. La dataviz, un outil qui démocratise l’analytique 1.3 une innovation ou une révolution ?
  37. 37. 1 Il faut noter que l’analytique ne concerne pas uniquement les grandes entreprises : elle concerne toutes les entreprises et tous les métiers dans lesquels la donnée joue un rôle majeur. Par exemple, l'analytique sera fondamentale pour une PME travaillant dans le domaine du social gaming (jeux sur les médias sociaux) : l'analyse des logs d'utilisation de ses jeux est sa seule manière de comprendre ses clients et donc son marché. Toutefois, les entreprises peuvent rencontrer des difficultés ou des enjeux lorsqu’elles se lancent pour la première fois dans l'analytique. Le premier enjeu est de faire en sorte que les connaissances issues de l'analytique se traduisent de manière opérationnelle dans le business de l'entreprise, pour apporter de la valeur. Pour cela, il faut que les profils pointus qui prennent en charge l'analytique (des statisticiens) soient bien intégrés dans les processus de l'entreprise et sachent communiquer. Une deuxième difficulté est que les statisticiens ont des besoins informatiques particuliers, que ce soit en termes de puissance de traitement, d'espace de stockage ou de vélocité, entre autres. Ces besoins se traduisent par des demandes atypiques, inhabituelles pour une DSI. La data visualization constitue une réponse à ces difficultés en démocratisant l'accès à l'analytique auprès de publics qui ne sont ni des statisticiens, ni des data miners. Pour y parvenir, la solution SAS® Visual Analytics intègre, par exemple, plusieurs méthodes analytiques et choisit automatiquement la meilleure pour répondre à une demande de l'utilisateur. D'un simple clic, par exemple, ce dernier pourra obtenir une prévision sur 6 mois sur un indicateur, sans besoin de compétences particulières en statistiques. Le temps de traitement sera d'une à deux secondes et l'utilisation se veut réellement intuitive. Autrement dit, la data visualization permet d'accéder à l'analytique sans connaissances statistiques pointues et accélère la prise de connaissance et la compréhension des données. Elle favorise également la diffusion de cette connaissance dans la société. Visual Analytics permet par exemple de la transmettre sous forme de fichiers pdf ou d'états interactifs sur tablettes. La possibilité de collaborer sur les données, en commentant les états, est également un moyen pour que celles-ci deviennent un véritable outil de travail, à tous les niveaux de l'entreprise. Jérôme Cornillet, Responsable de l’offre Business Analytics, SAS France
  38. 38. 39 Les questions de santé et de sécurité des patients requièrent une forte vigilance afin d’identifier des risques éventuels et éviter des problèmes de santé publique. Le niveau de surveillance demandée est en augmentation : la validation des médicaments en phase d’approbation et après mise sur le marché est critique. Les mesures terrain nécessitent des analyses approfondies. Ce graphique analyse la fréquence et la sévérité de certains effets indésirables. La matrice de corrélation montre en particulier une corrélation forte entre un médicament spécifique, le Thiazolidinedione, et les douleurs de poitrine. Pour illustrer l’importance de l’analytique dans le domaine pharmaceutique et le rôle que la data visualization peut jouer, nous remarquerons que les questions de santé et de sécurité des patients requièrent une forte vigilance afin d’identifier des risques éventuels et éviter des problèmes de santé publique. Le niveau de surveillance demandé est d’ailleurs en augmentation : la validation des médicaments en phase d’approbation et après mise sur le marché est critique. C’est pourquoi les mesures terrain nécessitent des analyses approfondies. ≤ Analyse d’effets indésirables Source:SAS® un exemple de data visualization dans le domaine de la recherche pharmaceutique 1.3 une innovation ou une révolution ?
  39. 39. 1 Cette valeur ajoutée permise par la data visualization dans le domaine de l’analytique appliquée aux big data est confirmée par Andrew Musselman d’Accenture : Le département "data visualization" a collaboré sur des travaux et des propositions commerciales avec le département analytique très bien implanté d’Accenture, qui inclut désormais un aspect plus nouveau concernant les big data. Il nous semble que ces deux facettes sont plus liées que par le passé, pas uniquement pour supprimer les tâches en doublon, mais aussi, plus fondamentalement, pour tirer profit des avantages de chaque facette. L’aspect big data a beaucoup à offrir à l’analytique, et vice-versa. Andrew Musselman, Data scientist, ingénieur et architecte dans le département Big Data d’Accenture Analytique, dataviz et big data : le trio gagnant ≥ L’empreinte de mouvement, telle qu’elle a été exposée à la Cité de l’Architecture et du Patrimoine, d’avril à août 20127 7. http://www.orange.com/m_fr/sponsoring/culture/Cite-de-l-architecture-et-du-patrimoine
  40. 40. 41 Notre démarche de data visualization s'inscrit dans la perspective plus globale des big data. Dans ce contexte, la mise en place d'outils dédiés vient servir une démarche générale de traitement des gros volumes de données (et des données spécifiques opérateurs). Même si la data visualization est un outil de valorisation des données qui peut être utilisé indépendamment des big data, il nous apparaît clairement que les deux sont assez liés. Nos projets s'adressent à nos clients, dans l'optique de leur proposer, à terme, des offres ou des services en adéquation avec leurs besoins. Une initiative développée au niveau du groupe, l’’empreinte de mouvement’, analyse et restitue de façon valorisée les informations de déplacement collectées pour un ou plusieurs individus. Dans cette approche, nous partons de points physiques, en intégrant une gestion de la temporalité à court terme dans un premier temps, avec une captation des données effectuée à intervalles réguliers (par exemple toutes les sept minutes) : il en ressort une sorte de "surface au sol" ou empreinte cartographique que nous sommes en mesure de représenter visuellement. Cette visualisation reflète le degré de sédentarité (c’est une lecture possible) et met au jour le périmètre géographique parcouru, mais également restitue les habitudes de l'individu, visibles à travers ses différents trajets. L'outil fait appel à une représentation logarithmique de manière à ne pas écraser les détails. En augmentant les temps d'observation (sur plusieurs jours ou plusieurs semaines) et en incluant une gestion temporelle à plus long terme, nous augmentons la pertinence de l'empreinte individuelle en question ; l’analyse qui s’en suit s’enrichira parallèlement. Catherine Ramus, Chef de projet Équipe design, Orange L’empreinte de mouvement, à la croisée de l’art, du business et des big data 1.3 une innovation ou une révolution ?
  41. 41. 1 L’essor des big data a largement fait émerger le besoin en data visualization. En retour, les capacités d’analyse et d’exploration que celle-ci autorise suscitent encore plus d’intérêt pour les big data. "Au final, explique Mouloud Dey, Directeur des Solutions et Marchés Émergents chez SAS, dataviz et big data apparaissent souvent disjoints, mais notre conception est autre : ces deux secteurs ont bel et bien partie liée. La data visualization est en effet particulièrement intéressante lorsque l’on dispose de gros volumes de données que l’on a besoin de mettre en relation, pour leur donner du sens." > Les progrès dans la compréhension du fonctionnement du cerveau La science nous a permis d’atteindre aujourd’hui une compréhension beaucoup plus fine du cerveau humain. Elle révèle que la data visualization est une méthode particulièrement efficace pour représenter, analyser et interpréter des données. La vue, qui est gérée par le cortex visuel situé à l’arrière du cerveau, est très rapide et efficace. Nous voyons immédiatement, avec peu d’efforts. La pensée (la cognition), qui est gérée principalement par le cortex cérébral à l’avant du cerveau, est beaucoup plus lente et moins efficace. La manière traditionnelle de représenter et de donner du sens aux données nécessite une pensée consciente pour presque l’ensemble du processus. La data visualization fait au contraire pencher la balance du côté d’un plus grand recours à la perception visuelle, tirant profit de la puissance de nos yeux autant que possible.  Source : Few, Stephen (2013): Data Visualization for Human Perception. In: Soegaard, Mads and Dam, Rikke Friis (eds.). The Encyclopedia of Human-Computer Interaction, 2nd Ed. Aarhus, Denmark: The Interaction Design Foundation. Available online at http://www.interaction-design.org/encyclopedia/data_visualization_for_human_perception.html La data visualization, un outil sur-mesure pour votre cerveau
  42. 42. 43 Comme l’explique Noah Iliinsky8 dans une conférence LinkedIn Talks9 mise en ligne en avril 2012, "le cerveau humain est habitué à reconnaître des schémas récurrents. Il agit donc sur le mode d’une machine à détecter des motifs (patterns). Ces motifs visibles à travers les graphes, par exemple, sont un moyen de comparer les différentes informations, par le biais des contrastes qui s’en dégagent. De fait, l’esprit humain est alors beaucoup plus à même de saisir des tendances, des écarts ou des évolutions." 10 8. Doté d’un Master en Communication Technique obtenu à l’Université de Washington et d’une Licence de Physique de la Faculté de Reed, Noah Iliinski (@noahi) est un développeur informatique qui s’emploie à réflé- chir à des approches efficaces en matière de conception visuelle dédiée à la représentation de l’information. 9. http://www.youtube.com/watch?v=R-oiKt7bUU8 10. Le compte rendu complet de cette conférence est accessible ici : http://fr.slideshare.net/Cooperatique/noah-iliinsky-prsente-la-dataviz 11. http://www.01net.com/ editorial/592687/chute-historique-des-ventes-mondiales-de-pc-au-1er-tri- mestre-2013/. 12. http://www.journaldunet.com/ebusiness/internet-mobile/les-ventes-de-tablettes-depasseraient-celles-des- pc-0413.shtml > Les nouveaux terminaux et les nouvelles interfaces d’accès à l’information La data visualization est sans doute le mode d’analyse et d’exploration des données de l’ère post-PC dans laquelle nous entrons. Alors que selon IDC les ventes mondiales d’ordinateurs ont plongé de 14% au premier trimestre 201311 , Gartner prévoit que les ventes de tablettes dépasseront celles de PC en 201712 . Dans ce contexte, les outils de data visualization tirent tout le parti de l’interface tactile des tablettes pour permettre de manipuler en direct les graphiques, sélectionner différentes vues, appliquer des filtres, etc. C’est d’ailleurs une attente forte de la part des utilisateurs de dataviz, comme en témoigne l’anecdote édifiante relevée par Pierre-Olivier Sicamois, de Lagardère Active : "La Présidente de la régie nous a imposé une contrainte unique : il fallait que la solution fonctionne sur iPad." 1.3 une innovation ou une révolution ?
  43. 43. 1 Dans certains cas, le fait même qu’une partie du personnel soit équipée de certains matériels pousse à la diffusion de la data visualization dans l’entreprise. C’est ce qui s’est passé, par exemple, chez ID Logistics. 11. http://www.01net.com/ editorial/592687/chute-historique-des-ventes-mondiales-de-pc-au-1er-trimestre-2013/. 12. http://www.journaldunet.com/ebusiness/internet-mobile/les-ventes-de-tablettes-depasseraient-celles-des-pc-0413.shtml Dans les faits, dès que nous montrons aux directions générales SAS® Visual Analytics sur tablette, elles disent unanimement que c'est ce dont elles avaient besoin. En effet, les DG n'ont pas l'utilité à rentrer en profondeur dans le détail des données ; ce qui les intéresse, c'est d'avoir à disposition des tableaux de bord intelligents, qui soient utilisables partout, à tout moment. Je citerai l'exemple de notre Comité de Direction. Ce dernier disposait auparavant d'un portail avec l'ensemble des tableaux de bord disponibles : avancement des ventes, CA, qualité du service au client... Aujourd'hui, nous avons accès à tous ces indicateurs sur iPad. Les mises à jour sur le serveur Visual Analytics sont synchronisées automatiquement sur mon iPad. Si je veux analyser les états depuis chez moi, le soir, dans de bonnes conditions en termes de confort et d'ergonomie, j'en ai la possibilité. Nous sommes désormais tout à fait libres et mobiles, tout en restant parfaitement connectés aux données permettant de piloter l'entreprise. Serge Boulet, Directeur Marketing & Communication, SAS France Le périmètre d'application de nos solutions dataviz s'est établi de manière un peu "triviale" à destination d'un cercle restreint (que nous envisageons d'élargir) : les utilisateurs de l'iPad, et plus précisément les membres de la Direction des Opérations et de la Direction Générale. Emmanuel Vexlard, DSI, ID Logistics Quand l’iPad sert de porte d’entrée à la dataviz La data visualization sur tablette, l’outil d’analyse des données que les DG attendaient
  44. 44. 45 ≥ Exemple de data visualization sur iPad chez ID Logistics Et ce n’est probablement que le début. Les progrès des interfaces homme-machine (IHM), de plus en plus intuitives, ouvrent en effet de nouveaux horizons à la dataviz. La data visualization est selon nous promise à un bel avenir, en particulier avec l'arrivée prochaine des dalles tactiles, promesse de représentations graphiques encore plus interactives, et le boom que devraient connaître les tablettes et la 3D. Or, ces avancées technologiques sont synonymes de changement dans les modes de représentations. Pour preuve, l'INRIA expérimente actuellement des visualisations multi-écrans, impliquant la gestuelle de l'utilisateur. Frédérique Pain, Experience Strategy Director, Alcatel-Lucent Bell Labs Le renouvellement des IHM, vivier d’innovations pour la dataviz 1.3 une innovation ou une révolution ?
  45. 45. 11 1.4 à qui s’adresse la dataviz ? Tout d’abord, levons une confusion possible liée au fait que la data visualization s’inscrit souvent dans le cadre des big data. Si la dataviz trouve effectivement tout son sens dès lors qu’il s’agit d’exploiter un volume de données conséquent, il serait faux de croire qu’elle est réservée aux grandes entreprises. Comme le soulignait Jérôme Cornillet de SAS dans la partie 1.3, des organisations de taille réduite peuvent tout à fait être amenées à traiter des volumes de données importants et trouveront un grand intérêt à pouvoir le faire de manière simple, sans recourir à des spécialistes de l’analyse statistique. Si l’on s’intéresse aux profils des utilisateurs de dataviz, on s’aperçoit qu’ils sont variés, mais peuvent être regroupés en trois grandes catégories : le grand public, les parties prenantes internes de l’entreprise (direction, collaborateurs voire prestataires), et enfin des partenaires extérieurs à l’entreprise. Concernant les usages grand public de la dataviz, nous en avons déjà évoqué certains dans les pages précédentes, au travers du "pariteur" de France Télévisions ou encore de la mise à disposition de données pour les citoyens de la part du Ministère belge de l’ Économie. On notera simplement ici qu’une même application peut s’adresser à différents publics. C’est notamment le cas des données fournies par le SPF Économie belge : "Nos données sont disponibles d'une part pour le grand public, qui y accède via un portail open data, et d'autre part pour des utilisateurs à l'Institut National de la Statistique" explique ainsi Caroline Denil. Il convient alors de mettre en œuvre les modalités d’accès et les visualisations les plus appropriées (nous y reviendrons).
  46. 46. 47 1.4 à qui s’adresse la dataviz ? Un autre exemple de dataviz grand public : Social Ecorama ≥ Social Ecorama13 Le projet Social Ecorama consiste à mettre à disposition des visiteurs du site Web de BFM-Business un indicateur de l’humeur des ménages et du moral des entreprises. Cet indicateur a plusieurs originalités. Tout d’abord, il est construit en analysant les messages postés par les internautes sur les médias sociaux, de type Twitter et Facebook. Les partenaires technologiques du projet, SAS et Inbox, analysent ces messages, collectent cette grande quantité de données textuelles et les analysent pour savoir si elles reflètent un sentiment positif ou négatif, selon différents critères. Sont ainsi observés, pour les ménages, les messages ayant trait au chômage, à la consommation, au logement, au pouvoir d’achat, etc. Du côté des entreprises, ce sont la croissance, les profits, les embauches, les exportations, entre autres, qui sont passés au crible. Pour chaque item, un indicateur de "positivité" est calculé, pour estimer si le climat sur le sujet est plutôt à l’optimisme ou au pessimisme sur les médias sociaux. 13. http://ecorama.inbox.fr/
  47. 47. 1 La deuxième spécificité est que ces indicateurs sont suivis quotidiennement, alors que les enquêtes d’opinion classiques par sondages sont réalisées à des fréquences de l’ordre du mois. Enfin, la troisième grande originalité de Social Ecorama est le rendu sous forme de data visualization des résultats. Les internautes peuvent visualiser l’évolution de la positivité des ménages et des entreprises, sous forme de courbes, en sélectionnant les mots-clés qui les intéressent, ainsi que la période. Le projet a été lancé le 3 avril 2013 et déjà plus de trois mois de données sont disponibles pour l’exploration. La combinaison de ces trois originalités fait de Social Ecorama une première mondiale.. Emmanuel Lechypre, Éditorialiste, Responsable pôle Analyse et Prévisions BFM Business Même constat du côté de Clément Delpirou, associé chez InfoPro Digital : La data visualization permet bien sûr d'exploiter et de valoriser nos contenus, mais j'y vois surtout une valeur sûre pour répondre à trois objectifs essentiels. En termes d'audience d'abord, c'est le moyen de mettre nos contenus à la disposition de tous (ex. : notre classement des écoles d'ingénieurs), ou notre cartographie des BTS. C'est deuxièmement la possibilité d'apporter une réelle valeur ajoutée à la gestion de nos abonnements, ce qui n'est pas négligeable au vu du paysage médiatique chahuté auquel nous sommes confrontés. D'ailleurs, il ne s'agit plus d'abonnements classiques à des revues, mais de véritables abonnements à des systèmes d'information : avec Industry Explorer, par exemple, nous offrons un accès aux magazines, mais également une consultation fiche par fiche des informations sur les entreprises. C'est ainsi que nous sommes en mesure d’enrichir notre offre éditoriale tout en développant les revenus de nos abonnements. Enfin, la dataviz est le moyen pour nous de développer des lignes business spécifiques. Avec la cartographie notamment, nous touchons du doigt une valeur allant au delà de la valeur de l'abonnement seul, ce qui était impossible avec les moyens technologiques traditionnels (ex. : on peut consulter une carte de toutes les usines d'Aquitaine ayant déclaré investir plus de 10 millions d'euros l'année prochaine). Clément Delpirou, Associé, InfoPro Digital
  48. 48. 49 En interne, la data visualization est utilisée à tous les niveaux de l’entreprise, de la Direction générale aux équipes terrains, en passant par les directions Métiers. Son usage est même parfois très répandu, y compris dans de vastes organisations, telle qu’une multinationale comme Philips. C’est ce que nous confirme Menno Haijma, Senior Global Manager chez Philips : "la plupart des personnes concernées sont des managers et des business leaders, que ce soit dans les pays ou au niveau central." En ce qui concerne la DG ou la Présidence d’une entreprise, comme nous l’avons déjà évoqué, c’est la capacité à obtenir en temps réel, y compris en mobilité, une vision synthétique des grands indicateurs de l’entreprise, alimentés par des données actualisées en temps réel, qui séduit. Dans une perspective Business Intelligence, nous avons mis en place une solution sur iPad. Celle-ci répond aux attentes de la Direction, dans la mesure où son action de pilotage nécessite d'avoir à disposition des tableaux de bord dotés d'indicateurs clés qui puissent favoriser l'analyse et optimiser la prise de décision. Jérôme Tharaud, Responsable des études et développement, Prisma Media ≥ Dataviz sur iPad chez Prisma Media Décider à l’aide d’indicateurs clés 1.4 à qui s’adresse la dataviz ?
  49. 49. L’arrivée de notre nouveau Directeur Général, il y a quatre ou cinq mois, a été l’occasion pour la Présidente de la Régie Publicitaire et le DG d'organiser une réunion du Comité de Direction, au cours de laquelle nous avons réalisé un "tour d'horizon" des projets en cours. Voici ce qui nous a été remonté : "la régie publicitaire est plurimédia, mais les statistiques ne remontent aucune donnée plurimédia". Cette remarque nous a quelque peu étonnés dans la mesure où, justement, notre système de reporting était capable de remonter de telles données, à travers les cubes que nous avions mis en place ! Quoi qu'il en soit, nous nous sommes engagés auprès de la Présidente et au DG à mettre à leur disposition sous un mois de telles statistiques plurimédia. Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire, Direction des Technologies Lagardère Active 1 La data visualization pour diffuser une information disponible, mais qui passait inaperçue Et il arrive que les chefs de projets dataviz aient des surprises ! On s’aperçoit parfois que des informations mises à disposition de longue date sous forme d’états classiques sont totalement ignorées par la Direction. La dataviz est alors un moyen de les remettre en évidence pour qu’elles soient enfin utilisées.
  50. 50. 51 Concernant les directions métiers, elles sont doublement intéressées par la data visualization. Tout d’abord, parce qu’elles en sont les premières utilisatrices. Mais aussi parce que, sans elles, ces solutions ne pourraient pas être mises en place. Ce sont les Métiers qui connaissent les besoins, la signification des chiffres, et qui sont seuls à même d’interpréter les visualisations. Ils sont donc à la fois consommateurs et coproducteurs de la dataviz. À terme, une fois le système industrialisé, c'est à la fois aux équipes techniques et aux équipes Métiers qu'il s'adressera. En effet, ces dernières contribuent largement aux processus de développement, dans la mesure où ce sont elles qui sont chargées de paramétrer, de qualifier les données, et d'alimenter le moteur. Le système leur servira dans une visée de reporting et de suivi de la qualité du service proposé aux internautes. Eric Lajarige, Responsable de projets search, PagesJaunes Le Métier, à la fois utilisateur et co-constructeur de la dataviz 1.4 à qui s’adresse la dataviz ?
  51. 51. 1 PagesJaunes détecter de manière automatique et via la donnée les requêtes mal catégorisées Le moteur de recherches PagesJaunes permet aux internautes de rechercher un professionnel dans toute la France, en renseignant deux champs : "Quoi/qui" et "Où". La catégorisation d’une requête en "Quoi" ou "Qui" est donc particulièrement importante. Une mauvaise catégorisation des requêtes diminue sensiblement les chances pour un professionnel d’être trouvé lors d’une recherche. Si un visiteur tape "acacias, Toulouse", on peut penser qu’il veut acheter des acacias. Cela signifie qu’on catégorise "acacias" en objet ("Quoi ?"). Et si l’utilisateur cherchait en fait l’adresse d’un restaurant appelé "Les Acacias" à Toulouse ? Il faut comprendre "Les Acacias" comme le nom d’une entreprise ("Qui ?"). Dans un cas, la réponse attendue est une liste de pépinières, dans l’autre, l’adresse d’un restaurant bien identifié. Sachant que la proposition de valeur du groupe PagesJaunes est justement d’offrir de la visibilité aux professionnels et aux entreprises, cela peut être dramatique. Mais comment détecter les requêtes n’aboutissant pas à cause d’une mauvaise catégorisation dans le flot des requêtes quotidiennes ? Pour y parvenir, l’agence 55 | fifty-five.com a développé pour PagesJaunes une interface d’exploration des requêtes, permettant de filtrer une liste de requêtes selon différents critères interdépendants. Grâce à cette interface, il devient possible de détecter visuellement les requêtes pour lesquelles la présomption d’erreur de catégorisation est la plus forte. Martin Daniel, Chef de projet Data Visual, fifty-five
  52. 52. 53 ≥ L’interface de Search Analytics de PagesJaunes (Plus les chiffres dans les colonnes affinage ou localité sont proches de 1, plus la probabilité que le professionnel ait été mal labélisé dans la base de données est forte.) 1.4 à qui s’adresse la dataviz ?
  53. 53. 1 La plupart des fonctions de l’entreprise peuvent bénéficier de la data visualization : marketing, commercial, finance, fabrication industrielle, R&D… Laurence Kerjean, de L’Oréal, nous le confirme : On retrouve souvent des métiers très en contact avec le terrain. Jusqu’ici, ces métiers ne disposaient pas nécessairement des bons outils de reporting ou d’analyse, et la dataviz vient à propos combler ce manque. Dès lors que la donnée "de base" est quantitative, la data visualization est un vrai vecteur pour son exploitation. Tous les métiers ou domaines sont donc concernés. D’ailleurs, même les données qualitatives peuvent être mises en images, il suffit de les convertir en valeurs numériques (ex. : pas content = 1 point / très satisfait = 7 points). Pour le marketing en particulier, la data visualization est très efficace, car elle permet de présenter à des personnels créatifs (par nature) des données quantitatives sous forme visuelle, donc plus simples et rapides à digérer. Laurence Kerjean, Global Digital Manager L’Oréal La solution est accessible à l'ensemble des salariés mais, dans les faits, ce sont surtout les départements Marketing en Europe et en Amérique qui l'utilisent, ainsi que les studios de développement dans le monde. Charles du Réau Consumer & Market Knowledge Director, Ubisoft À des fins d'analyse concurrentielle, nos outils s'adressent aux départements Achats, Vente et Marketing essentiellement. Dans cette visée, ils fournissent une intelligence sectorielle poussée utile à la définition de notre stratégie. Clément Delpirou Associé, Infopro Digital La dataviz, c’est pour tous les métiers La dataviz, un outil pour comprendre l’environnement concurrentiel de l’entreprise
  54. 54. 55 D’autres contributeurs insistent moins sur cet aspect reporting et mettent davantage en exergue la meilleure compréhension du métier lui-même. La représentation visuelle permet en effet de rendre compte de la cohérence des processus composant le métier, ce qui n’était pas toujours possible auparavant. Enfin, grâce à son aspect pratique, la dataviz sort des bureaux et porte la puissance de l’analytique au plus près du terrain. Les équipes opérationnelles peuvent s’en servir pour prendre des décisions rapidement, comme c’est le cas chez STMicroelectronics. La réalisation de reporting n’est pas, pour nous, ce qu’il y a de plus novateur dans la data visualization. Même s’ils permettent aujourd’hui de filtrer plus finement et d’offrir une synthèse, les reportings existaient déjà dans les outils d’informatique décisionnelle (BI) classiques. Notre approche de la data visualization se concentre plutôt sur la récupération, à n’importe quel moment du cycle d’achats, sous forme visuelle et collaborative, de l’ensemble des informations du référentiel de données (comptes fournisseurs, prix des articles, catalogues par fournisseurs et familles de produits, recommandations achats, informations en provenance de la supply chain, etc.). Nous obtenons ainsi sous la forme d’un tableau de bord une vision synoptique de plusieurs processus métiers qui étaient jusqu’alors disjoints. C’est là que réside pour nous la véritable innovation. Franck Jouenne, Director, IT & Services Strategic Sourcing, Alcatel-Lucent Nous implémentons nos solutions DataViz à l'intention de l'ensemble de nos salariés : de l'ouvrier au chef de service, en passant par le technicien. Dans ce cadre, un ouvrier recourra plus fréquemment aux cartes de contrôle et graphes d'état des machines, par exemple, tandis que le chef de service s'intéressera aux tendances du rendement. Guillaume Deschamps, FMT / Central Functions YTI / EDA, ST Microelectronics Mieux comprendre et piloter le métier, grâce à la dataviz La dataviz, un outil de choix dans l’industrie 1.4 à qui s’adresse la dataviz ?
  55. 55. 1 Toujours dans le domaine de l’industrie, la data visualization permet de comprendre certaines situations techniques complexes et de prendre les bonnes décisions. Un public d’ingénieurs y trouvera donc son avantage. Je considère que l'apport de la dataviz peut être particulièrement intéressant pour les ingénieurs sur des points nécessitant une expertise pointue, mais également pour les décideurs. La gestion de la restitution de l'énergie produite par les différents trains l'illustre particulièrement bien : un train qui freine produit une énergie conséquente et difficilement stockable. C'est pourquoi il vaut mieux l'utiliser dès qu'elle est produite, en la réinjectant sur un autre train. La possibilité de localiser sur une carte ces points de restitution n'est pas négligeable : visualiser précisément la récupération énergétique à l’œuvre contribue à calculer la consommation électrique, à établir les coûts associés, ainsi qu'à définir les actions à conduire en conséquence. En l'occurrence, la data visualization permet ici à nos ingénieurs experts de mieux visualiser à quel endroit ou en quelle zone faire figurer un stockeur... C'est également le moyen pour les décideurs d'appréhender les secteurs où il est intéressant d'investir. Maguelonne Chandesris, Responsable de l’équipe Statistique, Économétrie et Datamining, Direction Innovation & Recherche SNCF La data visualization au service des ingénieurs
  56. 56. 57 Un autre secteur industriel dans lequel la data visualization se révèle très utile est celui de l’énergie. Le déploiement des compteurs intelligents doit permettre d’optimiser la distribution d’énergie dans le réseau grâce à un suivi fin (tendance, profils) et l’anticipation de la demande (prévision maintenance). La volumétrie des données à analyser est un enjeu crucial, la rapidité et la capacité d’analyse primordiale. Ce graphique illustre la consommation électrique selon différents profils (horaire, journalier) ainsi que le suivi en continu de la tendance. Le graphique à bulles présente la consommation par zone géographique. Source:SAS® La data visualization appliquée au secteur de l’énergie ≥ Gestion des Compteurs Intelligents 1.4 à qui s’adresse la dataviz ?
  57. 57. 1 Pour clore cet aperçu des différentes fonctions pouvant mettre à profit la data visualization, nous pouvons dire que l’éventail est très large. Des directions ou secteurs d’activité les plus classiques à d’autres que l’on attendrait moins, la dataviz se fraye de plus en plus un passage dans les entreprises. Il arrive que certains professionnels aient des comportements frauduleux ou contribuent à une fraude généralisée, voire carrément organisée en réseau (détournement ou abus de prestations sociales, fraude à l’assurance…). Ce genre de fraude est difficile à détecter lorsqu'on considère une transaction isolée, de type réparation de véhicule ou vente d'une paire de lunettes, par exemple. En revanche, à partir du moment où l'on arrive à mettre en relation un grand nombre d'assurés bénéficiant de la même complaisance ou de la même fraude, il est possible de mettre en évidence des réseaux collusoires entre assurés et professionnels. Cela est difficile, sinon impossible, par la seule étude de tableaux chiffrés. Une représentation graphique peut permettre de repérer des schémas ou des points anormaux du premier coup d’œil, qui peuvent signaler une fraude possible. À noter que la dataviz est utilisée dans la détection des fraudes aussi bien par des assureurs privés que dans le cas des indemnisations publiques (indemnités chômage, allocations familiales, etc.). Je vous en donnerai d'ailleurs une illustration flagrante avec une référence parmi nos clients. Le Comté de Los Angeles a eu l'idée de superposer le graphe des données représentant la distribution des prestations sociales avec les coordonnées géographiques correspondantes : il a eu alors la surprise de constater qu'une zone de forte distribution de prestations sociales coïncidait avec des secteurs résidentiels ! C'est grâce à une telle combinaison de dimensions multiples (données sociales, données des assureurs, coordonnées géographiques, voire conversations sur les médias sociaux) qu'une présomption de fraude peut gagner en force et finir par s'imposer d'elle-même. Mouloud Dey, Directeur des Solutions et Marchés Émergents, SAS France Quand la dataviz fait trembler… les fraudeurs !
  58. 58. 59 Enfin, dernier public de la data visualization, et non des moindres : les clients de l’entreprise. L’exemple d’IFR GfK est particulièrement représentatif. Le groupe réalise des enquêtes liées à la distribution de biens de grande consommation à travers trois méthodes principales : des panels détaillants, des études ad hoc (questionnaires) et le recensement des produits disponibles sur étagères. Le produit qu’il commercialise à ses clients, issus de ces recherches, c’est de la donnée. Or, si certains clients restent fidèles au reporting classique, un nouveau segment apparaît d’une clientèle friande d’outils plus visuels. On le voit, la data visualization se prête à une grande variété d’usages. Ceux-ci peuvent faire l’objet de regroupements, tels que celui proposé par Frédérique Pain d’Alcatel-Lucent : Si la dataviz apparaît aussi transverse, c’est parce qu’elle présente toute une série d’avantages, que nous allons détailler dans la deuxième partie de l’ouvrage… D'un point de vue général, la data visualization a quatre champs d'application principaux : • l’analyse des données à des fins de reporting ; • l’exploitation des données pour expliquer le monde (ex. : études médicales) ; • l'optimisation des processus (ex. : logistique) ; • la prédiction, faisant intervenir l'étude poussée de patterns, pour anticiper les phénomènes à venir. Frédérique Pain, Experience Strategy Director, Alcatel-Lucent Bell Labs grandes familles 4 d’usages 1.4 à qui s’adresse la dataviz ?
  59. 59. 12 Par delà l’ extrême variété de leurs secteurs d’activités et de leurs usages, nos contributeurs s’accordent sur une série de bénéfices de la data visualization, tant pour l’entreprise que pour les utilisateurs eux-mêmes. De manière synthétique, nous pouvons dire que la dataviz améliore : la compréhension des données, la communication des données, la prise de décision, la motivation des utilisateurs, la capacité à innover. 2 Les bénéfices de la data visualization 2
  60. 60. 61 2.1 la dataviz facilite la compréhension des données L’exemple du quartet d’Anscombe, dans la partie 1, illustrait d’un point de vue théorique qu’un tableau de chiffres n’était pas toujours facile à interpréter et qu’un graphique pouvait être bien plus éloquent. D’un point de vue pratique, les contributeurs que nous avons interrogés font cette constatation : lorsqu’il s’agit d’analyser les données pour leur donner un sens, la représentation graphique est un allié de taille. C’est par exemple ce que nous confirme Pierre-Olivier Sicamois de Lagardère Active : Nous avons choisi de recourir à la dataviz pour simplifier l’accès à l'information et pour combler nos lacunes dans l'appréhension de certaines données. En effet, la lecture de tableaux est utile lorsque le chiffre en lui-même est primordial (ex. : CA). Mais autrement, un camembert est bien plus parlant : il permet de visualiser précisément la répartition des différents médias, la prédominance d'un média sur un autre ou bien le panachage de ces médias par annonceur... Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire, Direction des Technologies, Lagardère Active La data visualization pour mieux comprendre le comportement des annonceurs
  61. 61. 1 Cet avantage de la dataviz sur les tableaux de chiffres bruts est renforcé par la conjonction de deux phénomènes. D’une part, l’environnement de l’entreprise est de plus en plus complexe, et met en jeu des données de natures très différentes. Il n'est pas rare qu'une requête client retourne jusqu’à 80 combinaisons d'itinéraires différentes ! À nous de définir les bons leviers pour que le client arrive à s'y retrouver, et ce selon différentes dimensions. Par exemple, nous devons nous interroger sur la meilleure manière de représenter à la fois les grilles horaires, les prix et les données géographiques. Frédérique Ville, Directrice de l'Innovation, Voyages-sncf.com Visualiser simultanément et intelligemment des données de natures différentes 2 ≥ Mytripset, Voyages-sncf.com
  62. 62. 63 Nous avons rendu disponible de l’information qui ne l’était pas auparavant, rien qu’en combinant différentes sources. Yves Daelmans, ICT Project Manager, IMEC La data visualization permet justement de représenter simplement cette complexité, donc de la rendre assimilable pour en tirer de la valeur. C’est ce que nous explique Bernard Lebelle, fondateur de l’agence Bleu-Cobalt et auteur de Convaincre avec des graphiques efficaces (Eyrolles, 2009) et Dites-le en images : des idées ? Un crayon ! (Eyrolles, 2013) : 1. Pour plus de détails et exemples, on se reportera au site http://senseable.mit.edu/trainsofdata/ L'originalité, ici, c'est de montrer que l'on peut agréger et visualiser simultanément des données de structures différentes : des données de production (les trains) et des données commerciales (comment sont remplis les trains ?). Nous donnons à voir la complexité du système1 . Maguelonne Chandesris, Responsable de l’équipe Statistique, Économétrie et Datamining, Direction Innovation Recherche SNCF Mytripset, Voyages-sncf.com 2.1 la dataviz facilite la compréhension des données
  63. 63. 12 Rendre visuelles les dimensions complexes (temporelles, géographiques, relationnelles) permet de mieux identifier les gisements de productivité, de compétitivité ou de marge. Dans l’exemple suivant, nous avons 4 dimensions (CA, parts de marché, évolution temporelle et 2 acteurs différents) représentées sur un seul graphique. Par ailleurs, en enrichissant et en optimisant le traitement graphique des données, on évite le syndrome d’information overload (lorsque l’ajout d’une trop grande volumétrie de données chiffrées sur de nouvelles dimensions vient saturer les capacités de traitement de l’esprit humain). D’importants volumes de données multidimensionnelles deviennent soudain facilement assimilables. Bernard Lebelle, Fondateur de Bleu-Cobalt Source :Bleu-Cobalt® ≥ Maîtriser le complexe pour identifier les gisements de croissance
  64. 64. 65 D’autre part, l’économie s’accélère et il faut réussir à appréhender cette complexité rapidement. Face à cette double contrainte, les entreprises se rendent à l’évidence : il est illusoire de vouloir tout mettre en équations, de tout rationaliser. Leur monde n’est pas soluble dans des modèles théoriques. Elles se convertissent donc à une autre manière, plus empirique, de considérer leurs données, pour que puisse émerger leur signification. La data visualization se prête bien à cette observation sans a priori. Ainsi, pour reprendre les termes de Claude-Henri Mélédo, Une grande nouveauté qu'introduit la data visualization, notamment dans un contexte big data, est l'apparition de graphiques qui ne viennent pas en aval d'une analyse, pour expliquer ou communiquer, mais en amont, pour explorer. Comprendre plus vite Dans un contexte où tout s'accélère et où nous n'avons plus le temps de lire de grands rapports pleins de détails, la data visualization est un moyen de comprendre et d'analyser plus vite. Elle nous permet de bénéficier tout de suite, en un coup d’œil, d'une vue globale sur les indicateurs clés de l'entreprise. Emmanuel Vexlard, DSI, ID Logistics 2.1 la dataviz facilite la compréhension des données
  65. 65. 12 Avec la BI traditionnelle, l'utilisateur est en mode requêtage (sélection, puis récupération des données) et doit se poser les questions a priori. En ce sens, d'une certaine façon, la BI traditionnelle réduit la donnée et coupe peut-être l'utilisateur d'une information qu'il aurait vue en récupérant toute la donnée de façon visuelle. Ainsi, avec les outils classiques, une invraisemblance ne saute pas nécessairement aux yeux et risque de nous échapper. Si nous envisageons les choses dans un contexte Big Data, c'est d'autant plus frappant. Avec la dataviz, en revanche, l'utilisateur est dans un mode de découverte totale des données. Il a la possibilité d'entreprendre une analyse exploratoire, de se promener dans les données. Imaginons une série de données comportant une donnée aberrante, soit liée à un problème de qualité des données, soit au contraire reflétant une exception digne d'intérêt. Je vous défie de la repérer avec un outil de BI traditionnel, sauf à multiplier les requêtes. Avec une interface visuelle, vous serez tout de suite alerté par cette donnée particulière. En définitive, le côté visuel apporte beaucoup. Nombre de nos clients sont déjà rompus aux mécanismes de la BI ou des statistiques, mais les outils de data visualization sont pour eux l’occasion de se demander s'il n'y a pas des questions – qu'ils avaient éclipsées avec la BI classique – qu'ils pourraient envisager sous un angle nouveau. C'est tout un univers d'horizons qui s'offre à eux. Serge Boulet, Directeur Marketing Communication, SAS France À la découverte des données
  66. 66. 67 ≥ Source : SAS® Ce graphique fait partie d’un tableau de bord de pilotage achat. Il montre l’évolution dans le temps de la marge brute et du coût. Le treemap montre la répartition des montants par fournisseur. Data visualization et pilotage des fournisseurs Deux exemples de pilotage enrichi par la Data Visualization : 2.1 la dataviz facilite la compréhension des données
  67. 67. 12 Deux exemples de pilotage enrichi par la Data Visualization : Ce graphique fait partie d’un tableau de bord de pilotage financier. Il illustre l’évolution du revenu sur deux ans (réalisé et prévu). L’histogramme montre l’évolution du profit mensuel sur la même période. Data visualisation et tableau de bord financier ≥ Source : SAS® Plusieurs entreprises nous ont d’ailleurs fait part de leurs actions concrètes ou de leurs intentions d’utiliser la data visualization à des fins d’exploration.
  68. 68. 69 Par sa capacité à faire ressortir de manière graphique très parlante des données aberrantes, la data visualization en mode exploratoire est aussi un excellent moyen de repérer des problèmes, et donc d’y remédier. L’idéal serait pour nous de réussir à révéler une information jusqu'alors invisible, au moyen de la data visualization. Notre outil vise ainsi, à terme, à dégager d'un volume de données phénoménal des tendances difficiles à appréhender sans représentation visuelle. C'est un point que nous souhaiterions approfondir, et plus précisément pour nos données marketing. Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire, Direction des Technologies, Lagardère Active La dataviz est, à n'en pas douter, un moyen d'explorer les données de manière poussée, ce qui, dans une visée marketing, s'avère des plus intéressants : le filtrage ou la possibilité de zoomer sur un instant t, par exemple, sont des moyens mis au service de l'exploration de tendances. Ils permettent de valider des hypothèses, mais également de procéder à des expérimentations en termes d'expérience utilisateur. Frédérique Pain, Experience Strategy Director, Alcatel-Lucent Bell Labs La data visualisation pour explorer des tendances 2.1 la dataviz facilite la compréhension des données
  69. 69. 12 Enfin, la dataviz permet l’exploration de données jusqu’alors inexploitées et mal comprises, les données non structurées. C’est d’autant plus important que le volume de celles-ci explose, notamment sous la poussée des médias sociaux. Notre besoin était d'explorer notre data set, pour mieux appréhender la pertinence des résultats que nous renvoyons aux internautes. En effet, pour améliorer la qualité de notre indexation, nous n'avions jusqu'alors à notre disposition que des remontées statistiques difficiles à exploiter lorsque l'on sait que nous traitons des dizaines de millions de requêtes par mois. Dans ce volume, il est particulièrement difficile de détecter les requêtes sur lesquelles notre moteur répond mal. Un outil comme la data visualization va nous donner un autre levier pour déceler plus rapidement les dysfonctionnements. Éric Lajarige, Responsable de projets search, PagesJaunes Explorer pour corriger
  70. 70. 71 En définitive, la data visualization nous invite à reprendre la distinction classique entre données, information et connaissance. Si les données sont des éléments unitaires, bruts, reflétant une réalité, l’information est leur mise en cohérence pour leur donner du sens. Le cas des contenus publiés sur la Toile est éloquent : l'analyse et la mise en relation des thématiques, des mots, des phrases, des documents (et éventuellement, derrière, des liens entre les individus) constituent une formidable mine d'or pour les directions Marketing, mais également pour les acteurs de l'intelligence économique en général. Plus spécifiquement, il y a des relations que nous ne pouvons percevoir à l’œil nu, mais que nous sommes à même d'appréhender par le biais d’analyses graphiques sophistiquées. C'est le cas notamment des analyses de graphes sociaux qui permettent de mettre en évidence des relations non triviales entre les individus. C'est pour moi un apport majeur de la data visualization. Pour dire les choses autrement, nous avons besoin de la dataviz pour révéler ce qui n'est pas immédiatement perceptible, et la problématique des Big Data vient renforcer ce besoin. Mouloud Dey, Directeur des Solutions et Marchés Émergents, SAS France La dataviz pour explorer les contenus du Web et du Web social 2.1 la dataviz facilite la compréhension des données
  71. 71. 12 Très simplificateur, l’exemple d’Anscombe1 illustre toutefois parfaitement les apports de la data visualization dans une approche qu’on pourrait qualifier d’analytique et la nécessaire complémentarité des solutions à mettre en œuvre dans un processus de décision basé sur des données. Dans ce cas précis, la data visualization invite à remettre en cause le modèle très (trop) simple d’ajustement linéaire, évidemment insuffisant pour décrire et expliquer de manière pertinente les données observées, et à rechercher des modèles alternatifs plus précis et plus adaptés. Les Anglo-saxons disposent de termes simples pour exprimer ces approches complémentaires. Disposer d’un recul suffisant (HINDSIGHT), apporter des éclairages sous différents angles (INSIGHT), enfin se doter d’une réelle clairvoyance, pour ne pas dire prévoyance (FORESIGHT), forment les trois principaux piliers d’une démarche expérimentale appropriée à un processus de décision centré sur l’analytique, visant à donner du sens aux données et à justifier des décisions optimales. Une étude récente a montré que sur les 10 dernières années, les entreprises du SP 500 qui utilisent l’analytique au cœur de leurs processus de décision surperforment leurs concurrents d’environ 64%. L’utilisation d’approches analytiques centrées sur les données trouve en effet sa légitimité dans un nombre croissant de processus métiers, qui en retirent des bénéfices impressionnants. Mouloud Dey, Directeur des Solutions et Marchés Émergents, SAS France La dataviz au cœur du processus de décision : les bienfaits d’une démarche analytique 1. Voir I.1, Définitions de la dataviz
  72. 72. 73 On peut dire que la dataviz achève le cheminement en permettant aux utilisateurs de s’approprier cette information, de la manipuler, pour faire ressortir sa valeur dans son contexte. Mais pour que cette valeur trouve tout son potentiel, il convient qu’elle se diffuse dans l’organisation. C’est ce que nous allons voir au chapitre suivant. Le revenue management ou yield management largement utilisé par les compagnies aériennes, les grandes chaînes hôtelières (mais aussi par la SNCF2 ) depuis de nombreuses années est un exemple concret d’approche business analytics. Des décisions optimales (fixation des prix) sont prises en fonction de modèles de prévision de la demande (forecasting) et d’hypothèses d’écoulement du stock des prestations à offrir (sièges d’avion ou de train, chambres d’hôtel). Ce genre d’approche se décline aujourd’hui à grande échelle pour fixer les prix des articles, des démarques et optimiser les marges chez les acteurs les plus avancés de la grande distribution. Dans des domaines aussi variés que le marketing (mais aussi la prévention de la fraude, les octrois de crédit, etc.), l’observation historique de caractéristiques individuelles permet aujourd’hui de segmenter, de modéliser, de profiler et d’anticiper assez précisément les comportements de chacun d’entre nous. Enfin, dans le domaine industriel, la maintenance d’équipements critiques (plates-formes de forage, centrales électriques…) justifie également, au vu des enjeux financiers, une réelle prévention des risques de défaillance, que la modélisation prédictive permet d’affiner. La data visualization, au cœur de ces approches analytiques, apporte le recul et les éclairages préalables à la modélisation dans ces différents processus métiers, mais aussi les analyses d’impacts relatives à la mise en œuvre effective de ces modèles. 2. Voir I.2, encadré  La dataviz pour faire évoluer l’offre de la SNCF dans différents domaines  2.1 la dataviz facilite la compréhension des données
  73. 73. 1 2.2 la dataviz améliore la communication Les données ne reflètent pas seulement la réalité, elles ne sont pas uniquement un levier de pilotage. Elles sont également un outil de communication. Malheureusement, peu d’entre nous parlent couramment leur langage. Nous avons, pour la plupart, besoin d’un interprète pour nous faire pénétrer dans l’intelligence de la donnée. C’est là que la data visualization intervient. Cet usage de la dataviz à des fins de communication concerne autant l’intérieur des organisations que leur rapport avec leur environnement, aussi bien les entreprises que les services publics ou l’administration. C’est ainsi que le SPF Économie en fait usage dans sa communication en direction des citoyens belges. Les bénéfices de notre programme dataviz sont conséquents pour l'ensemble des citoyens : ces derniers ont non seulement besoin de graphes représentant les évolutions (ex. : évolution des assujettis à la TVA), mais aussi de pouvoir exporter leurs données comme bon leur semble. C'est ce qu'aujourd'hui nous sommes en mesure de leur proposer. Caroline Denil, Data Warehouse Program Manager, SPF Économie Améliorer la communication vers les citoyens 2
  74. 74. 75 2.2 la dataviz améliore la communication 1. http://economie.fgov.be/fr/statistiques/chiffres/economie/construction_industrie/ immo/prix_moyen_appartements/ L’appétence pour les tableaux de chiffres complexes n’est pas plus grande dans les entreprises que dans le grand public. En particulier, le top management ne souhaitera pas, en général, fouiller des états volumineux et compliqués. Ce dont il a besoin, c’est d’une représentation claire et élégante de l’information pour lui permettre de prendre ses décisions. Dans ce contexte, la représentation graphique des données trouve tout son sens. Data visualization permettant de naviguer sur une carte pour découvrir le prix moyen ou médian des appartements et d’exporter les résultats au format csv.1 Nos démarches en matière de data visualization s'inscrivent dans la continuité des efforts que nous avons entrepris en matière de Business Intelligence. Elles font appel à une composante forte : la volonté de rendre les rapports et les données plus sexy, autrement dit, plus simples à comprendre. Actuellement, nos efforts visent essentiellement à rendre les données plus esthétiques, plus abordables, in fine plus accessibles aux gens qui ont peu de temps à disposition pour appréhender réellement la teneur de l'information. Nous pouvons donc dire que notre dataviz est aujourd'hui principalement orientée reporting. Pierre-Olivier Sicamois, Responsable du domaine Régie publicitaire Direction des Technologies, Lagardère Active Des états plus faciles à appréhender pour des décideurs ayant peu de temps
  75. 75. 1 Enfin, l’entreprise se doit de faire le même effort lorsqu’elle communique vers ses clients, confrontés aux mêmes problèmes de ressources et de disponibilité. En ce sens, la data visualization n’est que le prolongement logique de l’histoire de la BI. Comprises, communiquées, les données deviennent un levier d’action. C’est ce que le chapitre 2.3 s’emploie à montrer. 2 La data visualization est l’aboutissement d’une longue histoire en matière de reporting. À une époque pas si lointaine, les données que nous collections étaient stockées sous forme papier et nous envoyions des classeurs à nos clients. Une salle entière était réservée à nos archives. La deuxième étape a consisté à communiquer ces données au format numérique, sous forme de fichiers. Dès lors, nous avons commencé à transformer les données en graphiques, pour les rendre plus comestibles. La troisième étape, celle que nous vivons aujourd’hui, est une étape dans laquelle nous nous devons de collecter une information de plus en plus complexe et volumineuse. Dans le même temps, nos clients ont de moins en moins de temps, et des équipes de plus en plus réduites, pour traiter l’information que nous leur fournissons. C’est ce qui nous a amenés, depuis 3 ans et surtout depuis 2013, à déployer un nouveau mode d’accès à nos données sous forme de data visualization. Cette offre est d’ores et déjà disponible pour l’ensemble de nos clients dans le monde. Fabrice Benaut, CIO global IFR, Head of IS and Operations, IFR Monitoring La datavisualisation, évolution naturelle de la communication des données à ses clients

×