ISC Paris – MBA e-business            1
Table des matières1.     Synthèse ...........................................................................................
5.    Conclusion ............................................................................................................
1.         SYNTHESELe Big Data est un nouveau concept issu de la Silicon valley : Il comprend l’ensemble destechnologies p...
La maîtrise des données grâce aux technologies Big Data, constituera une mine d’ord’information pour l’entreprise, et sera...
Enfin, si cette révolution Big Data offre de « big promesses de croissance », il existenéanmoins des freins à son développ...
2.             INTRODUCTION      2.1 Exposé de la problématiqueDepuis soixante ans, l’ordinateur, cette invention mathémat...
Le Big Data est annoncé comme la prochaine révolution informatique, illusion pour certains,véritable opportunité pour d’au...
2.2 MéthodologieDans un premier temps il est important de faire une présentation du contexte lié au Big Data :Comprendre s...
3.         PRESENTATION DU CONTEXTECette section décrit l’origine du phénomène Big Data, en donne une définition et identi...
3.1.1 La généralisation d’InternetLa généralisation d’Internet à travers le monde a engendré de plus en plus de données. I...
Depuis 2007, lhumanité produit plus de données que de capacités à les stocker.[3]En 2010, on a produit cette même quantité...
Figure 3 : L’évolution de l’usage d’Internet en France [6]On constate qu’entre 2002 et 2012 : 5 [7]            Le nombre d...
3.1.2 Les nouveaux usagesLa généralisation d’Internet a permis de nouveaux usages qui ont à leur tour contribué àl’explosi...
o 50 millions de tweets par jour transitent par les serveurs de Tweeter. [9]           Figure 4 : Evolution du volume de t...
o La mobilité, qui consiste, pour l’utilisateur, à continuer à utiliser ses applications    lorsqu’il est en déplacement. ...
La situation qui vient d’être décrite permet ainsi, au-delà des chiffres évoqués, de mieuxexpliquer l’origine du Big Data ...
3.2 L’analyse du mot Big Data sur InternetLorsque l’on interroge Google trends7 sur le terme « Big Data » (cf. figure ci-d...
3.3 Définition du Big DataLe terme Big Data est utilisé par un grand nombre de personnes travaillant ou s’intéressantaux T...
Gartner définit le concept du Big Data comme « l’accumulation sans fin des donnéesnumériques », et si l’entreprise n’en do...
Ce seuil n’est pas clairement défini : pour certains c’est à partir de lExa-octet, pour          d’autres du Zetta-octet. ...
Le critère de variété       Le troisième « V » représente la variété des données qui représente à peu près 80 %       des ...
3.4 Ce qui a permis l’émergence du Big DataLes premières entreprises qui se sont équipées des technologies Big Data sont c...
Le tableau suivant résume les solutions Big Data proposées par les principaux acteurs :                       Acteurs     ...
La capacité de stockage et la puissance de calcul sont, grâce au Cloud, devenues un          service externalisé. La locat...
Arriver à traiter ces données constituerait une mine d’or d’informations pour denombreuses entreprises dans différents dom...
4.          LES ENJEUX DU BIG DATA POUR       L’ENTREPRISECette section analyse les enjeux du Big Data pour l’entreprise s...
évolutions qui lui sont demandés par les utilisateurs (services métiers de l’entreprise, dont leMarketing). Les données "a...
Ces étapes, généralement intégrées dans le processus qualité de l’entreprise (par exemple,cycle en V, …), définissent le d...
4.2 Enquête auprès des acteurs SI et MarketingLe Big Data étant un concept récent, il était intéressant de soumettre un qu...
4.2.2 L’analyse des résultatsL’enquête a été réalisée du 26/07 au 26/08/12 et a donné lieue à 36 réponses. Les réponsesbru...
C’est assez étonnant car on aurait pu croire que ce nouveau concept allait être associé :       o A une notion de Big brot...
4.3 Les enjeux et impacts du Big Data pour les entreprisesPour le cabinet McKinsey, conseil en stratégie d’entreprise, le ...
4.3.1 Le challenge technologiqueL’un des enjeux du Big Data pour l’entreprise est de s’adapter en investissant dans lesnou...
Il permet ainsi de simplifier la création de valeur à partir des données analysées.   C’est par exemple ce que propose Goo...
4.3.2 L’enjeu économiqueIDC14 évalue le taux de croissance des technologies Big Data annuel moyen de 39,4%, ce quidevrait ...
Dans létude «Big data: harnessing a game-changing asset», de The Economist IntelligenceUnit, publiée en septembre 2011, on...
L’exploitation de ces données massives dépend de la stratégie et du besoin de lentreprise.Ainsi Tesco et Walmart15 suivent...
Un bon exemple est celui des « pures players »: Ces acteurs majeurs du Web, tels queGoogle, Facebook, Amazon, ont montré l...
4.3.3 Impact organisationnelL’intégration des nouvelles technologies Big Data dans les entreprises va entraîner deschangem...
Cela leur permettra d’adapter la stratégie de l’entreprise pour créer de la richesse à partir deces données.Pour atteindre...
b) L’apparition de nouveaux métiersLes entreprises sont obligées de trouver et de mettre en place de nouvelles solutionsan...
4.4 Big Data dans les télécoms : l’étude de cas ORANGE  Non publié .                              43
5.          CONCLUSIONLe déluge de données est un phénomène de société qui est amené à croître dans les prochainesannées e...
Le Big Data ne concerne pas que les entreprises. Le secteur public peut y trouverégalement un intérêt. D’ailleurs, l’Etat ...
ANNEXE 1 : ENQUETE D’OPINION SUR LEBIG DATAQuestionnaire et Résultats bruts de l’enquête                                  ...
47
48
49
ANNEXE 2 : GUIDE D’ENTRETIEN POUR   L’ETUDE DE CASCe guide a servi de fil conducteur aux entretiens qui ont été menés.   1...
ANNEXE 3 : SOURCES ET BIBLIOGRAPHIE[1] Devideo «Six provocations au sujet du phenomène Big Data» Taken from Kranzberg,Melv...
technologies.fr/archives/3338/infographie-quelle-quantite-de-contenu-est-publiee-quotidiennement-sur-le-web/> - Avril 2011...
Prochain SlideShare
Chargement dans…5
×

Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engohan- MBA ISC PARIS

26 367 vues

Publié le

L’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par des investissements humains et matériels. Celles qui sauront tirer profit de leur capital « Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité et d’innovation...

Publié dans : Technologie
3 commentaires
42 j’aime
Statistiques
Remarques
Aucun téléchargement
Vues
Nombre de vues
26 367
Sur SlideShare
0
Issues des intégrations
0
Intégrations
109
Actions
Partages
0
Téléchargements
159
Commentaires
3
J’aime
42
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engohan- MBA ISC PARIS

  1. 1. ISC Paris – MBA e-business 1
  2. 2. Table des matières1. Synthèse ............................................................................................................................. 42. Introduction ........................................................................................................................ 7 2.1 Exposé de la problématique ......................................................................................... 7 2.2 Méthodologie ............................................................................................................... 9 2.3 Limites de l’étude ........................................................................................................ 93. Présentation du contexte................................................................................................... 10 3.1 L’origine du Big Data ................................................................................................ 10 3.1.1 La généralisation d’Internet ............................................................................... 11 3.1.2 Les nouveaux usages .......................................................................................... 14 3.2 L’analyse du mot Big Data sur Internet ..................................................................... 18 3.3 Définition du Big Data .............................................................................................. 19 3.4 Ce qui a permis l’émergence du Big Data ................................................................. 234. Les enjeux du Big Data pour l’Entreprise ........................................................................ 27 4.1 Les relations entre les départements informatique et marketing ............................... 27 4.2 Enquête auprès des acteurs SI et Marketing .............................................................. 30 4.2.1 La méthodologie d’enquête ................................................................................ 30 4.2.2 L’analyse des résultats ....................................................................................... 31 4.3 Les enjeux et impacts du Big Data pour les entreprises ............................................ 33 4.3.1 Le challenge technologique ................................................................................ 34 4.3.2 L’enjeu économique ........................................................................................... 36 4.3.3 Impact organisationnel ....................................................................................... 40 4.4 Big Data dans les télécoms : l’étude de cas ORANGE ............................................. 43 4.4.1 Les solutions Big Data chez Orange Business ServicesError! Bookmark not defined. 4.4.2 La perception du Big Data chez Orange France. Error! Bookmark not defined. 2
  3. 3. 5. Conclusion ........................................................................................................................ 44Annexe 1 : Enquête d’opinion sur le Big Data ......................................................................... 46Annexe 2 : Guide d’entretien pour l’étude de cas .................................................................... 50Annexe 3 : Sources et Bibliographie ........................................................................................ 51Table des figuresFigure 1 : Tableau SWOT des enjeux du Big Data pour l’entreprise ........................................ 6Figure 2 : L’évolution des techniques de stockage [2]............................................................. 11Figure 3 : L’évolution de l’usage d’Internet en France [6] ...................................................... 13Figure 4 : Evolution du volume de tweets transmis quotidiennement [9] ............................... 15Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trends ......................... 18Figure 6 : Acteurs liés au concept du Big Data ........................................................................ 19Figure 7 : Logo d’Hadoop ........................................................................................................ 23Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17] .......... 37Figure 9 : Les étapes clés de transformation du SI vers l’innovation (Source : OBS – P.Bourhis) .................................................................................... Error! Bookmark not defined.Figure 10 : Périmètre des technologies Big Data ..................................................................... 44Table des tableauxTableau 1 : Tableau de conversion des unités de volume de données ..................................... 20Tableau 2 : Solutions Big Data des principaux acteurs ............................................................ 24 3
  4. 4. 1. SYNTHESELe Big Data est un nouveau concept issu de la Silicon valley : Il comprend l’ensemble destechnologies permettant de stocker, traiter et analyser des données et contenus hétérogènesafin d’en faire ressortir de la valeur et de la création de richesse pour les entreprises.Il est considéré par certains comme la prochaine révolution technologique.Son apparition est liée à l’essor de l’Internet et au développement de nouveaux usages(réseaux sociaux, produits connectés), car en augmentant de façon exponentielle nos données,ils créent ainsi un phénomène de déluge de données.S’il n’a pas encore de définition académique, le Big Data est caractérisé par les critères des«3V»: Volume, pour la quantité de données à stocker au-delà de l’Exa-octet, Vitesse, pour le traitement de ces données en quasi temps-réel, et Variété, pour la capacité à gérer des données structurées et non structurées.Les acteurs participant au développement de ce concept sont : Les acteurs majeurs du Web, Les éditeurs de logiciels, Les opérateurs télécoms.Les premières technologies Big Data ont été créées par les entreprises leaders du Web(Google, Amazon, Yahoo, …) car ce sont les premières qui ont eu à faire face à desproblématiques de gros volumes de données à traiter en temps réel.Les technologies Big Data (Map reduce, Dynamo, Hadoop, …) s’appuient sur : Le Cloud computing, pour sa capacité à stocker de gros volumes de données, Les nouvelles méthodes d’analyses (Web sémantique, crowdsourcing, analyse de sentiments, …) qui permettent de croiser diverses sources de données et offrent de nouvelles possibilités d’analyse décisionnelle. 4
  5. 5. La maîtrise des données grâce aux technologies Big Data, constituera une mine d’ord’information pour l’entreprise, et sera un facteur de différenciation pour l’entreprisedu 21ème siècle.Google nous en fait la démonstration en ouvrant de nouveaux business models, grâce à cesmasses de données qui étaient jusque là encore inexploitées.Ce nouvel écosystème, avec l’apparition des technologies Big Data, a entrainé un changementde paradigme pour le marketing : On est passé d’un marketing transactionnel (marketingproduit) à un marketing relationnel (marketing client). C’est toute la relation marketing avecle client qui a changé, celle-ci est devenue plus directe, avec une portée plus étendue etdemandant des réactions plus instantanées de la part de l’entreprise pour être efficace.L’intégration des technologies Big Data par les équipes en charge des données (DSI,marketing) passera par une adaptation des méthodes de travail et des processus pour quel’entreprise puisse tirer profit du data-déluge. Cela passe par un nouveau partenariat entrela DSI et le marketing.L’entreprise devra réfléchir à trois principaux enjeux : Le challenge technologique : Investir dans ces nouvelles technologies qui touchent au stockage et à l’analyse des données. L’enjeu économique : Créer de nouveaux business models en tirant profit des données pour créer de nouveaux leviers de croissance. L’impact organisationnel : Adapter son organisation et accompagner les équipes en charges des données vers cette nouvelle stratégie (conduite du changement), tout en anticipant l’apparition de nouveaux métiers (Data scientist).L’étude du cas Orange Business Services nous permet de voir comment la transformationglobale de son SI l’a conduite vers la fourniture d’offres innovantes Big Data (plusieursprojets en cours).Le Big Data ne concerne pas que les entreprises. Le secteur public est également en train deréfléchir à la mise en place de ces nouvelles technologies (appel à projets de l’état français). 5
  6. 6. Enfin, si cette révolution Big Data offre de « big promesses de croissance », il existenéanmoins des freins à son développement tels que le cadre réglementaire pour l’utilisation deces données et les problèmes liés à la sécurité de l’information.Les enjeux du Big Data peuvent ainsi être résumés à partir du tableau SWOT1 suivant : Forces Faiblesses • Développement d’outils analytiques • Pénurie de compétences pour gérer performants aux services du marketing ces nouvelles technologies • Renforcement de la compétitivité • Conduite du changement • Développement de nouveaux business models Opportunités Menaces • Généralisation du Cloud computing • Cadre réglementaire non défini • Appels à projets publics (e-santé, …) • Sécurité de l’information Figure 1 : Tableau SWOT des enjeux du Big Data pour l’entrepriseL’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par desinvestissements humains et matériels. Celles qui sauront tirer profit de leur capital« Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité etd’innovation.1 SWOT : Méthode d’analyse selon quatre axes Forces (Strengths), Faiblesses (Weakness) Opportunités (Opportunities) et Menaces(Threats). 6
  7. 7. 2. INTRODUCTION 2.1 Exposé de la problématiqueDepuis soixante ans, l’ordinateur, cette invention mathématique, nous permet de rentrer desinformations et d’exécuter des programmes pour faciliter le traitement de nos données. Il estdevenu au fil du temps, l’outil indispensable d’abord pour les entreprises, puis pour lesparticuliers. Si au début sa principale utilité consistait à réaliser des opérations complexes et àstocker des données, l’ordinateur trouva très vite ses limites par l’excès de données à traiter. Ilfut alors inventé la base de données.Ainsi, à partir des années 1990, démarre l’exploitation des bases de données relationnellesdont la plus connue et généralisée à ce jour reste SQL (Simply Query Language)2. La base dedonnées relationnelle constitue un ensemble structuré de données qui permet à l’utilisateur degérer plus facilement ses données par l’envoi de requêtes simples. Dès lors, ces bases dedonnées ont monopolisé le marché de stockage et de manipulation d’informations dans lesSystèmes d’Information (SI) des entreprises et ont permis, entre autres, le développement desoutils CRM (Customer Relationship Management – base de données traitant les donnéesclients).Ces dix dernières années, les technologies de linformation ont envahi notre vie quotidienne etprofessionnelle. La nouvelle économie, ou e-business, a émergé grâce à Internet qui a permisleur interconnexion sur un réseau unique à léchelle mondiale. Avec l’arrivée d’Internet,l’information s’est démocratisée et nous avons désormais accès à une multituded’informations, traitée par des millions d’ordinateurs interconnectés entre eux.Au 21ème siècle, l’explosion de la donnée est en train d’atteindre toutes les entreprises et sonexpansion est le symbole d’une transformation économique et sociale globale. Cetteexplosion de données est aussi connue sous le terme de « Big Data ».2 SQL : langage standard de description et de manipulation des données. La majorité des Systèmes de Gestion de Bases de Données (SGBD)actuels sont basés sur ce modèle. 7
  8. 8. Le Big Data est annoncé comme la prochaine révolution informatique, illusion pour certains,véritable opportunité pour d’autres… C’est un sujet dont nous allons entendre parler encoreun bon moment !Aussi, devant l’émergence de ce nouveau concept, un certain nombre de questions se posent : Pourquoi parle-t-on aujourd’hui du Big Data et de ces déluges de données ? Qu’est ce que ce concept Big Data et comment est il apparu ? Avec ces masses de données, faut-il envisager des nouvelles méthodes d’analyse et de gestion de données inexplorées par l’entreprise et qui pourraient leur apporter de la valeur ajoutée ? Est-ce une vraie opportunité et quels sont les enjeux du Big Data pour les entreprises ? Enfin, Comme le dit Melvin Kranzberg “La technologie n’est ni bonne, ni mauvaise, ni neutre… L’interaction entre la technologie et l’écosystème social est telle que les développements techniques ont des conséquences environnementales, sociales, et humaines qui dépassent de loin les objectifs des appareils techniques et des pratiques elles-mêmes.” [1] L’arrivée des nouvelles technologies changeant nos conditions de travail, il peut être intéressant de se demander si le Big Data imposera une nouvelle manière de travailler entre les équipes SI et Marketing. C’est sous cet angle que nous aborderons la problématique de cette étude. 8
  9. 9. 2.2 MéthodologieDans un premier temps il est important de faire une présentation du contexte lié au Big Data :Comprendre son origine, tenter d’en donner une définition et identifier les facteurs qui ontfavorisé son émergence. C’est l’objet du chapitre 3 « Présentation du contexte ».Le chapitre 4 analyse les enjeux et les impacts du Big Data pour l’entreprise en focalisant surles relations entre les acteurs informatiques et marketing. Cette analyse dresse tout d’abord unétat des lieux des relations actuelles et des problèmes et limites auxquels elles sontconfrontées, puis étudie les apports potentiels du Big Data et les impacts associés.L’analyse est consolidée par une enquête auprès d’acteurs concernés par le sujet sur leurconnaissance actuelle et leur appréciation du Big Data, ainsi que de l’étude d’un cas pratiqueavec le cas Orange, afin de mettre en perspective l’intégration de cette technologie Big Datadans l’entreprise.La conclusion (chapitre 5) permet d’ouvrir le champ des investigations et notamment cellesdes freins au développement du Big Data. 2.3 Limites de l’étudeLe Big Data étant un sujet récent, les ouvrages qui lui sont consacrés sont rares etexclusivement rédigés en Anglais3.Cette étude est donc uniquement basée sur des recherches effectuées sur le Web.De plus, la problématique étant principalement analysée sous l’angle des relations entre le SIet le Marketing, les détails techniques ou réglementaires du Big Data ne sont pas abordés.3 On citera par exemple l’ouvrage « Big Data: High-Impact Strategies - What You Need to Know: Definitions, Adoptions, Impact, Benefits,Maturity, Vendor - Kevin Roebuck » 9
  10. 10. 3. PRESENTATION DU CONTEXTECette section décrit l’origine du phénomène Big Data, en donne une définition et identifie lesfacteurs qui ont favorisé son émergence. 3.1 L’origine du Big DataAu début notre communication était analogique : voix humaine, courrier postal, photographieargentique, … . Avec l’arrivée de l’électronique et de l’informatique, on est passéprogressivement dans le monde du numérique.La numérisation est le moyen technique de transformer de l’information et de passer d’unsignal analogique (son, image,…) à un signal numérique (information codée) exploitable parl’informatique. Cette action de numérisation transforme le support initial en donnéeinformatique (fichier électronique, …).Au fil du temps, la numérisation a concerné tous les supports qu’ils soient sous forme depapier (photo, fax, …), de vidéo, de voix (musique, voix téléphonique, …).Si la numérisation est à la base de la création de la donnée informatique, l’explosion de cettedonnée est arrivée au début des années 2000 avec le boom Internet.Deux facteurs principaux sont à l’origine de l’apparition du Big Data, en augmentant de façonexponentielle et quotidienne nos données, engendrant ainsi un phénomène de déluge dedonnées : La généralisation de l’usage d’Internet, L’apparition de nouveaux usages. 10
  11. 11. 3.1.1 La généralisation d’InternetLa généralisation d’Internet à travers le monde a engendré de plus en plus de données. Il estintéressant de donner quelques chiffres pour mieux se représenter cette accumulation dedonnées.Lhumanité a produit environ 5 Exaoctets (Eo)4 de données depuis l’avènement del’informatique jusquen 2003.L’amélioration des techniques de stockage et la diminution des coûts ont accompagné cettecroissance de données en donnant la capacité de stocker toujours plus de données sur dessupports de plus en plus petits et de moins en moins chers.A titre d’illustration, l’image ci-dessous représente l’évolution de ce stockage, avec : à gauche, une baie de stockage en 1980, avec une capacité de 20 Go, pour un coût du Go estimé entre 32 000 et 57 000 $, à droite, une carte Micro SD en 2010, disposant d’une capacité de 32 Go, pour un coût du Go situé entre 3 et 4 $. Figure 2 : L’évolution des techniques de stockage [2]4 Un Exa-octet (Eo) équivaut à un milliard de Giga-octets (Go). 11
  12. 12. Depuis 2007, lhumanité produit plus de données que de capacités à les stocker.[3]En 2010, on a produit cette même quantité de données (soit 5Eo) en deux jours environ.Une étude du cabinet McKinsey, datée de mai 2011, estime qu « en 2010, les entreprisesauraient stocké chacune en moyenne 7 Eo supplémentaires de données, et les particuliers 6Eo. Pour donner un ordre de grandeur, 1 Eo représente environ 10.000 fois la capacité de laBibliothèque du Congrès Américain. » [2]« 90 % de lensemble des données du monde ont été créées ces deux dernières années »estimait récemment Stephen Gold dIBM lors dune présentation au récent Webcom deMontréal. "Nous vivons un data-déluge : lessentiel des données que nous utiliserons dans 2ans naura rien à voir avec celles que nous utilisons aujourdhui." [4]C’est la croissance du nombre d’internautes qui explique cette explosion de données.L’usage d’internet est en forte augmentation dans le monde entier, avec notamment 3,4milliards d’utilisateurs estimés en 2016, soit près de 45 % de la population mondiale. [5]Ramené à la situation française, on constate que les internautes français sont très actifs sur leWeb avec 38 millions de connectés qui y passent une moyenne de 2 heures par jour.La figure suivante donne une rétrospective de l’évolution de l’usage d’Internet en France surune période de 10 ans : 12
  13. 13. Figure 3 : L’évolution de l’usage d’Internet en France [6]On constate qu’entre 2002 et 2012 : 5 [7] Le nombre d’Internautes a plus que doublé, passant de 16 à 38 millions (+133 %), Le temps moyen de navigation d’un usager est passé de 6 heures à 65 heures par mois, L’adoption des abonnements haut-débit, permettant de disposer de débits d’accès supérieurs à 2 Mbits/s (voire jusqu’à 100 Mb/s avec la fibre optique), a accompagné le développement d’Internet, Enfin, si le marché des moteurs de recherches a vu naître le monopole du géant Google, celui des sites marchands (e-commerce) s’est largement étendu à une multitude de nouveaux acteurs.5 Source : Baromêtre Fevad Mediamétrie/Netratings 13
  14. 14. 3.1.2 Les nouveaux usagesLa généralisation d’Internet a permis de nouveaux usages qui ont à leur tour contribué àl’explosion des données informatiques.Les plus caractéristiques de ces nouveaux usages sont : Les réseaux sociaux Les réseaux sociaux (Facebook, Twitter, Linkedin, …) représentent un nouveau type de communication de groupe qui s’est imposé d’abord auprès des particuliers et qui aujourd’hui arrive dans l’entreprise. Ces réseaux génèrent de plus en plus en données en permettant à leurs membres de diffuser ou mettre en ligne des photos, des commentaires, des notes, … et de les partager avec les membres de leur communauté. L’internaute, qui au départ avait un rôle passif de lecteur sur Internet, devient désormais une source active en créant du contenu, entraînant ainsi une hausse des données produites sur le Web. Là encore, quelques chiffres permettent de mieux saisir l’importance du volume de données générées par les réseaux sociaux : o On peut lire dans cet article consacré à Facebook « Jay Parikh a ainsi levé le voile sur d’autres chiffres qui donnent autant le tournis : Facebook compte 2,7 milliards de « likes » ou mentions « j’aime » chaque jour et 2,5 milliards de contenus (statuts, photos, vidéos) sont partagés au quotidien sur le réseau social. » Le réseau social doit stocker l’équivalent de 500 téraoctets par jour [8] 14
  15. 15. o 50 millions de tweets par jour transitent par les serveurs de Tweeter. [9] Figure 4 : Evolution du volume de tweets transmis quotidiennement [9]Les plateformes de contenus multimédiasAujourd’hui, nous avons accès à différents services de contenus via Internet, depuisnotre télévision ou notre ordinateur personnel, qu’ils s’agissent de la Vidéo à lademande (VOD – Video On Demand) proposée par tous les Fournisseurs d’AccèsInternet, ou de la diffusion de contenus par streaming pour regarder des films, écouterla radio ou de la musique à partir de notre PC.o YouTube, c’est 35 heures de vidéos chargées chaque minute et 2 milliards de clips vus chaque jour. [10]o Flickr représente 5 millions d’images ajoutées chaque jour, soit 60 photos par seconde. [11]La mobilité et les produits connectésInternet d’une part, mais aussi les réseaux mobiles de nouvelle génération disposant dehauts débits pour l’accès à Internet (téléphonie mobile de 3ème génération UMTS, puisla 4G ou LTE) et les nouveaux protocoles sans-fil pour les communications deproximité (RFID, NFC, Bluetooth, …) ont rendu possible deux nouveaux usages quesont : 15
  16. 16. o La mobilité, qui consiste, pour l’utilisateur, à continuer à utiliser ses applications lorsqu’il est en déplacement. L’engouement pour les tablettes (63,6 millions de tablettes vendues dans le monde en 2011), l’explosion des ventes de smartphones (près de 10 millions de Français équipés en 2010) et la multiplication des accès mobiles via des bornes Wi-Fi (dans les hôtels, les restaurants, les magasins, …) en sont les exemples les plus représentatifs. [12]o La maison intelligente, qui regroupe la connexion à Internet d’une multitude d’appareils domestiques (TV, réfrigérateur, table de cuisson, compteur électrique intelligent, …).Tous ces produits connectés génèrent des masses de données considérables dans leurfonctionnement (traces d’appels, historiques de navigation, …).Avec l’essor de l’Internet, nos équipements (objets personnels, voitures, capteurs, etc.)communiqueront entre eux ainsi qu’avec des systèmes d’informations tiers (centralesd’achat, centres de sécurité, …) : Tout cela conduira à accroitre les volumes dedonnées.On peut se donner une idée de l’importance du nombre (actuel et futur) de ces objetsconnectés, par la réflexion suivante : Chaque produit connecté est doté d’une adresseInternet publique, également désignée adresse IP du nom du protocole qui permet latransmission des données au sein du réseau Internet.A la création d’Internet ses inventeurs avait prévu un système gérant jusqu’à 4milliards d’adresses en théorie (adresses IPv4), ce qui était considéré comme uneressource quasi-illimitée dans les années 1970. Le 3 février 2011, la dernière adresseIPv4 a été attribuée, imposant de passer à IPv6, nouvelle version du protocole IP, quiest conçu pour supporter 667 millions de milliards d’adresses par millimètre carré desurface terrestre. 16
  17. 17. La situation qui vient d’être décrite permet ainsi, au-delà des chiffres évoqués, de mieuxexpliquer l’origine du Big Data : Depuis le début de l’ère informatique, la numérisation de nos applications a engendré une croissance continue des données. Dans le même temps, les améliorations des techniques de stockage offraient la capacité à accompagner cette croissance. Depuis le début du 21ème siècle, le monde informatique fait face à une explosion exponentielle de données, engendrée par le développement d’Internet et l’apparition de nouveaux usages (réseaux sociaux, plateformes de services, mobilité et produits connectés), et favorisée par l’amélioration des technologies de transport (débit d’accès à Internet) et des capacités de stockage. Les utilisateurs génèrent de plus en de données et dans un intervalle de temps de plus en plus court. Avec l’explosion des données, beaucoup d’entreprises dans différents secteurs dactivité (acteurs de l’Internet, e-commerce, recherche scientifique, organismes publics, …) ont dépassé le péta-octet pour le stockage de leur données. Stocker toutes ces données devient aujourd’hui un véritable défi technologique. De même leur traitement avec les techniques actuelles de type bases de données relationnelles n’est plus adaptée. C’est ainsi, qu’est apparu, pour la première fois en 2008, le terme "Big Data", introduit par l’entreprise Gartner6, désignant ce phénomène de déluge de données informatiques ou "data-déluge".6 Entreprise de conseil dans le domaine des technologies de l’information et de la communication aux USA 17
  18. 18. 3.2 L’analyse du mot Big Data sur InternetLorsque l’on interroge Google trends7 sur le terme « Big Data » (cf. figure ci-dessous), onconstate que ce terme est apparu dans les moteurs de recherches au milieu de l’année 2010 etque depuis cette année, la recherche de ce mot ne cesse d’augmenter. Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trendsC’est surtout dans la Silicon Valley et en Asie du Sud-Est que les recherches sont les plusnombreuses, ce qui s’explique par la forte activité autour du monde Internet et des TIC dansces régions.En 2012, on constate une généralisation de l’usage de ce mot élargie à de plus en plus derégions à travers le monde (Europe, Israël, Australie, …) : c’est le signe que le concept sort ducercle fermé des informaticiens de la Silicon Valley.7 Google trends : Outil de tendances des recherches qui permet d’analyser la fréquence de recherche d’un mot par les internautes du mondeentier 18
  19. 19. 3.3 Définition du Big DataLe terme Big Data est utilisé par un grand nombre de personnes travaillant ou s’intéressantaux Technologies de l’Information et de la Communication (TIC).Le choix de l’appellation de ce phénomène est intéressant : C’est l’association des termes« big » et « data », le terme « big » se réfèrant au volume de plus en plus important desdonnées et le terme « data» évoquant la valeur de toutes les données.Aucune définition ne s’est vraiment imposée et chaque acteur possède la sienne en fonctionde ses centres d’intérêts.Les acteurs qui orbitent autour de ce concept sont : Les éditeurs de logiciels qui développent les technologies Big Data, Les acteurs du Web (Google, Amazon, Facebook, Linked in, …) qui mettent déjà en œuvre ces technologies (voir plus loin, au §0), Les opérateurs télécoms et hébergeurs qui transportent et stockent ces données. gén ère e erg héb génère Big DATA tran spo rte exploite re nè gé Data mining Figure 6 : Acteurs liés au concept du Big Data 19
  20. 20. Gartner définit le concept du Big Data comme « l’accumulation sans fin des donnéesnumériques », et si l’entreprise n’en donne pas de définition académique exacte, elle proposetoutefois de le caractériser selon les critères des trois V: Volume, Vitesse et Variété. Le critère de volume Pour mieux saisir les chiffres donnés par la suite, le tableau suivant donne les correspondances de volume : Nom Symbole Conversion Kilo-octet ko 1 ko = 1 000 octets Méga-octet Mo 1 Mo = 1 000 ko Giga-octet Go 1 Go = 1 000 Mo Téra-octet To 1 To = 1 000 Go Péta-octet Po 1 Po = 1 000 To Exa-octet Eo 1 Eo = 1 000 Po Zetta-octet Zo 1 Zo = 1 000 Eo Yotta-octet Yo 1 Yo = 1 000 Zo Tableau 1 : Tableau de conversion des unités de volume de données La génération en masse des données par la population entière et nos machines ont fait évoluer considérablement les tailles de stockage « Vers les années 1990 on parlait en Giga, en 2000 en Téra et en 2010 on parle en Péta. Une organisation a d’ailleurs atteint 2 Yotta : c’est la NSA8 pour stocker toutes les données issues des communications électroniques américaines » (P. Bourhis– Orange Business Services). "Les hommes ont généré 150 Exa-octets de données en 2005 et en génèreront 1 200 Exa-octets en 2010" (The Economist, 27/02/2010). Le volume de données à prendre en compte lorsque l’on parle de Big Data c’est le seuil à partir duquel il devient difficile de gérer ces données avec une solution de base de données relationnelle classique.8 NSA (National Security Agency) : Agence Nationale de Sécurité 20
  21. 21. Ce seuil n’est pas clairement défini : pour certains c’est à partir de lExa-octet, pour d’autres du Zetta-octet. L’aspect volume nest cependant pas suffisant pour définir le Big Data. Il faut lui ajouter le critère de vitesse. Le critère de vitesse Ce critère détermine la fréquence à laquelle les données sont générées et partagées. Avec les systèmes opérationnels classiques de gestion et d’analyse de données (par exemple, les ERP9, les CRM), les données sont traitées à froid une fois la collecte des informations effectuées et généralement selon une périodicité de l’ordre de 24h (voire 2h pour les systèmes optimaux). Dans un système d’information confronté au data-déluge, ce fonctionnement n’est plus possible, car un tel volume de données oblige à traiter l’information en quasi temps- réel pour pouvoir être exploitées efficacement. Par exemple, si nous prenons le cas des réseaux sociaux, il n’est pas possible d’arrêter de collecter même une heure les données produites, car le retard accumulé serait alors impossible à rattraper pour l’exploitation des informations. Citons également cet autre exemple, celui d’un constructeur de voitures qui est en train de réfléchir à la mise en place d’une remontée d’au moins 150 millions événements (informations provenant de puce intégrer dans la voiture ou les pneus) par jour à implémenter dans son système d’information. Il devient dès lors impossible pour beaucoup d’outils d’analyse et de CRM de traiter et d’analyser à cette fréquence, les données qui sont collectées et partagées en temps réel. Le Big Data consiste donc également à analyser de gros volumes de données dans des délais les plus proches du temps réel.9 ERP « Enterprise Ressource Planning » : Progiciel de gestion intégrée permettant de gérer l’ensemble des processus d’une entreprise(ressources humaines, comptabilité et finances, aide à la décision, logistique, …) 21
  22. 22. Le critère de variété Le troisième « V » représente la variété des données qui représente à peu près 80 % des données non structurées : sons, photos, vidéos, contenus de blogs ou de réseaux sociaux, … On croule sous la donnée provenant de sources variées, qui créent une diversité de données qui ne s’inscrivent plus dans des structures prédéfinies, faciles à utiliser comme les bases de données transactionnelles. Elles sont de ce fait devenues difficiles à manipuler de façon performante par les outils traditionnels. C’est ce critère qui fait principalement la particularité du Big Data car il évoque la capacité à gérer des données structurées et non structurées : Les technologies Big Data doivent permettre danalyser de manière aussi simple que des champs numériques ou des textes pré-formatés, ces données non structurées et d’y trouver de la valeur ajoutée.On peut ainsi définir le Big Data comme : Un concept faisant référence au déluge de données que nous accumulons dans nos systèmes ; Mais aussi comme un ensemble de méthodes et de solutions mises au point par les éditeurs de logiciels et utilisées par les entreprises, pour permettre le stockage et lanalyse en temps-réel des données volumineuses, structurées et non structurées.Par la suite dans le document, pour distinguer ces deux notions, nous parlerons du Big Datapour évoquer la première, et des technologies Big Data lorsque l’on se réfère à la deuxième. 22
  23. 23. 3.4 Ce qui a permis l’émergence du Big DataLes premières entreprises qui se sont équipées des technologies Big Data sont celles desmoteurs de recherche Web (Google, Amazon, Yahoo) car ce sont les premières qui ont eu àfaire face à des problématiques de gros volumes de données à traiter en temps réel.En effet, leur besoin de stockage et d’analyse dépassant les capacités des bases de donnéestraditionnelles, elles ont développé et mis à disposition des communautés en Open Source10des outils de gestion. Ces systèmes permettent d’analyser et de restituer des données à unetrès grande vitesse car les calculs se font en quasi temps-réel. Il est ainsi possible de s’offrir àmoindre coût l’équivalent des supercalculateurs proposés par Oracle ou IBM.Google a développé sa propre technologie Big Data, Map Reduce.Oracle, leader dans le domaine des bases de données propose aussi sa solution NoSQLDatabase qui est une adaptation commerciale de la solution open source NoSQL (Not OnlySQL).Yahoo a développé Hadoop, technologie créée par Doug Cutting, qui pour la petite histoire luia attribué le nom de l’éléphant en peluche de son fils. Hadoop est la solution Big Data la plusutilisée aujourd’hui. Figure 7 : Logo d’HadoopOn utilise ces solutions dans beaucoup de domaines : finance, communautés de vendeurs etd’acheteurs (Ebay), les systèmes de recommandations d’offres aux clients pour le commerceen ligne et les réseaux sociaux.10 Open-source : Les logiciels Open Source se caractérisent par la liberté daccès à leur code source à la différence des logicielscommerciaux. 23
  24. 24. Le tableau suivant résume les solutions Big Data proposées par les principaux acteurs : Acteurs Solutions Big Data Dynamo ; S3 MapReduce ; BigTable Cassandra ; Hive SenseiDB ; Voldemort No Database SQL Storm ; FlockDB Hadoop ; S4 Tableau 2 : Solutions Big Data des principaux acteursCes technologies Big Data n’auraient pas pu voir le jour sans l’existence : du Cloud computing, pour sa capacité à stocker de gros volumes de données. Le Cloud computing, ou « informatique dans les nuages » est un nouveau modèle informatique qui propose des services informatiques à la demande. Son avantage pour une entreprise est de disposer d’une infrastructure ou d’un service applicatif dont le coût dépend de l’utilisation. Cela permet une grande souplesse d’utilisation (la puissance de stockage ou de calcul étant augmentée en fonction des besoins réels de l’entreprise) et optimise les coûts en évitant à l’entreprise des investissements coûteux (mise en service des plates-formes informatiques) e t e n l a libérant de la maintenance de ces infrastructures. 24
  25. 25. La capacité de stockage et la puissance de calcul sont, grâce au Cloud, devenues un service externalisé. La location de la puissance de calcul et l’espace de stockage adaptés au volume de données du Big Data a ainsi permis son expansion. En effet, très peu dacteurs peuvent effecteur ces traitements avec leurs propres infrastructures. Grâce au Cloud, le Big Data est à la portée des PME et des acteurs non experts du traitement des données. de nouvelles méthodes d’analyse La Business Intelligence ou linformatique décisionnelle, c’est lexploitation des données de lentreprise pour faciliter l’aide à la prise de décision par les donneurs d’ordre. Ce qui permet de comprendre le fonctionnement de l’entreprise et d’anticiper des actions pour son pilotage. Ces outils décisionnels sont basés sur lexploitation dun système d’information décisionnel qui est alimenté grâce à lextraction de données de production. Les systèmes actuels de Business Intelligence deviennent obsolètes pour exploiter les données non structurées. En effet, la gestion des bases de données avec des solutions traditionnelles ne sont plus adaptées pour analyser cette quantité de données, non structurées et en temps réel. Comme le souligne Romain Chaumais, PDG d’Ysance11 "La Business Intelligence classique part de la stratégie de lentreprise et allume des voyants correspondant aux objectifs. A linverse, le Big Analytics dégage une logique dans un océan de données bien trop nombreuses pour quun humain puisse les analyser. « Le datamining » automatisait déjà cette analyse mais avec des échantillons représentatifs. Le Big Data attaque les données dans leur totalité, ce qui permet didentifier la moindre anomalie ». Ainsi, les technologies Big Data regroupent aussi des méthodes danalyse - appelées « Big Analytics » - utilisées pour tirer profit des données.11 Romain Chaumais, PGD Co-Fondateur dYsance et Directeur du pôle Business Intelligence. Ysance est une société de conseil et réalisationinformatique. 25
  26. 26. Arriver à traiter ces données constituerait une mine d’or d’informations pour denombreuses entreprises dans différents domaines d’activités, l’objectif étant de trouverde « nouvelles connaissances » en croisant les données d’une organisation avec lamasse de données beaucoup moins structurées du Web (comme des blogs),personnelles (comme des emails) pour proposer de nouveaux services à valeurajoutée : amélioration de la qualité de service, augmentation du taux de transformationclients, …. 26
  27. 27. 4. LES ENJEUX DU BIG DATA POUR L’ENTREPRISECette section analyse les enjeux du Big Data pour l’entreprise sous le spectre des relationsentre les directions informatiques et marketing.Comme l’ont souligné les sections précédentes, le Big Data constituera une mine d’ord’informations pour l’entreprise qui arrivera à les maîtriser. Cette maîtrise passera par uneévolution des relations entre le monde du Système d’Information et celui du Marketing.Autrement dit, comment faire évoluer les technologies et méthodes d’analyse employéesactuellement dans l’Entreprise pour tirer profit du data-déluge.Par la suite, sont abordés : L’état des lieux des relations entre les départements informatique et marketing, Les enjeux du Big Data pour l’Entreprise sous les perspectives techniques, économiques et organisationnelles, La mise en perspective du Big Data sur une entreprise : L’étude du cas ORANGE. 4.1 Les relations entre les départements informatique et marketingL’informatique joue un rôle de plus en plus important dans la relation client avec les bases dedonnées relationnelles (CRM, ERP...) qui permettent de gérer tous les processus de traitementdes clients (commande, livraison, facturation, …).Une entreprise évolue avec ses nouveaux projets, mais aussi les évènements exogènes(fusions, acquisitions, …). A chaque nouveau projet est associée l’évolution du ou dessystème(s) d’information. On arrive à la constitution de systèmes disparates qui cohabitent etdoivent s’intégrer entre eux, ce qui rend le Système d’Information (SI) de l’entreprisecomplexe et difficile à gérer.Ces projets de transformation de l’entreprise obligent les directions des systèmesdinformation à gérer avec le plus de rigueur possible, un système dinformation en productionqui gère des données opérationnelles critiques (trésorerie, facturation, …) et les nouvelles 27
  28. 28. évolutions qui lui sont demandés par les utilisateurs (services métiers de l’entreprise, dont leMarketing). Les données "appartiennent" aux métiers et transitent dans les tuyaux etapplications de la DSI qui joue le rôle de logisticien de l’information, pour que le métierpuisse travailler.Le marketing est devenu indispensable au développement des grandes entreprises surtout dansles environnements concurrentiels actuel où les clients sont difficiles à acquérir et à fidéliser.L’avènement du numérique, d’Internet et des réseaux sociaux ont transformé la relation entreclient et les services Marketing, le client ayant un accès beaucoup plus rapide et direct avecl’entreprise pour exprimer ses besoins, avis, réclamations, …Dans un passé proche, une grande firme dans le domaine agro-alimentaire qui utilisait del’huile de palme dans un de ses produits, a été obligée de modifier la composition de sonproduit pour prendre en compte les mécontentements remontés par ses clients (eux-mêmesalertés et incités en cela par l’organisation Greenpeace). Si dans un premier temps, le« community manager »12 de l’entreprise n’a pas jugé bon de prendre en compte cesréclamations, par la suite l’affaire a pris un tel impact sur la Toile (« buzz ») que seulel’intervention personnelle du PDG et sa promesse de modifier le produit incriminé a permis àl’entreprise de retrouver la confiance de ses clients.Cet exemple illustre que la relation marketing avec le client a changé, en devenant plusdirecte, avec une portée plus étendue et qu’elle demande des réactions plus instantanées dela part de l’entreprise pour être efficace.Pour satisfaire les exigences du client (qualité du service rendu, rapidité d’exécution, …) lesservices marketing n’ont d’autres choix que de s’appuyer sur des applications informatiquesde plus en plus performantes. Il en résulte des demandes d’évolutions auprès de la DSI,laquelle se doit de trouver les meilleures solutions techniques pour satisfaire les enjeux dubusiness.Actuellement, ce processus entre l’expression de besoin réalisée par le service demandeur(dans notre cas, le service Marketing) et la mise en application sur le système opérationnel del’entreprise, passe par une multitude d’étapes réalisées par la DSI.12 « Community manager » : Responsable de la communication de l’entreprise sur Internet et notamment sur les réseaux sociaux. 28
  29. 29. Ces étapes, généralement intégrées dans le processus qualité de l’entreprise (par exemple,cycle en V, …), définissent le déroulement des opérations et comprennent : La planification de l’évolution : compréhension du besoin, estimation du coût et du délai de réalisation, intégration dans la feuille de route du développement du SI, Sa spécification : rédaction des exigences fonctionnelles et de performances, Sa réalisation : codage et qualification sur une plateforme de tests, L’accompagnement au changement des utilisateurs : formation des utilisateurs, Le déploiement et mise en service sur le SI opérationnel.Toute évolution entraîne un risque de dysfonctionnement sur l’existant et il est donc impératifde tester cette non-régression, ce qui explique que les cycles de vie de projets des évolutionssont longs et peuvent atteindre de 6 mois à plusieurs années.Par ailleurs, il ne serait pas concevable de traiter au fil de l’eau chaque demande d’évolution.Ces dernières sont donc rassemblées dans des versions d’évolution du SI qui ne sortent que 1à 2 fois par an. Ainsi, même une évolution mineure, par exemple sur la tarification d’uneoffre, qui ne nécessiterait que peu de charges en termes de réalisation, aurait un délai de miseen œuvre obligatoirement long puisque dépendante de la sortie de la version globale du SI àlaquelle elle appartient.L’atteinte des objectifs métiers dépend de l’entente entre ces deux mondes pour que chacuncontribue aux objectifs de l’autre : la DSI doit se mettre au service du Marketing (mise enplace d’outils performant) ; et le Marketing anticiper ses besoins pour prendre en compte lescontraintes informatiques.Aujourd’hui les DSI arrivent à répondre aux demandes des services marketing malgré leurscontraintes propres qui induisent un certain manque de souplesse, mais qu’en sera-t-il demain,lorsque l’entreprise souhaitera tirer partie du Big Data.Il sera alors nécessaire que la DSI soit capable d’avoir les outils techniques performants(technologies Big Data), mais aussi que la méthodologie utilisée pour traiter des évolutions duSI puisse évoluer vers un cycle beaucoup plus court (adaptation à l’instantanéité) tout enmaintenant la rigueur permettant d’assurer la stabilité et la fiabilité du SI opérationnelexistant. 29
  30. 30. 4.2 Enquête auprès des acteurs SI et MarketingLe Big Data étant un concept récent, il était intéressant de soumettre un questionnaire poursonder l’opinion d’acteurs potentiellement intéressés par ce sujet. 4.2.1 La méthodologie d’enquêteLa méthodologie utilisée pour réaliser cette enquête est la suivante : La population ciblée est celle des cadres travaillant dans les directions SI et Marketing des entreprises des secteurs des TIC.( 83 % des sondés travaillent dans le domaine des TIC) Il s’agit d’une enquête en ligne utilisant l’outil « Google document ». Le lien vers ce questionnaire a été publié sur les réseaux sociaux professionnels (linkedin, twitter) et transmis directement à la population cible. Le questionnaire, présenté en Annexe 1, comprend : o Une introduction qui rappelle le contexte de l’émergence du Big Data. Cette phrase d’accroche a pour but de capter l’attention du sondé et de l’inciter à répondre à une question simple : « Avec l’essor d’Internet, des réseaux sociaux, des usages mobiles, une quantité impressionnante de données se retrouvent sur le WEB chaque seconde dans le monde. Comment gérer ces données, que faire de ces millions dinformations que nous déposons chaque jour sur la toile ? Le nouveau concept "Big Data" regroupe des technologies pouvant gérer, stocker et analyser en temps réel tous ces données et contenus hétérogènes afin den extraire des informations pertinentes … Mine dor pour certains, Illusion pour dautres ... Et vous quel est votre avis ? » o Un premier thème qui est visible, est lié à la question posée en titre du questionnaire sur « la connaissance du Big Data ». Il permet de faire un état des lieux de la connaissance du Big Data auprès des sondés. o Un deuxième thème caché. Il s’agit d’analyser d’une part, si l’opinion des sondés sur le Big Data est positive ou négative et d’autre part, s’ils estiment que c’est uniquement un concept à la mode mis en avant par ceux qui le vendent (éditeurs logiciels), ou s’il y a un réel intérêt pour l’entreprise à utiliser ces technologies. 30
  31. 31. 4.2.2 L’analyse des résultatsL’enquête a été réalisée du 26/07 au 26/08/12 et a donné lieue à 36 réponses. Les réponsesbrutes sont présentées en Annexe 1.Concernant le premier thème « connaissance du Big Data », on constate que : La population qui a répondu s’intéresse aux nouvelles technologies (97% des personnes interrogées) et la moitié indique connaitre le concept Big Data (53%). La question liée à la solution Hadoop permet de vérifier que seuls 47% ont en vraiment une connaissance approfondie. Les personnes connaissant le Big Data utilisent déjà des solutions Coud computing dans leurs entreprises (61% des sondés). L’analyse approfondie des résultats montre que les personnes connaissant le Big Data travaillent notamment dans le domaine du conseil (Solucom, Devoteam, …) ou de la Business Intelligence (123 open Data, Bizzneo, iAdvize, …). En répondant à 83% que le Big Data sert à l’analyse et l’exploitation des données, les sondés (y compris ceux qui ne connaissent pas le Big Data) montrent qu’ils en comprennent l’utilité. Ce premier point est intéressant car il confirme bien que ce concept est en train de se mettre en place et que l’on commence à s’y intéresser.Concernant le deuxième thème qui était de « faire ressortir la perception qu’ont les sondés duBig Data » :L’enquête montre que cette perception est très positive car la plupart des sondés (y comprisceux qui déclarent ne pas connaitre le Big Data) pensent que cela va apporter de la croissance(89%), permettre de devancer les concurrents (72%) et que la gestion des données est unemine d’or d’information pour l’entreprise (86%). 31
  32. 32. C’est assez étonnant car on aurait pu croire que ce nouveau concept allait être associé : o A une notion de Big brother avec une crainte pour l’utilisation des données personnelles (43%). o Ou un simple concept marketing mis en avant par les éditeurs de logiciels (seulement 6 %).Pour finir la majorité des personnes ont bien compris que le Big Data allait plus profiter auxnouveaux acteurs du Web (72%), aux fonctions Marketing (69%) et aller améliorer lesrelations entre les informaticiens et le marketing (69 %). 32
  33. 33. 4.3 Les enjeux et impacts du Big Data pour les entreprisesPour le cabinet McKinsey, conseil en stratégie d’entreprise, le Big Data constitue « leprochain cap pour l’innovation, la compétitivité et la productivité » [13]La capacité à extraire ces données variées pour les analyser le plus rapidement possible est undéfi technologique à venir pour les entreprises travaillant dans le domaine du e-business car ilfaudra satisfaire les besoins d’une société de plus en plus tournée vers l’instantanée.La solution réside dans l’utilisation des nouvelles technologies comme le Big Data pourrépondre aux objectifs des directions marketing et donner les moyens aux directionsinformatiques détendre leur périmètre afin de combiner informatique et marketing pourmaitriser les données relatives au client. Cela en devient stratégique pour l’entreprise pourréussir dans la « décennie digitale » à venir.Avec l’arrivée des technologies Big Data, il est fondamental de se poser plusieurs questionscomme celle de l’impact sur le marché ou de la valeur que cela va créer, ou encore commentces nouvelles technologiques vont changer la stratégie, les processus et les performances del’entreprise ?Cette analyse est abordée selon les axes suivants : Le challenge technologique, L’enjeu économique, L’impact organisationnel. 33
  34. 34. 4.3.1 Le challenge technologiqueL’un des enjeux du Big Data pour l’entreprise est de s’adapter en investissant dans lesnouvelles technologies qui touchent au stockage et à l’analyse des données. L’investissement en capacité de stockage Traiter l’augmentation de stockage avec les systèmes actuels reviendrait à faire exploser les budgets d’investissement informatiques. Même si cela était possible, il y aurait deux autres problèmes à résoudre : o Celui de la place pour stocker les données car les entrepôts de données de l’entreprise seraient bien vite saturés. Devant le volume de données à traiter, il faudrait ajouter des quantités de disques et baies de stockage supplémentaires et on se retrouverait rapidement en limite de place en mètres carrés. o De plus, la dépense en énergie électrique nécessaire au fonctionnement des entrepôts de données ajouterait des dépenses aux budgets de fonctionnement des entreprises. Les nouvelles technologies Big Data permettent l’évolution du stockage vers des systèmes distribués13, grâce à l’infrastructure du Cloud computing. Cela correspond à répartir un même fichier sur plusieurs systèmes et permet de rationnaliser les volumes de stockage. Investissement dans l’analyse La valeur des technologies Big Data provient également des croisements entre sources de données diverses, structurées ou non. L’entreprise doit investir dans ces techniques pour disposer de leur puissance d’analyse. On distingue : o Le Web sémantique qui permet d’utiliser toutes les ressources d’Internet et de croiser ces données avec n’importe quelle autre donnée du Web.13 Un système distribué est un ensemble d’entités autonomes de calcul (ordinateurs, PDA, processeurs, processus, processus léger etc.)interconnectées et qui peuvent communiquer. 34
  35. 35. Il permet ainsi de simplifier la création de valeur à partir des données analysées. C’est par exemple ce que propose Google dans sa toute nouvelle fonction « Knowledge Graph », une immense base de données qui permet dobtenir des réponses pointues.o Les nouvelles techniques de Datamining : Des nouvelles techniques sont en train de se développer, celles-ci améliorent les techniques traditionnelles (les associations, les classifications, les algorithmes ….) :  Le crowdsourcing : remontée via les réseaux sociaux de données ou d’informations suite à un appel à contribution,  L’analyse de sentiments : recherche des opinions à partir de l’analyse textuelle,  L’analyse de réseaux : techniques permettant d’identifier des leaders d’opinion et leur pouvoir de prescription dans des réseaux sociaux en particulier. 35
  36. 36. 4.3.2 L’enjeu économiqueIDC14 évalue le taux de croissance des technologies Big Data annuel moyen de 39,4%, ce quidevrait le faire passer, en cinq ans, de 3,2 milliards de dollars en 2010 à 16,9 milliards dedollars en 2015.« Un marché qui devrait donner du grain à moudre à l’ensemble du secteur informatiquepuisque le cabinet d’étude estime que sur ce montant global d’investissement, 40% serontconsacrés aux Services et 30% au logiciel » [14]Dans une étude récente le cabinet McKinsey qualifie le phénomène Big Data de « nouvellefrontière de l’innovation de la compétition et de la productivité ». [15]Cette étude montre que la maîtrise des données (capacité à les analyser) aura un impact surl’aide que l’informatique va apporter aux métiers pour trouver de nouveaux axes decompétitivité. Par ailleurs, elle précise que l’exploitation du Big Data pourrait permettre : déconomiser plus de 250 milliards d’Euros sur lensemble du secteur public Européen (identification des fraudes, gestion et mesures de lefficacité des affectations des subventions et des plans dinvestissements, ...). un surplus global de 600 milliards de dollars pour le secteur des sites marchands grâce à l’utilisation des données de géo-localisation (campagne de promotion destinée aux clients a proximité du magasin, …)Selon les analystes Mc Kinsey, la gestion des nombreuses données avec les outils actuelsaurait déjà un impact sur la productivité, ces dernières années. L’utilisation de façon effectivedes technologies Big Data, permettrait « une augmentation potentielle des margesd’exploitation pouvant atteindre 60% ».Par ailleurs, le cabinet indique que l’ensemble des couches du SI sont désormais mobilisées etoptimisées pour permettre une valorisation métier des données, qu’elles soient structurées ounon. Il prévoit ainsi qu’en 2016, 7% du Chiffres d’Affaires généré par les ventes de serveursconcernera des infrastructures destinées au seul Big Data.14 IDC est un acteur majeur de la Recherche, du Conseil et de l’Évènementiel sur les marchés des Technologies de l’Information, desTélécommunications et de la Communication 36
  37. 37. Dans létude «Big data: harnessing a game-changing asset», de The Economist IntelligenceUnit, publiée en septembre 2011, on constate que les entreprises qui utilisent intelligemmentleurs données voient leur croissance augmenter de 5 à 6 % en moyenne. [15]La figure ci-après présente la liste des revenus prévisionnels issus de la vente de technologiesBig Data sur l’année 2012. [17] Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17]De l’avis de Forbes, ces entreprises ont devant elles une énorme opportunité d’accroitre leursrevenus en offrant des services d’accompagnement pour aider les entreprises à adopter le BigData.Toutes ces études, même si elles restent prospectives, montrent que la tendance auprès descabinets spécialisés est de considérer le Big Data comme une technologie porteuse et pleined’avenir.Avant, les entreprises travaillaient dans un contexte où la production de la donnée étaitcoûteuse, elles devaient alors en limiter la production. Maintenant, ce problème est révolu carles données sont presque gratuites et abondantes. Ce qui est important, ce n’est plus deproduire les données mais plutôt de les manier, de les exploiter, c’est donc l’efficacité del’exploitation et non plus de la production de données qui prime. 37
  38. 38. L’exploitation de ces données massives dépend de la stratégie et du besoin de lentreprise.Ainsi Tesco et Walmart15 suivent deux stratégies différentes : Tesco à fait le choix de croiser les données pour personnaliser les offres selon client (profiling) et Walmart plutôt celui de récupérer des données externes (météo, ventes...) pour permettre l’optimisation de la gestion des stocks (prédiction).Par l’agrégation et le traitement de ces données, de nouveaux business models émergent enconcevant de nouveaux services.C’est le cas du marché du Web analytics qui génère déjà plusieurs milliards d’euros sur desoutils et des services. Cette technique d’analyse des comportements permet d’élaborer desmicro segmentations des scores d’appétence (le calcul qui donne la probabilité qu’un prospectdevienne client) ou de churn (le calcul qui permet de connaitre le taux de perte d’un client)qui sont nécessaires pour personnaliser la relation et les offres proposées au client. C’est ledomaine le plus exploité aujourd’hui par le Big Data.En effet, la collecte et l’analyse des informations du parcours client, de son comportementlors d’un achat sur les sites Internet et le temps passé vont permettre : Une optimisation des pages web et une amélioration de l’expérience utilisateur en apportant des modifications aux sites pour une meilleure rentabilité, L’accélération du développement de nouveaux produits et leur adaptation au plus près des attentes et des usages du client, De faire de la veille ou de la prévision en tirant parti des dialogues continus du web social pour surveiller des tendances.15 La firme anglaise Tesco est la troisième plus grande chaîne de commerce. Walmart est le premier groupe mondial de grande distribution, 38
  39. 39. Un bon exemple est celui des « pures players »: Ces acteurs majeurs du Web, tels queGoogle, Facebook, Amazon, ont montré leur capacité à transformer linformation en résultatséconomiques et ont été les précurseurs de ces nouveaux business models en constituant cesgrosses bases de connaissances sur leurs clients, produits, fournisseurs, ...Le modèle économique de base de Google, la publicité contextuelle, s’appuie sur l’analyse enmasse des comportements pour cibler de manières fines certaines niches de marché.C’est aussi le cas pour Facebook : Son business model est basé sur la monétisation desinformations personnelles et contenu de ces adhérents.On a cité l’exemple du Web mais la création de la valeur par la connaissance client restepossible dans n’importe quel domaine.Par exemple, dans le secteur bancaire, l’analyse des flux de transactions permet de détecter entemps réel des fraudes bancaires et de déclencher automatiquement le blocage d’une carte decrédit.En synthèse, l’utilisation du Big Data améliorera sans doute la compétitivité d’uneentreprise face aux concurrents en lui permettant d’être plus réactive face aux besoins,exigences et intérêts de ses clients. 39
  40. 40. 4.3.3 Impact organisationnelL’intégration des nouvelles technologies Big Data dans les entreprises va entraîner deschangements en termes de gouvernance et organisationnels.Le volet de l’impact organisationnel est abordé ici sous deux angles : La conduite du changement, où comment l’entreprise va être amenée à gérer son adaptation vers un nouveau mode de fonctionnement L’apparition de nouveaux métiers.a) La conduite du changementL’intégration du Big Data dans une entreprise risque d’entraîner une rupture de sonorganisation : Elle devra modifier sa manière de travailler pour s’adapter à ce nouvelécosystème (arrivée de nouveaux acteurs, renforcement de la concurrence, importance desréseaux sociaux, changement de la relation client, …).Un manque d’adaptation de l’entreprise pour canaliser le Big Data la mettrait dans dessituations à risque : Cela peut être, par exemple, une perte de productivité des employés, unedégradation de la réputation de lentreprise ou de ses produits, ou encore l’incapacité àrecommander et personnaliser la bonne offre à chaque client.Pour réussir cette transformation, il est nécessaire d’adopter un changement de mentalité ausein de l’entreprise. C’est toute la réflexion métier qui est différente car les données, enpermettant dobtenir de nouvelles informations, deviennent le pilote de la stratégie del’entreprise. La priorité réside bien dans la maîtrise de la donnée.Les décideurs doivent être sensibilisés à la valeur de la donnée. Pour cela il faut arriver à lesconvaincre de l’intérêt qu’il y a à exploiter ces données, en développant deux axes : Le renforcement de l’efficacité des métiers et notamment la relation Marketing – Client (connaissances client), Mais aussi la capacité, pour les donneurs d’ordre, à tirer des synthèses d’aides à la décision (tendances du marché, …). 40
  41. 41. Cela leur permettra d’adapter la stratégie de l’entreprise pour créer de la richesse à partir deces données.Pour atteindre un degré d’efficacité, il faut un partenariat renforcé entre les équipesinformatique et marketing qui seront les acteurs du Big Data dans l’entreprise.Pour arriver à améliorer le fonctionnement actuel décrit au §4.1, il sera nécessaire : pour les équipes informatiques : o d’arriver à mettre en place des cycles toujours plus courts et plus orientés « time to market»16, pour les évolutions demandées par les équipes marketing, tout en conservant la fiabilité du système opérationnel, o et mettre à disposition du marketing des interfaces adaptées (outils ergonomiques directement accessibles depuis le poste de travail de l’utilisateur) et des procédures simplifiées (administration des droits utilisateurs, accès aux outils et bases de données, support utilisateur réactif, …), qui leur permettront de réaliser de manière autonome leurs requêtes sur le SI. pour les équipes marketing, de s’approprier les outils mis à leur disposition pour qu’elles arrivent à formuler les bonnes requêtes adaptées à leur besoins. En étant à même de maîtriser leurs requêtes, les services marketing n’en seront que plus performants. Enfin, de faire émerger un nouveau modèle de collaboration entre l’informatique et le marketing pour renforcer la synergie entre ces équipes. En effet, actuellement la DSI détient la donnée qui est utile au Marketing. Ce dernier est donc tenté de peser de plus en plus sur la gouvernance de la DSI. D’un autre côté, avec l’importance prise par la donnée dans un environnement Big Data, la DSI pourrait être amenée à étendre son rôle vers l’analyse de cette donnée. Cette nouvelle collaboration pourrait passer par la mise en place d’une structure transverse à la DSI et au Marketing, qui serait en charge de la gouvernance du programme Big Data dans l’entreprise.16 Time-to-market : terme utilisé pour exprimer le délai nécessaire pour le développement d’un projet et sa mise en place avant sa mise enservice ou son lancement sur le marché 41
  42. 42. b) L’apparition de nouveaux métiersLes entreprises sont obligées de trouver et de mettre en place de nouvelles solutionsanalytiques complexes dédiées aux Big Data et pour cela, elles doivent investir en outilsspécialisés mais aussi en ressources humaines.L’un des enjeux du Big Data sera aussi lié aux compétences d’analyse.Ces nouvelles technologies nécessitent de nouvelles compétences, notamment des Datascientist17, profils rares car il nexiste pas encore d’écoles proposant des formationsacadémiques pour les former. Ces profils requièrent une double compétence enmathématiques et en analyse qui leur permet d’extraire du sens et de rendre les donnéesintelligibles.Cette pénurie de compétences qualifiées risque d’entraver l’exploitation du Big Data ou d’endélocaliser une partie de son exploitation. Data scientist : métier désignant les nouveaux rôles d’analystes liés au Big Data et disposant d’une double compétence Mathématiques –17Analytique 42
  43. 43. 4.4 Big Data dans les télécoms : l’étude de cas ORANGE Non publié . 43
  44. 44. 5. CONCLUSIONLe déluge de données est un phénomène de société qui est amené à croître dans les prochainesannées et le Big Data pourrait bien devenir la prochaine grande révolution technologique.En effet, nous assistons au développement de nouveaux outils performants d’analyse et degestion de données qui marquent une rupture technologique avec le monde actuel des basesde données relationnelles.Avec ce nouveau concept, l’entreprise doit commencer une réflexion autour de ses besoins etobjectifs et mettre en place la stratégie adéquate pour s’adapter à ce nouvel écosystème. Périmètre des technologies Big Data Business Intelligence Business Analytics Exploitation Exploitation indirecte des Exploitation directe des des données (reporting) données données SGBD Gestion des données ERP ( SI, Marketing) CRM Stockage des Stockage de données / Cloud Computing données Réseaux Opérateurs Transport des données Générations des données struturées / non structurées Figure 9 : Périmètre des technologies Big Data 44
  45. 45. Le Big Data ne concerne pas que les entreprises. Le secteur public peut y trouverégalement un intérêt. D’ailleurs, l’Etat français a lancé récemment un appel à projetsconsacré au Big Data pour la mise en place de ces technologies autour des données publiques.[18]Ces projets pourraient concerner : la sécurité publique et la lutte contre le terrorisme par le recoupement d’informations provenant des services de sécurité (police, gendarmerie, renseignements). La lutte contre la fraude fiscale, La santé publique (télédiagnostics, téléconsultation…).Enfin, il existe des menaces au développement du Big Data qui sont liées : Aux aspects juridiques : Les freins proviendront de toutes les questions liées à la réglementation juridique à mettre en place autour de ces nouvelles technologies. Plusieurs questions peuvent être posées : o Quelle est l’obligation de conserver les données (traçabilité de l’information) et le délai légal de conservation ? o La propriété de la donnée stockée, o A-t-on une obligation à détruire les données que lon stocke ? o Le respect de la vie privée et du droit à loubli. A la sécurité de l’information : Plus de données manipulées appelle une sécurité renforcée du Système d’Information et de la gestion du droit d’accès à ces données. Il sera nécessaire de cloisonner les données en fonction du droit d’en connaître des utilisateurs. 45
  46. 46. ANNEXE 1 : ENQUETE D’OPINION SUR LEBIG DATAQuestionnaire et Résultats bruts de l’enquête 46
  47. 47. 47
  48. 48. 48
  49. 49. 49
  50. 50. ANNEXE 2 : GUIDE D’ENTRETIEN POUR L’ETUDE DE CASCe guide a servi de fil conducteur aux entretiens qui ont été menés. 1) Qu’est ce que le Big Data ? 2) Quels sont les projets Big Data d’Orange 3) Pourquoi parle-t-on toujours du Cloud et du Big Data ensemble ? 4) Quels sont les clients qui l’utilisent, pour quels usages ? 5) Pourquoi à la Direction du SI France, on ne parle pas du tout du Big Data, nous n’avons aucun projet à l’horizon 2015 sur ce sujet ? 6) Quels sont les besoins en Big Data d’Orange pour ses besoins internes ? 7) Quelles sont les opportunités et les difficultés du Big Data pour Orange ? 8) Est-ce que le Big Data va changer nos manières de travailler entre le marketing et l’informatique pour gérer des projets et vendre nos solutions et produits ? 9) Sommes ou serons-nous pilotés par la donnée ? 10) Que pensez-vous de cette déclaration : « Lentreprise du 21ème siècle doit maîtriser linformation ou disparaître ». 11) Quelle peut être la stratégie de cohérence, de fiabilité, de qualité des données entre nos différentes entités pour réussir à intégrer le Big Data ? 12) A qui va profiter le Big Data dans l’entreprise : aux fonctions marketing et/ou à la DSI ? 13) Est-ce que cela va rendre notre entreprise plus compétitive ? 50
  51. 51. ANNEXE 3 : SOURCES ET BIBLIOGRAPHIE[1] Devideo «Six provocations au sujet du phenomène Big Data» Taken from Kranzberg,Melvin (1986) Technology and History: "Kranzbergs Laws", Technology and Culture, Vol.27, No. 3, pp. 544-560 - <http://www.decideo.fr/Six-provocations-au-sujet-du-phenomene-des-Big-Data_a4532.html> - Septembre 2011[2] Frenchweb « Etudes McKinsey » - <http://expert.frenchweb.fr/tag/mckinsey/> - Juin 2012[3] Le monde .fr « Le cimetière des exaoctets » -<http://www.lemonde.fr/vous/article/2012/06/19/le-cimetiere-des-exaoctets_1721206_3238.html> - Juin 2012[4] Blog-Devost « Big Data ,petites réfléxions » - <http://blog.dewost.com/big-data-petites-reflexions> - Juin 2012[5] Le Webmarketeur « Infographie, les chiffres clés d’internet en France en 2011 » -<http://www.le-webmarketeur.com/2012/01/06/infographie-les-chiffres-cles-d%E2%80%99internet-en-france-en-2011/> - Décembre 2012[6] Dofollow.bz « les chiffres clés d’Internet » -<http://dofollow.bz/?post/2012/01/10/Chiffres-cles-Internet-France-10-ans> - Janvier 2010[7] Fevad « Les chiffres de la consommation digitale en France » -<http://www.fevad.com/uploads/files/Etudes/chiffrescles/chiffres_cles2012.pdf> - Juin 2012[8] 20minutes « Facebook, 27 milliards de likes par jour » -<http://www.20minutes.fr/web/facebook/989615-facebook-27-milliards-likes-chaque-jour> -Aout 2012[9] Blog Waebo «Augmentation exponentielle du nombre de tweets par jour» -<http://www.waebo.com/twitter-augmentation-exponentielle-du-nombre-de-tweets-par-jour.html> - Février 2010[10] Information IT pour les TPE/PME, ITespresso – <http://www.itespresso.fr/youtube-media-mastoc-defaut-mass-media-55152.html> - Juillet 2012[11] Le Blog des nouvelles technologies « Infographie, quelle quantité de contenu est publiéequotidiennement sur le web » - <http://www.blog-nouvelles- 51
  52. 52. technologies.fr/archives/3338/infographie-quelle-quantite-de-contenu-est-publiee-quotidiennement-sur-le-web/> - Avril 2011[12] Journal du net « les ventes de tablettes 2011 » -<http://www.journaldunet.com/solutions/systemes-reseaux/ventes-de-tablettes-en-2011.shtml> - Novembre 2011[13] 01net « Big data, la prochaine révolution informatique » -<http://pro.01net.com/editorial/535404/big-data-la-prochaine-revolution-informatique/> -Juillet 2011[14] Le mag IT « Big Data : des besoins forts, un concept diffus, un marché en phase delancement » - <http://www.lemagit.fr/article/sap-sybase-big-data/11354/1/big-data-des-besoins-forts-concept-diffus-marche-phase-lancement/> - Mai 2012[15] Mc Kinsey.com « Big Data: The next frontier for innovation, competition, andproductivity » - <htpp://wwwmckinsey.com/mgi/publication/big_dara/index.asp> - Mai 2012[16] e-marketing « Big data: le plus grand risque est de ne rien faire » <http://www.e-marketing.fr/Marketing-Direct/Article/-Big-data-le-plus-grand-risque-est-de-ne-rien-faire--42524-1.htm>Janvier 2012[17] Forbes - Big Data is a big market business»<http://www.forbes.com/sites/siliconangle/2012/02/17/big-data-is-big-market-big-business> -Février 2012[18] Site du gouvernement français « Appel à projets Big Data » - <http://investissement-avenir.gouvernement.fr/content/lancement-de-lappel-%C3%A0-projets-consacr%C3%A9-au-big-data> - Mars 2012 52

×