SlideShare une entreprise Scribd logo
ISC Paris – MBA e-business




            1
Table des matières

1.     Synthèse ............................................................................................................................. 4

2.     Introduction ........................................................................................................................ 7

     2.1     Exposé de la problématique ......................................................................................... 7

     2.2     Méthodologie ............................................................................................................... 9

     2.3     Limites de l’étude ........................................................................................................ 9

3.     Présentation du contexte................................................................................................... 10

     3.1     L’origine du Big Data ................................................................................................ 10

       3.1.1        La généralisation d’Internet ............................................................................... 11

       3.1.2        Les nouveaux usages .......................................................................................... 14

     3.2     L’analyse du mot Big Data sur Internet ..................................................................... 18

     3.3     Définition du Big Data .............................................................................................. 19

     3.4     Ce qui a permis l’émergence du Big Data ................................................................. 23

4.     Les enjeux du Big Data pour l’Entreprise ........................................................................ 27

     4.1     Les relations entre les départements informatique et marketing ............................... 27

     4.2     Enquête auprès des acteurs SI et Marketing .............................................................. 30

       4.2.1        La méthodologie d’enquête ................................................................................ 30

       4.2.2        L’analyse des résultats ....................................................................................... 31

     4.3     Les enjeux et impacts du Big Data pour les entreprises ............................................ 33

       4.3.1        Le challenge technologique ................................................................................ 34

       4.3.2        L’enjeu économique ........................................................................................... 36

       4.3.3        Impact organisationnel ....................................................................................... 40

     4.4     Big Data dans les télécoms : l’étude de cas ORANGE ............................................. 43

       4.4.1        Les solutions Big Data chez Orange Business ServicesError! Bookmark not
       defined.

       4.4.2        La perception du Big Data chez Orange France. Error! Bookmark not defined.


                                                                      2
5.    Conclusion ........................................................................................................................ 44

Annexe 1 : Enquête d’opinion sur le Big Data ......................................................................... 46

Annexe 2 : Guide d’entretien pour l’étude de cas .................................................................... 50

Annexe 3 : Sources et Bibliographie ........................................................................................ 51




Table des figures

Figure 1 : Tableau SWOT des enjeux du Big Data pour l’entreprise ........................................ 6

Figure 2 : L’évolution des techniques de stockage [2]............................................................. 11

Figure 3 : L’évolution de l’usage d’Internet en France [6] ...................................................... 13

Figure 4 : Evolution du volume de tweets transmis quotidiennement [9] ............................... 15

Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trends ......................... 18

Figure 6 : Acteurs liés au concept du Big Data ........................................................................ 19

Figure 7 : Logo d’Hadoop ........................................................................................................ 23

Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17] .......... 37

Figure 9 : Les étapes clés de transformation du SI vers l’innovation (Source : OBS – P.
Bourhis) .................................................................................... Error! Bookmark not defined.

Figure 10 : Périmètre des technologies Big Data ..................................................................... 44




Table des tableaux

Tableau 1 : Tableau de conversion des unités de volume de données ..................................... 20

Tableau 2 : Solutions Big Data des principaux acteurs ............................................................ 24




                                                                    3
1.         SYNTHESE
Le Big Data est un nouveau concept issu de la Silicon valley : Il comprend l’ensemble des
technologies permettant de stocker, traiter et analyser des données et contenus hétérogènes
afin d’en faire ressortir de la valeur et de la création de richesse pour les entreprises.

Il est considéré par certains comme la prochaine révolution technologique.

Son apparition est liée à l’essor de l’Internet et au développement de nouveaux usages
(réseaux sociaux, produits connectés), car en augmentant de façon exponentielle nos données,
ils créent ainsi un phénomène de déluge de données.

S’il n’a pas encore de définition académique, le Big Data est caractérisé par les critères des
«3V»:

       Volume, pour la quantité de données à stocker au-delà de l’Exa-octet,

       Vitesse, pour le traitement de ces données en quasi temps-réel,

       et Variété, pour la capacité à gérer des données structurées et non structurées.

Les acteurs participant au développement de ce concept sont :

       Les acteurs majeurs du Web,

       Les éditeurs de logiciels,

       Les opérateurs télécoms.



Les premières technologies Big Data ont été créées par les entreprises leaders du Web
(Google, Amazon, Yahoo, …) car ce sont les premières qui ont eu à faire face à des
problématiques de gros volumes de données à traiter en temps réel.

Les technologies Big Data (Map reduce, Dynamo, Hadoop, …) s’appuient sur :

       Le Cloud computing, pour sa capacité à stocker de gros volumes de données,

       Les nouvelles méthodes d’analyses (Web sémantique, crowdsourcing, analyse de
       sentiments, …) qui permettent de croiser diverses sources de données et offrent de
       nouvelles possibilités d’analyse décisionnelle.




                                                 4
La maîtrise des données grâce aux technologies Big Data, constituera une mine d’or
d’information pour l’entreprise, et sera un facteur de différenciation pour l’entreprise
du 21ème siècle.

Google nous en fait la démonstration en ouvrant de nouveaux business models, grâce à ces
masses de données qui étaient jusque là encore inexploitées.

Ce nouvel écosystème, avec l’apparition des technologies Big Data, a entrainé un changement
de paradigme pour le marketing : On est passé d’un marketing transactionnel (marketing
produit) à un marketing relationnel (marketing client). C’est toute la relation marketing avec
le client qui a changé, celle-ci est devenue plus directe, avec une portée plus étendue et
demandant des réactions plus instantanées de la part de l’entreprise pour être efficace.



L’intégration des technologies Big Data par les équipes en charge des données (DSI,
marketing) passera par une adaptation des méthodes de travail et des processus pour que
l’entreprise puisse tirer profit du data-déluge. Cela passe par un nouveau partenariat entre
la DSI et le marketing.

L’entreprise devra réfléchir à trois principaux enjeux :

       Le challenge technologique : Investir dans ces nouvelles technologies qui touchent au
       stockage et à l’analyse des données.

       L’enjeu économique : Créer de nouveaux business models en tirant profit des
       données pour créer de nouveaux leviers de croissance.

       L’impact organisationnel : Adapter son organisation et accompagner les équipes en
       charges des données vers cette nouvelle stratégie (conduite du changement), tout en
       anticipant l’apparition de nouveaux métiers (Data scientist).



L’étude du cas Orange Business Services nous permet de voir comment la transformation
globale de son SI l’a conduite vers la fourniture d’offres innovantes Big Data (plusieurs
projets en cours).



Le Big Data ne concerne pas que les entreprises. Le secteur public est également en train de
réfléchir à la mise en place de ces nouvelles technologies (appel à projets de l’état français).

                                                5
Enfin, si cette révolution Big Data offre de « big promesses de croissance », il existe
néanmoins des freins à son développement tels que le cadre réglementaire pour l’utilisation de
ces données et les problèmes liés à la sécurité de l’information.



Les enjeux du Big Data peuvent ainsi être résumés à partir du tableau SWOT1 suivant :

                                Forces                                         Faiblesses

              • Développement d’outils analytiques             • Pénurie de compétences pour gérer
              performants aux services du marketing            ces nouvelles technologies
              • Renforcement de la compétitivité               • Conduite du changement
              • Développement de nouveaux
              business models


                           Opportunités                                         Menaces

              • Généralisation du Cloud computing              • Cadre réglementaire non défini
              • Appels à projets publics (e-santé, …)          • Sécurité de l’information



                           Figure 1 : Tableau SWOT des enjeux du Big Data pour l’entreprise




L’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par des
investissements humains et matériels. Celles qui sauront tirer profit de leur capital
« Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité et
d’innovation.




1
  SWOT : Méthode d’analyse selon quatre axes Forces (Strengths), Faiblesses (Weakness) Opportunités (Opportunities) et Menaces
(Threats).


                                                              6
2.             INTRODUCTION
      2.1 Exposé de la problématique

Depuis soixante ans, l’ordinateur, cette invention mathématique, nous permet de rentrer des
informations et d’exécuter des programmes pour faciliter le traitement de nos données. Il est
devenu au fil du temps, l’outil indispensable d’abord pour les entreprises, puis pour les
particuliers. Si au début sa principale utilité consistait à réaliser des opérations complexes et à
stocker des données, l’ordinateur trouva très vite ses limites par l’excès de données à traiter. Il
fut alors inventé la base de données.

Ainsi, à partir des années 1990, démarre l’exploitation des bases de données relationnelles
dont la plus connue et généralisée à ce jour reste SQL (Simply Query Language)2. La base de
données relationnelle constitue un ensemble structuré de données qui permet à l’utilisateur de
gérer plus facilement ses données par l’envoi de requêtes simples. Dès lors, ces bases de
données ont monopolisé le marché de stockage et de manipulation d’informations dans les
Systèmes d’Information (SI) des entreprises et ont permis, entre autres, le développement des
outils CRM (Customer Relationship Management – base de données traitant les données
clients).

Ces dix dernières années, les technologies de l'information ont envahi notre vie quotidienne et
professionnelle. La nouvelle économie, ou e-business, a émergé grâce à Internet qui a permis
leur interconnexion sur un réseau unique à l'échelle mondiale. Avec l’arrivée d’Internet,
l’information s’est démocratisée et nous avons désormais accès à une multitude
d’informations, traitée par des millions d’ordinateurs interconnectés entre eux.



Au 21ème siècle, l’explosion de la donnée est en train d’atteindre toutes les entreprises et son
expansion est le symbole d’une transformation économique et sociale globale. Cette
explosion de données est aussi connue sous le terme de « Big Data ».




2
 SQL : langage standard de description et de manipulation des données. La majorité des Systèmes de Gestion de Bases de Données (SGBD)
actuels sont basés sur ce modèle.


                                                                 7
Le Big Data est annoncé comme la prochaine révolution informatique, illusion pour certains,
véritable opportunité pour d’autres… C’est un sujet dont nous allons entendre parler encore
un bon moment !

Aussi, devant l’émergence de ce nouveau concept, un certain nombre de questions se posent :

       Pourquoi parle-t-on aujourd’hui du Big Data et de ces déluges de données ? Qu’est ce
       que ce concept Big Data et comment est il apparu ?

       Avec ces masses de données, faut-il envisager des nouvelles méthodes d’analyse et de
       gestion de données inexplorées par l’entreprise et qui pourraient leur apporter de la
       valeur ajoutée ? Est-ce une vraie opportunité et quels sont les enjeux du Big Data pour
       les entreprises ?

       Enfin, Comme le dit Melvin Kranzberg “La technologie n’est ni bonne, ni mauvaise,
       ni neutre… L’interaction entre la technologie et l’écosystème social est telle que les
       développements techniques ont des conséquences environnementales, sociales, et
       humaines qui dépassent de loin les objectifs des appareils techniques et des pratiques
       elles-mêmes.” [1]

       L’arrivée des nouvelles technologies changeant nos conditions de travail, il peut être
       intéressant de se demander si le Big Data imposera une nouvelle manière de travailler
       entre les équipes SI et Marketing. C’est sous cet angle que nous aborderons la
       problématique de cette étude.




                                              8
2.2 Méthodologie

Dans un premier temps il est important de faire une présentation du contexte lié au Big Data :
Comprendre son origine, tenter d’en donner une définition et identifier les facteurs qui ont
favorisé son émergence. C’est l’objet du chapitre 3 « Présentation du contexte ».

Le chapitre 4 analyse les enjeux et les impacts du Big Data pour l’entreprise en focalisant sur
les relations entre les acteurs informatiques et marketing. Cette analyse dresse tout d’abord un
état des lieux des relations actuelles et des problèmes et limites auxquels elles sont
confrontées, puis étudie les apports potentiels du Big Data et les impacts associés.

L’analyse est consolidée par une enquête auprès d’acteurs concernés par le sujet sur leur
connaissance actuelle et leur appréciation du Big Data, ainsi que de l’étude d’un cas pratique
avec le cas Orange, afin de mettre en perspective l’intégration de cette technologie Big Data
dans l’entreprise.

La conclusion (chapitre 5) permet d’ouvrir le champ des investigations et notamment celles
des freins au développement du Big Data.




      2.3 Limites de l’étude

Le Big Data étant un sujet récent, les ouvrages qui lui sont consacrés sont rares et
exclusivement rédigés en Anglais3.

Cette étude est donc uniquement basée sur des recherches effectuées sur le Web.

De plus, la problématique étant principalement analysée sous l’angle des relations entre le SI
et le Marketing, les détails techniques ou réglementaires du Big Data ne sont pas abordés.




3
 On citera par exemple l’ouvrage « Big Data: High-Impact Strategies - What You Need to Know: Definitions, Adoptions, Impact, Benefits,
Maturity, Vendor - Kevin Roebuck »


                                                                  9
3.         PRESENTATION DU CONTEXTE
Cette section décrit l’origine du phénomène Big Data, en donne une définition et identifie les
facteurs qui ont favorisé son émergence.




    3.1 L’origine du Big Data

Au début notre communication était analogique : voix humaine, courrier postal, photographie
argentique, … . Avec l’'arrivée de l’électronique et de l’informatique, on est passé
progressivement dans le monde du numérique.

La numérisation est le moyen technique de transformer de l’information et de passer d’un
signal analogique (son, image,…) à un signal numérique (information codée) exploitable par
l’informatique. Cette action de numérisation transforme le support initial en donnée
informatique (fichier électronique, …).

Au fil du temps, la numérisation a concerné tous les supports qu’ils soient sous forme de
papier (photo, fax, …), de vidéo, de voix (musique, voix téléphonique, …).



Si la numérisation est à la base de la création de la donnée informatique, l’explosion de cette
donnée est arrivée au début des années 2000 avec le boom Internet.

Deux facteurs principaux sont à l’origine de l’apparition du Big Data, en augmentant de façon
exponentielle et quotidienne nos données, engendrant ainsi un phénomène de déluge de
données :

       La généralisation de l’usage d’Internet,

       L’apparition de nouveaux usages.




                                              10
3.1.1 La généralisation d’Internet

La généralisation d’Internet à travers le monde a engendré de plus en plus de données. Il est
intéressant de donner quelques chiffres pour mieux se représenter cette accumulation de
données.

L'humanité a produit environ 5 Exaoctets (Eo)4 de données depuis l’avènement de
l’informatique jusqu'en 2003.

L’amélioration des techniques de stockage et la diminution des coûts ont accompagné cette
croissance de données en donnant la capacité de stocker toujours plus de données sur des
supports de plus en plus petits et de moins en moins chers.

A titre d’illustration, l’image ci-dessous représente l’évolution de ce stockage, avec :

             à gauche, une baie de stockage en 1980, avec une capacité de 20 Go, pour un coût du
             Go estimé entre 32 000 et 57 000 $,

             à droite, une carte Micro SD en 2010, disposant d’une capacité de 32 Go, pour un coût
             du Go situé entre 3 et 4 $.




                                         Figure 2 : L’évolution des techniques de stockage [2]




4
    Un Exa-octet (Eo) équivaut à un milliard de Giga-octets (Go).


                                                                    11
Depuis 2007, l'humanité produit plus de données que de capacités à les stocker.[3]

En 2010, on a produit cette même quantité de données (soit 5Eo) en deux jours environ.

Une étude du cabinet McKinsey, datée de mai 2011, estime qu' « en 2010, les entreprises
auraient stocké chacune en moyenne 7 Eo supplémentaires de données, et les particuliers 6
Eo. Pour donner un ordre de grandeur, 1 Eo représente environ 10.000 fois la capacité de la
Bibliothèque du Congrès Américain. » [2]

« 90 % de l'ensemble des données du monde ont été créées ces deux dernières années »
estimait récemment Stephen Gold d'IBM lors d'une présentation au récent Webcom de
Montréal. "Nous vivons un data-déluge : l'essentiel des données que nous utiliserons dans 2
ans n'aura rien à voir avec celles que nous utilisons aujourd'hui." [4]



C’est la croissance du nombre d’internautes qui explique cette explosion de données.

L’usage d’internet est en forte augmentation dans le monde entier, avec notamment 3,4
milliards d’utilisateurs estimés en 2016, soit près de 45 % de la population mondiale. [5]

Ramené à la situation française, on constate que les internautes français sont très actifs sur le
Web avec 38 millions de connectés qui y passent une moyenne de 2 heures par jour.



La figure suivante donne une rétrospective de l’évolution de l’usage d’Internet en France sur
une période de 10 ans :




                                               12
Figure 3 : L’évolution de l’usage d’Internet en France [6]




On constate qu’entre 2002 et 2012 : 5 [7]

            Le nombre d’Internautes a plus que doublé, passant de 16 à 38 millions (+133 %),

            Le temps moyen de navigation d’un usager est passé de 6 heures à 65 heures par mois,

            L’adoption des abonnements haut-débit, permettant de disposer de débits d’accès
             supérieurs à 2 Mbits/s (voire jusqu’à 100 Mb/s avec la fibre optique), a accompagné le
             développement d’Internet,

            Enfin, si le marché des moteurs de recherches a vu naître le monopole du géant
             Google, celui des sites marchands (e-commerce) s’est largement étendu à une
             multitude de nouveaux acteurs.




5
    Source : Baromêtre Fevad Mediamétrie/Netratings


                                                               13
3.1.2 Les nouveaux usages

La généralisation d’Internet a permis de nouveaux usages qui ont à leur tour contribué à
l’explosion des données informatiques.

Les plus caractéristiques de ces nouveaux usages sont :

       Les réseaux sociaux

       Les réseaux sociaux (Facebook, Twitter, Linkedin, …) représentent un nouveau type
       de communication de groupe qui s’est imposé d’abord auprès des particuliers et qui
       aujourd’hui arrive dans l’entreprise.

       Ces réseaux génèrent de plus en plus en données en permettant à leurs membres de
       diffuser ou mettre en ligne des photos, des commentaires, des notes, … et de les
       partager avec les membres de leur communauté.

       L’internaute, qui au départ avait un rôle passif de lecteur sur Internet, devient
       désormais une source active en créant du contenu, entraînant ainsi une hausse des
       données produites sur le Web.

       Là encore, quelques chiffres permettent de mieux saisir l’importance du volume de
       données générées par les réseaux sociaux :

       o On peut lire dans cet article consacré à Facebook « Jay Parikh a ainsi levé le voile
           sur d’autres chiffres qui donnent autant le tournis : Facebook compte 2,7 milliards
           de « likes » ou mentions « j’aime » chaque jour et 2,5 milliards de contenus
           (statuts, photos, vidéos) sont partagés au quotidien sur le réseau social. » Le
           réseau social doit stocker l’équivalent de 500 téraoctets par jour [8]




                                               14
o 50 millions de tweets par jour transitent par les serveurs de Tweeter. [9]




           Figure 4 : Evolution du volume de tweets transmis quotidiennement [9]




Les plateformes de contenus multimédias

Aujourd’hui, nous avons accès à différents services de contenus via Internet, depuis
notre télévision ou notre ordinateur personnel, qu’ils s’agissent de la Vidéo à la
demande (VOD – Video On Demand) proposée par tous les Fournisseurs d’Accès
Internet, ou de la diffusion de contenus par streaming pour regarder des films, écouter
la radio ou de la musique à partir de notre PC.

o YouTube, c’est 35 heures de vidéos chargées chaque minute et 2 milliards de clips
    vus chaque jour. [10]

o Flickr représente 5 millions d’images ajoutées chaque jour, soit 60 photos par
    seconde. [11]



La mobilité et les produits connectés

Internet d’une part, mais aussi les réseaux mobiles de nouvelle génération disposant de
hauts débits pour l’accès à Internet (téléphonie mobile de 3ème génération UMTS, puis
la 4G ou LTE) et les nouveaux protocoles sans-fil pour les communications de
proximité (RFID, NFC, Bluetooth, …) ont rendu possible deux nouveaux usages que
sont :




                                           15
o La mobilité, qui consiste, pour l’utilisateur, à continuer à utiliser ses applications
    lorsqu’il est en déplacement.

    L’engouement pour les tablettes (63,6 millions de tablettes vendues dans le monde
    en 2011), l’explosion des ventes de smartphones (près de 10 millions de Français
    équipés en 2010) et la multiplication des accès mobiles via des bornes Wi-Fi (dans
    les hôtels, les restaurants, les magasins, …) en sont les exemples les plus
    représentatifs. [12]

o La maison intelligente, qui regroupe la connexion à Internet d’une multitude
    d’appareils domestiques (TV, réfrigérateur, table de cuisson, compteur électrique
    intelligent, …).

Tous ces produits connectés génèrent des masses de données considérables dans leur
fonctionnement (traces d’appels, historiques de navigation, …).

Avec l’essor de l’Internet, nos équipements (objets personnels, voitures, capteurs, etc.)
communiqueront entre eux ainsi qu’avec des systèmes d’informations tiers (centrales
d’achat, centres de sécurité, …) : Tout cela conduira à accroitre les volumes de
données.

On peut se donner une idée de l’importance du nombre (actuel et futur) de ces objets
connectés, par la réflexion suivante : Chaque produit connecté est doté d’une adresse
Internet publique, également désignée adresse IP du nom du protocole qui permet la
transmission des données au sein du réseau Internet.

A la création d’Internet ses inventeurs avait prévu un système gérant jusqu’à 4
milliards d’adresses en théorie (adresses IPv4), ce qui était considéré comme une
ressource quasi-illimitée dans les années 1970. Le 3 février 2011, la dernière adresse
IPv4 a été attribuée, imposant de passer à IPv6, nouvelle version du protocole IP, qui
est conçu pour supporter 667 millions de milliards d’adresses par millimètre carré de
surface terrestre.




                                       16
La situation qui vient d’être décrite permet ainsi, au-delà des chiffres évoqués, de mieux
expliquer l’origine du Big Data :

             Depuis le début de l’ère informatique, la numérisation de nos applications a engendré
             une croissance continue des données. Dans le même temps, les améliorations des
             techniques de stockage offraient la capacité à accompagner cette croissance.

             Depuis le début du 21ème siècle, le monde informatique fait face à une explosion
             exponentielle de données, engendrée par le développement d’Internet et l’apparition
             de nouveaux usages (réseaux sociaux, plateformes de services, mobilité et produits
             connectés), et favorisée par l’amélioration des technologies de transport (débit d’accès
             à Internet) et des capacités de stockage. Les utilisateurs génèrent de plus en de
             données et dans un intervalle de temps de plus en plus court.

             Avec l’explosion des données, beaucoup d’entreprises dans différents secteurs
             d'activité (acteurs de l’Internet, e-commerce, recherche scientifique, organismes
             publics, …) ont dépassé le péta-octet pour le stockage de leur données. Stocker toutes
             ces données devient aujourd’hui un véritable défi technologique. De même leur
             traitement avec les techniques actuelles de type bases de données relationnelles n’est
             plus adaptée.

             C’est ainsi, qu’est apparu, pour la première fois en 2008, le terme "Big Data", introduit
             par l’entreprise Gartner6, désignant ce phénomène de déluge de données informatiques
             ou "data-déluge".




6
    Entreprise de conseil dans le domaine des technologies de l’information et de la communication aux USA


                                                                    17
3.2 L’analyse du mot Big Data sur Internet

Lorsque l’on interroge Google trends7 sur le terme « Big Data » (cf. figure ci-dessous), on
constate que ce terme est apparu dans les moteurs de recherches au milieu de l’année 2010 et
que depuis cette année, la recherche de ce mot ne cesse d’augmenter.




                        Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trends




C’est surtout dans la Silicon Valley et en Asie du Sud-Est que les recherches sont les plus
nombreuses, ce qui s’explique par la forte activité autour du monde Internet et des TIC dans
ces régions.

En 2012, on constate une généralisation de l’usage de ce mot élargie à de plus en plus de
régions à travers le monde (Europe, Israël, Australie, …) : c’est le signe que le concept sort du
cercle fermé des informaticiens de la Silicon Valley.

7
 Google trends : Outil de tendances des recherches qui permet d’analyser la fréquence de recherche d’un mot par les internautes du monde
entier


                                                                  18
3.3 Définition du Big Data

Le terme Big Data est utilisé par un grand nombre de personnes travaillant ou s’intéressant
aux Technologies de l’Information et de la Communication (TIC).

Le choix de l’appellation de ce phénomène est intéressant : C’est l’association des termes
« big » et « data », le terme « big » se réfèrant au volume de plus en plus important des
données et le terme « data» évoquant la valeur de toutes les données.

Aucune définition ne s’est vraiment imposée et chaque acteur possède la sienne en fonction
de ses centres d’intérêts.



Les acteurs qui orbitent autour de ce concept sont :

       Les éditeurs de logiciels qui développent les technologies Big Data,
       Les acteurs du Web (Google, Amazon, Facebook, Linked in, …) qui mettent déjà en
       œuvre ces technologies (voir plus loin, au §0),
       Les opérateurs télécoms et hébergeurs qui transportent et stockent ces données.



                             gén
                                ère
                                                                      e
                                                                   erg
                                                                héb

                         génère            Big DATA



                                                                   tran
                                                                       spo
                                                                          rte
                                                    exploite
                                  re
                                nè
                             gé




                                               Data mining

                             Figure 6 : Acteurs liés au concept du Big Data




                                                  19
Gartner définit le concept du Big Data comme « l’accumulation sans fin des données
numériques », et si l’entreprise n’en donne pas de définition académique exacte, elle propose
toutefois de le caractériser selon les critères des trois V: Volume, Vitesse et Variété.

             Le critère de volume

             Pour mieux saisir les chiffres donnés par la suite, le tableau suivant donne les
             correspondances de volume :

                                       Nom                Symbole                 Conversion

                               Kilo-octet                     ko         1 ko = 1 000 octets

                               Méga-octet                     Mo         1 Mo = 1 000 ko

                               Giga-octet                     Go         1 Go = 1 000 Mo

                               Téra-octet                     To         1 To = 1 000 Go

                               Péta-octet                     Po         1 Po = 1 000 To

                               Exa-octet                      Eo         1 Eo = 1 000 Po

                               Zetta-octet                    Zo         1 Zo = 1 000 Eo

                               Yotta-octet                    Yo         1 Yo = 1 000 Zo

                               Tableau 1 : Tableau de conversion des unités de volume de données




             La génération en masse des données par la population entière et nos machines ont fait
             évoluer considérablement les tailles de stockage « Vers les années 1990 on parlait en
             Giga, en 2000 en Téra et en 2010 on parle en Péta. Une organisation a d’ailleurs
             atteint 2 Yotta : c’est la NSA8 pour stocker toutes les données issues des
             communications électroniques américaines » (P. Bourhis– Orange Business Services).

             "Les hommes ont généré 150 Exa-octets de données en 2005 et en génèreront 1 200
             Exa-octets en 2010" (The Economist, 27/02/2010).

             Le volume de données à prendre en compte lorsque l’on parle de Big Data c’est le
             seuil à partir duquel il devient difficile de gérer ces données avec une solution de
             base de données relationnelle classique.



8
    NSA (National Security Agency) : Agence Nationale de Sécurité


                                                                    20
Ce seuil n’est pas clairement défini : pour certains c’est à partir de l'Exa-octet, pour
          d’autres du Zetta-octet.

          L’aspect volume n'est cependant pas suffisant pour définir le Big Data. Il faut lui
          ajouter le critère de vitesse.



          Le critère de vitesse

          Ce critère détermine la fréquence à laquelle les données sont générées et partagées.

          Avec les systèmes opérationnels classiques de gestion et d’analyse de données (par
          exemple, les ERP9, les CRM), les données sont traitées à froid une fois la collecte des
          informations effectuées et généralement selon une périodicité de l’ordre de 24h (voire
          2h pour les systèmes optimaux).

          Dans un système d’information confronté au data-déluge, ce fonctionnement n’est plus
          possible, car un tel volume de données oblige à traiter l’information en quasi temps-
          réel pour pouvoir être exploitées efficacement.

          Par exemple, si nous prenons le cas des réseaux sociaux, il n’est pas possible d’arrêter
          de collecter même une heure les données produites, car le retard accumulé serait alors
          impossible à rattraper pour l’exploitation des informations.

          Citons également cet autre exemple, celui d’un constructeur de voitures qui est en train
          de réfléchir à la mise en place d’une remontée d’au moins 150 millions événements
          (informations provenant de puce intégrer dans la voiture ou les pneus) par jour à
          implémenter dans son système d’information.

          Il devient dès lors impossible pour beaucoup d’outils d’analyse et de CRM de traiter et
          d’analyser à cette fréquence, les données qui sont collectées et partagées en temps réel.

          Le Big Data consiste donc également à analyser de gros volumes de données dans
          des délais les plus proches du temps réel.




9
  ERP « Enterprise Ressource Planning » : Progiciel de gestion intégrée permettant de gérer l’ensemble des processus d’une entreprise
(ressources humaines, comptabilité et finances, aide à la décision, logistique, …)


                                                                21
Le critère de variété

       Le troisième « V » représente la variété des données qui représente à peu près 80 %
       des données non structurées : sons, photos, vidéos, contenus de blogs ou de réseaux
       sociaux, …

       On croule sous la donnée provenant de sources variées, qui créent une diversité de
       données qui ne s’inscrivent plus dans des structures prédéfinies, faciles à utiliser
       comme les bases de données transactionnelles. Elles sont de ce fait devenues difficiles
       à manipuler de façon performante par les outils traditionnels.

       C’est ce critère qui fait principalement la particularité du Big Data car il évoque la
       capacité à gérer des données structurées et non structurées : Les technologies Big
       Data doivent permettre d'analyser de manière aussi simple que des champs numériques
       ou des textes pré-formatés, ces données non structurées et d’y trouver de la valeur
       ajoutée.



On peut ainsi définir le Big Data comme :

       Un concept faisant référence au déluge de données que nous accumulons dans nos
       systèmes ;

       Mais aussi comme un ensemble de méthodes et de solutions mises au point par les
       éditeurs de logiciels et utilisées par les entreprises, pour permettre le stockage et
       l'analyse en temps-réel des données volumineuses, structurées et non structurées.

Par la suite dans le document, pour distinguer ces deux notions, nous parlerons du Big Data
pour évoquer la première, et des technologies Big Data lorsque l’on se réfère à la deuxième.




                                              22
3.4 Ce qui a permis l’émergence du Big Data

Les premières entreprises qui se sont équipées des technologies Big Data sont celles des
moteurs de recherche Web (Google, Amazon, Yahoo) car ce sont les premières qui ont eu à
faire face à des problématiques de gros volumes de données à traiter en temps réel.

En effet, leur besoin de stockage et d’analyse dépassant les capacités des bases de données
traditionnelles, elles ont développé et mis à disposition des communautés en Open Source10
des outils de gestion. Ces systèmes permettent d’analyser et de restituer des données à une
très grande vitesse car les calculs se font en quasi temps-réel. Il est ainsi possible de s’offrir à
moindre coût l’équivalent des supercalculateurs proposés par Oracle ou IBM.

Google a développé sa propre technologie Big Data, Map Reduce.

Oracle, leader dans le domaine des bases de données propose aussi sa solution NoSQL
Database qui est une adaptation commerciale de la solution open source NoSQL (Not Only
SQL).

Yahoo a développé Hadoop, technologie créée par Doug Cutting, qui pour la petite histoire lui
a attribué le nom de l’éléphant en peluche de son fils. Hadoop est la solution Big Data la plus
utilisée aujourd’hui.




                                                     Figure 7 : Logo d’Hadoop




On utilise ces solutions dans beaucoup de domaines : finance, communautés de vendeurs et
d’acheteurs (Ebay), les systèmes de recommandations d’offres aux clients pour le commerce
en ligne et les réseaux sociaux.




10
     Open-source : Les logiciels Open Source se caractérisent par la liberté d'accès à leur code source à la différence des logiciels
commerciaux.


                                                                 23
Le tableau suivant résume les solutions Big Data proposées par les principaux acteurs :

                       Acteurs                          Solutions Big Data


                                              Dynamo ; S3


                                              MapReduce ; BigTable



                                              Cassandra ; Hive



                                              SenseiDB ; Voldemort



                                              No Database SQL



                                              Storm ; FlockDB


                                              Hadoop ; S4

                         Tableau 2 : Solutions Big Data des principaux acteurs




Ces technologies Big Data n’auraient pas pu voir le jour sans l’existence :

       du Cloud computing, pour sa capacité à stocker de gros volumes de données.

       Le Cloud computing, ou « informatique dans les nuages » est un nouveau modèle
       informatique qui propose des services informatiques à la demande.

       Son avantage pour une entreprise est de disposer d’une infrastructure ou d’un service
       applicatif dont le coût dépend de l’utilisation. Cela permet une grande souplesse
       d’utilisation (la puissance de stockage ou de calcul étant augmentée en fonction des
       besoins réels de l’entreprise) et optimise les coûts en évitant à l’entreprise des
       investissements coûteux (mise en service des plates-formes informatiques) e t e n l a
       libérant de la maintenance de ces infrastructures.

                                                 24
La capacité de stockage et la puissance de calcul sont, grâce au Cloud, devenues un
          service externalisé. La location de la puissance de calcul et l’espace de stockage
          adaptés au volume de données du Big Data a ainsi permis son expansion. En effet, très
          peu d'acteurs peuvent effecteur ces traitements avec leurs propres infrastructures.
          Grâce au Cloud, le Big Data est à la portée des PME et des acteurs non experts du
          traitement des données.



          de nouvelles méthodes d’analyse

          La Business Intelligence ou l'informatique décisionnelle, c’est l'exploitation des
          données de l'entreprise pour faciliter l’aide à la prise de décision par les donneurs
          d’ordre. Ce qui permet de comprendre le fonctionnement de l’entreprise et d’anticiper
          des actions pour son pilotage. Ces outils décisionnels sont basés sur l'exploitation d'un
          système d’information décisionnel qui est alimenté grâce à l'extraction de données de
          production.

          Les systèmes actuels de Business Intelligence deviennent obsolètes pour exploiter les
          données non structurées. En effet, la gestion des bases de données avec des solutions
          traditionnelles ne sont plus adaptées pour analyser cette quantité de données, non
          structurées et en temps réel.

          Comme le souligne Romain Chaumais, PDG d’Ysance11 "La Business Intelligence
          classique part de la stratégie de l'entreprise et allume des voyants correspondant aux
          objectifs. A l'inverse, le Big Analytics dégage une logique dans un océan de données
          bien trop nombreuses pour qu'un humain puisse les analyser. « Le datamining »
          automatisait déjà cette analyse mais avec des échantillons représentatifs. Le Big Data
          attaque les données dans leur totalité, ce qui permet d'identifier la moindre
          anomalie ».

          Ainsi, les technologies Big Data regroupent aussi des méthodes d'analyse - appelées
          « Big Analytics » - utilisées pour tirer profit des données.




11
  Romain Chaumais, PGD Co-Fondateur d'Ysance et Directeur du pôle Business Intelligence. Ysance est une société de conseil et réalisation
informatique.


                                                                  25
Arriver à traiter ces données constituerait une mine d’or d’informations pour de
nombreuses entreprises dans différents domaines d’activités, l’objectif étant de trouver
de « nouvelles connaissances » en croisant les données d’une organisation avec la
masse de données beaucoup moins structurées du Web (comme des blogs),
personnelles (comme des emails) pour proposer de nouveaux services à valeur
ajoutée : amélioration de la qualité de service, augmentation du taux de transformation
clients, ….




                                      26
4.          LES ENJEUX DU BIG DATA POUR
       L’ENTREPRISE
Cette section analyse les enjeux du Big Data pour l’entreprise sous le spectre des relations
entre les directions informatiques et marketing.

Comme l’ont souligné les sections précédentes, le Big Data constituera une mine d’or
d’informations pour l’entreprise qui arrivera à les maîtriser. Cette maîtrise passera par une
évolution des relations entre le monde du Système d’Information et celui du Marketing.
Autrement dit, comment faire évoluer les technologies et méthodes d’analyse employées
actuellement dans l’Entreprise pour tirer profit du data-déluge.

Par la suite, sont abordés :

       L’état des lieux des relations entre les départements informatique et marketing,

       Les enjeux du Big Data pour l’Entreprise sous les perspectives techniques,
       économiques et organisationnelles,

       La mise en perspective du Big Data sur une entreprise : L’étude du cas ORANGE.




    4.1 Les relations entre les départements informatique et
        marketing

L’informatique joue un rôle de plus en plus important dans la relation client avec les bases de
données relationnelles (CRM, ERP...) qui permettent de gérer tous les processus de traitement
des clients (commande, livraison, facturation, …).

Une entreprise évolue avec ses nouveaux projets, mais aussi les évènements exogènes
(fusions, acquisitions, …). A chaque nouveau projet est associée l’évolution du ou des
système(s) d’information. On arrive à la constitution de systèmes disparates qui cohabitent et
doivent s’intégrer entre eux, ce qui rend le Système d’Information (SI) de l’entreprise
complexe et difficile à gérer.

Ces projets de transformation de l’entreprise obligent les directions des systèmes
d'information à gérer avec le plus de rigueur possible, un système d'information en production
qui gère des données opérationnelles critiques (trésorerie, facturation, …) et les nouvelles

                                              27
évolutions qui lui sont demandés par les utilisateurs (services métiers de l’entreprise, dont le
Marketing). Les données "appartiennent" aux métiers et transitent dans les tuyaux et
applications de la DSI qui joue le rôle de logisticien de l’information, pour que le métier
puisse travailler.



Le marketing est devenu indispensable au développement des grandes entreprises surtout dans
les environnements concurrentiels actuel où les clients sont difficiles à acquérir et à fidéliser.

L’avènement du numérique, d’Internet et des réseaux sociaux ont transformé la relation entre
client et les services Marketing, le client ayant un accès beaucoup plus rapide et direct avec
l’entreprise pour exprimer ses besoins, avis, réclamations, …

Dans un passé proche, une grande firme dans le domaine agro-alimentaire qui utilisait de
l’huile de palme dans un de ses produits, a été obligée de modifier la composition de son
produit pour prendre en compte les mécontentements remontés par ses clients (eux-mêmes
alertés et incités en cela par l’organisation Greenpeace). Si dans un premier temps, le
« community manager »12 de l’entreprise n’a pas jugé bon de prendre en compte ces
réclamations, par la suite l’affaire a pris un tel impact sur la Toile (« buzz ») que seule
l’intervention personnelle du PDG et sa promesse de modifier le produit incriminé a permis à
l’entreprise de retrouver la confiance de ses clients.

Cet exemple illustre que la relation marketing avec le client a changé, en devenant plus
directe, avec une portée plus étendue et qu’elle demande des réactions plus instantanées de
la part de l’entreprise pour être efficace.



Pour satisfaire les exigences du client (qualité du service rendu, rapidité d’exécution, …) les
services marketing n’ont d’autres choix que de s’appuyer sur des applications informatiques
de plus en plus performantes. Il en résulte des demandes d’évolutions auprès de la DSI,
laquelle se doit de trouver les meilleures solutions techniques pour satisfaire les enjeux du
business.

Actuellement, ce processus entre l’expression de besoin réalisée par le service demandeur
(dans notre cas, le service Marketing) et la mise en application sur le système opérationnel de
l’entreprise, passe par une multitude d’étapes réalisées par la DSI.

12
     « Community manager » : Responsable de la communication de l’entreprise sur Internet et notamment sur les réseaux sociaux.


                                                                     28
Ces étapes, généralement intégrées dans le processus qualité de l’entreprise (par exemple,
cycle en V, …), définissent le déroulement des opérations et comprennent :

       La planification de l’évolution : compréhension du besoin, estimation du coût et du
       délai de réalisation, intégration dans la feuille de route du développement du SI,

       Sa spécification : rédaction des exigences fonctionnelles et de performances,

       Sa réalisation : codage et qualification sur une plateforme de tests,

       L’accompagnement au changement des utilisateurs : formation des utilisateurs,

       Le déploiement et mise en service sur le SI opérationnel.

Toute évolution entraîne un risque de dysfonctionnement sur l’existant et il est donc impératif
de tester cette non-régression, ce qui explique que les cycles de vie de projets des évolutions
sont longs et peuvent atteindre de 6 mois à plusieurs années.

Par ailleurs, il ne serait pas concevable de traiter au fil de l’eau chaque demande d’évolution.
Ces dernières sont donc rassemblées dans des versions d’évolution du SI qui ne sortent que 1
à 2 fois par an. Ainsi, même une évolution mineure, par exemple sur la tarification d’une
offre, qui ne nécessiterait que peu de charges en termes de réalisation, aurait un délai de mise
en œuvre obligatoirement long puisque dépendante de la sortie de la version globale du SI à
laquelle elle appartient.



L’atteinte des objectifs métiers dépend de l’entente entre ces deux mondes pour que chacun
contribue aux objectifs de l’autre : la DSI doit se mettre au service du Marketing (mise en
place d’outils performant) ; et le Marketing anticiper ses besoins pour prendre en compte les
contraintes informatiques.

Aujourd’hui les DSI arrivent à répondre aux demandes des services marketing malgré leurs
contraintes propres qui induisent un certain manque de souplesse, mais qu’en sera-t-il demain,
lorsque l’entreprise souhaitera tirer partie du Big Data.

Il sera alors nécessaire que la DSI soit capable d’avoir les outils techniques performants
(technologies Big Data), mais aussi que la méthodologie utilisée pour traiter des évolutions du
SI puisse évoluer vers un cycle beaucoup plus court (adaptation à l’instantanéité) tout en
maintenant la rigueur permettant d’assurer la stabilité et la fiabilité du SI opérationnel
existant.


                                               29
4.2 Enquête auprès des acteurs SI et Marketing

Le Big Data étant un concept récent, il était intéressant de soumettre un questionnaire pour
sonder l’opinion d’acteurs potentiellement intéressés par ce sujet.

       4.2.1 La méthodologie d’enquête

La méthodologie utilisée pour réaliser cette enquête est la suivante :

       La population ciblée est celle des cadres travaillant dans les directions SI et
       Marketing des entreprises des secteurs des TIC.( 83 % des sondés travaillent dans le
       domaine des TIC)

       Il s’agit d’une enquête en ligne utilisant l’outil « Google document ». Le lien vers ce
       questionnaire a été publié sur les réseaux sociaux professionnels (linkedin, twitter) et
       transmis directement à la population cible.

       Le questionnaire, présenté en Annexe 1, comprend :

       o Une introduction qui rappelle le contexte de l’émergence du Big Data. Cette
           phrase d’accroche a pour but de capter l’attention du sondé et de l’inciter à
           répondre à une question simple : « Avec l’essor d’Internet, des réseaux sociaux,
           des usages mobiles, une quantité impressionnante de données se retrouvent sur le
           WEB chaque seconde dans le monde. Comment gérer ces données, que faire de ces
           millions d'informations que nous déposons chaque jour sur la toile ? Le nouveau
           concept "Big Data" regroupe des technologies pouvant gérer, stocker et analyser
           en temps réel tous ces données et contenus hétérogènes afin d'en extraire des
           informations pertinentes … Mine d'or pour certains, Illusion pour d'autres ... Et
           vous quel est votre avis ? »

       o Un premier thème qui est visible, est lié à la question posée en titre du
           questionnaire sur « la connaissance du Big Data ». Il permet de faire un état des
           lieux de la connaissance du Big Data auprès des sondés.

       o Un deuxième thème caché. Il s’agit d’analyser d’une part, si l’opinion des sondés
           sur le Big Data est positive ou négative et d’autre part, s’ils estiment que c’est
           uniquement un concept à la mode mis en avant par ceux qui le vendent (éditeurs
           logiciels), ou s’il y a un réel intérêt pour l’entreprise à utiliser ces technologies.




                                                30
4.2.2 L’analyse des résultats

L’enquête a été réalisée du 26/07 au 26/08/12 et a donné lieue à 36 réponses. Les réponses
brutes sont présentées en Annexe 1.



Concernant le premier thème « connaissance du Big Data », on constate que :

       La population qui a répondu s’intéresse aux nouvelles technologies (97% des
       personnes interrogées) et la moitié indique connaitre le concept Big Data (53%).

       La question liée à la solution Hadoop permet de vérifier que seuls 47% ont en
       vraiment une connaissance approfondie.

       Les personnes connaissant le Big Data utilisent déjà des solutions Coud computing
       dans leurs entreprises (61% des sondés).

       L’analyse approfondie des résultats montre que les personnes connaissant le Big Data
       travaillent notamment dans le domaine du conseil (Solucom, Devoteam, …) ou de la
       Business Intelligence (123 open Data, Bizzneo, iAdvize, …).

       En répondant à 83% que le Big Data sert à l’analyse et l’exploitation des données, les
       sondés (y compris ceux qui ne connaissent pas le Big Data) montrent qu’ils en
       comprennent l’utilité.

   Ce premier point est intéressant car il confirme bien que ce concept est en train de se
   mettre en place et que l’on commence à s’y intéresser.



Concernant le deuxième thème qui était de « faire ressortir la perception qu’ont les sondés du
Big Data » :

L’enquête montre que cette perception est très positive car la plupart des sondés (y compris
ceux qui déclarent ne pas connaitre le Big Data) pensent que cela va apporter de la croissance
(89%), permettre de devancer les concurrents (72%) et que la gestion des données est une
mine d’or d’information pour l’entreprise (86%).




                                             31
C’est assez étonnant car on aurait pu croire que ce nouveau concept allait être associé :

       o A une notion de Big brother avec une crainte pour l’utilisation des données
           personnelles (43%).

       o Ou un simple concept marketing mis en avant par les éditeurs de logiciels
           (seulement 6 %).



Pour finir la majorité des personnes ont bien compris que le Big Data allait plus profiter aux
nouveaux acteurs du Web (72%), aux fonctions Marketing (69%) et aller améliorer les
relations entre les informaticiens et le marketing (69 %).




                                               32
4.3 Les enjeux et impacts du Big Data pour les entreprises

Pour le cabinet McKinsey, conseil en stratégie d’entreprise, le Big Data constitue « le
prochain cap pour l’innovation, la compétitivité et la productivité » [13]



La capacité à extraire ces données variées pour les analyser le plus rapidement possible est un
défi technologique à venir pour les entreprises travaillant dans le domaine du e-business car il
faudra satisfaire les besoins d’une société de plus en plus tournée vers l’instantanée.

La solution réside dans l’utilisation des nouvelles technologies comme le Big Data pour
répondre aux objectifs des directions marketing et donner les moyens aux directions
informatiques d'étendre leur périmètre afin de combiner informatique et marketing pour
maitriser les données relatives au client. Cela en devient stratégique pour l’entreprise pour
réussir dans la « décennie digitale » à venir.



Avec l’arrivée des technologies Big Data, il est fondamental de se poser plusieurs questions
comme celle de l’impact sur le marché ou de la valeur que cela va créer, ou encore comment
ces nouvelles technologiques vont changer la stratégie, les processus et les performances de
l’entreprise ?

Cette analyse est abordée selon les axes suivants :

       Le challenge technologique,

       L’enjeu économique,

       L’impact organisationnel.




                                                 33
4.3.1 Le challenge technologique

L’un des enjeux du Big Data pour l’entreprise est de s’adapter en investissant dans les
nouvelles technologies qui touchent au stockage et à l’analyse des données.

          L’investissement en capacité de stockage

          Traiter l’augmentation de stockage avec les systèmes actuels reviendrait à faire
          exploser les budgets d’investissement informatiques.

          Même si cela était possible, il y aurait deux autres problèmes à résoudre :

          o Celui de la place pour stocker les données car les entrepôts de données de
               l’entreprise seraient bien vite saturés. Devant le volume de données à traiter, il
               faudrait ajouter des quantités de disques et baies de stockage supplémentaires et on
               se retrouverait rapidement en limite de place en mètres carrés.

          o De plus, la dépense en énergie électrique nécessaire au fonctionnement des
               entrepôts de données ajouterait des dépenses aux budgets de fonctionnement des
               entreprises.



          Les nouvelles technologies Big Data permettent l’évolution du stockage vers des
          systèmes distribués13, grâce à l’infrastructure du Cloud computing. Cela correspond à
          répartir un même fichier sur plusieurs systèmes et permet de rationnaliser les volumes
          de stockage.



          Investissement dans l’analyse

          La valeur des technologies Big Data provient également des croisements entre sources
          de données diverses, structurées ou non. L’entreprise doit investir dans ces techniques
          pour disposer de leur puissance d’analyse.

          On distingue :

          o Le Web sémantique qui permet d’utiliser toutes les ressources d’Internet et de
               croiser ces données avec n’importe quelle autre donnée du Web.

13
   Un système distribué est un ensemble d’entités autonomes de calcul (ordinateurs, PDA, processeurs, processus, processus léger etc.)
interconnectées et qui peuvent communiquer.


                                                                 34
Il permet ainsi de simplifier la création de valeur à partir des données analysées.

   C’est par exemple ce que propose Google dans sa toute nouvelle fonction
   « Knowledge Graph », une immense base de données qui permet d'obtenir des
   réponses pointues.

o Les nouvelles techniques de Datamining : Des nouvelles techniques sont en train
   de se développer, celles-ci améliorent les techniques traditionnelles (les
   associations, les classifications, les algorithmes ….) :

    Le crowdsourcing : remontée via les réseaux sociaux de données ou
      d’informations suite à un appel à contribution,

    L’analyse de sentiments : recherche des opinions à partir de l’analyse textuelle,

    L’analyse de réseaux : techniques permettant d’identifier des leaders d’opinion
      et leur pouvoir de prescription dans des réseaux sociaux en particulier.




                                       35
4.3.2 L’enjeu économique

IDC14 évalue le taux de croissance des technologies Big Data annuel moyen de 39,4%, ce qui
devrait le faire passer, en cinq ans, de 3,2 milliards de dollars en 2010 à 16,9 milliards de
dollars en 2015.

« Un marché qui devrait donner du grain à moudre à l’ensemble du secteur informatique
puisque le cabinet d’étude estime que sur ce montant global d’investissement, 40% seront
consacrés aux Services et 30% au logiciel » [14]



Dans une étude récente le cabinet McKinsey qualifie le phénomène Big Data de « nouvelle
frontière de l’innovation de la compétition et de la productivité ». [15]

Cette étude montre que la maîtrise des données (capacité à les analyser) aura un impact sur
l’aide que l’informatique va apporter aux métiers pour trouver de nouveaux axes de
compétitivité. Par ailleurs, elle précise que l’exploitation du Big Data pourrait permettre :

          d'économiser plus de 250 milliards d’Euros sur l'ensemble du secteur public
          Européen (identification des fraudes, gestion et mesures de l'efficacité des
          affectations des subventions et des plans d'investissements, ...).

          un surplus global de 600 milliards de dollars pour le secteur des sites marchands
          grâce à l’utilisation des données de géo-localisation (campagne de promotion destinée
          aux clients a proximité du magasin, …)

Selon les analystes Mc Kinsey, la gestion des nombreuses données avec les outils actuels
aurait déjà un impact sur la productivité, ces dernières années. L’utilisation de façon effective
des technologies Big Data, permettrait « une augmentation potentielle des marges
d’exploitation pouvant atteindre 60% ».

Par ailleurs, le cabinet indique que l’ensemble des couches du SI sont désormais mobilisées et
optimisées pour permettre une valorisation métier des données, qu’elles soient structurées ou
non. Il prévoit ainsi qu’en 2016, 7% du Chiffres d’Affaires généré par les ventes de serveurs
concernera des infrastructures destinées au seul Big Data.



14
  IDC est un acteur majeur de la Recherche, du Conseil et de l’Évènementiel sur les marchés des Technologies de l’Information, des
Télécommunications et de la Communication


                                                               36
Dans l'étude «Big data: harnessing a game-changing asset», de The Economist Intelligence
Unit, publiée en septembre 2011, on constate que les entreprises qui utilisent intelligemment
leurs données voient leur croissance augmenter de 5 à 6 % en moyenne. [15]

La figure ci-après présente la liste des revenus prévisionnels issus de la vente de technologies
Big Data sur l’année 2012. [17]




              Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17]




De l’avis de Forbes, ces entreprises ont devant elles une énorme opportunité d’accroitre leurs
revenus en offrant des services d’accompagnement pour aider les entreprises à adopter le Big
Data.



Toutes ces études, même si elles restent prospectives, montrent que la tendance auprès des
cabinets spécialisés est de considérer le Big Data comme une technologie porteuse et pleine
d’avenir.



Avant, les entreprises travaillaient dans un contexte où la production de la donnée était
coûteuse, elles devaient alors en limiter la production. Maintenant, ce problème est révolu car
les données sont presque gratuites et abondantes. Ce qui est important, ce n’est plus de
produire les données mais plutôt de les manier, de les exploiter, c’est donc l’efficacité de
l’exploitation et non plus de la production de données qui prime.




                                                     37
L’exploitation de ces données massives dépend de la stratégie et du besoin de l'entreprise.

Ainsi Tesco et Walmart15 suivent deux stratégies différentes :

             Tesco à fait le choix de croiser les données pour personnaliser les offres selon client
             (profiling)

             et Walmart plutôt celui de récupérer des données externes (météo, ventes...) pour
             permettre l’optimisation de la gestion des stocks (prédiction).



Par l’agrégation et le traitement de ces données, de nouveaux business models émergent en
concevant de nouveaux services.

C’est le cas du marché du Web analytics qui génère déjà plusieurs milliards d’euros sur des
outils et des services. Cette technique d’analyse des comportements permet d’élaborer des
micro segmentations des scores d’appétence (le calcul qui donne la probabilité qu’un prospect
devienne client) ou de churn (le calcul qui permet de connaitre le taux de perte d’un client)
qui sont nécessaires pour personnaliser la relation et les offres proposées au client. C’est le
domaine le plus exploité aujourd’hui par le Big Data.

En effet, la collecte et l’analyse des informations du parcours client, de son comportement
lors d’un achat sur les sites Internet et le temps passé vont permettre :

             Une optimisation des pages web et une amélioration de l’expérience utilisateur en
             apportant des modifications aux sites pour une meilleure rentabilité,

             L’accélération du développement de nouveaux produits et leur adaptation au plus près
             des attentes et des usages du client,

             De faire de la veille ou de la prévision en tirant parti des dialogues continus du web
             social pour surveiller des tendances.




15
     La firme anglaise Tesco est la troisième plus grande chaîne de commerce. Walmart est le premier groupe mondial de grande distribution,


                                                                     38
Un bon exemple est celui des « pures players »: Ces acteurs majeurs du Web, tels que
Google, Facebook, Amazon, ont montré leur capacité à transformer l'information en résultats
économiques et ont été les précurseurs de ces nouveaux business models en constituant ces
grosses bases de connaissances sur leurs clients, produits, fournisseurs, ...

Le modèle économique de base de Google, la publicité contextuelle, s’appuie sur l’analyse en
masse des comportements pour cibler de manières fines certaines niches de marché.

C’est aussi le cas pour Facebook : Son business model est basé sur la monétisation des
informations personnelles et contenu de ces adhérents.



On a cité l’exemple du Web mais la création de la valeur par la connaissance client reste
possible dans n’importe quel domaine.

Par exemple, dans le secteur bancaire, l’analyse des flux de transactions permet de détecter en
temps réel des fraudes bancaires et de déclencher automatiquement le blocage d’une carte de
crédit.



En synthèse, l’utilisation du Big Data améliorera sans doute la compétitivité d’une
entreprise face aux concurrents en lui permettant d’être plus réactive face aux besoins,
exigences et intérêts de ses clients.




                                                39
4.3.3 Impact organisationnel

L’intégration des nouvelles technologies Big Data dans les entreprises va entraîner des
changements en termes de gouvernance et organisationnels.

Le volet de l’impact organisationnel est abordé ici sous deux angles :

       La conduite du changement, où comment l’entreprise va être amenée à gérer son
       adaptation vers un nouveau mode de fonctionnement

       L’apparition de nouveaux métiers.



a) La conduite du changement

L’intégration du Big Data dans une entreprise risque d’entraîner une rupture de son
organisation : Elle devra modifier sa manière de travailler pour s’adapter à ce nouvel
écosystème (arrivée de nouveaux acteurs, renforcement de la concurrence, importance des
réseaux sociaux, changement de la relation client, …).

Un manque d’adaptation de l’entreprise pour canaliser le Big Data la mettrait dans des
situations à risque : Cela peut être, par exemple, une perte de productivité des employés, une
dégradation de la réputation de l'entreprise ou de ses produits, ou encore l’incapacité à
recommander et personnaliser la bonne offre à chaque client.

Pour réussir cette transformation, il est nécessaire d’adopter un changement de mentalité au
sein de l’entreprise. C’est toute la réflexion métier qui est différente car les données, en
permettant d'obtenir de nouvelles informations, deviennent le pilote de la stratégie de
l’entreprise. La priorité réside bien dans la maîtrise de la donnée.



Les décideurs doivent être sensibilisés à la valeur de la donnée. Pour cela il faut arriver à les
convaincre de l’intérêt qu’il y a à exploiter ces données, en développant deux axes :

       Le renforcement de l’efficacité des métiers et notamment la relation Marketing –
       Client (connaissances client),

       Mais aussi la capacité, pour les donneurs d’ordre, à tirer des synthèses d’aides à la
       décision (tendances du marché, …).


                                               40
Cela leur permettra d’adapter la stratégie de l’entreprise pour créer de la richesse à partir de
ces données.



Pour atteindre un degré d’efficacité, il faut un partenariat renforcé entre les équipes
informatique et marketing qui seront les acteurs du Big Data dans l’entreprise.

Pour arriver à améliorer le fonctionnement actuel décrit au §4.1, il sera nécessaire :

          pour les équipes informatiques :

          o d’arriver à mettre en place des cycles toujours plus courts et plus orientés « time to
                market»16, pour les évolutions demandées par les équipes marketing, tout en
                conservant la fiabilité du système opérationnel,

          o et mettre à disposition du marketing des interfaces adaptées (outils ergonomiques
                directement accessibles depuis le poste de travail de l’utilisateur) et des procédures
                simplifiées (administration des droits utilisateurs, accès aux outils et bases de
                données, support utilisateur réactif, …), qui leur permettront de réaliser de manière
                autonome leurs requêtes sur le SI.

          pour les équipes marketing, de s’approprier les outils mis à leur disposition pour
          qu’elles arrivent à formuler les bonnes requêtes adaptées à leur besoins. En étant à
          même de maîtriser leurs requêtes, les services marketing n’en seront que plus
          performants.

          Enfin, de faire émerger un nouveau modèle de collaboration entre l’informatique et le
          marketing pour renforcer la synergie entre ces équipes.

          En effet, actuellement la DSI détient la donnée qui est utile au Marketing. Ce dernier
          est donc tenté de peser de plus en plus sur la gouvernance de la DSI.

          D’un autre côté, avec l’importance prise par la donnée dans un environnement Big
          Data, la DSI pourrait être amenée à étendre son rôle vers l’analyse de cette donnée.

          Cette nouvelle collaboration pourrait passer par la mise en place d’une structure
          transverse à la DSI et au Marketing, qui serait en charge de la gouvernance du
          programme Big Data dans l’entreprise.


16
  Time-to-market : terme utilisé pour exprimer le délai nécessaire pour le développement d’un projet et sa mise en place avant sa mise en
service ou son lancement sur le marché


                                                                  41
b) L’apparition de nouveaux métiers

Les entreprises sont obligées de trouver et de mettre en place de nouvelles solutions
analytiques complexes dédiées aux Big Data et pour cela, elles doivent investir en outils
spécialisés mais aussi en ressources humaines.

L’un des enjeux du Big Data sera aussi lié aux compétences d’analyse.

Ces nouvelles technologies nécessitent de nouvelles compétences, notamment des Data
scientist17, profils rares car il n'existe pas encore d’écoles proposant des formations
académiques pour les former. Ces profils requièrent une double compétence en
mathématiques et en analyse qui leur permet d’extraire du sens et de rendre les données
intelligibles.

Cette pénurie de compétences qualifiées risque d’entraver l’exploitation du Big Data ou d’en
délocaliser une partie de son exploitation.




 Data scientist : métier désignant les nouveaux rôles d’analystes liés au Big Data et disposant d’une double compétence Mathématiques –
17

Analytique


                                                                 42
4.4 Big Data dans les télécoms : l’étude de cas ORANGE




  Non publié .




                              43
5.          CONCLUSION
Le déluge de données est un phénomène de société qui est amené à croître dans les prochaines
années et le Big Data pourrait bien devenir la prochaine grande révolution technologique.

En effet, nous assistons au développement de nouveaux outils performants d’analyse et de
gestion de données qui marquent une rupture technologique avec le monde actuel des bases
de données relationnelles.

Avec ce nouveau concept, l’entreprise doit commencer une réflexion autour de ses besoins et
objectifs et mettre en place la stratégie adéquate pour s’adapter à ce nouvel écosystème.

                                      Périmètre des technologies Big Data


        Business Intelligence                  Business Analytics                       Exploitation
      Exploitation indirecte des             Exploitation directe des                       des
        données (reporting)                          données                             données


                                          SGBD                                           Gestion des
                                                                                           données
                  ERP                                                                  ( SI, Marketing)
                                        CRM



                                                                                       Stockage des
              Stockage de données / Cloud Computing                                      données




                        Réseaux Opérateurs                                          Transport des données



                                                                                       Générations des
                                                                                            données
                                                                                       struturées / non
                                                                                          structurées

                                   Figure 9 : Périmètre des technologies Big Data




                                                        44
Le Big Data ne concerne pas que les entreprises. Le secteur public peut y trouver
également un intérêt. D’ailleurs, l’Etat français a lancé récemment un appel à projets
consacré au Big Data pour la mise en place de ces technologies autour des données publiques.
[18]

Ces projets pourraient concerner :

       la sécurité publique et la lutte contre le terrorisme par le recoupement d’informations
       provenant des services de sécurité (police, gendarmerie, renseignements).

       La lutte contre la fraude fiscale,

       La santé publique (télédiagnostics, téléconsultation…).


Enfin, il existe des menaces au développement du Big Data qui sont liées :
       Aux aspects juridiques :

       Les freins proviendront de toutes les questions liées à la réglementation juridique à
       mettre en place autour de ces nouvelles technologies.
       Plusieurs questions peuvent être posées :
       o Quelle est l’obligation de conserver les données (traçabilité de l’information) et le
           délai légal de conservation ?

       o La propriété de la donnée stockée,

       o A-t-on une obligation à détruire les données que l'on stocke ?

       o Le respect de la vie privée et du droit à l'oubli.



       A la sécurité de l’information :

       Plus de données manipulées appelle une sécurité renforcée du Système d’Information
       et de la gestion du droit d’accès à ces données. Il sera nécessaire de cloisonner les
       données en fonction du droit d’en connaître des utilisateurs.




                                              45
ANNEXE 1 : ENQUETE D’OPINION SUR LE
BIG DATA
Questionnaire et Résultats bruts de l’enquête




                                       46
47
48
49
ANNEXE 2 : GUIDE D’ENTRETIEN POUR
   L’ETUDE DE CAS
Ce guide a servi de fil conducteur aux entretiens qui ont été menés.

   1) Qu’est ce que le Big Data ?

   2) Quels sont les projets Big Data d’Orange

   3) Pourquoi parle-t-on toujours du Cloud et du Big Data ensemble ?

   4) Quels sont les clients qui l’utilisent, pour quels usages ?

   5) Pourquoi à la Direction du SI France, on ne parle pas du tout du Big Data, nous
       n’avons aucun projet à l’horizon 2015 sur ce sujet ?

   6) Quels sont les besoins en Big Data d’Orange pour ses besoins internes ?

   7) Quelles sont les opportunités et les difficultés du Big Data pour Orange ?

   8) Est-ce que le Big Data va changer nos manières de travailler entre le marketing et
       l’informatique pour gérer des projets et vendre nos solutions et produits ?

   9) Sommes ou serons-nous pilotés par la donnée ?

   10) Que pensez-vous de cette déclaration : « L'entreprise du 21ème siècle doit maîtriser
       l'information ou disparaître ».

   11) Quelle peut être la stratégie de cohérence, de fiabilité, de qualité des données entre
       nos différentes entités pour réussir à intégrer le Big Data ?

   12) A qui va profiter le Big Data dans l’entreprise : aux fonctions marketing et/ou à la
       DSI ?

   13) Est-ce que cela va rendre notre entreprise plus compétitive ?




                                               50
ANNEXE 3 : SOURCES ET BIBLIOGRAPHIE
[1] Devideo «Six provocations au sujet du phenomène Big Data» Taken from Kranzberg,
Melvin (1986) Technology and History: "Kranzberg's Laws", Technology and Culture, Vol.
27, No. 3, pp. 544-560 - <http://www.decideo.fr/Six-provocations-au-sujet-du-phenomene-
des-Big-Data_a4532.html> - Septembre 2011

[2] Frenchweb « Etudes McKinsey » - <http://expert.frenchweb.fr/tag/mckinsey/> - Juin 2012

[3] Le monde .fr « Le cimetière des exaoctets » -
<http://www.lemonde.fr/vous/article/2012/06/19/le-cimetiere-des-
exaoctets_1721206_3238.html> - Juin 2012

[4] Blog-Devost « Big Data ,petites réfléxions » - <http://blog.dewost.com/big-data-petites-
reflexions> - Juin 2012

[5] Le Webmarketeur « Infographie, les chiffres clés d’internet en France en 2011 » -
<http://www.le-webmarketeur.com/2012/01/06/infographie-les-chiffres-cles-
d%E2%80%99internet-en-france-en-2011/> - Décembre 2012

[6] Dofollow.bz « les chiffres clés d’Internet » -
<http://dofollow.bz/?post/2012/01/10/Chiffres-cles-Internet-France-10-ans> - Janvier 2010

[7] Fevad « Les chiffres de la consommation digitale en France » -
<http://www.fevad.com/uploads/files/Etudes/chiffrescles/chiffres_cles2012.pdf> - Juin 2012

[8] 20minutes « Facebook, 27 milliards de likes par jour » -
<http://www.20minutes.fr/web/facebook/989615-facebook-27-milliards-likes-chaque-jour> -
Aout 2012

[9] Blog Waebo «Augmentation exponentielle du nombre de tweets par jour» -
<http://www.waebo.com/twitter-augmentation-exponentielle-du-nombre-de-tweets-par-
jour.html> - Février 2010

[10] Information IT pour les TPE/PME, ITespresso – <http://www.itespresso.fr/youtube-
media-mastoc-defaut-mass-media-55152.html> - Juillet 2012

[11] Le Blog des nouvelles technologies « Infographie, quelle quantité de contenu est publiée
quotidiennement sur le web » - <http://www.blog-nouvelles-




                                               51
technologies.fr/archives/3338/infographie-quelle-quantite-de-contenu-est-publiee-
quotidiennement-sur-le-web/> - Avril 2011

[12] Journal du net « les ventes de tablettes 2011 » -
<http://www.journaldunet.com/solutions/systemes-reseaux/ventes-de-tablettes-en-
2011.shtml> - Novembre 2011

[13] 01net « Big data, la prochaine révolution informatique » -
<http://pro.01net.com/editorial/535404/big-data-la-prochaine-revolution-informatique/> -
Juillet 2011

[14] Le mag IT « Big Data : des besoins forts, un concept diffus, un marché en phase de
lancement » - <http://www.lemagit.fr/article/sap-sybase-big-data/11354/1/big-data-des-
besoins-forts-concept-diffus-marche-phase-lancement/> - Mai 2012

[15] Mc Kinsey.com « Big Data: The next frontier for innovation, competition, and
productivity » - <htpp://wwwmckinsey.com/mgi/publication/big_dara/index.asp> - Mai 2012

[16] e-marketing « Big data: le plus grand risque est de ne rien faire » <http://www.e-
marketing.fr/Marketing-Direct/Article/-Big-data-le-plus-grand-risque-est-de-ne-rien-faire--
42524-1.htm>Janvier 2012

[17] Forbes - Big Data is a big market business»
<http://www.forbes.com/sites/siliconangle/2012/02/17/big-data-is-big-market-big-business> -
Février 2012

[18] Site du gouvernement français « Appel à projets Big Data » - <http://investissement-
avenir.gouvernement.fr/content/lancement-de-lappel-%C3%A0-projets-consacr%C3%A9-au-
big-data> - Mars 2012




                                               52

Contenu connexe

Tendances

Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
Jean-Marc Dupont
 
Mémoire Master Marketing Digital - Sharitiz
Mémoire Master Marketing Digital - SharitizMémoire Master Marketing Digital - Sharitiz
Mémoire Master Marketing Digital - Sharitiz
Philippe JEAN-BAPTISTE, Executive MBA, MSc, MA
 
Mémoire Les nouvelles technologies, les marques et la grande distribution
Mémoire Les nouvelles technologies, les marques et la grande distributionMémoire Les nouvelles technologies, les marques et la grande distribution
Mémoire Les nouvelles technologies, les marques et la grande distribution
Benjamin Richard
 
Mémoire de fin d’études : Master II Big Data et fouille de données
Mémoire de fin d’études : Master II Big Data et fouille de donnéesMémoire de fin d’études : Master II Big Data et fouille de données
Mémoire de fin d’études : Master II Big Data et fouille de données
Camelia Mastani
 
Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)
Adrien Tilhet-Prat
 
Memoire - MBA management et marketing digital
Memoire - MBA management et marketing digitalMemoire - MBA management et marketing digital
Memoire - MBA management et marketing digital
EmilieThoorens
 
Mise en place d'une stratégie de marketing digital
Mise en place d'une stratégie de marketing digital Mise en place d'une stratégie de marketing digital
Mise en place d'une stratégie de marketing digital
Karim Ben Alaya
 
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélité
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélitéMémoire Master Moi 2011 Armelle Nguyen programme de fidélité
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélité
Master MOI
 
Mémoire de recherche - Le comportement du consommateur sur le web
Mémoire de recherche - Le comportement du consommateur sur le webMémoire de recherche - Le comportement du consommateur sur le web
Mémoire de recherche - Le comportement du consommateur sur le web
Jérôme Lacoste
 
Big data
Big dataBig data
Mémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et PersonnalisationMémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et Personnalisation
Pamela Desvignes
 
Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)
NRB
 
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerceMémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
Anaïs Thubert
 
Mémoire de recherche - Community management et stratégie média social en B2B
Mémoire de recherche - Community management et stratégie média social en B2BMémoire de recherche - Community management et stratégie média social en B2B
Mémoire de recherche - Community management et stratégie média social en B2B
Nicolas Durand
 
Rapport pfe isi_Big data Analytique
Rapport pfe isi_Big data AnalytiqueRapport pfe isi_Big data Analytique
Rapport pfe isi_Big data Analytique
Yosra ADDALI
 
Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y
Julia Marras
 
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
Gilles Côme Kouassi
 
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
Bernard Gaudin
 
Transformation digitale
Transformation digitaleTransformation digitale
Transformation digitale
AmeniBoubaker2
 

Tendances (20)

Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Mémoire Master Marketing Digital - Sharitiz
Mémoire Master Marketing Digital - SharitizMémoire Master Marketing Digital - Sharitiz
Mémoire Master Marketing Digital - Sharitiz
 
Mémoire Les nouvelles technologies, les marques et la grande distribution
Mémoire Les nouvelles technologies, les marques et la grande distributionMémoire Les nouvelles technologies, les marques et la grande distribution
Mémoire Les nouvelles technologies, les marques et la grande distribution
 
Mémoire de fin d’études : Master II Big Data et fouille de données
Mémoire de fin d’études : Master II Big Data et fouille de donnéesMémoire de fin d’études : Master II Big Data et fouille de données
Mémoire de fin d’études : Master II Big Data et fouille de données
 
Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)
 
Memoire - MBA management et marketing digital
Memoire - MBA management et marketing digitalMemoire - MBA management et marketing digital
Memoire - MBA management et marketing digital
 
Mise en place d'une stratégie de marketing digital
Mise en place d'une stratégie de marketing digital Mise en place d'une stratégie de marketing digital
Mise en place d'une stratégie de marketing digital
 
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélité
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélitéMémoire Master Moi 2011 Armelle Nguyen programme de fidélité
Mémoire Master Moi 2011 Armelle Nguyen programme de fidélité
 
Mémoire de recherche - Le comportement du consommateur sur le web
Mémoire de recherche - Le comportement du consommateur sur le webMémoire de recherche - Le comportement du consommateur sur le web
Mémoire de recherche - Le comportement du consommateur sur le web
 
Big data
Big dataBig data
Big data
 
Mémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et PersonnalisationMémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et Personnalisation
 
Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)
 
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerceMémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
Mémoire - Les chatbots, nouveau support de la relation client dans le e-commerce
 
Mémoire de recherche - Community management et stratégie média social en B2B
Mémoire de recherche - Community management et stratégie média social en B2BMémoire de recherche - Community management et stratégie média social en B2B
Mémoire de recherche - Community management et stratégie média social en B2B
 
Pfe
PfePfe
Pfe
 
Rapport pfe isi_Big data Analytique
Rapport pfe isi_Big data AnalytiqueRapport pfe isi_Big data Analytique
Rapport pfe isi_Big data Analytique
 
Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y
 
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
ELABORATION D'UNE STRATEGIE DE COMMUNICATION POUR LE LANCEMENT D'UNE PLATEFOR...
 
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
Bibliographie mémoire - Réinventer la communication interne à l'ère collabora...
 
Transformation digitale
Transformation digitaleTransformation digitale
Transformation digitale
 

En vedette

Big Data, Better Understanding, Better Care
Big Data, Better Understanding, Better CareBig Data, Better Understanding, Better Care
Big Data, Better Understanding, Better Care
The Health and Social Care Information Centre
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayet
Kezhan SHI
 
Ethique et statistique en assurance : le cas du tarif unisexe
Ethique et statistique en assurance : le cas du tarif unisexeEthique et statistique en assurance : le cas du tarif unisexe
Ethique et statistique en assurance : le cas du tarif unisexe
R&A - Risk & Analysis
 
Assurance & Big Data
Assurance & Big DataAssurance & Big Data
Assurance & Big Data
Insurance_Marketing
 
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILVMastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Romain Jouin
 
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
Kezhan SHI
 

En vedette (6)

Big Data, Better Understanding, Better Care
Big Data, Better Understanding, Better CareBig Data, Better Understanding, Better Care
Big Data, Better Understanding, Better Care
 
Big data en (ré)assurance régis delayet
Big data en (ré)assurance   régis delayetBig data en (ré)assurance   régis delayet
Big data en (ré)assurance régis delayet
 
Ethique et statistique en assurance : le cas du tarif unisexe
Ethique et statistique en assurance : le cas du tarif unisexeEthique et statistique en assurance : le cas du tarif unisexe
Ethique et statistique en assurance : le cas du tarif unisexe
 
Assurance & Big Data
Assurance & Big DataAssurance & Big Data
Assurance & Big Data
 
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILVMastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
Mastère Big Data et Assurance de l'Ecole d'Ingénieur Léonard de Vinci - ESILV
 
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
F Ewald -- Assurance, prévention, prédiction ... dans l'univers du Big Data -...
 

Similaire à Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engohan- MBA ISC PARIS

Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Hélène Etienne
 
Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ? Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ?
Christina Galouzis
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big Data
Télécom Paris
 
Livre Blanc Big Data : fin ou renouveau du Marketing ?
Livre Blanc Big Data : fin ou renouveau du Marketing ?Livre Blanc Big Data : fin ou renouveau du Marketing ?
Livre Blanc Big Data : fin ou renouveau du Marketing ?Aproged
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Sparklane
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
Nexialog Consulting
 
Etude business transformation2015_sopragroup_01_bt
Etude business transformation2015_sopragroup_01_btEtude business transformation2015_sopragroup_01_bt
Etude business transformation2015_sopragroup_01_btFlorian Ferrando-Bohbot
 
Théorie des organisations
Théorie des organisationsThéorie des organisations
Théorie des organisations
Amina Yahyai
 
Théorie des organisations
Théorie des organisationsThéorie des organisations
Théorie des organisations
Amina Yahyai
 
Diemension stratégique si
Diemension stratégique siDiemension stratégique si
Diemension stratégique si
Yassir Zaaiter
 
Maîtriser concrètement le Big Data
Maîtriser concrètement le Big DataMaîtriser concrètement le Big Data
Maîtriser concrètement le Big Data
Soft Concept
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBG
Margarita Zlatkova
 
Introduction
IntroductionIntroduction
Introduction
Ines Slimene
 
Mergers and acquisitions screen
Mergers and acquisitions screenMergers and acquisitions screen
Mergers and acquisitions screen
Gdemichael
 
Les geants-du-web
Les geants-du-webLes geants-du-web
Les geants-du-web
Christophe Monnier
 
Dossier presse chaire-big-data-market-insights
Dossier presse chaire-big-data-market-insightsDossier presse chaire-big-data-market-insights
Dossier presse chaire-big-data-market-insights
Télécom Paris
 
cours edi
cours  edicours  edi
cours edi
Ayoub Elotmani
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesSAS FRANCE
 
Livre blanc digital rh 2016 v f
Livre blanc digital rh 2016 v fLivre blanc digital rh 2016 v f
Livre blanc digital rh 2016 v f
amaury baiges
 
Big data : avis d'Experts
Big data : avis d'ExpertsBig data : avis d'Experts
Big data : avis d'Experts
Linda Bor
 

Similaire à Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engohan- MBA ISC PARIS (20)

Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ? Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ?
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big Data
 
Livre Blanc Big Data : fin ou renouveau du Marketing ?
Livre Blanc Big Data : fin ou renouveau du Marketing ?Livre Blanc Big Data : fin ou renouveau du Marketing ?
Livre Blanc Big Data : fin ou renouveau du Marketing ?
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
 
Etude business transformation2015_sopragroup_01_bt
Etude business transformation2015_sopragroup_01_btEtude business transformation2015_sopragroup_01_bt
Etude business transformation2015_sopragroup_01_bt
 
Théorie des organisations
Théorie des organisationsThéorie des organisations
Théorie des organisations
 
Théorie des organisations
Théorie des organisationsThéorie des organisations
Théorie des organisations
 
Diemension stratégique si
Diemension stratégique siDiemension stratégique si
Diemension stratégique si
 
Maîtriser concrètement le Big Data
Maîtriser concrètement le Big DataMaîtriser concrètement le Big Data
Maîtriser concrètement le Big Data
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBG
 
Introduction
IntroductionIntroduction
Introduction
 
Mergers and acquisitions screen
Mergers and acquisitions screenMergers and acquisitions screen
Mergers and acquisitions screen
 
Les geants-du-web
Les geants-du-webLes geants-du-web
Les geants-du-web
 
Dossier presse chaire-big-data-market-insights
Dossier presse chaire-big-data-market-insightsDossier presse chaire-big-data-market-insights
Dossier presse chaire-big-data-market-insights
 
cours edi
cours  edicours  edi
cours edi
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usages
 
Livre blanc digital rh 2016 v f
Livre blanc digital rh 2016 v fLivre blanc digital rh 2016 v f
Livre blanc digital rh 2016 v f
 
Big data : avis d'Experts
Big data : avis d'ExpertsBig data : avis d'Experts
Big data : avis d'Experts
 

Dernier

PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptxPRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
AlbertSmithTambwe
 
Les écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptxLes écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptx
abderrahimbourimi
 
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
Horgix
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
OCTO Technology
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
UNITECBordeaux
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
OCTO Technology
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Laurent Speyser
 
COURS D'ADMINISTRATION RESEAU SOUS WINDOWS
COURS D'ADMINISTRATION RESEAU  SOUS WINDOWSCOURS D'ADMINISTRATION RESEAU  SOUS WINDOWS
COURS D'ADMINISTRATION RESEAU SOUS WINDOWS
AlbertSmithTambwe
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
Université de Franche-Comté
 

Dernier (9)

PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptxPRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
PRESENTATION DE L'ACTIVE DIRECTORY SOUS WINDOWS SERVEUR.pptx
 
Les écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptxLes écrans informatiques au fil du temps.pptx
Les écrans informatiques au fil du temps.pptx
 
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
MongoDB in a scale-up: how to get away from a monolithic hell — MongoDB Paris...
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
 
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
 
COURS D'ADMINISTRATION RESEAU SOUS WINDOWS
COURS D'ADMINISTRATION RESEAU  SOUS WINDOWSCOURS D'ADMINISTRATION RESEAU  SOUS WINDOWS
COURS D'ADMINISTRATION RESEAU SOUS WINDOWS
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
 

Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engohan- MBA ISC PARIS

  • 1. ISC Paris – MBA e-business 1
  • 2. Table des matières 1. Synthèse ............................................................................................................................. 4 2. Introduction ........................................................................................................................ 7 2.1 Exposé de la problématique ......................................................................................... 7 2.2 Méthodologie ............................................................................................................... 9 2.3 Limites de l’étude ........................................................................................................ 9 3. Présentation du contexte................................................................................................... 10 3.1 L’origine du Big Data ................................................................................................ 10 3.1.1 La généralisation d’Internet ............................................................................... 11 3.1.2 Les nouveaux usages .......................................................................................... 14 3.2 L’analyse du mot Big Data sur Internet ..................................................................... 18 3.3 Définition du Big Data .............................................................................................. 19 3.4 Ce qui a permis l’émergence du Big Data ................................................................. 23 4. Les enjeux du Big Data pour l’Entreprise ........................................................................ 27 4.1 Les relations entre les départements informatique et marketing ............................... 27 4.2 Enquête auprès des acteurs SI et Marketing .............................................................. 30 4.2.1 La méthodologie d’enquête ................................................................................ 30 4.2.2 L’analyse des résultats ....................................................................................... 31 4.3 Les enjeux et impacts du Big Data pour les entreprises ............................................ 33 4.3.1 Le challenge technologique ................................................................................ 34 4.3.2 L’enjeu économique ........................................................................................... 36 4.3.3 Impact organisationnel ....................................................................................... 40 4.4 Big Data dans les télécoms : l’étude de cas ORANGE ............................................. 43 4.4.1 Les solutions Big Data chez Orange Business ServicesError! Bookmark not defined. 4.4.2 La perception du Big Data chez Orange France. Error! Bookmark not defined. 2
  • 3. 5. Conclusion ........................................................................................................................ 44 Annexe 1 : Enquête d’opinion sur le Big Data ......................................................................... 46 Annexe 2 : Guide d’entretien pour l’étude de cas .................................................................... 50 Annexe 3 : Sources et Bibliographie ........................................................................................ 51 Table des figures Figure 1 : Tableau SWOT des enjeux du Big Data pour l’entreprise ........................................ 6 Figure 2 : L’évolution des techniques de stockage [2]............................................................. 11 Figure 3 : L’évolution de l’usage d’Internet en France [6] ...................................................... 13 Figure 4 : Evolution du volume de tweets transmis quotidiennement [9] ............................... 15 Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trends ......................... 18 Figure 6 : Acteurs liés au concept du Big Data ........................................................................ 19 Figure 7 : Logo d’Hadoop ........................................................................................................ 23 Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17] .......... 37 Figure 9 : Les étapes clés de transformation du SI vers l’innovation (Source : OBS – P. Bourhis) .................................................................................... Error! Bookmark not defined. Figure 10 : Périmètre des technologies Big Data ..................................................................... 44 Table des tableaux Tableau 1 : Tableau de conversion des unités de volume de données ..................................... 20 Tableau 2 : Solutions Big Data des principaux acteurs ............................................................ 24 3
  • 4. 1. SYNTHESE Le Big Data est un nouveau concept issu de la Silicon valley : Il comprend l’ensemble des technologies permettant de stocker, traiter et analyser des données et contenus hétérogènes afin d’en faire ressortir de la valeur et de la création de richesse pour les entreprises. Il est considéré par certains comme la prochaine révolution technologique. Son apparition est liée à l’essor de l’Internet et au développement de nouveaux usages (réseaux sociaux, produits connectés), car en augmentant de façon exponentielle nos données, ils créent ainsi un phénomène de déluge de données. S’il n’a pas encore de définition académique, le Big Data est caractérisé par les critères des «3V»: Volume, pour la quantité de données à stocker au-delà de l’Exa-octet, Vitesse, pour le traitement de ces données en quasi temps-réel, et Variété, pour la capacité à gérer des données structurées et non structurées. Les acteurs participant au développement de ce concept sont : Les acteurs majeurs du Web, Les éditeurs de logiciels, Les opérateurs télécoms. Les premières technologies Big Data ont été créées par les entreprises leaders du Web (Google, Amazon, Yahoo, …) car ce sont les premières qui ont eu à faire face à des problématiques de gros volumes de données à traiter en temps réel. Les technologies Big Data (Map reduce, Dynamo, Hadoop, …) s’appuient sur : Le Cloud computing, pour sa capacité à stocker de gros volumes de données, Les nouvelles méthodes d’analyses (Web sémantique, crowdsourcing, analyse de sentiments, …) qui permettent de croiser diverses sources de données et offrent de nouvelles possibilités d’analyse décisionnelle. 4
  • 5. La maîtrise des données grâce aux technologies Big Data, constituera une mine d’or d’information pour l’entreprise, et sera un facteur de différenciation pour l’entreprise du 21ème siècle. Google nous en fait la démonstration en ouvrant de nouveaux business models, grâce à ces masses de données qui étaient jusque là encore inexploitées. Ce nouvel écosystème, avec l’apparition des technologies Big Data, a entrainé un changement de paradigme pour le marketing : On est passé d’un marketing transactionnel (marketing produit) à un marketing relationnel (marketing client). C’est toute la relation marketing avec le client qui a changé, celle-ci est devenue plus directe, avec une portée plus étendue et demandant des réactions plus instantanées de la part de l’entreprise pour être efficace. L’intégration des technologies Big Data par les équipes en charge des données (DSI, marketing) passera par une adaptation des méthodes de travail et des processus pour que l’entreprise puisse tirer profit du data-déluge. Cela passe par un nouveau partenariat entre la DSI et le marketing. L’entreprise devra réfléchir à trois principaux enjeux : Le challenge technologique : Investir dans ces nouvelles technologies qui touchent au stockage et à l’analyse des données. L’enjeu économique : Créer de nouveaux business models en tirant profit des données pour créer de nouveaux leviers de croissance. L’impact organisationnel : Adapter son organisation et accompagner les équipes en charges des données vers cette nouvelle stratégie (conduite du changement), tout en anticipant l’apparition de nouveaux métiers (Data scientist). L’étude du cas Orange Business Services nous permet de voir comment la transformation globale de son SI l’a conduite vers la fourniture d’offres innovantes Big Data (plusieurs projets en cours). Le Big Data ne concerne pas que les entreprises. Le secteur public est également en train de réfléchir à la mise en place de ces nouvelles technologies (appel à projets de l’état français). 5
  • 6. Enfin, si cette révolution Big Data offre de « big promesses de croissance », il existe néanmoins des freins à son développement tels que le cadre réglementaire pour l’utilisation de ces données et les problèmes liés à la sécurité de l’information. Les enjeux du Big Data peuvent ainsi être résumés à partir du tableau SWOT1 suivant : Forces Faiblesses • Développement d’outils analytiques • Pénurie de compétences pour gérer performants aux services du marketing ces nouvelles technologies • Renforcement de la compétitivité • Conduite du changement • Développement de nouveaux business models Opportunités Menaces • Généralisation du Cloud computing • Cadre réglementaire non défini • Appels à projets publics (e-santé, …) • Sécurité de l’information Figure 1 : Tableau SWOT des enjeux du Big Data pour l’entreprise L’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par des investissements humains et matériels. Celles qui sauront tirer profit de leur capital « Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité et d’innovation. 1 SWOT : Méthode d’analyse selon quatre axes Forces (Strengths), Faiblesses (Weakness) Opportunités (Opportunities) et Menaces (Threats). 6
  • 7. 2. INTRODUCTION 2.1 Exposé de la problématique Depuis soixante ans, l’ordinateur, cette invention mathématique, nous permet de rentrer des informations et d’exécuter des programmes pour faciliter le traitement de nos données. Il est devenu au fil du temps, l’outil indispensable d’abord pour les entreprises, puis pour les particuliers. Si au début sa principale utilité consistait à réaliser des opérations complexes et à stocker des données, l’ordinateur trouva très vite ses limites par l’excès de données à traiter. Il fut alors inventé la base de données. Ainsi, à partir des années 1990, démarre l’exploitation des bases de données relationnelles dont la plus connue et généralisée à ce jour reste SQL (Simply Query Language)2. La base de données relationnelle constitue un ensemble structuré de données qui permet à l’utilisateur de gérer plus facilement ses données par l’envoi de requêtes simples. Dès lors, ces bases de données ont monopolisé le marché de stockage et de manipulation d’informations dans les Systèmes d’Information (SI) des entreprises et ont permis, entre autres, le développement des outils CRM (Customer Relationship Management – base de données traitant les données clients). Ces dix dernières années, les technologies de l'information ont envahi notre vie quotidienne et professionnelle. La nouvelle économie, ou e-business, a émergé grâce à Internet qui a permis leur interconnexion sur un réseau unique à l'échelle mondiale. Avec l’arrivée d’Internet, l’information s’est démocratisée et nous avons désormais accès à une multitude d’informations, traitée par des millions d’ordinateurs interconnectés entre eux. Au 21ème siècle, l’explosion de la donnée est en train d’atteindre toutes les entreprises et son expansion est le symbole d’une transformation économique et sociale globale. Cette explosion de données est aussi connue sous le terme de « Big Data ». 2 SQL : langage standard de description et de manipulation des données. La majorité des Systèmes de Gestion de Bases de Données (SGBD) actuels sont basés sur ce modèle. 7
  • 8. Le Big Data est annoncé comme la prochaine révolution informatique, illusion pour certains, véritable opportunité pour d’autres… C’est un sujet dont nous allons entendre parler encore un bon moment ! Aussi, devant l’émergence de ce nouveau concept, un certain nombre de questions se posent : Pourquoi parle-t-on aujourd’hui du Big Data et de ces déluges de données ? Qu’est ce que ce concept Big Data et comment est il apparu ? Avec ces masses de données, faut-il envisager des nouvelles méthodes d’analyse et de gestion de données inexplorées par l’entreprise et qui pourraient leur apporter de la valeur ajoutée ? Est-ce une vraie opportunité et quels sont les enjeux du Big Data pour les entreprises ? Enfin, Comme le dit Melvin Kranzberg “La technologie n’est ni bonne, ni mauvaise, ni neutre… L’interaction entre la technologie et l’écosystème social est telle que les développements techniques ont des conséquences environnementales, sociales, et humaines qui dépassent de loin les objectifs des appareils techniques et des pratiques elles-mêmes.” [1] L’arrivée des nouvelles technologies changeant nos conditions de travail, il peut être intéressant de se demander si le Big Data imposera une nouvelle manière de travailler entre les équipes SI et Marketing. C’est sous cet angle que nous aborderons la problématique de cette étude. 8
  • 9. 2.2 Méthodologie Dans un premier temps il est important de faire une présentation du contexte lié au Big Data : Comprendre son origine, tenter d’en donner une définition et identifier les facteurs qui ont favorisé son émergence. C’est l’objet du chapitre 3 « Présentation du contexte ». Le chapitre 4 analyse les enjeux et les impacts du Big Data pour l’entreprise en focalisant sur les relations entre les acteurs informatiques et marketing. Cette analyse dresse tout d’abord un état des lieux des relations actuelles et des problèmes et limites auxquels elles sont confrontées, puis étudie les apports potentiels du Big Data et les impacts associés. L’analyse est consolidée par une enquête auprès d’acteurs concernés par le sujet sur leur connaissance actuelle et leur appréciation du Big Data, ainsi que de l’étude d’un cas pratique avec le cas Orange, afin de mettre en perspective l’intégration de cette technologie Big Data dans l’entreprise. La conclusion (chapitre 5) permet d’ouvrir le champ des investigations et notamment celles des freins au développement du Big Data. 2.3 Limites de l’étude Le Big Data étant un sujet récent, les ouvrages qui lui sont consacrés sont rares et exclusivement rédigés en Anglais3. Cette étude est donc uniquement basée sur des recherches effectuées sur le Web. De plus, la problématique étant principalement analysée sous l’angle des relations entre le SI et le Marketing, les détails techniques ou réglementaires du Big Data ne sont pas abordés. 3 On citera par exemple l’ouvrage « Big Data: High-Impact Strategies - What You Need to Know: Definitions, Adoptions, Impact, Benefits, Maturity, Vendor - Kevin Roebuck » 9
  • 10. 3. PRESENTATION DU CONTEXTE Cette section décrit l’origine du phénomène Big Data, en donne une définition et identifie les facteurs qui ont favorisé son émergence. 3.1 L’origine du Big Data Au début notre communication était analogique : voix humaine, courrier postal, photographie argentique, … . Avec l’'arrivée de l’électronique et de l’informatique, on est passé progressivement dans le monde du numérique. La numérisation est le moyen technique de transformer de l’information et de passer d’un signal analogique (son, image,…) à un signal numérique (information codée) exploitable par l’informatique. Cette action de numérisation transforme le support initial en donnée informatique (fichier électronique, …). Au fil du temps, la numérisation a concerné tous les supports qu’ils soient sous forme de papier (photo, fax, …), de vidéo, de voix (musique, voix téléphonique, …). Si la numérisation est à la base de la création de la donnée informatique, l’explosion de cette donnée est arrivée au début des années 2000 avec le boom Internet. Deux facteurs principaux sont à l’origine de l’apparition du Big Data, en augmentant de façon exponentielle et quotidienne nos données, engendrant ainsi un phénomène de déluge de données : La généralisation de l’usage d’Internet, L’apparition de nouveaux usages. 10
  • 11. 3.1.1 La généralisation d’Internet La généralisation d’Internet à travers le monde a engendré de plus en plus de données. Il est intéressant de donner quelques chiffres pour mieux se représenter cette accumulation de données. L'humanité a produit environ 5 Exaoctets (Eo)4 de données depuis l’avènement de l’informatique jusqu'en 2003. L’amélioration des techniques de stockage et la diminution des coûts ont accompagné cette croissance de données en donnant la capacité de stocker toujours plus de données sur des supports de plus en plus petits et de moins en moins chers. A titre d’illustration, l’image ci-dessous représente l’évolution de ce stockage, avec : à gauche, une baie de stockage en 1980, avec une capacité de 20 Go, pour un coût du Go estimé entre 32 000 et 57 000 $, à droite, une carte Micro SD en 2010, disposant d’une capacité de 32 Go, pour un coût du Go situé entre 3 et 4 $. Figure 2 : L’évolution des techniques de stockage [2] 4 Un Exa-octet (Eo) équivaut à un milliard de Giga-octets (Go). 11
  • 12. Depuis 2007, l'humanité produit plus de données que de capacités à les stocker.[3] En 2010, on a produit cette même quantité de données (soit 5Eo) en deux jours environ. Une étude du cabinet McKinsey, datée de mai 2011, estime qu' « en 2010, les entreprises auraient stocké chacune en moyenne 7 Eo supplémentaires de données, et les particuliers 6 Eo. Pour donner un ordre de grandeur, 1 Eo représente environ 10.000 fois la capacité de la Bibliothèque du Congrès Américain. » [2] « 90 % de l'ensemble des données du monde ont été créées ces deux dernières années » estimait récemment Stephen Gold d'IBM lors d'une présentation au récent Webcom de Montréal. "Nous vivons un data-déluge : l'essentiel des données que nous utiliserons dans 2 ans n'aura rien à voir avec celles que nous utilisons aujourd'hui." [4] C’est la croissance du nombre d’internautes qui explique cette explosion de données. L’usage d’internet est en forte augmentation dans le monde entier, avec notamment 3,4 milliards d’utilisateurs estimés en 2016, soit près de 45 % de la population mondiale. [5] Ramené à la situation française, on constate que les internautes français sont très actifs sur le Web avec 38 millions de connectés qui y passent une moyenne de 2 heures par jour. La figure suivante donne une rétrospective de l’évolution de l’usage d’Internet en France sur une période de 10 ans : 12
  • 13. Figure 3 : L’évolution de l’usage d’Internet en France [6] On constate qu’entre 2002 et 2012 : 5 [7] Le nombre d’Internautes a plus que doublé, passant de 16 à 38 millions (+133 %), Le temps moyen de navigation d’un usager est passé de 6 heures à 65 heures par mois, L’adoption des abonnements haut-débit, permettant de disposer de débits d’accès supérieurs à 2 Mbits/s (voire jusqu’à 100 Mb/s avec la fibre optique), a accompagné le développement d’Internet, Enfin, si le marché des moteurs de recherches a vu naître le monopole du géant Google, celui des sites marchands (e-commerce) s’est largement étendu à une multitude de nouveaux acteurs. 5 Source : Baromêtre Fevad Mediamétrie/Netratings 13
  • 14. 3.1.2 Les nouveaux usages La généralisation d’Internet a permis de nouveaux usages qui ont à leur tour contribué à l’explosion des données informatiques. Les plus caractéristiques de ces nouveaux usages sont : Les réseaux sociaux Les réseaux sociaux (Facebook, Twitter, Linkedin, …) représentent un nouveau type de communication de groupe qui s’est imposé d’abord auprès des particuliers et qui aujourd’hui arrive dans l’entreprise. Ces réseaux génèrent de plus en plus en données en permettant à leurs membres de diffuser ou mettre en ligne des photos, des commentaires, des notes, … et de les partager avec les membres de leur communauté. L’internaute, qui au départ avait un rôle passif de lecteur sur Internet, devient désormais une source active en créant du contenu, entraînant ainsi une hausse des données produites sur le Web. Là encore, quelques chiffres permettent de mieux saisir l’importance du volume de données générées par les réseaux sociaux : o On peut lire dans cet article consacré à Facebook « Jay Parikh a ainsi levé le voile sur d’autres chiffres qui donnent autant le tournis : Facebook compte 2,7 milliards de « likes » ou mentions « j’aime » chaque jour et 2,5 milliards de contenus (statuts, photos, vidéos) sont partagés au quotidien sur le réseau social. » Le réseau social doit stocker l’équivalent de 500 téraoctets par jour [8] 14
  • 15. o 50 millions de tweets par jour transitent par les serveurs de Tweeter. [9] Figure 4 : Evolution du volume de tweets transmis quotidiennement [9] Les plateformes de contenus multimédias Aujourd’hui, nous avons accès à différents services de contenus via Internet, depuis notre télévision ou notre ordinateur personnel, qu’ils s’agissent de la Vidéo à la demande (VOD – Video On Demand) proposée par tous les Fournisseurs d’Accès Internet, ou de la diffusion de contenus par streaming pour regarder des films, écouter la radio ou de la musique à partir de notre PC. o YouTube, c’est 35 heures de vidéos chargées chaque minute et 2 milliards de clips vus chaque jour. [10] o Flickr représente 5 millions d’images ajoutées chaque jour, soit 60 photos par seconde. [11] La mobilité et les produits connectés Internet d’une part, mais aussi les réseaux mobiles de nouvelle génération disposant de hauts débits pour l’accès à Internet (téléphonie mobile de 3ème génération UMTS, puis la 4G ou LTE) et les nouveaux protocoles sans-fil pour les communications de proximité (RFID, NFC, Bluetooth, …) ont rendu possible deux nouveaux usages que sont : 15
  • 16. o La mobilité, qui consiste, pour l’utilisateur, à continuer à utiliser ses applications lorsqu’il est en déplacement. L’engouement pour les tablettes (63,6 millions de tablettes vendues dans le monde en 2011), l’explosion des ventes de smartphones (près de 10 millions de Français équipés en 2010) et la multiplication des accès mobiles via des bornes Wi-Fi (dans les hôtels, les restaurants, les magasins, …) en sont les exemples les plus représentatifs. [12] o La maison intelligente, qui regroupe la connexion à Internet d’une multitude d’appareils domestiques (TV, réfrigérateur, table de cuisson, compteur électrique intelligent, …). Tous ces produits connectés génèrent des masses de données considérables dans leur fonctionnement (traces d’appels, historiques de navigation, …). Avec l’essor de l’Internet, nos équipements (objets personnels, voitures, capteurs, etc.) communiqueront entre eux ainsi qu’avec des systèmes d’informations tiers (centrales d’achat, centres de sécurité, …) : Tout cela conduira à accroitre les volumes de données. On peut se donner une idée de l’importance du nombre (actuel et futur) de ces objets connectés, par la réflexion suivante : Chaque produit connecté est doté d’une adresse Internet publique, également désignée adresse IP du nom du protocole qui permet la transmission des données au sein du réseau Internet. A la création d’Internet ses inventeurs avait prévu un système gérant jusqu’à 4 milliards d’adresses en théorie (adresses IPv4), ce qui était considéré comme une ressource quasi-illimitée dans les années 1970. Le 3 février 2011, la dernière adresse IPv4 a été attribuée, imposant de passer à IPv6, nouvelle version du protocole IP, qui est conçu pour supporter 667 millions de milliards d’adresses par millimètre carré de surface terrestre. 16
  • 17. La situation qui vient d’être décrite permet ainsi, au-delà des chiffres évoqués, de mieux expliquer l’origine du Big Data : Depuis le début de l’ère informatique, la numérisation de nos applications a engendré une croissance continue des données. Dans le même temps, les améliorations des techniques de stockage offraient la capacité à accompagner cette croissance. Depuis le début du 21ème siècle, le monde informatique fait face à une explosion exponentielle de données, engendrée par le développement d’Internet et l’apparition de nouveaux usages (réseaux sociaux, plateformes de services, mobilité et produits connectés), et favorisée par l’amélioration des technologies de transport (débit d’accès à Internet) et des capacités de stockage. Les utilisateurs génèrent de plus en de données et dans un intervalle de temps de plus en plus court. Avec l’explosion des données, beaucoup d’entreprises dans différents secteurs d'activité (acteurs de l’Internet, e-commerce, recherche scientifique, organismes publics, …) ont dépassé le péta-octet pour le stockage de leur données. Stocker toutes ces données devient aujourd’hui un véritable défi technologique. De même leur traitement avec les techniques actuelles de type bases de données relationnelles n’est plus adaptée. C’est ainsi, qu’est apparu, pour la première fois en 2008, le terme "Big Data", introduit par l’entreprise Gartner6, désignant ce phénomène de déluge de données informatiques ou "data-déluge". 6 Entreprise de conseil dans le domaine des technologies de l’information et de la communication aux USA 17
  • 18. 3.2 L’analyse du mot Big Data sur Internet Lorsque l’on interroge Google trends7 sur le terme « Big Data » (cf. figure ci-dessous), on constate que ce terme est apparu dans les moteurs de recherches au milieu de l’année 2010 et que depuis cette année, la recherche de ce mot ne cesse d’augmenter. Figure 5 : Résultat de la recherche du terme « Big Data » sur Google trends C’est surtout dans la Silicon Valley et en Asie du Sud-Est que les recherches sont les plus nombreuses, ce qui s’explique par la forte activité autour du monde Internet et des TIC dans ces régions. En 2012, on constate une généralisation de l’usage de ce mot élargie à de plus en plus de régions à travers le monde (Europe, Israël, Australie, …) : c’est le signe que le concept sort du cercle fermé des informaticiens de la Silicon Valley. 7 Google trends : Outil de tendances des recherches qui permet d’analyser la fréquence de recherche d’un mot par les internautes du monde entier 18
  • 19. 3.3 Définition du Big Data Le terme Big Data est utilisé par un grand nombre de personnes travaillant ou s’intéressant aux Technologies de l’Information et de la Communication (TIC). Le choix de l’appellation de ce phénomène est intéressant : C’est l’association des termes « big » et « data », le terme « big » se réfèrant au volume de plus en plus important des données et le terme « data» évoquant la valeur de toutes les données. Aucune définition ne s’est vraiment imposée et chaque acteur possède la sienne en fonction de ses centres d’intérêts. Les acteurs qui orbitent autour de ce concept sont : Les éditeurs de logiciels qui développent les technologies Big Data, Les acteurs du Web (Google, Amazon, Facebook, Linked in, …) qui mettent déjà en œuvre ces technologies (voir plus loin, au §0), Les opérateurs télécoms et hébergeurs qui transportent et stockent ces données. gén ère e erg héb génère Big DATA tran spo rte exploite re nè gé Data mining Figure 6 : Acteurs liés au concept du Big Data 19
  • 20. Gartner définit le concept du Big Data comme « l’accumulation sans fin des données numériques », et si l’entreprise n’en donne pas de définition académique exacte, elle propose toutefois de le caractériser selon les critères des trois V: Volume, Vitesse et Variété. Le critère de volume Pour mieux saisir les chiffres donnés par la suite, le tableau suivant donne les correspondances de volume : Nom Symbole Conversion Kilo-octet ko 1 ko = 1 000 octets Méga-octet Mo 1 Mo = 1 000 ko Giga-octet Go 1 Go = 1 000 Mo Téra-octet To 1 To = 1 000 Go Péta-octet Po 1 Po = 1 000 To Exa-octet Eo 1 Eo = 1 000 Po Zetta-octet Zo 1 Zo = 1 000 Eo Yotta-octet Yo 1 Yo = 1 000 Zo Tableau 1 : Tableau de conversion des unités de volume de données La génération en masse des données par la population entière et nos machines ont fait évoluer considérablement les tailles de stockage « Vers les années 1990 on parlait en Giga, en 2000 en Téra et en 2010 on parle en Péta. Une organisation a d’ailleurs atteint 2 Yotta : c’est la NSA8 pour stocker toutes les données issues des communications électroniques américaines » (P. Bourhis– Orange Business Services). "Les hommes ont généré 150 Exa-octets de données en 2005 et en génèreront 1 200 Exa-octets en 2010" (The Economist, 27/02/2010). Le volume de données à prendre en compte lorsque l’on parle de Big Data c’est le seuil à partir duquel il devient difficile de gérer ces données avec une solution de base de données relationnelle classique. 8 NSA (National Security Agency) : Agence Nationale de Sécurité 20
  • 21. Ce seuil n’est pas clairement défini : pour certains c’est à partir de l'Exa-octet, pour d’autres du Zetta-octet. L’aspect volume n'est cependant pas suffisant pour définir le Big Data. Il faut lui ajouter le critère de vitesse. Le critère de vitesse Ce critère détermine la fréquence à laquelle les données sont générées et partagées. Avec les systèmes opérationnels classiques de gestion et d’analyse de données (par exemple, les ERP9, les CRM), les données sont traitées à froid une fois la collecte des informations effectuées et généralement selon une périodicité de l’ordre de 24h (voire 2h pour les systèmes optimaux). Dans un système d’information confronté au data-déluge, ce fonctionnement n’est plus possible, car un tel volume de données oblige à traiter l’information en quasi temps- réel pour pouvoir être exploitées efficacement. Par exemple, si nous prenons le cas des réseaux sociaux, il n’est pas possible d’arrêter de collecter même une heure les données produites, car le retard accumulé serait alors impossible à rattraper pour l’exploitation des informations. Citons également cet autre exemple, celui d’un constructeur de voitures qui est en train de réfléchir à la mise en place d’une remontée d’au moins 150 millions événements (informations provenant de puce intégrer dans la voiture ou les pneus) par jour à implémenter dans son système d’information. Il devient dès lors impossible pour beaucoup d’outils d’analyse et de CRM de traiter et d’analyser à cette fréquence, les données qui sont collectées et partagées en temps réel. Le Big Data consiste donc également à analyser de gros volumes de données dans des délais les plus proches du temps réel. 9 ERP « Enterprise Ressource Planning » : Progiciel de gestion intégrée permettant de gérer l’ensemble des processus d’une entreprise (ressources humaines, comptabilité et finances, aide à la décision, logistique, …) 21
  • 22. Le critère de variété Le troisième « V » représente la variété des données qui représente à peu près 80 % des données non structurées : sons, photos, vidéos, contenus de blogs ou de réseaux sociaux, … On croule sous la donnée provenant de sources variées, qui créent une diversité de données qui ne s’inscrivent plus dans des structures prédéfinies, faciles à utiliser comme les bases de données transactionnelles. Elles sont de ce fait devenues difficiles à manipuler de façon performante par les outils traditionnels. C’est ce critère qui fait principalement la particularité du Big Data car il évoque la capacité à gérer des données structurées et non structurées : Les technologies Big Data doivent permettre d'analyser de manière aussi simple que des champs numériques ou des textes pré-formatés, ces données non structurées et d’y trouver de la valeur ajoutée. On peut ainsi définir le Big Data comme : Un concept faisant référence au déluge de données que nous accumulons dans nos systèmes ; Mais aussi comme un ensemble de méthodes et de solutions mises au point par les éditeurs de logiciels et utilisées par les entreprises, pour permettre le stockage et l'analyse en temps-réel des données volumineuses, structurées et non structurées. Par la suite dans le document, pour distinguer ces deux notions, nous parlerons du Big Data pour évoquer la première, et des technologies Big Data lorsque l’on se réfère à la deuxième. 22
  • 23. 3.4 Ce qui a permis l’émergence du Big Data Les premières entreprises qui se sont équipées des technologies Big Data sont celles des moteurs de recherche Web (Google, Amazon, Yahoo) car ce sont les premières qui ont eu à faire face à des problématiques de gros volumes de données à traiter en temps réel. En effet, leur besoin de stockage et d’analyse dépassant les capacités des bases de données traditionnelles, elles ont développé et mis à disposition des communautés en Open Source10 des outils de gestion. Ces systèmes permettent d’analyser et de restituer des données à une très grande vitesse car les calculs se font en quasi temps-réel. Il est ainsi possible de s’offrir à moindre coût l’équivalent des supercalculateurs proposés par Oracle ou IBM. Google a développé sa propre technologie Big Data, Map Reduce. Oracle, leader dans le domaine des bases de données propose aussi sa solution NoSQL Database qui est une adaptation commerciale de la solution open source NoSQL (Not Only SQL). Yahoo a développé Hadoop, technologie créée par Doug Cutting, qui pour la petite histoire lui a attribué le nom de l’éléphant en peluche de son fils. Hadoop est la solution Big Data la plus utilisée aujourd’hui. Figure 7 : Logo d’Hadoop On utilise ces solutions dans beaucoup de domaines : finance, communautés de vendeurs et d’acheteurs (Ebay), les systèmes de recommandations d’offres aux clients pour le commerce en ligne et les réseaux sociaux. 10 Open-source : Les logiciels Open Source se caractérisent par la liberté d'accès à leur code source à la différence des logiciels commerciaux. 23
  • 24. Le tableau suivant résume les solutions Big Data proposées par les principaux acteurs : Acteurs Solutions Big Data Dynamo ; S3 MapReduce ; BigTable Cassandra ; Hive SenseiDB ; Voldemort No Database SQL Storm ; FlockDB Hadoop ; S4 Tableau 2 : Solutions Big Data des principaux acteurs Ces technologies Big Data n’auraient pas pu voir le jour sans l’existence : du Cloud computing, pour sa capacité à stocker de gros volumes de données. Le Cloud computing, ou « informatique dans les nuages » est un nouveau modèle informatique qui propose des services informatiques à la demande. Son avantage pour une entreprise est de disposer d’une infrastructure ou d’un service applicatif dont le coût dépend de l’utilisation. Cela permet une grande souplesse d’utilisation (la puissance de stockage ou de calcul étant augmentée en fonction des besoins réels de l’entreprise) et optimise les coûts en évitant à l’entreprise des investissements coûteux (mise en service des plates-formes informatiques) e t e n l a libérant de la maintenance de ces infrastructures. 24
  • 25. La capacité de stockage et la puissance de calcul sont, grâce au Cloud, devenues un service externalisé. La location de la puissance de calcul et l’espace de stockage adaptés au volume de données du Big Data a ainsi permis son expansion. En effet, très peu d'acteurs peuvent effecteur ces traitements avec leurs propres infrastructures. Grâce au Cloud, le Big Data est à la portée des PME et des acteurs non experts du traitement des données. de nouvelles méthodes d’analyse La Business Intelligence ou l'informatique décisionnelle, c’est l'exploitation des données de l'entreprise pour faciliter l’aide à la prise de décision par les donneurs d’ordre. Ce qui permet de comprendre le fonctionnement de l’entreprise et d’anticiper des actions pour son pilotage. Ces outils décisionnels sont basés sur l'exploitation d'un système d’information décisionnel qui est alimenté grâce à l'extraction de données de production. Les systèmes actuels de Business Intelligence deviennent obsolètes pour exploiter les données non structurées. En effet, la gestion des bases de données avec des solutions traditionnelles ne sont plus adaptées pour analyser cette quantité de données, non structurées et en temps réel. Comme le souligne Romain Chaumais, PDG d’Ysance11 "La Business Intelligence classique part de la stratégie de l'entreprise et allume des voyants correspondant aux objectifs. A l'inverse, le Big Analytics dégage une logique dans un océan de données bien trop nombreuses pour qu'un humain puisse les analyser. « Le datamining » automatisait déjà cette analyse mais avec des échantillons représentatifs. Le Big Data attaque les données dans leur totalité, ce qui permet d'identifier la moindre anomalie ». Ainsi, les technologies Big Data regroupent aussi des méthodes d'analyse - appelées « Big Analytics » - utilisées pour tirer profit des données. 11 Romain Chaumais, PGD Co-Fondateur d'Ysance et Directeur du pôle Business Intelligence. Ysance est une société de conseil et réalisation informatique. 25
  • 26. Arriver à traiter ces données constituerait une mine d’or d’informations pour de nombreuses entreprises dans différents domaines d’activités, l’objectif étant de trouver de « nouvelles connaissances » en croisant les données d’une organisation avec la masse de données beaucoup moins structurées du Web (comme des blogs), personnelles (comme des emails) pour proposer de nouveaux services à valeur ajoutée : amélioration de la qualité de service, augmentation du taux de transformation clients, …. 26
  • 27. 4. LES ENJEUX DU BIG DATA POUR L’ENTREPRISE Cette section analyse les enjeux du Big Data pour l’entreprise sous le spectre des relations entre les directions informatiques et marketing. Comme l’ont souligné les sections précédentes, le Big Data constituera une mine d’or d’informations pour l’entreprise qui arrivera à les maîtriser. Cette maîtrise passera par une évolution des relations entre le monde du Système d’Information et celui du Marketing. Autrement dit, comment faire évoluer les technologies et méthodes d’analyse employées actuellement dans l’Entreprise pour tirer profit du data-déluge. Par la suite, sont abordés : L’état des lieux des relations entre les départements informatique et marketing, Les enjeux du Big Data pour l’Entreprise sous les perspectives techniques, économiques et organisationnelles, La mise en perspective du Big Data sur une entreprise : L’étude du cas ORANGE. 4.1 Les relations entre les départements informatique et marketing L’informatique joue un rôle de plus en plus important dans la relation client avec les bases de données relationnelles (CRM, ERP...) qui permettent de gérer tous les processus de traitement des clients (commande, livraison, facturation, …). Une entreprise évolue avec ses nouveaux projets, mais aussi les évènements exogènes (fusions, acquisitions, …). A chaque nouveau projet est associée l’évolution du ou des système(s) d’information. On arrive à la constitution de systèmes disparates qui cohabitent et doivent s’intégrer entre eux, ce qui rend le Système d’Information (SI) de l’entreprise complexe et difficile à gérer. Ces projets de transformation de l’entreprise obligent les directions des systèmes d'information à gérer avec le plus de rigueur possible, un système d'information en production qui gère des données opérationnelles critiques (trésorerie, facturation, …) et les nouvelles 27
  • 28. évolutions qui lui sont demandés par les utilisateurs (services métiers de l’entreprise, dont le Marketing). Les données "appartiennent" aux métiers et transitent dans les tuyaux et applications de la DSI qui joue le rôle de logisticien de l’information, pour que le métier puisse travailler. Le marketing est devenu indispensable au développement des grandes entreprises surtout dans les environnements concurrentiels actuel où les clients sont difficiles à acquérir et à fidéliser. L’avènement du numérique, d’Internet et des réseaux sociaux ont transformé la relation entre client et les services Marketing, le client ayant un accès beaucoup plus rapide et direct avec l’entreprise pour exprimer ses besoins, avis, réclamations, … Dans un passé proche, une grande firme dans le domaine agro-alimentaire qui utilisait de l’huile de palme dans un de ses produits, a été obligée de modifier la composition de son produit pour prendre en compte les mécontentements remontés par ses clients (eux-mêmes alertés et incités en cela par l’organisation Greenpeace). Si dans un premier temps, le « community manager »12 de l’entreprise n’a pas jugé bon de prendre en compte ces réclamations, par la suite l’affaire a pris un tel impact sur la Toile (« buzz ») que seule l’intervention personnelle du PDG et sa promesse de modifier le produit incriminé a permis à l’entreprise de retrouver la confiance de ses clients. Cet exemple illustre que la relation marketing avec le client a changé, en devenant plus directe, avec une portée plus étendue et qu’elle demande des réactions plus instantanées de la part de l’entreprise pour être efficace. Pour satisfaire les exigences du client (qualité du service rendu, rapidité d’exécution, …) les services marketing n’ont d’autres choix que de s’appuyer sur des applications informatiques de plus en plus performantes. Il en résulte des demandes d’évolutions auprès de la DSI, laquelle se doit de trouver les meilleures solutions techniques pour satisfaire les enjeux du business. Actuellement, ce processus entre l’expression de besoin réalisée par le service demandeur (dans notre cas, le service Marketing) et la mise en application sur le système opérationnel de l’entreprise, passe par une multitude d’étapes réalisées par la DSI. 12 « Community manager » : Responsable de la communication de l’entreprise sur Internet et notamment sur les réseaux sociaux. 28
  • 29. Ces étapes, généralement intégrées dans le processus qualité de l’entreprise (par exemple, cycle en V, …), définissent le déroulement des opérations et comprennent : La planification de l’évolution : compréhension du besoin, estimation du coût et du délai de réalisation, intégration dans la feuille de route du développement du SI, Sa spécification : rédaction des exigences fonctionnelles et de performances, Sa réalisation : codage et qualification sur une plateforme de tests, L’accompagnement au changement des utilisateurs : formation des utilisateurs, Le déploiement et mise en service sur le SI opérationnel. Toute évolution entraîne un risque de dysfonctionnement sur l’existant et il est donc impératif de tester cette non-régression, ce qui explique que les cycles de vie de projets des évolutions sont longs et peuvent atteindre de 6 mois à plusieurs années. Par ailleurs, il ne serait pas concevable de traiter au fil de l’eau chaque demande d’évolution. Ces dernières sont donc rassemblées dans des versions d’évolution du SI qui ne sortent que 1 à 2 fois par an. Ainsi, même une évolution mineure, par exemple sur la tarification d’une offre, qui ne nécessiterait que peu de charges en termes de réalisation, aurait un délai de mise en œuvre obligatoirement long puisque dépendante de la sortie de la version globale du SI à laquelle elle appartient. L’atteinte des objectifs métiers dépend de l’entente entre ces deux mondes pour que chacun contribue aux objectifs de l’autre : la DSI doit se mettre au service du Marketing (mise en place d’outils performant) ; et le Marketing anticiper ses besoins pour prendre en compte les contraintes informatiques. Aujourd’hui les DSI arrivent à répondre aux demandes des services marketing malgré leurs contraintes propres qui induisent un certain manque de souplesse, mais qu’en sera-t-il demain, lorsque l’entreprise souhaitera tirer partie du Big Data. Il sera alors nécessaire que la DSI soit capable d’avoir les outils techniques performants (technologies Big Data), mais aussi que la méthodologie utilisée pour traiter des évolutions du SI puisse évoluer vers un cycle beaucoup plus court (adaptation à l’instantanéité) tout en maintenant la rigueur permettant d’assurer la stabilité et la fiabilité du SI opérationnel existant. 29
  • 30. 4.2 Enquête auprès des acteurs SI et Marketing Le Big Data étant un concept récent, il était intéressant de soumettre un questionnaire pour sonder l’opinion d’acteurs potentiellement intéressés par ce sujet. 4.2.1 La méthodologie d’enquête La méthodologie utilisée pour réaliser cette enquête est la suivante : La population ciblée est celle des cadres travaillant dans les directions SI et Marketing des entreprises des secteurs des TIC.( 83 % des sondés travaillent dans le domaine des TIC) Il s’agit d’une enquête en ligne utilisant l’outil « Google document ». Le lien vers ce questionnaire a été publié sur les réseaux sociaux professionnels (linkedin, twitter) et transmis directement à la population cible. Le questionnaire, présenté en Annexe 1, comprend : o Une introduction qui rappelle le contexte de l’émergence du Big Data. Cette phrase d’accroche a pour but de capter l’attention du sondé et de l’inciter à répondre à une question simple : « Avec l’essor d’Internet, des réseaux sociaux, des usages mobiles, une quantité impressionnante de données se retrouvent sur le WEB chaque seconde dans le monde. Comment gérer ces données, que faire de ces millions d'informations que nous déposons chaque jour sur la toile ? Le nouveau concept "Big Data" regroupe des technologies pouvant gérer, stocker et analyser en temps réel tous ces données et contenus hétérogènes afin d'en extraire des informations pertinentes … Mine d'or pour certains, Illusion pour d'autres ... Et vous quel est votre avis ? » o Un premier thème qui est visible, est lié à la question posée en titre du questionnaire sur « la connaissance du Big Data ». Il permet de faire un état des lieux de la connaissance du Big Data auprès des sondés. o Un deuxième thème caché. Il s’agit d’analyser d’une part, si l’opinion des sondés sur le Big Data est positive ou négative et d’autre part, s’ils estiment que c’est uniquement un concept à la mode mis en avant par ceux qui le vendent (éditeurs logiciels), ou s’il y a un réel intérêt pour l’entreprise à utiliser ces technologies. 30
  • 31. 4.2.2 L’analyse des résultats L’enquête a été réalisée du 26/07 au 26/08/12 et a donné lieue à 36 réponses. Les réponses brutes sont présentées en Annexe 1. Concernant le premier thème « connaissance du Big Data », on constate que : La population qui a répondu s’intéresse aux nouvelles technologies (97% des personnes interrogées) et la moitié indique connaitre le concept Big Data (53%). La question liée à la solution Hadoop permet de vérifier que seuls 47% ont en vraiment une connaissance approfondie. Les personnes connaissant le Big Data utilisent déjà des solutions Coud computing dans leurs entreprises (61% des sondés). L’analyse approfondie des résultats montre que les personnes connaissant le Big Data travaillent notamment dans le domaine du conseil (Solucom, Devoteam, …) ou de la Business Intelligence (123 open Data, Bizzneo, iAdvize, …). En répondant à 83% que le Big Data sert à l’analyse et l’exploitation des données, les sondés (y compris ceux qui ne connaissent pas le Big Data) montrent qu’ils en comprennent l’utilité. Ce premier point est intéressant car il confirme bien que ce concept est en train de se mettre en place et que l’on commence à s’y intéresser. Concernant le deuxième thème qui était de « faire ressortir la perception qu’ont les sondés du Big Data » : L’enquête montre que cette perception est très positive car la plupart des sondés (y compris ceux qui déclarent ne pas connaitre le Big Data) pensent que cela va apporter de la croissance (89%), permettre de devancer les concurrents (72%) et que la gestion des données est une mine d’or d’information pour l’entreprise (86%). 31
  • 32. C’est assez étonnant car on aurait pu croire que ce nouveau concept allait être associé : o A une notion de Big brother avec une crainte pour l’utilisation des données personnelles (43%). o Ou un simple concept marketing mis en avant par les éditeurs de logiciels (seulement 6 %). Pour finir la majorité des personnes ont bien compris que le Big Data allait plus profiter aux nouveaux acteurs du Web (72%), aux fonctions Marketing (69%) et aller améliorer les relations entre les informaticiens et le marketing (69 %). 32
  • 33. 4.3 Les enjeux et impacts du Big Data pour les entreprises Pour le cabinet McKinsey, conseil en stratégie d’entreprise, le Big Data constitue « le prochain cap pour l’innovation, la compétitivité et la productivité » [13] La capacité à extraire ces données variées pour les analyser le plus rapidement possible est un défi technologique à venir pour les entreprises travaillant dans le domaine du e-business car il faudra satisfaire les besoins d’une société de plus en plus tournée vers l’instantanée. La solution réside dans l’utilisation des nouvelles technologies comme le Big Data pour répondre aux objectifs des directions marketing et donner les moyens aux directions informatiques d'étendre leur périmètre afin de combiner informatique et marketing pour maitriser les données relatives au client. Cela en devient stratégique pour l’entreprise pour réussir dans la « décennie digitale » à venir. Avec l’arrivée des technologies Big Data, il est fondamental de se poser plusieurs questions comme celle de l’impact sur le marché ou de la valeur que cela va créer, ou encore comment ces nouvelles technologiques vont changer la stratégie, les processus et les performances de l’entreprise ? Cette analyse est abordée selon les axes suivants : Le challenge technologique, L’enjeu économique, L’impact organisationnel. 33
  • 34. 4.3.1 Le challenge technologique L’un des enjeux du Big Data pour l’entreprise est de s’adapter en investissant dans les nouvelles technologies qui touchent au stockage et à l’analyse des données. L’investissement en capacité de stockage Traiter l’augmentation de stockage avec les systèmes actuels reviendrait à faire exploser les budgets d’investissement informatiques. Même si cela était possible, il y aurait deux autres problèmes à résoudre : o Celui de la place pour stocker les données car les entrepôts de données de l’entreprise seraient bien vite saturés. Devant le volume de données à traiter, il faudrait ajouter des quantités de disques et baies de stockage supplémentaires et on se retrouverait rapidement en limite de place en mètres carrés. o De plus, la dépense en énergie électrique nécessaire au fonctionnement des entrepôts de données ajouterait des dépenses aux budgets de fonctionnement des entreprises. Les nouvelles technologies Big Data permettent l’évolution du stockage vers des systèmes distribués13, grâce à l’infrastructure du Cloud computing. Cela correspond à répartir un même fichier sur plusieurs systèmes et permet de rationnaliser les volumes de stockage. Investissement dans l’analyse La valeur des technologies Big Data provient également des croisements entre sources de données diverses, structurées ou non. L’entreprise doit investir dans ces techniques pour disposer de leur puissance d’analyse. On distingue : o Le Web sémantique qui permet d’utiliser toutes les ressources d’Internet et de croiser ces données avec n’importe quelle autre donnée du Web. 13 Un système distribué est un ensemble d’entités autonomes de calcul (ordinateurs, PDA, processeurs, processus, processus léger etc.) interconnectées et qui peuvent communiquer. 34
  • 35. Il permet ainsi de simplifier la création de valeur à partir des données analysées. C’est par exemple ce que propose Google dans sa toute nouvelle fonction « Knowledge Graph », une immense base de données qui permet d'obtenir des réponses pointues. o Les nouvelles techniques de Datamining : Des nouvelles techniques sont en train de se développer, celles-ci améliorent les techniques traditionnelles (les associations, les classifications, les algorithmes ….) :  Le crowdsourcing : remontée via les réseaux sociaux de données ou d’informations suite à un appel à contribution,  L’analyse de sentiments : recherche des opinions à partir de l’analyse textuelle,  L’analyse de réseaux : techniques permettant d’identifier des leaders d’opinion et leur pouvoir de prescription dans des réseaux sociaux en particulier. 35
  • 36. 4.3.2 L’enjeu économique IDC14 évalue le taux de croissance des technologies Big Data annuel moyen de 39,4%, ce qui devrait le faire passer, en cinq ans, de 3,2 milliards de dollars en 2010 à 16,9 milliards de dollars en 2015. « Un marché qui devrait donner du grain à moudre à l’ensemble du secteur informatique puisque le cabinet d’étude estime que sur ce montant global d’investissement, 40% seront consacrés aux Services et 30% au logiciel » [14] Dans une étude récente le cabinet McKinsey qualifie le phénomène Big Data de « nouvelle frontière de l’innovation de la compétition et de la productivité ». [15] Cette étude montre que la maîtrise des données (capacité à les analyser) aura un impact sur l’aide que l’informatique va apporter aux métiers pour trouver de nouveaux axes de compétitivité. Par ailleurs, elle précise que l’exploitation du Big Data pourrait permettre : d'économiser plus de 250 milliards d’Euros sur l'ensemble du secteur public Européen (identification des fraudes, gestion et mesures de l'efficacité des affectations des subventions et des plans d'investissements, ...). un surplus global de 600 milliards de dollars pour le secteur des sites marchands grâce à l’utilisation des données de géo-localisation (campagne de promotion destinée aux clients a proximité du magasin, …) Selon les analystes Mc Kinsey, la gestion des nombreuses données avec les outils actuels aurait déjà un impact sur la productivité, ces dernières années. L’utilisation de façon effective des technologies Big Data, permettrait « une augmentation potentielle des marges d’exploitation pouvant atteindre 60% ». Par ailleurs, le cabinet indique que l’ensemble des couches du SI sont désormais mobilisées et optimisées pour permettre une valorisation métier des données, qu’elles soient structurées ou non. Il prévoit ainsi qu’en 2016, 7% du Chiffres d’Affaires généré par les ventes de serveurs concernera des infrastructures destinées au seul Big Data. 14 IDC est un acteur majeur de la Recherche, du Conseil et de l’Évènementiel sur les marchés des Technologies de l’Information, des Télécommunications et de la Communication 36
  • 37. Dans l'étude «Big data: harnessing a game-changing asset», de The Economist Intelligence Unit, publiée en septembre 2011, on constate que les entreprises qui utilisent intelligemment leurs données voient leur croissance augmenter de 5 à 6 % en moyenne. [15] La figure ci-après présente la liste des revenus prévisionnels issus de la vente de technologies Big Data sur l’année 2012. [17] Figure 8 : Revenus prévisionnels générés par les technologies Big Data en 2012 [17] De l’avis de Forbes, ces entreprises ont devant elles une énorme opportunité d’accroitre leurs revenus en offrant des services d’accompagnement pour aider les entreprises à adopter le Big Data. Toutes ces études, même si elles restent prospectives, montrent que la tendance auprès des cabinets spécialisés est de considérer le Big Data comme une technologie porteuse et pleine d’avenir. Avant, les entreprises travaillaient dans un contexte où la production de la donnée était coûteuse, elles devaient alors en limiter la production. Maintenant, ce problème est révolu car les données sont presque gratuites et abondantes. Ce qui est important, ce n’est plus de produire les données mais plutôt de les manier, de les exploiter, c’est donc l’efficacité de l’exploitation et non plus de la production de données qui prime. 37
  • 38. L’exploitation de ces données massives dépend de la stratégie et du besoin de l'entreprise. Ainsi Tesco et Walmart15 suivent deux stratégies différentes : Tesco à fait le choix de croiser les données pour personnaliser les offres selon client (profiling) et Walmart plutôt celui de récupérer des données externes (météo, ventes...) pour permettre l’optimisation de la gestion des stocks (prédiction). Par l’agrégation et le traitement de ces données, de nouveaux business models émergent en concevant de nouveaux services. C’est le cas du marché du Web analytics qui génère déjà plusieurs milliards d’euros sur des outils et des services. Cette technique d’analyse des comportements permet d’élaborer des micro segmentations des scores d’appétence (le calcul qui donne la probabilité qu’un prospect devienne client) ou de churn (le calcul qui permet de connaitre le taux de perte d’un client) qui sont nécessaires pour personnaliser la relation et les offres proposées au client. C’est le domaine le plus exploité aujourd’hui par le Big Data. En effet, la collecte et l’analyse des informations du parcours client, de son comportement lors d’un achat sur les sites Internet et le temps passé vont permettre : Une optimisation des pages web et une amélioration de l’expérience utilisateur en apportant des modifications aux sites pour une meilleure rentabilité, L’accélération du développement de nouveaux produits et leur adaptation au plus près des attentes et des usages du client, De faire de la veille ou de la prévision en tirant parti des dialogues continus du web social pour surveiller des tendances. 15 La firme anglaise Tesco est la troisième plus grande chaîne de commerce. Walmart est le premier groupe mondial de grande distribution, 38
  • 39. Un bon exemple est celui des « pures players »: Ces acteurs majeurs du Web, tels que Google, Facebook, Amazon, ont montré leur capacité à transformer l'information en résultats économiques et ont été les précurseurs de ces nouveaux business models en constituant ces grosses bases de connaissances sur leurs clients, produits, fournisseurs, ... Le modèle économique de base de Google, la publicité contextuelle, s’appuie sur l’analyse en masse des comportements pour cibler de manières fines certaines niches de marché. C’est aussi le cas pour Facebook : Son business model est basé sur la monétisation des informations personnelles et contenu de ces adhérents. On a cité l’exemple du Web mais la création de la valeur par la connaissance client reste possible dans n’importe quel domaine. Par exemple, dans le secteur bancaire, l’analyse des flux de transactions permet de détecter en temps réel des fraudes bancaires et de déclencher automatiquement le blocage d’une carte de crédit. En synthèse, l’utilisation du Big Data améliorera sans doute la compétitivité d’une entreprise face aux concurrents en lui permettant d’être plus réactive face aux besoins, exigences et intérêts de ses clients. 39
  • 40. 4.3.3 Impact organisationnel L’intégration des nouvelles technologies Big Data dans les entreprises va entraîner des changements en termes de gouvernance et organisationnels. Le volet de l’impact organisationnel est abordé ici sous deux angles : La conduite du changement, où comment l’entreprise va être amenée à gérer son adaptation vers un nouveau mode de fonctionnement L’apparition de nouveaux métiers. a) La conduite du changement L’intégration du Big Data dans une entreprise risque d’entraîner une rupture de son organisation : Elle devra modifier sa manière de travailler pour s’adapter à ce nouvel écosystème (arrivée de nouveaux acteurs, renforcement de la concurrence, importance des réseaux sociaux, changement de la relation client, …). Un manque d’adaptation de l’entreprise pour canaliser le Big Data la mettrait dans des situations à risque : Cela peut être, par exemple, une perte de productivité des employés, une dégradation de la réputation de l'entreprise ou de ses produits, ou encore l’incapacité à recommander et personnaliser la bonne offre à chaque client. Pour réussir cette transformation, il est nécessaire d’adopter un changement de mentalité au sein de l’entreprise. C’est toute la réflexion métier qui est différente car les données, en permettant d'obtenir de nouvelles informations, deviennent le pilote de la stratégie de l’entreprise. La priorité réside bien dans la maîtrise de la donnée. Les décideurs doivent être sensibilisés à la valeur de la donnée. Pour cela il faut arriver à les convaincre de l’intérêt qu’il y a à exploiter ces données, en développant deux axes : Le renforcement de l’efficacité des métiers et notamment la relation Marketing – Client (connaissances client), Mais aussi la capacité, pour les donneurs d’ordre, à tirer des synthèses d’aides à la décision (tendances du marché, …). 40
  • 41. Cela leur permettra d’adapter la stratégie de l’entreprise pour créer de la richesse à partir de ces données. Pour atteindre un degré d’efficacité, il faut un partenariat renforcé entre les équipes informatique et marketing qui seront les acteurs du Big Data dans l’entreprise. Pour arriver à améliorer le fonctionnement actuel décrit au §4.1, il sera nécessaire : pour les équipes informatiques : o d’arriver à mettre en place des cycles toujours plus courts et plus orientés « time to market»16, pour les évolutions demandées par les équipes marketing, tout en conservant la fiabilité du système opérationnel, o et mettre à disposition du marketing des interfaces adaptées (outils ergonomiques directement accessibles depuis le poste de travail de l’utilisateur) et des procédures simplifiées (administration des droits utilisateurs, accès aux outils et bases de données, support utilisateur réactif, …), qui leur permettront de réaliser de manière autonome leurs requêtes sur le SI. pour les équipes marketing, de s’approprier les outils mis à leur disposition pour qu’elles arrivent à formuler les bonnes requêtes adaptées à leur besoins. En étant à même de maîtriser leurs requêtes, les services marketing n’en seront que plus performants. Enfin, de faire émerger un nouveau modèle de collaboration entre l’informatique et le marketing pour renforcer la synergie entre ces équipes. En effet, actuellement la DSI détient la donnée qui est utile au Marketing. Ce dernier est donc tenté de peser de plus en plus sur la gouvernance de la DSI. D’un autre côté, avec l’importance prise par la donnée dans un environnement Big Data, la DSI pourrait être amenée à étendre son rôle vers l’analyse de cette donnée. Cette nouvelle collaboration pourrait passer par la mise en place d’une structure transverse à la DSI et au Marketing, qui serait en charge de la gouvernance du programme Big Data dans l’entreprise. 16 Time-to-market : terme utilisé pour exprimer le délai nécessaire pour le développement d’un projet et sa mise en place avant sa mise en service ou son lancement sur le marché 41
  • 42. b) L’apparition de nouveaux métiers Les entreprises sont obligées de trouver et de mettre en place de nouvelles solutions analytiques complexes dédiées aux Big Data et pour cela, elles doivent investir en outils spécialisés mais aussi en ressources humaines. L’un des enjeux du Big Data sera aussi lié aux compétences d’analyse. Ces nouvelles technologies nécessitent de nouvelles compétences, notamment des Data scientist17, profils rares car il n'existe pas encore d’écoles proposant des formations académiques pour les former. Ces profils requièrent une double compétence en mathématiques et en analyse qui leur permet d’extraire du sens et de rendre les données intelligibles. Cette pénurie de compétences qualifiées risque d’entraver l’exploitation du Big Data ou d’en délocaliser une partie de son exploitation. Data scientist : métier désignant les nouveaux rôles d’analystes liés au Big Data et disposant d’une double compétence Mathématiques – 17 Analytique 42
  • 43. 4.4 Big Data dans les télécoms : l’étude de cas ORANGE Non publié . 43
  • 44. 5. CONCLUSION Le déluge de données est un phénomène de société qui est amené à croître dans les prochaines années et le Big Data pourrait bien devenir la prochaine grande révolution technologique. En effet, nous assistons au développement de nouveaux outils performants d’analyse et de gestion de données qui marquent une rupture technologique avec le monde actuel des bases de données relationnelles. Avec ce nouveau concept, l’entreprise doit commencer une réflexion autour de ses besoins et objectifs et mettre en place la stratégie adéquate pour s’adapter à ce nouvel écosystème. Périmètre des technologies Big Data Business Intelligence Business Analytics Exploitation Exploitation indirecte des Exploitation directe des des données (reporting) données données SGBD Gestion des données ERP ( SI, Marketing) CRM Stockage des Stockage de données / Cloud Computing données Réseaux Opérateurs Transport des données Générations des données struturées / non structurées Figure 9 : Périmètre des technologies Big Data 44
  • 45. Le Big Data ne concerne pas que les entreprises. Le secteur public peut y trouver également un intérêt. D’ailleurs, l’Etat français a lancé récemment un appel à projets consacré au Big Data pour la mise en place de ces technologies autour des données publiques. [18] Ces projets pourraient concerner : la sécurité publique et la lutte contre le terrorisme par le recoupement d’informations provenant des services de sécurité (police, gendarmerie, renseignements). La lutte contre la fraude fiscale, La santé publique (télédiagnostics, téléconsultation…). Enfin, il existe des menaces au développement du Big Data qui sont liées : Aux aspects juridiques : Les freins proviendront de toutes les questions liées à la réglementation juridique à mettre en place autour de ces nouvelles technologies. Plusieurs questions peuvent être posées : o Quelle est l’obligation de conserver les données (traçabilité de l’information) et le délai légal de conservation ? o La propriété de la donnée stockée, o A-t-on une obligation à détruire les données que l'on stocke ? o Le respect de la vie privée et du droit à l'oubli. A la sécurité de l’information : Plus de données manipulées appelle une sécurité renforcée du Système d’Information et de la gestion du droit d’accès à ces données. Il sera nécessaire de cloisonner les données en fonction du droit d’en connaître des utilisateurs. 45
  • 46. ANNEXE 1 : ENQUETE D’OPINION SUR LE BIG DATA Questionnaire et Résultats bruts de l’enquête 46
  • 47. 47
  • 48. 48
  • 49. 49
  • 50. ANNEXE 2 : GUIDE D’ENTRETIEN POUR L’ETUDE DE CAS Ce guide a servi de fil conducteur aux entretiens qui ont été menés. 1) Qu’est ce que le Big Data ? 2) Quels sont les projets Big Data d’Orange 3) Pourquoi parle-t-on toujours du Cloud et du Big Data ensemble ? 4) Quels sont les clients qui l’utilisent, pour quels usages ? 5) Pourquoi à la Direction du SI France, on ne parle pas du tout du Big Data, nous n’avons aucun projet à l’horizon 2015 sur ce sujet ? 6) Quels sont les besoins en Big Data d’Orange pour ses besoins internes ? 7) Quelles sont les opportunités et les difficultés du Big Data pour Orange ? 8) Est-ce que le Big Data va changer nos manières de travailler entre le marketing et l’informatique pour gérer des projets et vendre nos solutions et produits ? 9) Sommes ou serons-nous pilotés par la donnée ? 10) Que pensez-vous de cette déclaration : « L'entreprise du 21ème siècle doit maîtriser l'information ou disparaître ». 11) Quelle peut être la stratégie de cohérence, de fiabilité, de qualité des données entre nos différentes entités pour réussir à intégrer le Big Data ? 12) A qui va profiter le Big Data dans l’entreprise : aux fonctions marketing et/ou à la DSI ? 13) Est-ce que cela va rendre notre entreprise plus compétitive ? 50
  • 51. ANNEXE 3 : SOURCES ET BIBLIOGRAPHIE [1] Devideo «Six provocations au sujet du phenomène Big Data» Taken from Kranzberg, Melvin (1986) Technology and History: "Kranzberg's Laws", Technology and Culture, Vol. 27, No. 3, pp. 544-560 - <http://www.decideo.fr/Six-provocations-au-sujet-du-phenomene- des-Big-Data_a4532.html> - Septembre 2011 [2] Frenchweb « Etudes McKinsey » - <http://expert.frenchweb.fr/tag/mckinsey/> - Juin 2012 [3] Le monde .fr « Le cimetière des exaoctets » - <http://www.lemonde.fr/vous/article/2012/06/19/le-cimetiere-des- exaoctets_1721206_3238.html> - Juin 2012 [4] Blog-Devost « Big Data ,petites réfléxions » - <http://blog.dewost.com/big-data-petites- reflexions> - Juin 2012 [5] Le Webmarketeur « Infographie, les chiffres clés d’internet en France en 2011 » - <http://www.le-webmarketeur.com/2012/01/06/infographie-les-chiffres-cles- d%E2%80%99internet-en-france-en-2011/> - Décembre 2012 [6] Dofollow.bz « les chiffres clés d’Internet » - <http://dofollow.bz/?post/2012/01/10/Chiffres-cles-Internet-France-10-ans> - Janvier 2010 [7] Fevad « Les chiffres de la consommation digitale en France » - <http://www.fevad.com/uploads/files/Etudes/chiffrescles/chiffres_cles2012.pdf> - Juin 2012 [8] 20minutes « Facebook, 27 milliards de likes par jour » - <http://www.20minutes.fr/web/facebook/989615-facebook-27-milliards-likes-chaque-jour> - Aout 2012 [9] Blog Waebo «Augmentation exponentielle du nombre de tweets par jour» - <http://www.waebo.com/twitter-augmentation-exponentielle-du-nombre-de-tweets-par- jour.html> - Février 2010 [10] Information IT pour les TPE/PME, ITespresso – <http://www.itespresso.fr/youtube- media-mastoc-defaut-mass-media-55152.html> - Juillet 2012 [11] Le Blog des nouvelles technologies « Infographie, quelle quantité de contenu est publiée quotidiennement sur le web » - <http://www.blog-nouvelles- 51
  • 52. technologies.fr/archives/3338/infographie-quelle-quantite-de-contenu-est-publiee- quotidiennement-sur-le-web/> - Avril 2011 [12] Journal du net « les ventes de tablettes 2011 » - <http://www.journaldunet.com/solutions/systemes-reseaux/ventes-de-tablettes-en- 2011.shtml> - Novembre 2011 [13] 01net « Big data, la prochaine révolution informatique » - <http://pro.01net.com/editorial/535404/big-data-la-prochaine-revolution-informatique/> - Juillet 2011 [14] Le mag IT « Big Data : des besoins forts, un concept diffus, un marché en phase de lancement » - <http://www.lemagit.fr/article/sap-sybase-big-data/11354/1/big-data-des- besoins-forts-concept-diffus-marche-phase-lancement/> - Mai 2012 [15] Mc Kinsey.com « Big Data: The next frontier for innovation, competition, and productivity » - <htpp://wwwmckinsey.com/mgi/publication/big_dara/index.asp> - Mai 2012 [16] e-marketing « Big data: le plus grand risque est de ne rien faire » <http://www.e- marketing.fr/Marketing-Direct/Article/-Big-data-le-plus-grand-risque-est-de-ne-rien-faire-- 42524-1.htm>Janvier 2012 [17] Forbes - Big Data is a big market business» <http://www.forbes.com/sites/siliconangle/2012/02/17/big-data-is-big-market-big-business> - Février 2012 [18] Site du gouvernement français « Appel à projets Big Data » - <http://investissement- avenir.gouvernement.fr/content/lancement-de-lappel-%C3%A0-projets-consacr%C3%A9-au- big-data> - Mars 2012 52