Thèse Professionnelle
Présentée par :
Thibault PAILLIER
En vue d’obtenir le titre Certifié Niveau I :
Manager de la Straté...
Résumé
Dans cette thèse nous allons nous intéresser aux avantages de l’utilisation des big
data dans une entreprise située...
Résumé en anglais
In this thesis we will look at the advantages of the use of big data in a company in a
B2B market.
At fi...
Table des matières
INTRODUCTION .............................................................................................
TROISIEME PARTIE : L’UTILISATION DES BIG DATA DANS L’ENTREPRISE COFELY INEO ..........................................40
V...
1
Introduction
90% de toutes les données dans le monde ont été créés durant les deux dernières
années. De nos jours la don...
2
Première partie :
Concept de « big data »
3
I. L’ère de l’information
A. La généralisation d’internet
Aujourd’hui internet fait partie du quotidien de millions, voi...
4
pourquoi d’après une étude d’Oracle, comme le montre le graphique suivant, le volume
de données dans le monde va passer ...
5
l’augmentation exponentielle du volume de données. En France, un mobile sur deux
est un smartphone8, les Français sont c...
6
D’après des spécialistes d’IBM, les big data se définissent par 3 propriétés qui les
caractérisent à divers degrés. On l...
7
de données est la caractéristique première des big data et également la première
caractéristique qui vient à l’esprit lo...
8
2. Vélocité
Dans le passé, la vitesse de création des données ne nécessitait une mise à jour de
la base que tous les jou...
9
préférences, les intentions d’achat de leurs abonnés. 14 » Ce processus peut
également être adapté à d’autres formats de...
10
possèdent des balises délimitant des champs. L’information n’est pas organisée
mais possède toutefois une structure ide...
11
Tout en respectant les données de confidentialité et l’anonymat des personnes, il est
également possible d’utiliser des...
12
souris ni écran graphique, ni interface utilisateur pour rechercher certaines
informations stockées sur des serveurs so...
13
 « Pas de schéma (schema less). La base de données n’impose pas de
définition des éléments au sein d’un ensemble de do...
14
Figure 3 - Vue synthétique de l'outil Hadoop - d'après le site internet DATACONOMY [en ligne] [consulté le 19/06/15]
di...
15
- Hadoop Common 40: un outil permettant aux utilisateurs de lire les données
stockées sous le système Hadoop files.
- Y...
16
pour l’internaute en fonction de ses articles précèdent visionnés "apprend" au fur et à
mesure qu’il propose des articl...
17
Figure 4 - Heatmapdu parcours client dans un magasin - d'après le site internet TYCO RETAIL SOLUTIONS [en ligne]
[consu...
18
bases de données tandis que le data analyst tirera ses analyses d’une seule base tel
qu’un CRM 25.
Si le data scientist...
19
Figure 5 - d'après une étude de Markess International : Meilleures approches pour tirer parti du Big Data [en ligne]
[c...
20
II. Les différents usages du big data
Nous avons vu qu'une stratégie big data une fois implémentée dans une entreprise
...
21
en déduire des comportements « à risque » du point de vue de l’opérateur26», c’est-à-
dire le risque qu’un client ne qu...
22
plus ou moins précises des besoins de la population. De l’électricité est envoyée sur
le réseau et tout ce qui n’est pa...
23
assurance, épargne, mais aussi les grandes étapes dans la vie des clients telles que
la construction d’une maison, la n...
24
big data les banques pourraient ainsi réduire considérablement les risques de fraudes
bancaires qui coûtent près de 100...
25
d’achats des clients, tenir également compte de la météo qui influe sur les achats des
consommateurs et incorporer les ...
26
déclarent avoir des projets en cours sur l’utilisation des big data32. Si les contraintes
sont nombreuses, protections ...
27
doivent protéger les données personnelles beaucoup sont franchies au nom de la
sécurité nationale.
F. 4 V et 5 V et…
Le...
28
qui va s’imposer et avoir un impact extrêmement structurant sur le système de santé
en général 36 ». Pour les acteurs d...
29
machine apprend en fonction des nouvelles découvertes médicales du domaine et
améliore ses décisions.
- Prévention médi...
30
populations RH frise le zéro absolu 39», comme le déclare le spécialiste d’un cabinet
de conseil en transition numériqu...
31
technologies41. Même si de nombreux recruteurs ont peur que la machine prenne leur
place dans le recrutement des employ...
32
cela pourrait engendrer. Les big data permettent également de prévenir le
remplacement de pièces, c’est le cas pour Air...
33
III. Big data et marketing
A. Le marketing prédictif et fidélisation
Parmi les avantages liés aux big data pour le mark...
34
La fidélisation
Le taux d’attrition, c’est-à-dire le taux de clients qui quittent leur fournisseur pour se
tourner vers...
35
mois après leur engagement. Plus important encore il était possible en utilisant toutes
les informations collectées par...
36
rebondi quasi-instantanément à une coupure d’électricité durant le match avec un
tweet devenu un vrai cas d’école : Pow...
37
Si poster des statuts ou tweet instantanément ne requiert pas l’utilisation des big data
ce n’est pas le cas des annonc...
38
C. Le ciblage
Toutes les entreprises, à l’exception peut-être de certaines sociétés et start-ups,
possèdent de multiple...
39
Seconde partie :
Les big data face
aux professionnels
40
****CONFIDENTIEL****
41
Troisième partie :
L’utilisation des big data
dans l’entreprise Cofely
Ineo
&
42
****CONFIDENTIEL****
43
Bibliographie
Ouvrages :
COINTOT, Jean-Charles. LA RÉVOLUTION BIG DATA. Dunod. 2014. ISBN: 978-2-
10-071142-0
Viktor MA...
44
data blog [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://entreprisesnumeriques.co/2015/02/12/le-b...
45
JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet :
http://www.forbes.com/sites/oreillymedia/2...
46
SITE INTERNET DE COFELY [en ligne]. [Consulté le 15/07/15]. Disponible sur
Internet : http://cofely-gdfsuez.com/profil
...
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER
Prochain SlideShare
Chargement dans…5
×

Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER

573 vues

Publié le

Thèse professionnelle de Thibault PAILLIER, étudiant en Master 2ème année en marketing à l'IDRAC Business School. Sujet : COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ?

Publié dans : Marketing
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
573
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
21
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER

  1. 1. Thèse Professionnelle Présentée par : Thibault PAILLIER En vue d’obtenir le titre Certifié Niveau I : Manager de la Stratégie Commerciale Spécialité : Management de la Stratégie de marque, de l'innovation et du lancement de nouveaux produits et services COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? THÈSE Professionnelle dirigée par : François GONNET Entreprise : Cofely Ineo Digital, Groupe ENGIE Tuteur : Mme KOUADRIA Laetitia
  2. 2. Résumé Dans cette thèse nous allons nous intéresser aux avantages de l’utilisation des big data dans une entreprise située sur un marché B2B. Nous analyserons dans un premier temps via des études d’ouvrages comment les big data s’appliquent dans divers domaines tels que l’énergie, la télécommunication ou encore la santé et dans un second temps plus particulièrement dans différents services d’une entreprise tels que la logistique ou les ressources humaines. Nous étudierons plus en détail l’application des big data dans le marketing et nous confronterons nos recherches par des interviews de professionnels spécialisés en big data ainsi que l’interview d’une personne travaillant au sein de l’entreprise Cofely Ineo Digital qui n’utilise pas les big data. Nous nous attarderons sur le cas de cette société et nous étudierons comment les big data peuvent apporter de différentes manières des améliorations au marketing dans cette société.
  3. 3. Résumé en anglais In this thesis we will look at the advantages of the use of big data in a company in a B2B market. At first we will analyze through studies of books how big data apply in various fields such as energy, telecommunications or health and in a second time especially in different company services such as logistics or human resources. We will study in detail the application of big data in marketing and we will confront our research by the interviews of specialized professionals in big data and an interview with a person working in the company Cofely Ineo Digital that does not use the big data. We will focus on the case of this company and we will study how big data can bring in different ways improvements to the marketing in this company.
  4. 4. Table des matières INTRODUCTION .........................................................................................................................................................................1 PREMIERE PARTIE : CONCEPT DE « BIG DATA » .................................................................................................................2 I. L’ERE DEL’INFORMATION..................................................................................................................................................3 A. La généralisation d’internet .................................................................................................................................3 B. La révolution du smartphone...............................................................................................................................4 C. La règle des 3 V ......................................................................................................................................................5 1. Volume ................................................................................................................................................................. 6 2. Vélocité................................................................................................................................................................. 8 3. Variété .................................................................................................................................................................. 8 D. Les outils des big data .........................................................................................................................................10 1. Infrastructure réseau.......................................................................................................................................... 10 2. Les bases de données......................................................................................................................................... 11 3. Hadoopet les outils de découverte des données.............................................................................................. 13 4. Machine learning................................................................................................................................................ 15 5. Les outils de visualisation................................................................................................................................... 16 6. Les compétences humaines............................................................................................................................... 17 7. Benchmark des solutions ................................................................................................................................... 18 II. LES DIFFERENTS USAGES DU BIG DATA..............................................................................................................................20 A. Le secteur des télécommunications ..................................................................................................................20 B. Le secteur de l’énergie.........................................................................................................................................21 C. Le secteur bancaire ..............................................................................................................................................22 D. Le secteur du commerce .....................................................................................................................................24 E. Le secteur public...................................................................................................................................................25 F. 4 V et 5 V et…........................................................................................................................................................27 G. Le secteur de la santé ..........................................................................................................................................27 H. Ressources humaines ..........................................................................................................................................29 I. Production et logistique ......................................................................................................................................31 III. BIG DATAET MARKETING ................................................................................................................................................33 A. Le marketing prédictif et fidélisation................................................................................................................33 B. Real-time marketing et native advertising..........................................................................................................35 C. Le ciblage...............................................................................................................................................................38 SECONDE PARTIE : LES BIG DATA FACE AUX PROFESSIONNELS....................................................................................39 IV. METHODOLOGIEDERECHERCHE.....................................................................................ERROR! BOOKMARK NOTDEFINED. V. INTERVIEWS..................................................................................................................ERROR! BOOKMARK NOTDEFINED. A. Collaborateur d’Ineo Digital..............................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. B. Spécialiste big data.............................................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. C. Spécialiste marketing .........................................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. VI. SYNTHESEDES INTERVIEWS ............................................................................................ERROR! BOOKMARK NOTDEFINED.
  5. 5. TROISIEME PARTIE : L’UTILISATION DES BIG DATA DANS L’ENTREPRISE COFELY INEO ..........................................40 VII. PRESENTATION DE COFELY INEO................................................................................ERROR! BOOKMARK NOTDEFINED. A. Activité..................................................................................................................Error! Bookmark not defined. B. Organisation ........................................................................................................Error! Bookmark not defined. C. Clients....................................................................................................................Error! Bookmark not defined. VIII. LECAS DE LASOCIETE INEO DIGITAL...........................................................................ERROR! BOOKMARK NOTDEFINED. A. Présentation d’Ineo Digital................................................................................Error! Bookmark not defined. B. Ineo Digital et la donnée....................................................................................Error! Bookmark not defined. 1. Le commerce..........................................................................................................Error! Bookmark not defined. 2. Les achats ...............................................................................................................Error! Bookmark not defined. 3. Le service facturation.............................................................................................Error! Bookmark not defined. 4. Le service SAV.........................................................................................................Error! Bookmark not defined. C. Le service marketing chez Ineo Digital ............................................................Error! Bookmark not defined. 1. Le service marketing créateur de données............................................................Error! Bookmark not defined. 2. Les actions marketing chezIneo Digital.................................................................Error! Bookmark not defined. a. Le service marketing direct...............................................................................Error! Bookmark not defined. b. Le service marketing des offres.........................................................................Error! Bookmark not defined. IX. APPLICATIONDESBIGDATAAUSERVICEDUMARKETINGCHEZINEODIGITAL...................................ERROR! BOOKMARK NOTDEFINED. A. L’acquisition clients : ciblage.............................................................................Error! Bookmark not defined. B. La fidélisation.......................................................................................................Error! Bookmark not defined. C. Développer de nouvelles offres et prévoir leurs potentiels..........................Error! Bookmark not defined. D. La vente de services complémentaires aux clients........................................Error! Bookmark not defined. E. Client à risque ......................................................................................................Error! Bookmark not defined. F. Définir les prix des contrats de maintenance .................................................Error! Bookmark not defined. X. MISEEN PLACED’UN PROJETBIG DATADANS LASOCIETE INEO DIGITAL............................ERROR! BOOKMARK NOTDEFINED. A. Les ressources nécessaires ................................................................................Error! Bookmark not defined. 1. Généralités .............................................................................................................Error! Bookmark not defined. 2. Ineo digital..............................................................................................................Error! Bookmark not defined. a. Solutions logicielles...........................................................................................Error! Bookmark not defined. b. Compétences humaines....................................................................................Error! Bookmark not defined. c. Coût global.........................................................................................................Error! Bookmark not defined. B. ROI.........................................................................................................................Error! Bookmark not defined. C. Conclusion ............................................................................................................Error! Bookmark not defined. BIBLIOGRAPHIE........................................................................................................................................................................42 TABLE DES ILLUSTRATIONS...................................................................................................................................................47 ANNEXES ...................................................................................................................................................................................48 ANNEXE 1 – GUIDE D’ENTRETIEN DE M. ROLAND KOLTCHAKIAN.....................ERROR! BOOKMARK NOT DEFINED. ANNEXE 2 – GUIDE D’ENTRETIEN DE M. HERVE DHELIN .....................................ERROR! BOOKMARK NOT DEFINED. ANNEXE 3 – GUIDE D’ENTRETIEN DE MME LAETITIA KOUADRIA ......................ERROR! BOOKMARK NOT DEFINED.
  6. 6. 1 Introduction 90% de toutes les données dans le monde ont été créés durant les deux dernières années. De nos jours la donnée est de partout, et elle est créée constamment, sur internet, via les smartphones, via les objets connectés, lorsque l’on paye par carte… et son rythme de croissance est exponentiel. Si cette croissance engendre des coûts de stockage faramineux pour les entreprises du web que sont Google, Amazon, Apple, et encore Facebook, ces données sont aussi une de leur plus grande richesse. La donnée d’hier est la richesse d’aujourd’hui. Les technologies de stockage et surtout les puissances de calcul de nos jours ont permis de créer des solutions capables d’analyser ces données afin de pouvoir en tirer des informations précieuses. Les big data sont nés. Big data, ce terme anglo-saxon est apparu il y a quelques années déjà et fait son apparition régulièrement lorsqu’éclate un scandale sur l’espionnage par les Etats Unis. S’il est très connu comme une des techniques pour combattre le terrorisme ses domaines d’application sont illimités. Astronomie, agriculture, météo, traffic, sécurité, gestion de l’énergie, amélioration des défaillances des chaines de production, recherche scientifique, médecine… il est impossible de citer toutes les utilisations qu’il en est fait car elles ne cessent d’augmenter. Il y a toutefois un domaine où l’on ne parle que de ça, c’est le marketing. Les marketeurs ne jurent que par ça tant le potentiel des big data est immense. En effet les big data sont le fait d’utiliser énormément de données afin de pouvoir en quelque sorte prédire l’avenir, ou du moins anticiper les actions des consommateurs. Et qui n’aurait pas rêvé de pouvoir savoir à l’avance à quel endroit du rayon du supermarché les yeux du client vont se poser et quelle couleur va l’inciter à choisir le produit, en fonction de la météo du jour, du résultat du match de foot de l’équipe locale et du trafic en ville. Si cet exemple reste irréaliste il est représentatif de ce que les big data sont capables de faire pour le marketing, à savoir donner toutes les clés aux marketeurs afin de pouvoir vendre à la bonne personne, au bon moment, via le bon canal. C’est ce que nous allons étudier dans cette thèse à savoir comment en utilisant les big data, les marketeurs vont-ils pouvoir améliorer le marketing dans une entreprise sur un marché en B2B et de ce fait apporter de la valeur à leur entreprise.
  7. 7. 2 Première partie : Concept de « big data »
  8. 8. 3 I. L’ère de l’information A. La généralisation d’internet Aujourd’hui internet fait partie du quotidien de millions, voire de milliard de personnes dans le monde. En 2015, « 42% de la population mondiale est connectée à Internet1», cela représente près de « 3,025 milliards d’internautes 1». Sur cette population 70% se connecte quotidiennement avec un temps de connexion moyen de « 4,8 heures par jour via un ordinateur, et 2,1 heures via un mobile 1 ». Si ces chiffres peuvent sembler impressionnants, ils ne sont rien comparés à la quantité de données que cela représente. En effet, si la quantité de données présentes sur internet à ce jour n’est pas quantifiable – 2,5 exabyte, soit 2,5 milliards de gigabytes (GB) été créées par jour en 2012 d’après le géant de l’informatique IBM 2 - elle ne cesse de croître à chaque action d’un individu, et ce sur internent et en dehors. Car « chacun et chacune d’entre nous produit et transmet des données sur nous-mêmes. Nous faisons cela en nous déplaçant passivement – notre comportement étant enregistré par des caméras ou l’utilisation de notre carte – ou en nous connectant sur notre ordinateur ou en surfant sur le net 3» sur notre smartphone. Cette augmentation de données ou data a été très fortement accentuée par l’émergence des réseaux sociaux. Comme le déclare Jean- Charles Cointot dans son ouvrage La révolution Big Data « fin 2013, Facebook, Twitter, Google + et LinkedIn totalisaient à eux seuls près de 2,5 milliards d’abonnés et YouTube fait état de plus d’un milliard de visiteurs uniques chaque mois. 4». Lorsque l’on sait que pour une durée d’une minute chaque jour, près de 277 000 tweets sont publiés, que les utilisateurs Facebook partagent 2 460 000 contenus et qu’environ 72 heures de vidéos sont chargées sur YouTube 5 et que l’ensemble de ces informations sont entièrement stockées et analysées par ces géants du web on comprend mieux 1 BLOG DU MODERATEUR [en ligne]. [Consulté le02/06/15]. Disponible sur Internet : http://www.blogdumoderateur.com/chiffres-internet/ 2 BBC [en ligne]. [Consulté le02/06/15]. Disponiblesur Internet : http://www.bbc.com/news/business - 26383058 3 SCIENCE DAILY [en ligne].[Consulté le03/06/15]. Disponiblesur Internet : http://www.sciencedaily.com/releases/2013/05/130522085217.htm 4 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 10. ISBN: 978-2-10-071142-0 5 DOMO [en ligne]. [Consultéle 03/06/15].Disponiblesur Internet : https://www.domo.com/learn/da ta-never- sleeps-2
  9. 9. 4 pourquoi d’après une étude d’Oracle, comme le montre le graphique suivant, le volume de données dans le monde va passer de 7 zettabytes (ZB) en 2015 soit sept mille milliards de gigabytes, à près de 44 zettabytes en 2020. Figure 1 - l'augmentation des data de 40% par an - d'après le site internet ATKearney [en ligne] [consulté le 03/06/2015] disponible sur internet http://www.atkearney.fr/strategic-it/ideas-insights/article/- /asset_publisher/LCcgOeS4t85g/content/big-data-and-the-creative-destruction-of-today-s-business-models/10192 B. La révolution du smartphone D’après l’ITU (International Telecommunication Union), en 2015 le taux de pénétration du mobile dans le monde était de 97% pour atteindre près de 7 milliards de mobile contre 738 millions en 2000 6. En France, « le taux d’équipement est de l’ordre de 112% et en Île-de-France de l’ordre de 175%. Grâce à la baisse des prix, de plus en plus de gens ont deux téléphones, l’un privé et l’autre professionnel par exemple.7 ». Cette inexorable croissance du mobile à travers le monde est une cause principale de 6 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne].[Consulté le03/06/15]. Disponiblesur Internet : http://www.itu.int/en/ITU-D/Statistics/Documents/facts/ICTFactsFigures2015.pdf 7 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 19. ISBN: 978-2-10-071142-0
  10. 10. 5 l’augmentation exponentielle du volume de données. En France, un mobile sur deux est un smartphone8, les Français sont constamment connectés à internet : envoi et réception d’emails, réseaux sociaux, itinéraires, téléchargement de jeux, lecture de vidéos, achats en ligne… sont autant d’actions rendues possibles pour quiconque possède un smartphone à portée de main. Si Big Brother n’est qu’un fantasme pour certains ou une réalité pour d’autres, la réalité de la mémorisation automatique de chaque action de chaque utilisateur est une réalité. Lorsque une personne interagit sur un réseau social tel que Facebook ou Twitter tous les tweets, statuts, partage d’informations avec sa communauté ou " Like " sur une page d’une marque sont enregistrés. Si la majorité des utilisateurs ne prêtent que peu d’importance aux informations qu’ils rendent ainsi disponibles, ce n’est pas le cas des géants d’internet qui exploitent et analysent ces données afin de définir le profil de l’utilisateur, de pouvoir le cibler et lui proposer les contenus et les publicités les plus adaptés. C. La règle des 3 V Comme le rappelle Jean-Charles COINTOT dans son ouvrage La Révolution Big data, le big data c’est bien évidement le traitement de très gros volumes de données. Mais le big data est avant tout chose le traitement de très grosses données qui proviennent surtout de différentes sources. « Analyser les millions d’enregistrements stockés dans un entrepôt de données traditionnel, ce n’est pas du big data, c’est une analyse volumineuse 9 ». C’est uniquement lorsque l’on croise diverses sources d’informations dans des volumes de données importants que l’on peut parler de big data. Par exemple : « Combiner les informations de consommation des clients stockées dans un entrepôt de données avec les logs de navigation sur les sites Web et les enregistrements de discussions d’un centre d’appel pour essayer d’anticiper le départ d’un client, c’est du big data quelle que soit la taille des sources d’information.9 » 8 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le03/06/15]. Disponiblesur Internet : http://www.cbnews.fr/etudes/toujours-plus-de-smartphones-et-tablettes-selon-mma-france- a1013528 9 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 36. ISBN: 978-2-10-071142-0
  11. 11. 6 D’après des spécialistes d’IBM, les big data se définissent par 3 propriétés qui les caractérisent à divers degrés. On les appelle les 3 V pour : volume, vélocité, variété et qui sont représentés dans le schéma suivant : Figure 2– les 3V des big data - d'après le site internet blog.sqlauthority.com [en ligne] [consulté le 15/06/15] disponible sur internet http://blog.sqlauthority.com/2013/10/02/big-data-what-is-big-data-3-vs-of-big-data-volume-velocity-and- variety-day-2- 1. Volume Le terme anglais « Big data » se traduit par grosses données en français ou « mégadonnées 10» plus exactement comme cela a été décidé par la commission générale de terminologie et de néologie le 22 août 2014 dernier. L’important volume 10 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet : http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml
  12. 12. 7 de données est la caractéristique première des big data et également la première caractéristique qui vient à l’esprit lorsque l’on en parle. La capacité de traiter de très larges quantités de données est l’un des principaux avantages des big data. Comme le déclare Forbes11, avoir plus de données bat avoir des meilleurs modèles : si vous deviez prévoir la météo, auriez-vous de meilleurs résultats en prenant en compte 300 facteurs ou seulement 6 facteurs. La réponse semble évidente. « Dans une approche statistique basée sur l’échantillonnage, il faut savoir ce que l’on cherche pour que l’échantillon soit représentatif. Dans une approche big data, il n’est pas besoin de faire des hypothèses préconçues puisqu’on a toutes les données. L’important n’est pas de réduire la taille des données à analyser mais au contraire d’associer le plus de données possibles relatives de près ou de loin au phénomène que l’on souhaite analyser. Plus il y aura de données, plus on a de chance de trouver une information passée jusque-là totalement inaperçue. 12» Le volume représente également l’un des principaux challenges pour les services IT des sociétés. Avec l’apparition de nouveaux formats de données telles que les données des réseaux sociaux, les données de navigation sur les sites internet, les mobiles, la géolocalisation, les vidéos… etc de nombreuses entreprises ont acquis des Terabytes voire des Petabytes de données dans leurs serveurs. Beaucoup de sociétés possèdent parfois sans le savoir de vastes quantités de données archivées, parfois sous forme de log mais peu d’entre elles possèdent les capacités de les traiter. La problématique des sociétés face aux big data n’est donc pas de créer des données mais plutôt de les regrouper et de les exploiter entièrement afin de pouvoir extraire l’information qui sera passée jusque-là inaperçue. Pour la plupart des données comme les informations relatives à l’identité d’une entreprise ou d’une personne, elles sont statiques. D’autres, comme les échanges entre les membres d’un forum ou d’un blog ont une fréquence de rafraîchissement « assez faible allant de l’heure à la journée, d’autres enfin, comme les tweets, les données de géolocalisation sont très dynamiques. Il faut pouvoir les traiter au fil de l’eau. C’est la vélocité, deuxième caractéristique du big data.12 » 11 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet : http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what-you-need-to-know- about-big-data/2/ 12 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 45. ISBN: 978-2-10-071142-
  13. 13. 8 2. Vélocité Dans le passé, la vitesse de création des données ne nécessitait une mise à jour de la base que tous les jours, voire toutes les semaines. Aujourd’hui, avec l’émergence d’internet, sont apparus les réseaux sociaux et avec l’apparition des smartphones, sont apparues les applications mobiles, ces deux vecteurs sont les principales causes de la création en continu et en quantité importante de données. Les sociétés qui sont capables de traiter et d’analyser en temps réel ce qui se passe et réagir en fonction possèdent un avantage concurrentiel certain. C’est le cas du secteur de la finance qui a depuis longtemps déjà mis des outils pour traiter l’information des marchés en temps réel. Aujourd’hui des sociétés telles que Amazon ont également mis en place des outils pour analyser en temps réel la navigation de leurs clients afin de leurs préconiser des produits susceptibles de les intéresser en se basant sur les produits visités par d’autres clients ayant le même profil. 3. Variété Dans l’ouvrage récompensé du titre Bestseller par le Wall Street Journal et The New York Time de Viktor Mayer-Schönberger et Kenneth Cukier intitulé Big Data: A Revolution That Will Transform How We Live, Work, and Think 13 les auteurs expliquent comment tout devient donnée. Ils appellent ce phénomène la datafication. En effet avec le big data on ne se contente plus de traiter uniquement des données mesurables et quantifiables bien organiser dans les lignes et colonnes de tableaux Excel. Avec le big data le format des données n’a plus d’importance, texte, vidéos, emails, sms, tweet, pdf, données brutes depuis un capteur… etc, toutes les données peuvent être traitées. Si la donnée est un texte qui n’est pas tapé directement par un outil de saisie alors il faudra lire l’image numérique avec des outils de reconnaissance optique. « Par cette opération de traitement du texte brut, celui- ci est devenu une donnée analysable, réutilisable, agrégeable à d’autres données pour tout type de traitement. C’est ainsi que les blogs, les forums, les réseaux sociaux sont devenus de vrais gisements d’informations sur les sentiments, les envies, les irritants, les 13 Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION THAT WILL TRANSFORM HOW WE LIVE, WORK, AND THINK. John Murray.2013. ASIN: B00GOHL9H6
  14. 14. 9 préférences, les intentions d’achat de leurs abonnés. 14 » Ce processus peut également être adapté à d’autres formats de données, Jean Charles COINTOT donne un exemple concret de la manière dont une donnée telle que le son peut être numérisée grâce à des outils de reconnaissance vocale comme le sont par exemple Siri sur l’Iphone ou Google Voice Search. « On peut imaginer un abonné à un service de télévision connectée qui se plaint de n’avoir pas pu regarder correctement un film loué en vidéo à la demande, parce que la qualité de l’image était très mauvaise. La reconnaissance vocale pourra déterminer qu’il n’est pas content, qu’il y a un problème de qualité d’image et de le codifier sous forme de données. Ces données seront combinées avec celles du réseau de l’opérateur pour vérifier qu’il y a bien un problème de qualité et, grâce aux informations du client pour vérifier qu’il a bien loué la vidéo dont il parle. On accédera peut-être également à son historique, pour savoir si c’est la première fois que cela lui arrive, ou si c’est un problème récurrent sur cette ligne. Ces recherches permettront au conseiller clientèle de savoir s’il s’agit d’un fraudeur et donc de l’éconduire ou, à l’opposé, de reconnaître un client malchanceux et lui proposer d’éventuelles compensations. Aujourd’hui, en général, le conseiller sait qui vous êtes et connaît vos abonnements, mais n’a aucun moyen de savoir si ce que vous dites est vrai – sauf s’il y a une panne générale de secteur. Si la mauvaise qualité de votre expérience est due à un phénomène plus fin, il ne le sait pas.15 » Le big data comporte trois types de données : - Les données structurées qui correspondent à « l'ensemble des valeurs possibles est déterminé et connu à l'avance. Par exemple, dans une base de données rassemblant les résultats d'une enquête d'opinion, l'âge ou la catégorie socioprofessionnelle des individus interrogés sont des données structurées, car les tranches d'âges ou la liste des catégories socioprofessionnelles possibles sont déterminées a priori. 16» - Les données semi structurées qui regroupent les structures de description de contenu comme le HTML ou le SGML qui n’ont pas de champ rigide mais qui 14 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 49. ISBN: 978-2-10-071142-0 15 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 51. ISBN: 978-2-10-071142-0 16 SYNOMIA [en ligne]. [Consultéle 02/06/15]. Disponiblesur Internet : http://www.synomia.fr/fr/vision-et- techno/synomia-menu-la-data-non-structuree
  15. 15. 10 possèdent des balises délimitant des champs. L’information n’est pas organisée mais possède toutefois une structure identifiable. - Les données non structurées, ou données complexes. Ce sont l’ensemble des données comme le texte ou les images ou encore les enregistrements sonores qui ne possèdent aucune structure identifiable et aucune logique d’organisation d’un point de vue d’un ordinateur. D. Les outils des big data Nous avons étudié les différents bénéfices que pouvaient tirer chaque société en fonction de leur industrie, nous avons également analysé les avantages des big data pour les différents services d’une entreprise. Nous allons maintenant nous attarder sur les différents outils qui compose le big data. En effet nous avons pu commencer à apercevoir que le big data n’est pas uniquement un logiciel ou un moteur de recherche qu’on lancerait et qui nous donnerait la réponse à toutes nos problématiques, les big data sont complexes, lourds à mettre en place et les solutions qui le composent sont aussi diverses que variées. 1. Infrastructure réseau Dans les big data nous l’avons vu, le premier V est volume. C’est-à-dire que la quantité de données est imposante. « Les avantages potentiels du Big Data côtoient la nécessité d’accomplir des progrès significatifs sur le plan des infrastructures de stockage et réseau nécessaires pour accompagner son essor. C’est le cas des caméras de sécurité. Dans les aéroports, les responsables de la sécurité commencent à envisager la possibilité de passer au format UltraHD ou 4K. Une telle résolution permet de rechercher facilement des informations précises et détaillées dans les flux vidéo, remplaçant les images noir et blanc granuleuses tout en réduisant les risques de sécurité.
  16. 16. 11 Tout en respectant les données de confidentialité et l’anonymat des personnes, il est également possible d’utiliser des caméras 4K pour analyser le comportement des consommateurs ou la circulation des piétons. Car ce format n’est pas réservé aux téléviseurs XXXL présentés au salon au salon CES de Las Vegas ! Or, la résolution 4K exige un socle particulièrement solide. Une seule minute au format 4K représente environ 5,3 Go ! À Londres par exemple, 7 000 caméras de vidéosurveillance en 4K généreraient chaque jour quelque 52 pétaoctets, soit plusieurs fois le volume de données stockées dans la bibliothèque du Congrès de Washington. 17» Avec les big data la problématique du stockage des masses de données rentrent donc en compte. Mais ce n’est pas la seule problématique, même si aujourd’hui les solutions de stockage à bas coût existent, telles que la sauvegarde sur des serveurs, les technologies du big data nécessitent aussi des systèmes d’infrastructures réseaux agiles avec des capacités d’écriture et de calcul élevées. 2. Les bases de données Avec l’apparition des big data nous l’avons vu, est également apparu une très grande variété de données. Ces données peuvent provenir de différentes sources, comme les réseaux sociaux, des capteurs, les forums, mais aussi des conversations qui sont numérisées. Ces données brutes sont donc dites non structurées, c’est-à-dire qu’elles n’ont pas d’organisation, et ne peuvent pas être ordonnées afin de faciliter leur traitement. Afin de pouvoir les analyser il a alors été nécessaire de créer d’autres formats de stockage. Initialement, les données étaient stockées dans des bases de données dites classique en SQL. « SQL est l’acronyme de Structured Query Language. Il est connu depuis longtemps de tous les acteurs de l’informatique qui ont eu à rechercher rapidement des informations dans de grosses bases de données relationnelles (SGBD). Dans les années 90, certains commerciaux dans des compagnies de logistique n’avaient ni 17 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml
  17. 17. 12 souris ni écran graphique, ni interface utilisateur pour rechercher certaines informations stockées sur des serveurs souvent distants et reliés par des lignes spécialisées : ils entraient au clavier des commandes SQL et étaient capables de répondre à leur client sur la disponibilité de tel ou tel camion ou train en quelques secondes. SQL est aujourd’hui largement utilisé, car étant un des dispositifs d’organisation et d’interrogation de bases de données le plus structuré et le plus rapide ; il se décline sous différentes appellations qui montrent qu’il y a des adaptations diverses comme c’est notamment le cas de MySQL d’Oracle qui est le plus gros concurrent de SQL de Microsoft. 18» Pour les utiliser les données non structurées du big data, est apparu à partir de 2009 le terme NoSQL qui ne signifie pas "non SQL" mais plutôt "not only SQL". « Les bases de données NoSQL adressent des enjeux différents de ceux des bases de données relationnelles historiques. Ces bases de données de type NoSQL viennent compléter (et non pas remplacer) les bases de données relationnelles qui se heurtaient à des limites d’évolutivité et de performances dans des environnements de données massives. Avec la prolifération annoncée des objets connectés qui vont être autant de sources de nouvelles données, la gestion de bases de données massives se posera de manière accrue. Les bases de données NoSQL se différencient du modèle SQL par une logique de représentation de données non relationnelle qui se caractérise en général par : 38»  « D’importants volumes de données structurées et non structurées 38»  « Une multitude de requêtes simultanées 38»  « Une forte évolutivité de type scale out (évolution horizontale par rajout de serveurs) 38»  « De hautes performances 38» 18 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://blog.ontrack.fr/big-data- pourquoi-nosql/
  18. 18. 13  « Pas de schéma (schema less). La base de données n’impose pas de définition des éléments au sein d’un ensemble de données. 19» Ce format beaucoup plus flexible c’est aujourd’hui imposé dans le domaine des big data, comme un des formats de référence pour traiter les données complexes dans de grand volume. D’autres formats de données ont également étaient développés par des géants de l’informatique tel que le NewSQL développé par Google. 3. Hadoop et les outils de découvertedes données Les problèmes d’infrastructures résolus et les difficultés de stockage des données non structurées traitées il a fallu également développer des outils capables d’aller organiser et analyser ces vastes données. Pour les géants du web tels que Google, Yahoo, Facebook, Ebay… il est très vite devenu primordial pour eux de trouver une solution rapide et peu coûteuse capable d’aller organiser leurs données et d’en retirer les informations voulues. Il existe de nombreuses solutions sur le marché des big data, mais la solution la plus commune est l’outil développé en Open Source : Hadoop. Hadoop est une solution développée par Yahoo se basant sur des recherches de Google. Hadoop n’est pas une solution en elle-même c’est davantage une plate-forme composée de différents programmes comme on peut le voir sur le schéma suivant : 19 DATA BLOG [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de-donnees-nosql-quelles- repoussent-encore-leurs-limites/
  19. 19. 14 Figure 3 - Vue synthétique de l'outil Hadoop - d'après le site internet DATACONOMY [en ligne] [consulté le 19/06/15] disponible sur internet - http://dataconomy.com/hadoop-components-need-know/ Les 4 modules principaux qui composent l’outil sont : - Hadoop Distributed File System (HDFS) : « HDFS est comme son nom l’indique un système de fichiers distribué, c’est-à-dire que chaque machine composant la grille Hadoop (cluster en anglais) va héberger une partie des fichiers. Pour simplifier, on peut comparer HDFS à un RAID logiciel distribué sur plusieurs serveurs. Ce système de fichiers possède une capacité d’hébergement parfaitement linéaire (chaque octet de disque ajouté à la grille peut participer à l’hébergement des fichiers), une forte tolérance à la panne, par défaut, chaque fichier est présent en trois exemplaires distribués sur des machines, des racks, voire des data-centers différents. De la même façon, chaque machine apporte ses capacités en I/O au cluster et la grille est donc capable d’absorber rapidement de grandes quantités d’écriture. 20» - MapReduce 21 : cet outil trouve son nom d’après les deux opérations qu’il réalise. La lecture des informations dans la base de données, et la mise en forme dans un format adapté pour l’analyse (Map), puis le rassemblement des informations et leurs analyses pour donner un résultat simplifié (Reduce). 20 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/ 21 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is-hadoop-and-why-you-should- know-about-it?trk=mp-author-card
  20. 20. 15 - Hadoop Common 40: un outil permettant aux utilisateurs de lire les données stockées sous le système Hadoop files. - YARN 40: ce logiciel gère les ressources du système de stockage des données et des analyses. Hadoop est un outil utilisé par la plupart des sociétés traitant des grandes quantités de données car c’est un outil très flexible et très peu coûteux comme il est en open source, c’est-à-dire que tout le monde peut le modifier librement, et qu’il fonctionne sur tous les serveurs informatiques, mêmes les bas de gamme. 4. Machine learning En 1959, Arthur Samuel a défini le machine learning comme un champ d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés.22 Si le machine learning est bien antérieur aux big data c’est bien grâce au développement de ces derniers qu’il a retrouvé tout son intérêt. « Le machine learning consiste à construire des systèmes qui apprennent les données qu’ils reçoivent. Autrement dit, à partir d’un comportement initial, les algorithmes de machine learning sont capables de se corriger et d’évoluer en fonction des faits dont on les alimente. Ces systèmes sont le plus souvent basés sur des modèles mathématiques, comme les réseaux bayésiens naïfs ou les réseaux neuronaux, pour lesquels on va chercher un paramétrage optimal. La construction d’un système comporte ainsi deux phases. La phase initiale consiste à entraîner la machine, à partir d’un jeu de données connu. Une fois le système entraîné, il faut le confronter au monde réel et l’évaluer régulièrement afin qu’il se corrige et s’améliore à chaque nouvelle donnée reçue.23» Parmi les utilisateurs du machine learning couplé aux big data on retrouve notamment Amazon. Son moteur de recommandation qui suggère les articles les plus pertinents 22 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://dataconomy.com/understanding-big-data-machine-learning/ 23 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/
  21. 21. 16 pour l’internaute en fonction de ses articles précèdent visionnés "apprend" au fur et à mesure qu’il propose des articles et suivant les actions de l’internaute. Si le machine learning trouve tout son intérêt avec les big data c’est parce qu’avec la masse de données, et l’évolution des puissances de calcul, le machine learning permet d’améliorer avec signification la pertinence des prévisions des systèmes apprenant. 5. Les outils de visualisation Les big data n’ont aucun intérêt si l’analyse des résultats qu’ils fournissent n’est pas compréhensible par une personne humaine. Comme l’explique Jean-Charles COINTOT dans son ouvrage, « les représentations classiques de l’analyse descriptive par des courbes, pour les séries temporelles, par des histogrammes pour les variables continues, bâton pour les variables discrètes, camemberts pour les pourcentages ne sont plus suffisantes. Elles étaient prévues pour des modèles à deux voire trois dimensions maximum. 24». Avec les big data la quantité d’informations à communiquer est beaucoup plus complexe. C’est pourquoi de nouveaux modèles de visualisation des informations ont dû être développé tel que les étoiles, les cubes ou encore les heatmap. Les heatmap sont des cartes qui représentent les zones où les données analysées sont les plus élevées. Les heatmap sont particulièrement utiles pour représenter du parcours client dans les rayons des magasins comme c’est le cas sur l’image suivante. En utilisant les big data on peut ainsi représenter de façon concrète le parcours des clients étant également actifs sur les réseaux sociaux et ayant une carte de fidélité dans le magasin. 24 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 70. ISBN: 978-2-10-071142-0
  22. 22. 17 Figure 4 - Heatmapdu parcours client dans un magasin - d'après le site internet TYCO RETAIL SOLUTIONS [en ligne] [consulté le 24/06/15] disponible sur internet - http://www.tycoretailsolutions.com/Pages/ArticleDetail.aspx?ItemId=639 6. Les compétences humaines Les big data nécessitent des compétences en mathématique et en statistiques avancées. Il est également nécessaire d’avoir des compétences avec les outils informatiques, mais également comprendre les enjeux marketing afin de pouvoir produire des analyses permettant aux directions de l’entreprise de prendre des décisions. Un nouveau profil de spécialiste des big data est apparu, le data scientist. D’après IBM, le data scientist est une évolution des postes de data analyst, c’est-à- dire que son rôle est d’analyser des données pour faire apparaitre des modèles et de corrélations entre des évènements qui n’étaient pas identifiables à une petite échelle mais qui sont significatifs. La différence, selon IBM, entre un data analyst et un data scientist réside dans la capacité de ce dernier d’explorer les données de différentes
  23. 23. 18 bases de données tandis que le data analyst tirera ses analyses d’une seule base tel qu’un CRM 25. Si le data scientist est au cœur des enjeux du big data c’est l’ensemble des collaborateurs autour des projets big data qui doivent posséder des compétences en la matière. En effet même si le data scientist doit être capable de communiquer avec les dirigeants de l’entreprise et leurs fournir des analyses compréhensibles, ces derniers doivent être en adéquation avec la stratégie big data afin de pouvoir utiliser tous les avantages qu’ils offrent. 7. Benchmark des solutions Il existe aujourd’hui une multitude de solutions sur le marché en France. Certaines clés en main, d’autres en open source, ou encore en mode SaaS, c’est-à-dire que toute la solution est dématérialisée et passe par le cloud. Dans le mapping suivant, extrait d’une étude réalisée par le cabinet Markess International, on distingue clairement les différentes catégories de solutions correspondants aux différents outils qui composent les projets de big data. On retrouve logiquement tous les géants de l’IT qui ont très rapidement créé ou acquis, par l’achat de startup prometteuses, des solutions dédiées aux big data dans ce marché qui est un marché d’avenir et représentant un chiffre d’affaire très important. Dans les acteurs incontournables on retrouve notamment IBM, le géant des solutions informatiques qui propose des solutions à tous les niveaux du projet, de l’infrastructure réseau, à la business intelligence en passant par la gestion des données. La société Apache avec sa technologie Hadoop est également très présente tout comme SAP, Oracle, Microsoft ou encore Capgemini et même Amazon avec son offre hébergé dans le cloud. 25 IBM [en ligne].[Consulté le 24/06/15].Disponiblesur Internet : http://www- 01.ibm.com/software/data/infosphere/data-scientist/
  24. 24. 19 Figure 5 - d'après une étude de Markess International : Meilleures approches pour tirer parti du Big Data [en ligne] [consulté le 24/06/15] disponible sur internet : http://blog.markess.fr/2014/09/referentiel-de-pratiques-big-data- strategies-de-gouvernance-des- donnees.html
  25. 25. 20 II. Les différents usages du big data Nous avons vu qu'une stratégie big data une fois implémentée dans une entreprise devait lui permettre de gagner de la valeur. Cela ne signifie pas que les big data peuvent uniquement servir dans une stratégie visant à augmenter le chiffre d’affaire de l’entreprise. En effet l’utilisation des big data peut avoir lieu à tous les niveaux d’une entreprise de la chaîne de production au marketing et surtout pour toutes les industries du secteur de la santé à l’agriculture en passant par le monde de la finance. A. Le secteur des télécommunications Le secteur des télécommunications est au cœur du digital. Les opérateurs téléphoniques ont accès à des bases presque illimitées de données. Bien que la plupart ne soit pas exploitable notamment pour des questions d’ordre juridique sur les données privées, la plupart des données qui transitent par les téléphones, télévisions sur IP et antennes relais sont stockées et analysées. Les opérateurs ont pendant longtemps été en retard sur la connaissance de leurs clients car ils ont vécu pendant les vingt dernières années sur un marché en croissance constante, générant de fortes marges et avec une concurrence faible. Aujourd’hui, de nouveaux entrants ont fait leur apparition et les clients sont beaucoup plus attentifs aux prix du marché. C’est pourquoi les opérateurs ont mis à profit les bases de données comportant toutes les informations sur les clients afin de chercher à comprendre leurs attentes. « Fidélisation, connaissance client, système d’engagement sont devenus le crédo de la profession. Au-delà de la fidélisation, les opérateurs cherchent à prédire la probabilité qu’un client décide de passer chez un concurrent et à réagir en conséquence. Ils ont un avantage sur les autres industries dans la mesure où toutes nos communications passent par leur réseau et génèrent des CDR ( call detail records ) dont ils ont connaissance. Ainsi grâce aux technologies big data, il est possible de croiser l’analyse de ces enregistrements pour un abonné, sa navigation sur les sites Web, l’enregistrement éventuel de ses conversations avec le centre d’appel et de support et les « posts » envoyés sur des réseaux sociaux, afin de les combiner avec des analyses plus traditionnelles de type sociodémographique pour
  26. 26. 21 en déduire des comportements « à risque » du point de vue de l’opérateur26», c’est-à- dire le risque qu’un client ne quitte l’opérateur pour aller chez un concurrent. En analysant le profil du client, l’opérateur est alors capable de mettre en place des actions marketing personnalisées afin de retenir le client chez lui. Outre les avantages marketing du big data pour les opérateurs de télécommunication, le big data permet aussi aux acteurs de ce secteur de gérer plus efficacement l’optimisation du réseau, et plus exactement la qualité du service et l’optimisation automatique des réseaux. Auparavant les opérateurs disposaient uniquement des informations transmises par les antennes qu’ils possédaient. Avec les big data, ils sont désormais capables de traiter en temps réel des informations semi structurées telles que celles fournies par les terminaux des utilisateurs ainsi que celle de leur propre réseau. Le big data permet même d’aller encore plus loin. En utilisant les informations concernant les pannes passées et les actions humaines qu’il a été nécessaire de réaliser pour réparer le problème les machines "apprennent", et sont capables de réaliser elles-mêmes les actions correctives sans qu’un humain n’est besoin d’intervenir. Les pannes sont ainsi évitées ou réparées instantanément avec un taux d’erreurs très faible fournissant ainsi une qualité de service optimale et constante à l’ensemble des usagers. B. Le secteur de l’énergie Le secteur de l’énergie est un des secteurs les plus stratégiques tant par la dépendance de la population mondiale à l’électricité au quotidien mais également par la prise de conscience mondiale quant aux dangers d’une surexploitation des ressources énergétiques fossiles et nucléaires. Depuis plusieurs années déjà, les gouvernements ont pris conscience de l’enjeu énergétique et déploient des efforts importants afin de réduire la production des gaz à effet de serre et de développer l’utilisation des énergies renouvelables. L’un des principaux défis énergétiques est de réguler la production d’électricité afin qu’elle soit le plus proche possible des besoins réels. Actuellement l’électricité est produite en fonction de prévisions et des analyses 26 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 149. ISBN: 978-2-10-071142-0
  27. 27. 22 plus ou moins précises des besoins de la population. De l’électricité est envoyée sur le réseau et tout ce qui n’est pas consommé est perdu. Afin de réduire ces pertes et de diminuer la production d’énergie des réseaux dit intelligents ont été mis en place, on les appelle également « smart grid ». Ces réseaux ont la particularité d’être dotés de capteurs qui transmettent en temps réel des données sur la consommation et la distribution de l’énergie. « Les données captées sont remontées à un niveau local, régional ou central et analysées avec des technologies de big data pour réguler manuellement ou automatiquement le réseau et ses différents niveaux.27» L’utilisation des big data permet donc d’optimiser la production, les grosses centrales électriques produisent de l’électricité en continu et leur production ne peut pas être modifiée instantanément mais la production locale de l’énergie renouvelable peut plus facilement être modulée et redirigée vers d’autres réseaux si besoin. Grâce à l’analyse des besoins et contraintes des tous les acteurs l’acheminement, le transport et la distribution seront également améliorés. En utilisant les données météorologiques il est possible de calculer les capacités de production en énergie solaire et éolienne au niveau local, et les besoins en énergie en fonction de la connaissance de la consommation locale et ainsi d’améliorer la répartition des unités de production en incluant les productions des particuliers. De plus en plus de compteurs intelligents, c’est-à-dire qui remontent l’information presque instantanément aux fournisseurs sont installés chez les consommateurs. Ces données permettent aux fournisseurs de mieux comprendre la consommation des clients et en croisant ces informations avec d’autres informations d’adapter leurs offres tarifaires. C. Le secteur bancaire A l’instar du secteur des télécoms, les banques possèdent énormément de données sur les clients. Mais leur avantage avec les opérateurs téléphoniques est qu’elles possèdent des données relatives aux habitudes et aux comportements de consommations des clients, règlement par carte ou par chèque, retrait, emprunt, 27 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 157. ISBN: 978-2-10-071142-0
  28. 28. 23 assurance, épargne, mais aussi les grandes étapes dans la vie des clients telles que la construction d’une maison, la naissance d’un enfant, le mariage… autant de données dites privées qui sont disponibles aux banques. D’après certains analystes, les sociétés gérants les cartes de paiement telles que Visa, ou American express « surveillent désormais les transactions pour savoir si vous présentez le profil de quelqu’un qui s’apprête à divorcer. 28» Si le secteur bancaire regroupe une vaste communauté de métiers très divers et variés tels que les investissements, les banques privées ou publiques, les banques de détails, nous allons nous intéresser principalement aux banques de détails. Le premier avantage des big data pour les banques est la meilleure compréhension de leur clients. Aujourd’hui plus encore les banques n’offrent pas uniquement un moyen de protéger son argent. Les banques offrent des services personnalisés qui répondent à de nombreux besoin de leurs clients, prêts à la consommation et à moyen et long terme : assurances, compte courant, différents moyens de paiement (carte de crédit, carte de paiement, chéquier, paiement en ligne sécurisé,…) mais également différents moyens d’interactions tels que les agences, les centres d’appels, les distributeurs automatiques, les sites internet… En analysant l’ensemble des informations recueillies sur les habitudes de leurs clients, les banques sont capables de fournir un service adapté avec des offres adaptées aux besoins des clients. D’après Gartner 29, les big data sont une des clés pour permettre aux banques de résoudre leurs problèmes de fraudes et de sécurité. Toujours selon eux, l’analyse des big data permet aux sociétés de combiner et croiser des données internes et externes afin de pouvoir voir une image plus large des menaces contre leur entreprise. Pour les banques il est essentiel de pouvoir le plus rapidement possible, accepter ou refuser une transaction, en identifiant correctement s’il y a fraude ou non sans mettre en place des contrôles trop lourds qui rebuteraient les bon clients. En utilisant les capacités des 28 REINFORMATION.TV [en ligne].[Consulté le17/06/15]. Disponiblesur Internet : http://reinformation.tv/big- data-surveiller-achats-predire-divorce-reve-visa/ 29 GARTNER [en ligne].[Consulté le 16/06/15].Disponiblesur Internet : http://www.gartner.com/newsroom/id/2663015
  29. 29. 24 big data les banques pourraient ainsi réduire considérablement les risques de fraudes bancaires qui coûtent près de 100 milliards de dollars par an 30. D. Le secteur du commerce Pour l’auteur de l’ouvrage La révolution du big data, « Le commerce est sans doute le secteur où le big data va le plus révolutionner les pratiques. Que ce soit pour la gestion des magasins ou des sites marchands, la gestion du programme de fidélité, des promotions, des réassorts, ou encore de la logistique, son usage impacte toutes les activités du commerce. Cette révolution est en marche aux États- Unis, et démarre en France. 31» Pour les distributeurs, l’utilisation des big data impacte leur secteur sur trois axes essentiellement : - La gestion des stocks - Le ciblage des produits pour les clients - L’assortiment des magasins et des rayons Le premier point, la gestion des stocks, se rapproche des avantages que tire également le secteur de la logistique car tous comme les acteurs de ce secteur il est très important pour les distributeurs d’avoir suffisamment de produits en stock pour ne pas avoir de pénurie, ce qui peut entraîner le mécontentement des clients, sans non plus avoir trop de stock, ce qui engendre des coûts supplémentaires. Grâce aux big data, les distributeurs peuvent désormais analyser les données de diverses sources afin de prévoir les ventes. Ils peuvent par exemple mettre en corrélation leurs propres actions marketing ainsi que celles des concurrents, prendre en compte les informations glanées sur les réseaux sociaux sur les humeurs et les tendances 30 THE GUARDIAN [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than-100-billion-dollars 31 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 181. ISBN: 978-2-10-071142-0
  30. 30. 25 d’achats des clients, tenir également compte de la météo qui influe sur les achats des consommateurs et incorporer les facteurs locaux tels que les matchs ou les festivals. L’autre avantage des big data est, tout comme pour les secteurs que nous avons étudié précédemment, la connaissance client. A l’inverse du secteur bancaire qui possède des informations sur l’ensemble des habitudes d’achat des consommateurs, les chaînes de magasins possèdent uniquement des informations sur les achats effectués dans leurs rayons. Toutefois le niveau de détail de ces informations est beaucoup plus détaillé car les distributeurs ont accès aux tickets de caisse et donc, au détail des produits qui composent le chariot de leurs clients. Grâce aux cartes de fidélités, les magasins ont également la possibilité d’identifier les clients, ils peuvent ainsi réaliser des offres promotionnelles ciblées. Avec l’avènement du e-commerce, le client s’identifie pour faire ses courses en ligne ou les cookies de son ordinateur permettent de l’identifier précisément. Pour le reste le principe est le même, à savoir identifier le profil du client afin de mettre en avant les produits qui seront le plus susceptibles de les intéresser afin de leurs faire consommer d’avantage. Dernière utilisation pour les distributeurs des big data, l’analyse des déplacements des clients dans les rayons, le temps passé devant chaque rayon, ses arrêts, ses achats. Depuis toujours les magasins tentent de trouver le meilleur arrangement de leurs rayons afin que le client puisse passer devant les produits qu’ils souhaitent mettre en avant. En utilisant les données de géolocalisation de leur smartphone par exemple ou grâce à des caméras et des capteurs situés dans les magasins les géants de la distribution peuvent désormais analyser les données des déplacements et croiser ces informations avec la composition des achats des clients. E. Le secteur public Le secteur public entend également tirer parti des avantages des big data. Dans une étude de Markess, cinquante-trois décideurs d’organisations publiques interrogés
  31. 31. 26 déclarent avoir des projets en cours sur l’utilisation des big data32. Si les contraintes sont nombreuses, protections des données publiques, contraintes juridiques sur les données personnelles, harmonisation des échanges entre les services, les avantages de la mise en pratique de l’analyse des big data pourraient permettre au gouvernement de faire des économies importantes. Les administrations ont accès à des sources d’informations riches et variées, des données socio-démographiques de leur ville, aux informations de la sécurité sociale en passant aux trafics routiers et les transports en commun. Le gouvernement entend également ouvrir ces informations aux citoyens afin d’offrir des possibilités de développement de solutions s’appuyant sur ces « open data 33 ». Pour le gouvernement les avantages sont multiples : Identification des fraudes fiscales ; Amélioration du système scolaire ; Organisation des territoires, des systèmes de transport, des services aux citoyens ; mais aussi Diminution de la criminalité. Les big data sont donc une priorité pour l’état français, comme le prouve le "plan big data34" amorcée en juillet 2013 par Fleur Pellerin, alors ministre en charge de l’économie numérique. L’autre avantage retirer des big data par le gouvernement est indéniablement la sécurité du territoire. Les Etats Unis en ont fait un fonds de commerce de leur sécurité et lutte contre le terrorisme, ils exploitent toutes les informations qu’ils peuvent récupérer sur les citoyens dans le monde entier. D’après un article du monde, « aux Etats-Unis, avec les trois données que sont le code postal, la date de naissance et le sexe, 90 % des personnes sont désormais identifiables.35 ». De nombreux scandales ont démontré que les informations récoltées par les gouvernements ne s’arrêtaient pas uniquement aux états civils des citoyens : sms, appels, emails, mais aussi profil sur les réseaux sociaux, géolocalisation, les informations laissées sur la toile par les citoyens sont une mine d’or pour les services de renseignement et si certaines lois 32 SYNOMIA [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des- avancees-sensibles/ 33 DATA.GOUV.FR [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des- avancees-sensibles/https://www.data.gouv.fr/fr/ 34 01NET.COM [en ligne]. [Consultéle 17/06/15].Disponiblesur Internet : http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/ 35 LEMONDE.FR [en ligne].[Consulté le 17/06/15].Disponiblesur Internet: http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour-l- europe_4655737_3232.html
  32. 32. 27 doivent protéger les données personnelles beaucoup sont franchies au nom de la sécurité nationale. F. 4 V et 5 V et… Les 3 V sont à la base des big data, mais d’autres caractéristiques cruciales des big data sont apparues avec un quatrième puis un cinquième puis un sixième voire même un septième V selon certains spécialistes. Parmi les « autres V » que l’on retrouve en plus des 3 qui forment la base nous pouvons mentionner : - Véracité (Veracity) qui définit la qualité des données, bien qu'avec les big data le volume prime sur le manque de qualité, cet aspect reste important afin d’avoir des analyses justes et précises. - Variabilité (Variability) à ne pas confondre avec la variété, la variabilité correspond à la signification des données. Cela est le cas avec l’analyse d’informations provenant des réseaux sociaux ou des forums, suivant le contexte un même mot dans un tweet peut avoir une signification différente et changer complètement le sentiment exprimé. - Visualisation (Visualization), si la lecture des résultats n’est pas simplifiée et clarifiée alors l’étude des résultats ne peut avoir lieu. - Valeur (Value), avoir des big data et les exploiter ne fait pas tout pour une entreprise c’est une perte de temps et de ressources à moins que l’entreprise arrive à transformer ses big data en valeur pour son business. G. Le secteur de la santé Le secteur de la santé n’échappe pas non plus aux big data. D’après le « docteur Eric Baseilhac, directeur des Affaires Economiques du Leem, l’un des principaux syndicats de fabricants de médicaments, l’usage des Big Data dans la santé est une révolution,
  33. 33. 28 qui va s’imposer et avoir un impact extrêmement structurant sur le système de santé en général 36 ». Pour les acteurs de la santé les bénéfices sont nombreux : - Prévention des épidémies : comme le relate Viktor MAYER-SCHÖNBERGER et Kenneth CUKIER, en 2009, quelques temps avant la crise sanitaire mondiale du H1N1, des chercheurs de Google ont publié leurs recherches. Leurs recherches visaient à développer un outil qui permettrait d’identifier en temps réel l’évolution d’épidémiesen se basant sur les recherches Google des gens infectés. L’avantage de cet outil par rapport aux méthodes traditionnelles est le résultat en temps réel de la propagation des épidémies alors qu’il faut près de 2 semaines pour les organismes de santé pour recenser les maladies et dresser une carte, déjà périmée donc, des personnes infectées. Aujourd’hui toujours, leur outil fonctionne est permet de suivre l’état de la grippe dans le monde sur le site internet dédié : google.org Flu Trends (http://www.google.org/flutrends). Si cet outil n’est qu’un prototype de ce qu’il est possible de réaliser en utilisant de vastes quantités de recherches comme celles que Google possèdent, on imagine tout le potentiel des prédictions en utilisant les big data et en combinant différentes sources d’information telles que les réseaux sociaux, les achats de médicaments en pharmacie, les arrêts de travail, les appels téléphoniques aux urgences. Avec un algorithme assez puissant et un accès à toutes les informations il est tout à fait concevable de pouvoir identifier les débuts d’épidémies le plus tôt possible et ainsi déployer les moyens nécessaires pour les contenir. - Diagnostiques médicaux : à une échelle plus réduite mais faisant appel à des données tout aussi nombreuses on retrouve l’utilisation des big data pour soigner des patients au cas par cas. C’est déjà le cas aux USA, à New York au Memorial Sloan Kettering Cancer Center plus exactement. Dans cet institut médical les médecins utilisent un outil créé par IBM, Watson, qui permet d’assister les spécialistes dans leurs diagnostiques des patients et dans le choix des traitements.37 Cette technologie repose sur l’analyse de millions de données de cas passés de patients qui ont été traités. Bien plus qu’un simple assistant, la 36 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante- jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99 37 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : https://www.mskcc.org/blog/msk- trains-ibm-watson-help-doctors-make-better-treatment-choices
  34. 34. 29 machine apprend en fonction des nouvelles découvertes médicales du domaine et améliore ses décisions. - Prévention médicale : la compréhension du corps humain bien qu’elle ait énormément évolué depuis le siècle dernier reste encore complexe et de nombreuses maladies bien qu’elles puissent être traitées une fois identifiées ne peuvent pas être anticipées. Avec les big data les chercheurs sont capables d’aller puiser dans des milliards de données patients, du détail de leur génomes jusqu’aux différents événements de leur vie et trouver des modèles récurrents. C’est ce qu’explique le docteur Eric Baseilhac « Avec les données, on va être capable de cibler les bonnes personnes en fonction du risque qu’elles ont de développer telle ou telle maladie 38» Le secteur des télécommunications, de l’énergie, bancaire, du commerce, et public ne sont pas les seules industries d’application des big data. Le big data peut en réalité s’appliquer à toutes les industries, de l’agriculture au sport, l’étendue de ses applications n’a pas de limite et il ne serait pas surprenant de trouver les big data dans toutes les entreprises dans quelques décennies. De la même manière que chaque industrie pourra trouver des avantages qui lui sont propres de l’utilisation des big data, le même procédé s’applique aux différents services d’une entreprise. C’est pourquoi les ressources humaines d’une entreprise pourront trouver des avantages aux big data qui ne seront pas les mêmes que ceux que pourra trouver le département marketing ou le service logistique et transport. H. Ressources humaines Les ressources humaines sont un des domaines où l’usage de l’IT avait peu sa place. Pourtant les mœurs sont en train de changer malgré le fait que « La culture IT des 38 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante- jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99
  35. 35. 30 populations RH frise le zéro absolu 39», comme le déclare le spécialiste d’un cabinet de conseil en transition numérique. Le capital humain d’une société est la clé de son succès, sans collaborateurs efficaces et adaptés la plupart des sociétés se verraient mettre la clé sous la porte rapidement. Le recrutement, la promotion interne, et le taux de turnover sont trois facteurs essentiels qui peuvent être amélioré par l’utilisation des big data. Dans un article du Wall Street Journal de 201240, le journaliste rapporte le cas de la société Xerox. La société possédait un call center et recrutait les candidats en portant beaucoup d’importance sur les candidats qui possédaient une expérience similaire. La société avait un taux de turnover très élevé ce qui lui posait problème car l’investissement en formation des nouvelles recrues était de $5000 et il fallait que le nouvel arrivant reste au minimum 6 mois pour que sa formation soit amortie. En utilisant les big data, la société à découvert que les candidats avec une expérience similaire n’était pas ceux qui démissionnaient le moins, bien au contraire. L’analyse des résultats montraient que des candidats avec une personnalité créative été ceux qui convenaient le mieux au profil du poste. En testant leur nouvelle théorie pendant 6 mois, la société a ainsi réduit de 20% le taux de turn over de ses effectifs. Cet exemple démontre que en utilisant les big data et en recueillant suffisamment de données sur le profil des candidats et le profil du poste, le choix des candidats lors d’un entretien d’embauche peux améliorer le recrutement et donc les performances d’une entreprise. Certaines sociétés appliquent également les big data pour la promotion et la formation de leurs employés. En croisant les informations sur les employés, leurs profils psychologiques, leurs résultats dans l’entreprise, les informations externes à l’entreprise telles que les réseaux sociaux… etc les sociétés peuvent déterminer quel candidat est le mieux adapté pour évoluer sur tel ou tel poste ou encore quel employé a besoin de recevoir telle ou telle formation afin d’être plus performant dans ses missions. En France, l’utilisation des big data pour la sélection, ou la promotion des employés restent encore taboue. Pourtant aux USA, de nombreuses sociétés utilisent déjà ces 39 MYRHLINE [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://www.myrhline.com/dossier- rh/big-data-et-ressources-humaines/article/le-big-data-en-rh-ca-sert-a-quoi.html 40 WALL STREET JOURNAL [en ligne].[Consulté le 18/06/15].Disponiblesur Internet : http://www.wsj.com/articles/SB10000872396390443890304578006252019616768
  36. 36. 31 technologies41. Même si de nombreux recruteurs ont peur que la machine prenne leur place dans le recrutement des employés de demain ou s’ils doutent que des chiffres peuvent remplacer leur intuition, la réalité a prouvé que même les performances des hommes peuvent être prévisibles et quantifiable grâce à l’analyse de données. Ce modèle s’applique même au domaine du recrutement de joueurs sportif. Ce fut le cas dans le monde du baseball aux USA comme le relate le film de Brad Pitt, Moneyball42, l’histoire des Red Sox de Boston qui ont utilisé l’analyse de données sur les joueurs afin de constituer l’équipe la plus performante alors même qu’ils ne possédaient pas un gros budget. I. Production et logistique Aujourd’hui de plus en plus de chaînes de production et de logistique sont en partie voire totalement informatisées. Afin de contrôler le fonctionnement des chaînes de production et de logistique et d’identifier les défaillances des machines, de nombreux capteurs, puces RFID, systèmes de localisations sont installés afin de fournir en temps réel des informations aux opérateurs. Les données sont donc d’ores et déjà présentes dans les services production et logistique des entreprises. En production, les directeurs d’usines peuvent utiliser les analyses avancées afin de creuser les historiques des données des chaînes, identifier des récurrences et relations entre les différentes étapes des procédés et ensuite optimiser les facteurs qui semblent avoir les meilleurs effets sur le rendement43 . Pour Jean-Charles COINTOT « dans les usines, le big data permet de trouver les meilleurs réglages à partir de données réelles collectées en masse dans le processus de production. Grâce aux outils de visualisation, il devient possible d’observer ce qu’il se passe lorsque les réglages de la chaîne de production varient ensemble.44 » Le lancement de nouveaux produits peut alors être simulé et modélisé et ainsi prévenir de toutes les erreurs de conception que 41 WORK FORCE [en ligne].[Consulté le18/06/15]. Disponiblesur Internet : http://www.workforce.com/articles/companies-making-hr-big-data-work 42 WIKIPEDIA[en ligne]. [Consultéle 18/06/15].Disponiblesur Internet : https://en.wikipedia.org/wiki/Moneyball_(film) 43 MCKINSEY [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufacturing 44 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 124. ISBN: 978-2-10-071142-0
  37. 37. 32 cela pourrait engendrer. Les big data permettent également de prévenir le remplacement de pièces, c’est le cas pour Airbus qui utilisent les centaines de capteurs présents dans ses avions afin d’analyser quelles pièces sont susceptibles de devoir être changées en fonction de tous les facteurs extérieurs qui peuvent rentrer en compte, on parle ici de maintenance préventive 45. Les ressources humaines et la production et logistique ne sont pas les seuls services de l’entreprise qui peuvent tirer profit des big data. Les services risques et fraudes sont également amenés à utiliser cette technologie afin de détecter les mauvais payeurs et d’anticiper les risques liés à leur entreprise. Autre département de l’entreprise très demandeur des big data, le marketing et vente. C’est dans ce domaine que le marketing est aujourd’hui le plus utilisé et nous évoquerons ses bénéfices dans un autre chapitre. 45 L’USINE DIGITALE [en ligne]. [Consultéle 16/06/15].Disponiblesur Internet : http://www.usine- digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de-service.N334101
  38. 38. 33 III. Big data et marketing A. Le marketing prédictif et fidélisation Parmi les avantages liés aux big data pour le marketing on distingue le marketing prédictif. Si on devait résumer le marketing prédictif dans le monde de l’entreprise, on le définirait comme l’analyse poussée des comportements actuels des clients ayant pour objectif final d’anticiper leurs actions et de leurs suggérer des solutions ultra adaptées. D’après Yohan Stern, directeur général de Key Performance Group, « la magie du marketing prédictif, c'est de faire passer les marketeurs de la prédiction basée sur l'intuition et l'irrationnel à la prévision basée sur des données et des probabilités de réussite. Traditionnellement, un marketeur utilise son intuition et sélectionne arbitrairement quelques facteurs, qui doivent, selon toute vraisemblance, permettre de créer des segments ou des scoring pertinents : l'âge pour tel vêtement de mode, ou, encore, le sexe pour l'achat de tel produit au chocolat. 46» Aujourd’hui, le marketeur n’est plus obligé de se baser uniquement sur son intuition car il a accès aux données internes et externes sur ses clients et prospects en provenance de différentes sources (réseaux sociaux, email, application mobile, site web, forum…). En utilisant les puissances de calcul des big data et la capacité de faire ressortir des corrélations entre des signaux faibles, le marketeur peut s’appuyer sur des informations concrètes, basées sur des données en temps réel. Avec un tel outil entre les mains il n’a pas été compliqué pour les marketeurs de trouver des applications concrètes à leur métier tel que la fidélisation. 46 EMARKETING.FR [en ligne]. [Consultéle 25/06/15].Disponiblesur Internet : http://www.e- marketing.fr/Thematique/digital-data-1004/Big-Data-10021/Breves/Tribune-Marketing-predictif-quand-Big- Data-anticipe-actions-consommateurs-252194.htm
  39. 39. 34 La fidélisation Le taux d’attrition, c’est-à-dire le taux de clients qui quittent leur fournisseur pour se tourner vers un concurrent, a toujours été une des préoccupations principales du département marketing. Les raisons d’une rupture entre un client et un fournisseur peuvent être multiples, le client peut trouver un prix plus attractif chez la concurrence par exemple, il peut aussi ne plus être satisfait par le produit ou le service proposé par son fournisseur, la relation client peut également s’être détériorée du fait d’une mauvaise entente encore le client et son commercial, ou encore le client peut avoir subi de nombreuses pannes ou désagrément avec les produits de la société… Il est très compliqué de prédire si un client va rester fidèle ou non à son fournisseur et bien souvent lorsqu’une entreprise s’aperçoit que son client veut la quitter pour la concurrence il est déjà trop tard et même les actions marketing pour le retenir qu’elle peut mettre en place ne peuvent réparer une décision d’un client de partir. Le graal des entreprises serait d’être capable de prédire la perte d’un client et d’anticiper si un client a prévu de les quitter afin, avant qu’il ne soit trop tard, de mettre en place des actions marketing pour l’inciter à rester chez son fournisseur. Malheureusement les boules de cristal n’ont toujours pas prouvées leur efficacité et les machines à remonter le temps n’ont pas encore été inventées. Toutefois avec les big data les entreprises ont découvert qu’il leur était maintenant possible d’analyser les comportements de leurs clients non plus uniquement en se basant uniquement sur les retours des commerciaux mais en utilisant l’ensemble des points d’interaction entre le client et son fournisseur. Une entreprise de télécom suisse, avait un taux d’attrition de 19 % alors que la moyenne de leur secteur était située autour de 12%. Chaque année les équipes marketing étaient obligées de déployer des efforts considérables afin de combler cette perte de clientèle. Le directeur marketing décida de se tourner vers les big data afin trouver une solution à ce problème. La première étape fut de collecter et rassembler l’ensemble des données clients éparpiller entres les différents services de l’entreprise tel que le service marketing, le service client et SAV ou encore le service facturation. Lorsque ces données ont pu être analysées, les big data ont permis de constater que la majorité des clients qui résiliait leur abonnement étaient des clients qui partaient 11
  40. 40. 35 mois après leur engagement. Plus important encore il était possible en utilisant toutes les informations collectées par l’entreprise de trouver des signaux faibles, c’est-à-dire des évènements dans les actions des clients uniquement visible lorsque l’on croise l’ensemble des différentes données sur le client et ce pour des milliers de clients, identifiable quelques mois avant que celui-ci résilie son contrat. En mettant en place une série d’actions marketing chez ses clients qui possédaient les signaux d’une probabilité élevée de rompre leur contrat, l’entreprise a ainsi pu réduire son taux d’attrition de 19 % à 2 %. Cet exemple est un exemple concret d’application des big data à la fidélisation client. Les big data en utilisant des masses d’informations importantes sur des milliers de clients arrivent à détecter des similitudes entre des profils de clients. En utilisant également l’historique de clients déjà perdus on peut définir les indicateurs qui ont précédé la perte d’un client et ainsi identifier les clients possédant ces signaux et donc d’anticiper leur fuite. B. Real-time marketing et native advertising Le marketeur le sait, plus il est réactif plus son action aura d’impact sur le consommateur. Cette théorie est aujourd’hui aisément vérifiable sur les réseaux sociaux. Les marques cherchent à être le plus proche de leurs clients possible. En adaptant leur communication en fonction de l’actualité récente les marques cherchent à surfer sur les buzz du moment mais surtout à montrer aux consommateurs qu’elles sont comme eux, connecté à la réalité du moment et qu’elles peuvent réagir instantanément sur importe quel sujet. Les campagnes de publicité couteuses et créés par des grandes agences de communication existent toujours et continueront d’être diffusées sur les grandes chaines télévisées aux heures de grandes écoute, mais les marques l’ont bien compris, une campagne de publicité sur TF1 à 20h00 peut avoir autant d’impact qu’un Tweet ou un post ciglant au bon moment, à la différence que le coût varie d’un extrême à un autre. Cette action aujourd’hui de plus en plus populaire sur Twitter et Facebook « a connu un essor fulgurant en 2013 lorsque la marque Oreo, en pleine finale du Super Bowl, a
  41. 41. 36 rebondi quasi-instantanément à une coupure d’électricité durant le match avec un tweet devenu un vrai cas d’école : Power Out? No Problem. You can still dunk in the dark. En capitalisant sur un événement sportif planétaire, la marque a obtenu plus de 15 000 retweets. Pour un investissement minime, comparativement au coût de diffusion d’un spot TV sur les chaînes américaines durant cet événement, qui s’élève en moyenne à 4 millions de dollars. 47» Tweet que l’on retrouve sur l’image suivante. Figure 6 - Un tweet de la marque OREO en plein Super Bowl- d'après le site internet E-MARKETING.FR [enligne] [consulté le 07/07/15] disponible sur internet - http://www.e-marketing.fr/Thematique/Direct-Digital-1003/Tribunes/le-real-time- marketing-a-lheure-des-medias-sociaux-246136.htm 47 WEBMARKETING-COM.COM [en ligne]. [Consultéle 07/07/15].Disponiblesur Internet : http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples-de-son-utilisation-marketing
  42. 42. 37 Si poster des statuts ou tweet instantanément ne requiert pas l’utilisation des big data ce n’est pas le cas des annonces display. Elles sont partout, sous forme d’image, de GIF ou encore de vidéos, les sont présentes sur les blogs, ou les sites internet et mêmes au début des vidéos YouTube. La bannière ou annonce display reste un moyen efficace de capter l’attention du consommateur et de communiquer pour une marque et/ou de ramener le client vers le site web désiré. Depuis fort longtemps déjà les marketeurs ont mis en place des cookies, ces balises internet chargées de collecter les informations de navigation sur l’internaute afin de pouvoir le définir et ainsi lui proposer de la publicité ciblé par exemple. Ainsi lorsque l’on navigue sur Amazon à la recherche de la dernière paire de bottes tendance par exemple, il n’est pas rare de voir réapparaitre ces mêmes bottes dans une bannière publicité alors qu’on est en train de lire un article sur un blog de jardinage. De très nombreux site de e-commerce tel que Amazon, Cdiscount, La FNAC, ou encore EBay utilisent les bannières web afin de promouvoir leurs produits qu’ils affichent sur des sites à fort trafic tel que Facebook, Google, ou LeMonde.fr. Si les cookies réalisent parfaitement leur travail de tracking et de collecte d’informations sur les visiteurs, les big data apportent l’analyse de l’ensemble des paramètres de l’environnement. En effet le contenu publicitaire d’une annonce display aura beaucoup plus d’impact sur un visiteur si son contenu prend en compte premièrement le profil du visiteur en utilisant son historique de navigation comme les cookies le font actuellement mais également le site internet sur lequel la bannière va être mise en avant. En analysant le contenu d’une page web d’un article de presse par exemple, c’est-à-dire en utilisant la capacité d’analyse de texte des big data, la publicité peut cibler le visiteur et promouvoir une annonce en rapport avec l’information qu’il recherche au même moment ce qui aura un effet beaucoup plus important dans l’esprit de l’internaute que si il voyait apparaitre ses bottes d’Amazon qu’il a vu la veille alors qu’il est concentré pour rechercher des informations sur la culture de son potager.
  43. 43. 38 C. Le ciblage Toutes les entreprises, à l’exception peut-être de certaines sociétés et start-ups, possèdent de multiples clients depuis plusieurs années. Chaque client est unique et différent. Toutefois, les clients d’une entreprise ont des besoins similaires et possèdent donc des similitudes dans leur profil. La majorité des sociétés ont accumulé au fil des années beaucoup d’informations sur leurs clients. Le service marketing par exemple possède des informations sur le portefeuille client de l’entreprise, le service commercial possède également des informations sur les prospects et clients contenues dans son CRM qui est rempli par les commerciaux. Le service facturation également, tout comme le service achat dans sa relation avec les fournisseurs possède des informations sur les factures et paiements des clients. Si toutes ses données sont rassemblées et analysées il est alors possible de dresser un profil type de client de l’entreprise et même de définir des profils de client avec des potentiels de chiffre d’affaire important. En utilisant les big data, les entreprises cherchent à retrouver des caractéristiques entres leurs clients existants et les prospects qui composent leur base. Cette méthode semblable à du scoring, déjà utilisé dans de nombreuses entreprises, utilise les capacités des big data d’extraire de l’information de sources qui n’étaient pas exploitables auparavant tel que les commentaires mis dans le CRM ou encore les informations laissées sur internet par le prospect. Les entreprises peuvent ainsi cibler plus précisément encore les prospects qui représentent les plus gros potentiels de chiffre d’affaire dans l’avenir mais également les solutions et produits qui seront susceptibles de les intéresser d’avantage. Avec les big data le marketeur possède une vision à 360° du client pour comprendre comment il raisonne afin de réaliser la bonne action, au bon moment, vers la bonne cible et qui va permettre au consommateur de réaliser un acte d’achat. Les big data ne sont pas une révolution des pratiques marketing déjà existantes. C’est davantage une évolution des techniques actuelles avec des outils permettant d’être plus précis, d’anticiper, et d’être plus réactif afin d’améliorer les recettes de l’entreprise.
  44. 44. 39 Seconde partie : Les big data face aux professionnels
  45. 45. 40 ****CONFIDENTIEL****
  46. 46. 41 Troisième partie : L’utilisation des big data dans l’entreprise Cofely Ineo &
  47. 47. 42 ****CONFIDENTIEL****
  48. 48. 43 Bibliographie Ouvrages : COINTOT, Jean-Charles. LA RÉVOLUTION BIG DATA. Dunod. 2014. ISBN: 978-2- 10-071142-0 Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION THAT WILL TRANSFORM HOW WE LIVE, WORK, AND THINK. John Murray. 2013. ASIN: B00GOHL9H6 Sources web : 01NET.COM [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/ BBC [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.bbc.com/news/business-26383058 BLOG DU MODERATEUR [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.blogdumoderateur.com/chiffres-internet/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert- magazine/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://dataconomy.com/understanding-big-data-machine-learning/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is- hadoop-and-why-you-should-know-about-it?trk=mp-author-card BLOG.TERADATA [en ligne]. [Consulté le 08/07/15]. Disponible sur Internet : http://blogs.teradata.com/data-points/evaluating-and-planning-for-the-real-costs-of- big-data/
  49. 49. 44 data blog [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de- donnees-nosql-quelles-repoussent-encore-leurs-limites/ DATA.GOUV.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le- secteur-public-des-avancees-sensibles/https://www.data.gouv.fr/fr/ DOMO [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : https://www.domo.com/learn/data-never-sleeps-2 EMARKETING.FR [en ligne]. [Consulté le 25/06/15]. Disponible sur Internet : http://www.e-marketing.fr/Thematique/digital-data-1004/Big-Data- 10021/Breves/Tribune-Marketing-predictif-quand-Big-Data-anticipe-actions- consommateurs-252194.htm frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://frenchweb.fr/e-sante-jusquou-ira-le-big-data-pour-nous- soigner/186343#5hLErJ2kvUxMmkgG.99 frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : https://www.mskcc.org/blog/msk-trains-ibm-watson-help-doctors-make-better- treatment-choices GARTNER [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.gartner.com/newsroom/id/2663015 IBM [en ligne]. [Consulté le 24/06/15]. Disponible sur Internet : http://www- 01.ibm.com/software/data/infosphere/data-scientist/ ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.cbnews.fr/etudes/toujours-plus-de- smartphones-et-tablettes-selon-mma-france-a1013528 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.itu.int/en/ITU- D/Statistics/Documents/facts/ICTFactsFigures2015.pdf
  50. 50. 45 JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet : http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what- you-need-to-know-about-big-data/2/ JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet : http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://blog.ontrack.fr/big-data-pourquoi-nosql/ journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml L’USINE DIGITALE [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.usine-digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de- service.N334101 LEMONDE.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour- l-europe_4655737_3232.html LEMONDEINFORMATIQUE.FR [en ligne]. [Consulté le 19/07/15]. Disponible sur Internet : http://www.lemondeinformatique.fr/actualites/lire-les-salaires-des-8- competences-les-plus-recherchees-en-big-data-56610-page-1.html MCKINSEY [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufact uring myrhline [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://www.myrhline.com/dossier-rh/big-data-et-ressources-humaines/article/le-big- data-en-rh-ca-sert-a-quoi.html REINFORMATION.TV [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://reinformation.tv/big-data-surveiller-achats-predire-divorce-reve-visa/ SCIENCE DAILY [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.sciencedaily.com/releases/2013/05/130522085217.htm
  51. 51. 46 SITE INTERNET DE COFELY [en ligne]. [Consulté le 15/07/15]. Disponible sur Internet : http://cofely-gdfsuez.com/profil SYNOMIA [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.synomia.fr/fr/vision-et-techno/synomia-menu-la-data-non-structuree SYNOMIA [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le- secteur-public-des-avancees-sensibles/ THE GUARDIAN [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than- 100-billion-dollars wall street journal [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : http://www.wsj.com/articles/SB10000872396390443890304578006252019616768 WEBMARKETING-COM.COM [en ligne]. [Consulté le 07/07/15]. Disponible sur Internet : http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples- de-son-utilisation-marketing Wikipedia [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : https://en.wikipedia.org/wiki/Moneyball_(film) work force [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : http://www.workforce.com/articles/companies-making-hr-big-data-work

×