Big Data : partage d’une expérience en cours
de construction

Data News Business
Forum
J.Wieczorek

17/10/2013
Objectif
Liminaire
DQS
Positionnement organisationnel du Big Data
Les données
Compétences et profils

Agenda

Risques
Tend...
Liminaire
Liminaire

Partage d’une réflexion en cours de construction
J.Wieczorek 17/10/2013
DQS
3
4

1

J.Wieczorek 17/10/2013

2
DWH  Big Data
Bi  Big Data
Degré
D’analyse

BI
Big Data

t

J.Wieczorek 17/10/2013
Un changement de paradigme et un fantasme

Paradigme

Prolifération des données
sous forme numérisée

Fantasme n’est pas d...
La donnée
La donnée : un faux ami
Multiples, hétérogènes
Répond :
à des principes
à des taxonomies

Valeurs
101101101

Champs

J.Wie...
Les POCS NRB en Big Data
Chaîne de valeur

CREER

COLLECTER

HEBERGER

ANALYSER

UTILISER

ACTEURS

NRB
Partenaire(s)

J.W...
Profils consultants Big Data
Quels rôles pour quels profils pour Big Data?

Association entre :
Entrée :
description d’un environnement, d’un
objet d’i...
Test d’échantillon
 nous n’avions pas accès à toute
la population qui nous intéressait;
 D’ importantes décisions ont ét...
Des données massives à disposition

A

Le N du Big Data est presque aussi grand ou égal au N =

N =i
Big
Big
Data Data

A
...
Informations lacunaires

On va devoir accepter plus « d’élasticité intellectuelle »
car dans le domaine du Big Data 2+2 =‘...
Des cours intéressants
www.coursera.org

J.Wieczorek 17/10/2013
Risques
Déterminer l’intensité de la liaison qui peut exister entre des variables

Constitution d’un échantillon

Corrélations pot...
Types de risques statistiques

Sporadique

Répétitif

Statistiques

Inférence fallacieuse
erreur

faute

Biais de confirma...
Le paradoxe de Simpson

Homer

Edward

Un nom, deux prénoms, deux destinées…

J.Wieczorek 17/10/2013
Paradoxe statistique
Personnes blessées

Personnes malades

Explications
• Mathématique
• L’incidence du phénomène décès
e...
Types de risques : l’apophénie

Sporadique

Répétitif

Statistiques

Inference fallacieuse
erreur

faute

Biais de confirm...
Types de risques : raisonnement intuitif

place de théâtre + parking = 1,1 €

J.Wieczorek 17/10/2013

(*) inspiré de D.Kah...
Tendances Big Data
Big Data et micro applications

Stratégie de résolutions de problèmes qui instaure
une approche massive de pilotage par le...
Le Graal du Big Data : interagir avec l’unité ultime : l’individu dans son instantanéité.

Environnement
Big DATA

J.Wiecz...
Pilotage des données pour un individu acteur de son choix

J.Wieczorek 17/10/2013
Quel est le grain de sel qui rend le mets trop salé ?

J.Wieczorek 17/10/2013
Conclusions
On ne trébuche pas sur une montagne, mais sur une pierre

J.Wieczorek 17/10/2013
C’est la personne qui donne sens à
l’analyse de données; sa
compréhension dépend des outils
qu’elle sait utiliser.

J.Wiec...
Des données hétérogènes

J.Wieczorek 17/10/2013
Une corrélation

J.Wieczorek 17/10/2013
Merci Monsieur Pissaro

J.Wieczorek 17/10/2013
Prochain SlideShare
Chargement dans…5
×

Big data : partage d’une expérience en cours de construction (J. Wieczorek)

1 393 vues

Publié le

Ces slides proviennent de la présentation de Jacques Wieczorek lors du Data News Business Forum 2013 sur le thème Big Data Big Opportunities? Jacques y a partagé le retour de nos premières expériences dans le développement de services Big Data à valeur ajoutée.

Publié dans : Technologie
4 commentaires
2 j’aime
Statistiques
Remarques
  • Présentation à la fois très intéressante et très dense. Tout en expliquant ce qu’est le Big Data, elle le positionne dans son contexte et en présente son potentiel. Elle apporte également un outlook sur ses évolutions futures.
    A juste titre, elle attire également l’attention sur le fait que la réflexion est toujours en cours et sur les risques et limites de l'utilisation de Big Data.
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Belle analyse, jolie proposition, cher Jacques ! Chouette de pouvoir mieux utiliser big data.

    A condition que big data soit en de bonnes mains, que les questions et les clefs de lecture tiennent la route, bien sûr. L'IT, c'est comme la science, et science sans conscience, comme disait l'autre... Au plus big data se développe, au plus cette condition sera importante. Jean-Marie Sohier, Sealord
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Thank you for this very positive comment Wim!
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Big data is going to provide us answers in a world where we are drowning in data. It will be a big help for domains like Applied Customer Insight, where we have to understand our customers better to make them more successful in this ever changing world.
    But as always the ‘new thing’ is going to show us just a part of the truth. Apart from the hype around Big Data, it is very refreshing to see presentations like this that are positioning the BigD into the right context of what it can mean, what it is not and what we have to keep in the back of our mind if we are handling mass data.
    The presentation is providing a short and comprehensive view on what BidD is and where you can burn your hands…
    Wim.
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
Aucun téléchargement
Vues
Nombre de vues
1 393
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
26
Commentaires
4
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Big data : partage d’une expérience en cours de construction (J. Wieczorek)

  1. 1. Big Data : partage d’une expérience en cours de construction Data News Business Forum J.Wieczorek 17/10/2013
  2. 2. Objectif Liminaire DQS Positionnement organisationnel du Big Data Les données Compétences et profils Agenda Risques Tendances Big Data Conclusions 2
  3. 3. Liminaire
  4. 4. Liminaire Partage d’une réflexion en cours de construction J.Wieczorek 17/10/2013
  5. 5. DQS
  6. 6. 3 4 1 J.Wieczorek 17/10/2013 2
  7. 7. DWH  Big Data
  8. 8. Bi  Big Data Degré D’analyse BI Big Data t J.Wieczorek 17/10/2013
  9. 9. Un changement de paradigme et un fantasme Paradigme Prolifération des données sous forme numérisée Fantasme n’est pas de déterminer les contours en formation d’un futur immédiat MAIS bien d’un accès direct , sans médiation, à la réalité des phénomènes sociaux et économiques. J.Wieczorek 17/10/2013
  10. 10. La donnée
  11. 11. La donnée : un faux ami Multiples, hétérogènes Répond : à des principes à des taxonomies Valeurs 101101101 Champs J.Wieczorek 17/10/2013 Devient: intelligente par recoupement Hors contexte : Perte de signification Perte de valeur Cadre juridique : Qui est propriétaire de la donnée ? Des droits rattachés ? Qui est responsable des conséquences de son utilisation ?
  12. 12. Les POCS NRB en Big Data Chaîne de valeur CREER COLLECTER HEBERGER ANALYSER UTILISER ACTEURS NRB Partenaire(s) J.Wieczorek 17/10/2013 actif THESAURUS
  13. 13. Profils consultants Big Data
  14. 14. Quels rôles pour quels profils pour Big Data? Association entre : Entrée : description d’un environnement, d’un objet d’intérêt Data scientist J.Wieczorek 17/10/2013 * (1) Sortie : propriété que l’on veut prédire ou déterminer *(1) : Patil
  15. 15. Test d’échantillon  nous n’avions pas accès à toute la population qui nous intéressait;  D’ importantes décisions ont été prises sur une quantité faible de données contenue dans un échantillon afin de calculer une quantité dénommée « statistique » pour estimer une « caractéristique » dans la population appelée « paramètre ». N =i A N=  Postulat : Si N est trop petit, les résultats seront imprécis et pas pertinents; Si N est trop grand, des ressources et du temps sont gaspillés pour un gain minime. J.Wieczorek 17/10/2013
  16. 16. Des données massives à disposition A Le N du Big Data est presque aussi grand ou égal au N = N =i Big Big Data Data A N= Il faut :  accepter un nouveau savoir  abandonner les méthodes traditionnelles J.Wieczorek 17/10/2013
  17. 17. Informations lacunaires On va devoir accepter plus « d’élasticité intellectuelle » car dans le domaine du Big Data 2+2 =‘ 3,85 ’ J.Wieczorek 17/10/2013
  18. 18. Des cours intéressants www.coursera.org J.Wieczorek 17/10/2013
  19. 19. Risques
  20. 20. Déterminer l’intensité de la liaison qui peut exister entre des variables Constitution d’un échantillon Corrélations potentielles mais : Méthode probabiliste  Détecter une corrélation ne fait pas explication; Méthode non-probabiliste  Les corrélations ne diront pas la vérité sur les causalités. Elles exprimeront la vérité d’une relation mais qui ne sera peut-être pas du tout causale. L’ère du Big Data J.Wieczorek 17/10/2013
  21. 21. Types de risques statistiques Sporadique Répétitif Statistiques Inférence fallacieuse erreur faute Biais de confirmation Paradoxe de Simpson J.Wieczorek 17/10/2013
  22. 22. Le paradoxe de Simpson Homer Edward Un nom, deux prénoms, deux destinées… J.Wieczorek 17/10/2013
  23. 23. Paradoxe statistique Personnes blessées Personnes malades Explications • Mathématique • L’incidence du phénomène décès est élevée dans la population blessée mais l’hôpital A comporte plus de patients de ce type • L’incidence du phénomène décès est rare dans la population malade des 2 hôpitaux qui est nombreuse. Mais l’hôpital B comporte plus de patients de ce type. Pour le phénomène étudié il n’est pas pertinent de sommer indistinctement les 2 types de patients admis au service d’urgence. • Statistiques – épidémiologique • Les populations des patients des urgences des 2 hôpitaux ne sont pas similaires quant aux facteurs de risque. Il y a un effet de sélection quant aux facteurs de risques, trop peu de critères sont pris en compte. Une correction préalable aurait du intervenir. ? J.Wieczorek 17/10/2013
  24. 24. Types de risques : l’apophénie Sporadique Répétitif Statistiques Inference fallacieuse erreur faute Biais de confirmation Paradoxe de Simpson J.Wieczorek 17/10/2013 Cognitif
  25. 25. Types de risques : raisonnement intuitif place de théâtre + parking = 1,1 € J.Wieczorek 17/10/2013 (*) inspiré de D.Kahneman
  26. 26. Tendances Big Data
  27. 27. Big Data et micro applications Stratégie de résolutions de problèmes qui instaure une approche massive de pilotage par les données La valeur de l’information est constante Information valide Ancien modèle Délibération Décision possible t1 t2 t3 Prise de conscience Information valide Décision possible t4 temps Prise de décision La valeur de l’information diminue au cours du temps et tend vers 0 Délibération Modèle actuel t1 t2 t3 Prise de conscience Prise de décision J.Wieczorek 17/10/2013 t4 temps Traitement de masse pour des micro utilisations
  28. 28. Le Graal du Big Data : interagir avec l’unité ultime : l’individu dans son instantanéité. Environnement Big DATA J.Wieczorek 17/10/2013
  29. 29. Pilotage des données pour un individu acteur de son choix J.Wieczorek 17/10/2013
  30. 30. Quel est le grain de sel qui rend le mets trop salé ? J.Wieczorek 17/10/2013
  31. 31. Conclusions
  32. 32. On ne trébuche pas sur une montagne, mais sur une pierre J.Wieczorek 17/10/2013
  33. 33. C’est la personne qui donne sens à l’analyse de données; sa compréhension dépend des outils qu’elle sait utiliser. J.Wieczorek 17/10/2013
  34. 34. Des données hétérogènes J.Wieczorek 17/10/2013
  35. 35. Une corrélation J.Wieczorek 17/10/2013
  36. 36. Merci Monsieur Pissaro J.Wieczorek 17/10/2013

×