Le Big Data :
Une Révolution Numérique
Mickael
BEY
Tony
FELLET
Le Big Data, c’est
quoi ?
Historique
XIXème siècle XXème siècle 1990 2010
Les « 3 V »
• Volume
• Variété
• Vitesse
Le data deluge
Le data deluge
7 To de données par jours
10 To de données par jours
100 h de vidéos chaque minute
Internautes : 2.3 Millia...
Le data deluge
Tous les 2 ans : Création d’autant de données que depuis le début de l’humanité.
2014 : Exaoctets 2020 : Ze...
Les usages
Exemple
Nouvell
e
promoti
on
Supermarché
Les technologies du Big Data
Framework
Distribution
du stockage
Distribution des
calculs
Composants Hadoop
Plus de 150 composants
NoSQL
Visualisation
Conclusion
Merci de votre attention
Prochain SlideShare
Chargement dans…5
×

Le Big Data : Une Révolution Numérique

811 vues

Publié le

Conférence présentée par BEY Mickaël et FELLET Tony

Dans cette conférence nous allons parler d’un sujet qui nous concerne tous : l’exploitation des données produites en permanence par toutes les technologies numériques. Elles peuvent provenir de réseaux sociaux, de votre téléphone, de différents capteurs, de l’utilisation de votre carte bancaire. Comment ce volume de données peut-it être traité ? Quelles en sont les différentes utilisations ?

Publié dans : Données & analyses
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
811
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
79
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Dans le cadre de notre approfondissement technique réalisé au sein de l’exia, nous allons vous présenter le sujet suivant :
  • Le Big Data est un ensemble de d’outils qui permettent de traiter et d’analyser de larges quantités de données et d’en extraire les informations pertinentes à un coût accessible.

     Faire face à l’explosion du volume de données en proposant une alternative aux BDD devenues obsolètes.
  • L’histoire du Big Data est intimement liée à l’évolution des données et à la façon dont nous les collectons.
    19ème : Récolte de données chaque année et plusieurs mois pour pouvoir extraire des statistiques.
    20ème : Récolte plus régulière des données, échantillonnage des données considéré comme représentative
    1990 : Avec l’’informatique. Stocke les informations dans une BDD. Requête SQL. Limitation technique par sa rapidité d’exécution et par sa centralisation  Couteux
  • Volume: Ensemble des données collectés, traités et analysés.
    Variété: Différents types de données
    Vitesse (Vélocité): Fréquence de récupération des données
  • Le data déluge c’est un nouveau phénomène qui représente l’accroissement des données collectées, puisque la quantité de donnée qui augmente exponentiellement
  • Infra : machines physiques ou dans le cloud, cluster
    Stockage : Gère le stockage des données sur les disques
    Interrogation : Organisation des données et réponse aux requêtes
    Visualisation : Affichage graphique des résultats
  • Hadoop : Framework libre écrit en java destiné à accueillir des appli distribuées et scalables
    (utilisé par Facebook, Microsoft, eBay...)
    HDFS : Système de fichier distribué, tolérant à la panne
    Map Reduce : Algorithme de distribution de calculs
  • Spark : Composant très populaire qui veut remplacer map reduce, permet le stockage en ram
    Hive : Requêtage des données avec un langage très proche du SQL (select only) (Facebook)
    Pig : Outil de manipulation de données avec langage spécifique (Yahoo)
    Hbase : Base de données orientée colonnes
    ZooKeeper : Coordination des services sur un cluster hadoop
    Sqoop : SQl to hadOOP, transfert de données entre BDDR et Hadoop (Hive)
  • Mongo : BDD orientée document, facilement scalable, stocke du json
    Neo4j : BDD orienté graphe, utile pour stocker les réseaux sociaux, réseaux routiers et internet, etc.)(Utilisé par Viadeo)
    Plus de détails dans la conférence suivante
  • Pour conclure, ce qu’il faudra retenir c’est que le Big Data est un ensemble d’outil qui interagissent entre eux et qui permettent de passer de données brutes à des indices pertinent, c’est-à-dire créer de la valeur à partir de vos données. De plus, avec la quantité de données qui ne cesse d’augmenter, le Big Data va devenir un élément incontournable dans les prochaines années.
  • C’est la fin de notre présentation sur le Big Data. Nous espérons que cela vous aura permis de mieux cerner ce qu’est concrètement le Big Data ainsi que les usages que l’ont peut en faire et les enjeux qui en découlent.
    Si vous avez des questions, nous seront ravis d’y répondre. Merci de votre attention.
  • Le Big Data : Une Révolution Numérique

    1. 1. Le Big Data : Une Révolution Numérique
    2. 2. Mickael BEY Tony FELLET
    3. 3. Le Big Data, c’est quoi ?
    4. 4. Historique XIXème siècle XXème siècle 1990 2010
    5. 5. Les « 3 V » • Volume • Variété • Vitesse
    6. 6. Le data deluge
    7. 7. Le data deluge 7 To de données par jours 10 To de données par jours 100 h de vidéos chaque minute Internautes : 2.3 Milliards 2014 4 Milliards en 2020 Objets connectés : 12 Milliards 2014 50 Milliards e
    8. 8. Le data deluge Tous les 2 ans : Création d’autant de données que depuis le début de l’humanité. 2014 : Exaoctets 2020 : Zettaoctet 1 Gigaoctet Un film 1 Téraoctet 1 000 Go 1 Pétaoctet 1 000 000 Go 1 Exaoctet 1 000 000 000 Go 1 Zettaoctet 1 000 000 000 000 Go
    9. 9. Les usages
    10. 10. Exemple Nouvell e promoti on Supermarché
    11. 11. Les technologies du Big Data
    12. 12. Framework Distribution du stockage Distribution des calculs
    13. 13. Composants Hadoop Plus de 150 composants
    14. 14. NoSQL
    15. 15. Visualisation
    16. 16. Conclusion
    17. 17. Merci de votre attention

    ×