SlideShare une entreprise Scribd logo
Big Data
BIO
- Microsoft Student Partner Lead
- Lauréat du 55Heurs Maroc
- Webmaster de l’Université Ibn Tofail
- Microsoft Tech Addict
- M2 en Big Data et Cloud Computing
Definition
de la Big
Data
Définition de la Big Data
Terme qui désigne un ensemble très volumineux de
données qu’aucun outil classique ne peut traiter.
Les vvv de la big Data:
1) Volume
2) Variété
3) Vélocité
Ce qui se passe en 60 secondes sur le net
Causes
économiques
et
technologique
s
Baisse de prix exponentielle
• Les prix des ressources IT a chuté en accord avec la loi de Moore, qu’ils
s’agissent de la capacité de stockage, CPU et bande passante
Progrès initiés par les géants du Web
• Afin de bénéficier des ressources de stockage, les géants du Web ont du
développer pour leurs propres besoins de nouvelles technologies.
Exemples :
- Google a développé GFS qui va inspirer Hadoop
- Google a développé BigTable qui va inspirer Hbase
- Facebook a développé Hive et Cassandra
- Yahoo a développé Hadoop
Mouvement
s
NoSql
Mouvements NoSql
• Terme inventé en 2009 qui désigne un système de gestion de base de
données qui s’écarte du paradigme classiques des bases de données.
• Le besoin fondamental auquel répond NoSQL est la performance. En effet,
ces dernières années, les géants du Web comme Google et Amazon ont vu
leurs besoins en termes de charge et de volumétrie de données croître de
façon exponentielle.
Types NoSql
• Les solutions NoSQL existantes peuvent être regroupées en 4 grandes
familles.
Clef/Valeur : Les données sont représentées par un couple clé/valeur. La valeur
peut être une simple chaîne de caractères
Orientées colonnes : Ce modèle ressemble à une table dans un SGBDR à la
différence qu’avec une BD NoSQL orientée colonne, le nombre de colonnes est
dynamique.
Orientées graphes : Ce modèle de représentation des données se base sur la
théorie des graphes
Orientées documents : Ce modèle se base sur le paradigme clé valeur. La
valeur, dans ce cas est un document de type JSON ou XML
Outils Big
Data
Ecosystème Hadoop
• Framework Open Source destiné à faciliter la création d’application
distribuées
Il suffit de programmer Map et Reduce (Java, C++, Python, etc.)
Exemple de Map/Reduce
Services Hadoop
Spark
Framework de traitement très puissant open source qui se pose comme une
alternative de Map/Reduce, Il s’éxecute sur du HDFS.
Principaux langages de développements
Distributions Hadoop
Hadoop est notamment distribué par quatre acteurs qui proposent des services
de formation et un support commercial, mais également des fonctions
supplémentaires :
• Cloudera
• HortonWorks
• MapR
• IBM BigInsights
Métiers de
la Big Data
Métiers de la Big Data
• Chief Data Officer (CDO): Il est à la tête d’une équipe spécialisée dans
l’acquisition, l’analyse et l’exploitation des données. Sa fonction consiste à la
gouvernance de son équipe pour l’approvisionnement des données les plus
intéressantes et cohérentes pour l’intérêt de l’entreprise.
• Business Intelligence Manager: Il utilise des nouvelles technologies pour
mettre en place des tableaux de bords, des outils de reporting, afin de les
intégrer au système informatique.
• Data Scientist : Il est responsable de la collecte, du traitement, de
l’évaluation et de l’analyse des données massives, ou big data, afin
d’optimiser la stratégie de l’entreprise. Son rôle est de créer pour les métiers
de l’entreprise des algorithmes qui produisent des informations utiles,
notamment afin de proposer aux clients, les produits qu’ils recherchent.
Métiers de la Big Data
• Data Analyst Il utilise des techniques statistiques et des outils informatiques
spécialisés afin d’organiser, de synthétiser et de traduire les informations
dont les entreprises ont besoin pour faciliter les prises de décisions.
• Le Data Miner Il est le « fouilleur de données », le Sherlock Holmes de la
data. Son rôle est de dénicher les informations parmi de multiples données,
afin de les rendre exploitables et utiles pour l’entreprise. Il doit disposer
d’excellentes compétences en informatique, en statistiques et en business.
Machine
Learning
Machine Learning
Définition
Ensemble d’outils statistiques et d’algorithmes permettant d’automatiser la
construction d’une fonction de prédiction à partir d’un ensemble d’observation.
Exemples
- Détecter les comportements frauduleux lors d’une transaction
- Prédire les risques de solvabilités d’un client
- Découvrir les préférences d’un client
Projets
Mahout, Scikit-learn (Python), Mlib( Spark)
Success Stories
Thank You

Contenu connexe

Tendances

Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouse
BEL MRHAR Mohamed Amine
 

Tendances (20)

Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Big data
Big dataBig data
Big data
 
Data mining et data science
Data mining et data scienceData mining et data science
Data mining et data science
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX Hadoop
 
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache SparkPlateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
 
Antidot Information Factory - AIF
Antidot Information Factory - AIFAntidot Information Factory - AIF
Antidot Information Factory - AIF
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouse
 
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesLinked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 

Similaire à Big data

Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
ADBS
 
Hadoop et le big data
Hadoop et le big dataHadoop et le big data
Hadoop et le big data
Juvénal CHOKOGOUE
 

Similaire à Big data (20)

Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
BigData on change d'ère !
BigData on change d'ère ! BigData on change d'ère !
BigData on change d'ère !
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internetBig Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internet
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Doxa inter2019-le big data:outil d'aide à la décision
Doxa inter2019-le big data:outil d'aide à la décisionDoxa inter2019-le big data:outil d'aide à la décision
Doxa inter2019-le big data:outil d'aide à la décision
 
Hadoop et le big data
Hadoop et le big dataHadoop et le big data
Hadoop et le big data
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Doxa inter2019-la datascience au service de la décision stratégique
Doxa inter2019-la datascience au service de la décision stratégiqueDoxa inter2019-la datascience au service de la décision stratégique
Doxa inter2019-la datascience au service de la décision stratégique
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
 
EuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTech Trends : Big Data
EuraTech Trends : Big Data
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 

Plus de Ibn Tofail University (7)

Apache giraph
Apache giraphApache giraph
Apache giraph
 
Implémentation des principaux algorithmes de chiffrements en Java
Implémentation des principaux algorithmes de chiffrements en JavaImplémentation des principaux algorithmes de chiffrements en Java
Implémentation des principaux algorithmes de chiffrements en Java
 
Introducing project spartan
Introducing project spartanIntroducing project spartan
Introducing project spartan
 
Imagine cup maroc 2015
Imagine cup maroc 2015Imagine cup maroc 2015
Imagine cup maroc 2015
 
Youth spark Morocco
Youth spark MoroccoYouth spark Morocco
Youth spark Morocco
 
Reglement enactus fsk
Reglement enactus fskReglement enactus fsk
Reglement enactus fsk
 
Dossier de sponsoring SIFE FSK
Dossier de sponsoring SIFE FSKDossier de sponsoring SIFE FSK
Dossier de sponsoring SIFE FSK
 

Dernier

Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
zidani2
 

Dernier (11)

Newsletter SPW Agriculture en province du Luxembourg du 17-05-24
Newsletter SPW Agriculture en province du Luxembourg du 17-05-24Newsletter SPW Agriculture en province du Luxembourg du 17-05-24
Newsletter SPW Agriculture en province du Luxembourg du 17-05-24
 
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les ÉcolesEL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
 
Résultats enquête RH 2024 Fonction Publique.pdf
Résultats enquête RH 2024 Fonction Publique.pdfRésultats enquête RH 2024 Fonction Publique.pdf
Résultats enquête RH 2024 Fonction Publique.pdf
 
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
 
Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?
 
Sainte Jeanne d'Arc, patronne de la France 1412-1431.pptx
Sainte Jeanne d'Arc, patronne de la France 1412-1431.pptxSainte Jeanne d'Arc, patronne de la France 1412-1431.pptx
Sainte Jeanne d'Arc, patronne de la France 1412-1431.pptx
 
Festival de Cannes 2024.pptx
Festival    de     Cannes        2024.pptxFestival    de     Cannes        2024.pptx
Festival de Cannes 2024.pptx
 
Épreuve de leçon SII.pptx
Épreuve de leçon  SII.pptxÉpreuve de leçon  SII.pptx
Épreuve de leçon SII.pptx
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 

Big data

  • 2. BIO - Microsoft Student Partner Lead - Lauréat du 55Heurs Maroc - Webmaster de l’Université Ibn Tofail - Microsoft Tech Addict - M2 en Big Data et Cloud Computing
  • 4. Définition de la Big Data Terme qui désigne un ensemble très volumineux de données qu’aucun outil classique ne peut traiter. Les vvv de la big Data: 1) Volume 2) Variété 3) Vélocité
  • 5. Ce qui se passe en 60 secondes sur le net
  • 7. Baisse de prix exponentielle • Les prix des ressources IT a chuté en accord avec la loi de Moore, qu’ils s’agissent de la capacité de stockage, CPU et bande passante
  • 8. Progrès initiés par les géants du Web • Afin de bénéficier des ressources de stockage, les géants du Web ont du développer pour leurs propres besoins de nouvelles technologies. Exemples : - Google a développé GFS qui va inspirer Hadoop - Google a développé BigTable qui va inspirer Hbase - Facebook a développé Hive et Cassandra - Yahoo a développé Hadoop
  • 10. Mouvements NoSql • Terme inventé en 2009 qui désigne un système de gestion de base de données qui s’écarte du paradigme classiques des bases de données. • Le besoin fondamental auquel répond NoSQL est la performance. En effet, ces dernières années, les géants du Web comme Google et Amazon ont vu leurs besoins en termes de charge et de volumétrie de données croître de façon exponentielle.
  • 11. Types NoSql • Les solutions NoSQL existantes peuvent être regroupées en 4 grandes familles. Clef/Valeur : Les données sont représentées par un couple clé/valeur. La valeur peut être une simple chaîne de caractères Orientées colonnes : Ce modèle ressemble à une table dans un SGBDR à la différence qu’avec une BD NoSQL orientée colonne, le nombre de colonnes est dynamique. Orientées graphes : Ce modèle de représentation des données se base sur la théorie des graphes Orientées documents : Ce modèle se base sur le paradigme clé valeur. La valeur, dans ce cas est un document de type JSON ou XML
  • 13. Ecosystème Hadoop • Framework Open Source destiné à faciliter la création d’application distribuées Il suffit de programmer Map et Reduce (Java, C++, Python, etc.)
  • 16. Spark Framework de traitement très puissant open source qui se pose comme une alternative de Map/Reduce, Il s’éxecute sur du HDFS.
  • 17. Principaux langages de développements
  • 18. Distributions Hadoop Hadoop est notamment distribué par quatre acteurs qui proposent des services de formation et un support commercial, mais également des fonctions supplémentaires : • Cloudera • HortonWorks • MapR • IBM BigInsights
  • 20. Métiers de la Big Data • Chief Data Officer (CDO): Il est à la tête d’une équipe spécialisée dans l’acquisition, l’analyse et l’exploitation des données. Sa fonction consiste à la gouvernance de son équipe pour l’approvisionnement des données les plus intéressantes et cohérentes pour l’intérêt de l’entreprise. • Business Intelligence Manager: Il utilise des nouvelles technologies pour mettre en place des tableaux de bords, des outils de reporting, afin de les intégrer au système informatique. • Data Scientist : Il est responsable de la collecte, du traitement, de l’évaluation et de l’analyse des données massives, ou big data, afin d’optimiser la stratégie de l’entreprise. Son rôle est de créer pour les métiers de l’entreprise des algorithmes qui produisent des informations utiles, notamment afin de proposer aux clients, les produits qu’ils recherchent.
  • 21. Métiers de la Big Data • Data Analyst Il utilise des techniques statistiques et des outils informatiques spécialisés afin d’organiser, de synthétiser et de traduire les informations dont les entreprises ont besoin pour faciliter les prises de décisions. • Le Data Miner Il est le « fouilleur de données », le Sherlock Holmes de la data. Son rôle est de dénicher les informations parmi de multiples données, afin de les rendre exploitables et utiles pour l’entreprise. Il doit disposer d’excellentes compétences en informatique, en statistiques et en business.
  • 23. Machine Learning Définition Ensemble d’outils statistiques et d’algorithmes permettant d’automatiser la construction d’une fonction de prédiction à partir d’un ensemble d’observation. Exemples - Détecter les comportements frauduleux lors d’une transaction - Prédire les risques de solvabilités d’un client - Découvrir les préférences d’un client Projets Mahout, Scikit-learn (Python), Mlib( Spark)