SlideShare une entreprise Scribd logo
1  sur  24
@AymenZaafouri
Tunis Big Data Meetup
21/11/2015 – Cogite Coworking Space
1
LEK stack : Logstash, ElasticSearch, Kibana
Tunis Big Data Meetup
Aymen ZAAFOURI
Ingénieur en statistique et analyse de l’information
Promotion 2014
Mastère spécialisé « Informatique décisionnelle »
Promotion 2015
Data Scientist
2Tunis Big Data Meetup
• Logstash
• ElasticSearch
• Kibana
• ES - Hadoop
• Autres produits
Tunis Big Data Meetup 3
Logstash
collecte, analyse et stockage de logs.
Tunis Big Data Meetup 4
Log ?
Tunis Big Data Meetup 5
Log = Timestamp + Données
Input Filter Output
Logstash
o Version 2.0
o Il est développé en Java, sous licence Apache 2.0.
o Input: Syslog, IMAP, SGBD, IRC ,Twitter,…
o Filter: Standardisation des dates, Suppression des événements, …
o Output: ElasticSearch, MangoDB, Redis, …
Tunis Big Data Meetup 6
Logstash + Twitter = ?
Tunis Big Data Meetup 7
ElasticSearch
Moteur de recherche
Tunis Big Data Meetup 8
o 17 000 Commits (32 000 pour LEK)
o 35 000 000 Téléchargements
o 120 User groups dans 80 villes
o ElasticSearch est utilisé en production par:
o Wikipedia
o NASA
o Mozilla (300 millions d’événements par jour)
o Verizon ( 500 billion de documents)
Tunis Big Data Meetup 9
o Moteur de recherche:
– Moteur d’indexation de document
– Moteur de recherche sur les index
o Limites de la recherche SQL (% - Like):
– Pas de tolérance aux « Fotes » de frappe
– Performances désastreuses sur des millions de ligne
Tunis Big Data Meetup 10
Mots-clés
o Le mapping: l’équivalent du schéma dans une base de données
relationnelle.
o Un index: Un peu comme une base de données sur un SGBD relationnel.
o Les types: l’équivalent des tables dans un système relationnel.
o Les documents: comme les lignes dans une base de données relationnelle.
Les documents sont stockés au format JSON et ont un index, un type et un id en plus
des données.
Tunis Big Data Meetup 11
Points forts
o Simple mise en place.
o Rapide : Les recherches sont traitées en quasi temps réel grâce à la
parallélisation des traitements.
o Scalable : peut être distribué et plusieurs instances (nodes) peuvent
communiquer entre-elles dans un même cluster.
o Efficace : L’utilisation des bases NoSQL documentaires. Les données
sont automatiquement répliquées.
o Accessible : API REST
Tunis Big Data Meetup 12
Sense
Tunis Big Data Meetup 13
Sense
Tunis Big Data Meetup 14
Kibana
Outil de visualisation
Tunis Big Data Meetup 15
Kibana
• Kibana est une interface web permettant de rechercher des
infos stockées dans ElasticSearch
Tunis Big Data Meetup 16
Indexation
Requête
Résultats
Kibana
Tunis Big Data Meetup 17
Kibana
Tunis Big Data Meetup 18
ES for Hadoop
Tunis Big Data Meetup 19
ES for Hadoop
Tunis Big Data Meetup 20
o On peut accéder à Elasticsearch comme si les données existent sur HDFS.
o Les jobs sont exécutés sur les mêmes machines que les shards Elasticsearch, ce qui permet
d’éliminer le trafic réseau et d’avoir une meilleure performance, grâce à la proximité des données.
Autres produits
Tunis Big Data Meetup 21
Tunis Big Data Meetup 22
Merci pour votre attention
23Tunis Big Data Meetup
Restons en contact !
24
@AymenZaafouri
aymenzaafouri
aymen@zaafouri.fr
Tunis Big Data Meetup

Contenu connexe

Tendances

Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - ElasticsearchDavid Pilato
 
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...Bruno Bonnin
 
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?Sébastien Prunier
 
Introduction à ElasticSearch
Introduction à ElasticSearchIntroduction à ElasticSearch
Introduction à ElasticSearchFadel Chafai
 
ElasticSearch : Architecture et Développement
ElasticSearch : Architecture et DéveloppementElasticSearch : Architecture et Développement
ElasticSearch : Architecture et DéveloppementMohamed hedi Abidi
 
Solr and Elasticsearch in Action (at Breizhcamp)
Solr and Elasticsearch in Action (at Breizhcamp)Solr and Elasticsearch in Action (at Breizhcamp)
Solr and Elasticsearch in Action (at Breizhcamp)Lucian Precup
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchDavid Pilato
 
Paris data geek - Elasticsearch
Paris data geek - ElasticsearchParis data geek - Elasticsearch
Paris data geek - ElasticsearchDavid Pilato
 
Logs serveurs : du terme barbare à la simplicité de la réalité
Logs serveurs :  du terme barbare à la simplicité de la réalitéLogs serveurs :  du terme barbare à la simplicité de la réalité
Logs serveurs : du terme barbare à la simplicité de la réalitéKarles Nine
 
Lausanne JUG - Elasticsearch
Lausanne JUG - ElasticsearchLausanne JUG - Elasticsearch
Lausanne JUG - ElasticsearchDavid Pilato
 
Elasticsearch - Esme sudria
Elasticsearch - Esme sudriaElasticsearch - Esme sudria
Elasticsearch - Esme sudriaDavid Pilato
 
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamiel
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamielParis Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamiel
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamielModern Data Stack France
 
Déploiement ELK en conditions réelles
Déploiement ELK en conditions réellesDéploiement ELK en conditions réelles
Déploiement ELK en conditions réellesGeoffroy Arnoud
 
Hadoop et son écosystème - v2
Hadoop et son écosystème - v2Hadoop et son écosystème - v2
Hadoop et son écosystème - v2Khanh Maudoux
 
Hands on lab Elasticsearch
Hands on lab ElasticsearchHands on lab Elasticsearch
Hands on lab ElasticsearchDavid Pilato
 
MongoDB et Elasticsearch, meilleurs ennemis ?
MongoDB et Elasticsearch, meilleurs ennemis ?MongoDB et Elasticsearch, meilleurs ennemis ?
MongoDB et Elasticsearch, meilleurs ennemis ?Sébastien Prunier
 
Découverte de Redis
Découverte de RedisDécouverte de Redis
Découverte de RedisJEMLI Fathi
 
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearch
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearchBesoin de rien Envie de Search - Presentation Lucene Solr ElasticSearch
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearchfrancelabs
 

Tendances (20)

Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - Elasticsearch
 
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...
Breizhcamp 2015 - Comment (ne pas réussir à) modéliser ses data dans elastics...
 
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?
[Breizhcamp 2015] MongoDB et Elastic, meilleurs ennemis ?
 
Introduction à ElasticSearch
Introduction à ElasticSearchIntroduction à ElasticSearch
Introduction à ElasticSearch
 
Elasticsearch
ElasticsearchElasticsearch
Elasticsearch
 
ElasticSearch : Architecture et Développement
ElasticSearch : Architecture et DéveloppementElasticSearch : Architecture et Développement
ElasticSearch : Architecture et Développement
 
Solr and Elasticsearch in Action (at Breizhcamp)
Solr and Elasticsearch in Action (at Breizhcamp)Solr and Elasticsearch in Action (at Breizhcamp)
Solr and Elasticsearch in Action (at Breizhcamp)
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - Elasticsearch
 
Paris data geek - Elasticsearch
Paris data geek - ElasticsearchParis data geek - Elasticsearch
Paris data geek - Elasticsearch
 
Logs serveurs : du terme barbare à la simplicité de la réalité
Logs serveurs :  du terme barbare à la simplicité de la réalitéLogs serveurs :  du terme barbare à la simplicité de la réalité
Logs serveurs : du terme barbare à la simplicité de la réalité
 
Lausanne JUG - Elasticsearch
Lausanne JUG - ElasticsearchLausanne JUG - Elasticsearch
Lausanne JUG - Elasticsearch
 
Elasticsearch - Esme sudria
Elasticsearch - Esme sudriaElasticsearch - Esme sudria
Elasticsearch - Esme sudria
 
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamiel
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamielParis Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamiel
Paris Spark meetup : Extension de Spark (Tachyon / Spark JobServer) par jlamiel
 
Déploiement ELK en conditions réelles
Déploiement ELK en conditions réellesDéploiement ELK en conditions réelles
Déploiement ELK en conditions réelles
 
Hadoop et son écosystème - v2
Hadoop et son écosystème - v2Hadoop et son écosystème - v2
Hadoop et son écosystème - v2
 
Hands on lab Elasticsearch
Hands on lab ElasticsearchHands on lab Elasticsearch
Hands on lab Elasticsearch
 
MongoDB et Elasticsearch, meilleurs ennemis ?
MongoDB et Elasticsearch, meilleurs ennemis ?MongoDB et Elasticsearch, meilleurs ennemis ?
MongoDB et Elasticsearch, meilleurs ennemis ?
 
Découverte de Redis
Découverte de RedisDécouverte de Redis
Découverte de Redis
 
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearch
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearchBesoin de rien Envie de Search - Presentation Lucene Solr ElasticSearch
Besoin de rien Envie de Search - Presentation Lucene Solr ElasticSearch
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 

En vedette

Chapitre2 prise en_main_kibana
Chapitre2 prise en_main_kibanaChapitre2 prise en_main_kibana
Chapitre2 prise en_main_kibanaFabien SABATIER
 
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...Guillaume MOCQUET
 
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...Guillaume MOCQUET
 
Chapitre3 elk concepts_avances
Chapitre3 elk concepts_avancesChapitre3 elk concepts_avances
Chapitre3 elk concepts_avancesFabien SABATIER
 
Logging with Elasticsearch, Logstash & Kibana
Logging with Elasticsearch, Logstash & KibanaLogging with Elasticsearch, Logstash & Kibana
Logging with Elasticsearch, Logstash & KibanaAmazee Labs
 
Drupal 8 + Elasticsearch + Docker
Drupal 8 + Elasticsearch + DockerDrupal 8 + Elasticsearch + Docker
Drupal 8 + Elasticsearch + DockerRoald Umandal
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprisesAymen ZAAFOURI
 
Meetup Drupal Paris : Connexion Drupal et Elasticsearch
Meetup Drupal Paris : Connexion Drupal et Elasticsearch Meetup Drupal Paris : Connexion Drupal et Elasticsearch
Meetup Drupal Paris : Connexion Drupal et Elasticsearch ALTER WAY
 
How to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksHow to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksSlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShareSlideShare
 
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau Bénin
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau BéninLogiciel d'informatisation de l'Etat civil dans les communes du Plateau Bénin
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau BénineAtlas Francophone Afrique de l'Ouest
 
MADANIA Gestion de l'état civil
MADANIA Gestion de l'état civilMADANIA Gestion de l'état civil
MADANIA Gestion de l'état civilCNI Tunisia
 
Apache solr andré bois-crettez 08
Apache solr   andré bois-crettez 08Apache solr   andré bois-crettez 08
Apache solr andré bois-crettez 08Loïc Descotte
 
Drupal and Elasticsearch
Drupal and ElasticsearchDrupal and Elasticsearch
Drupal and ElasticsearchNikolay Ignatov
 
Sécurité d’une plateforme VoIP Open Source « Elastix »
Sécurité d’une plateforme VoIP Open Source « Elastix »Sécurité d’une plateforme VoIP Open Source « Elastix »
Sécurité d’une plateforme VoIP Open Source « Elastix »Yassine Brahmi
 

En vedette (19)

Chapitre2 prise en_main_kibana
Chapitre2 prise en_main_kibanaChapitre2 prise en_main_kibana
Chapitre2 prise en_main_kibana
 
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...
[Sildes] plateforme centralisée d’analyse des logs des frontaux http en temps...
 
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...
Plateforme centralisée d’analyse des logs des frontaux http en temps réel dan...
 
Chapitre3 elk concepts_avances
Chapitre3 elk concepts_avancesChapitre3 elk concepts_avances
Chapitre3 elk concepts_avances
 
IPTV
IPTVIPTV
IPTV
 
Chapitre1 elk chez_psa
Chapitre1 elk chez_psaChapitre1 elk chez_psa
Chapitre1 elk chez_psa
 
Logging with Elasticsearch, Logstash & Kibana
Logging with Elasticsearch, Logstash & KibanaLogging with Elasticsearch, Logstash & Kibana
Logging with Elasticsearch, Logstash & Kibana
 
Séminaire Log Management
Séminaire Log ManagementSéminaire Log Management
Séminaire Log Management
 
Drupal 8 + Elasticsearch + Docker
Drupal 8 + Elasticsearch + DockerDrupal 8 + Elasticsearch + Docker
Drupal 8 + Elasticsearch + Docker
 
Rapport projet pfe
Rapport projet pfeRapport projet pfe
Rapport projet pfe
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Meetup Drupal Paris : Connexion Drupal et Elasticsearch
Meetup Drupal Paris : Connexion Drupal et Elasticsearch Meetup Drupal Paris : Connexion Drupal et Elasticsearch
Meetup Drupal Paris : Connexion Drupal et Elasticsearch
 
How to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksHow to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & Tricks
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
 
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau Bénin
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau BéninLogiciel d'informatisation de l'Etat civil dans les communes du Plateau Bénin
Logiciel d'informatisation de l'Etat civil dans les communes du Plateau Bénin
 
MADANIA Gestion de l'état civil
MADANIA Gestion de l'état civilMADANIA Gestion de l'état civil
MADANIA Gestion de l'état civil
 
Apache solr andré bois-crettez 08
Apache solr   andré bois-crettez 08Apache solr   andré bois-crettez 08
Apache solr andré bois-crettez 08
 
Drupal and Elasticsearch
Drupal and ElasticsearchDrupal and Elasticsearch
Drupal and Elasticsearch
 
Sécurité d’une plateforme VoIP Open Source « Elastix »
Sécurité d’une plateforme VoIP Open Source « Elastix »Sécurité d’une plateforme VoIP Open Source « Elastix »
Sécurité d’une plateforme VoIP Open Source « Elastix »
 

Similaire à Tunis big data_meetup__21_nov2015__aymenzaafouri

Étude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuelsÉtude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuelsThomas Malice
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...Paris Open Source Summit
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusCHAKER ALLAOUI
 
Suivre l'évolution du covid19 sur RaspberryPi avec la suite Elastic
Suivre l'évolution du covid19 sur RaspberryPi avec la suite ElasticSuivre l'évolution du covid19 sur RaspberryPi avec la suite Elastic
Suivre l'évolution du covid19 sur RaspberryPi avec la suite ElasticIdriss Neumann
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon Consulting
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon ConsultingDevcon Ile Maurice présentation Use Cases Elasticsearch par Spoon Consulting
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon ConsultingJeremy Gachet
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyOxalide
 
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoTBenchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoTCHAKER ALLAOUI
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big dataRomain Jouin
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceParis Open Source Summit
 
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...Paris Open Source Summit
 

Similaire à Tunis big data_meetup__21_nov2015__aymenzaafouri (20)

Étude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuelsÉtude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuels
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Suivre l'évolution du covid19 sur RaspberryPi avec la suite Elastic
Suivre l'évolution du covid19 sur RaspberryPi avec la suite ElasticSuivre l'évolution du covid19 sur RaspberryPi avec la suite Elastic
Suivre l'évolution du covid19 sur RaspberryPi avec la suite Elastic
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon Consulting
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon ConsultingDevcon Ile Maurice présentation Use Cases Elasticsearch par Spoon Consulting
Devcon Ile Maurice présentation Use Cases Elasticsearch par Spoon Consulting
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoTBenchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
 
Big data
Big dataBig data
Big data
 
Utc data publica1
Utc data publica1Utc data publica1
Utc data publica1
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big data
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysance
 
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...
#OSSPARIS17 - Saturne : la maîtrise des échanges de données massifs par l’Ope...
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
Big data
Big dataBig data
Big data
 

Tunis big data_meetup__21_nov2015__aymenzaafouri

  • 1. @AymenZaafouri Tunis Big Data Meetup 21/11/2015 – Cogite Coworking Space 1 LEK stack : Logstash, ElasticSearch, Kibana Tunis Big Data Meetup
  • 2. Aymen ZAAFOURI Ingénieur en statistique et analyse de l’information Promotion 2014 Mastère spécialisé « Informatique décisionnelle » Promotion 2015 Data Scientist 2Tunis Big Data Meetup
  • 3. • Logstash • ElasticSearch • Kibana • ES - Hadoop • Autres produits Tunis Big Data Meetup 3
  • 4. Logstash collecte, analyse et stockage de logs. Tunis Big Data Meetup 4
  • 5. Log ? Tunis Big Data Meetup 5 Log = Timestamp + Données
  • 6. Input Filter Output Logstash o Version 2.0 o Il est développé en Java, sous licence Apache 2.0. o Input: Syslog, IMAP, SGBD, IRC ,Twitter,… o Filter: Standardisation des dates, Suppression des événements, … o Output: ElasticSearch, MangoDB, Redis, … Tunis Big Data Meetup 6
  • 7. Logstash + Twitter = ? Tunis Big Data Meetup 7
  • 9. o 17 000 Commits (32 000 pour LEK) o 35 000 000 Téléchargements o 120 User groups dans 80 villes o ElasticSearch est utilisé en production par: o Wikipedia o NASA o Mozilla (300 millions d’événements par jour) o Verizon ( 500 billion de documents) Tunis Big Data Meetup 9
  • 10. o Moteur de recherche: – Moteur d’indexation de document – Moteur de recherche sur les index o Limites de la recherche SQL (% - Like): – Pas de tolérance aux « Fotes » de frappe – Performances désastreuses sur des millions de ligne Tunis Big Data Meetup 10
  • 11. Mots-clés o Le mapping: l’équivalent du schéma dans une base de données relationnelle. o Un index: Un peu comme une base de données sur un SGBD relationnel. o Les types: l’équivalent des tables dans un système relationnel. o Les documents: comme les lignes dans une base de données relationnelle. Les documents sont stockés au format JSON et ont un index, un type et un id en plus des données. Tunis Big Data Meetup 11
  • 12. Points forts o Simple mise en place. o Rapide : Les recherches sont traitées en quasi temps réel grâce à la parallélisation des traitements. o Scalable : peut être distribué et plusieurs instances (nodes) peuvent communiquer entre-elles dans un même cluster. o Efficace : L’utilisation des bases NoSQL documentaires. Les données sont automatiquement répliquées. o Accessible : API REST Tunis Big Data Meetup 12
  • 13. Sense Tunis Big Data Meetup 13
  • 14. Sense Tunis Big Data Meetup 14
  • 16. Kibana • Kibana est une interface web permettant de rechercher des infos stockées dans ElasticSearch Tunis Big Data Meetup 16 Indexation Requête Résultats
  • 19. ES for Hadoop Tunis Big Data Meetup 19
  • 20. ES for Hadoop Tunis Big Data Meetup 20 o On peut accéder à Elasticsearch comme si les données existent sur HDFS. o Les jobs sont exécutés sur les mêmes machines que les shards Elasticsearch, ce qui permet d’éliminer le trafic réseau et d’avoir une meilleure performance, grâce à la proximité des données.
  • 21. Autres produits Tunis Big Data Meetup 21
  • 22. Tunis Big Data Meetup 22
  • 23. Merci pour votre attention 23Tunis Big Data Meetup
  • 24. Restons en contact ! 24 @AymenZaafouri aymenzaafouri aymen@zaafouri.fr Tunis Big Data Meetup