SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
Tutor: Stefano Dindo
Follow me on Twitter @stefanodindo
Progetto Open per l analisi dei log in
tempo reale di architetture Cloud
Laureando: Mattia Peterle
Site: www.zero12.it
Twitter: @zero12srl
LOGSTASH:
Realizzare un sistema di log Analysis:
• Dinamico
• Scalabile
• Portabile su diversi servizi con un unico
backend
• Autonomo
• Capace di monitorare in tempo reale i log
dei server di DriveFarm con notifiche tramite
email e conservazione dei log anche dopo il
termine di una risorsa di computazione
Scopo del progetto
( Istanze EC2 di Amazon Web
Services )
Architettura del progetto
L architettura alla base del sistema di Log Analysis prevede
l utilizzo di:
REDIS:
Database utilizzato
come Broker per la
trasmissione degli
Eventi	

LOGSTASH:
Software principale
per la manipolazione
degli Eventi
L architettura alla base del sistema di Log Analysis prevede
l utilizzo di:
KIBANA:
Web-App per la
visualizzazione dei
Log, effettua query
ad ElasticSearch
ELASTICSEARCH:
Motore di ricerca e
indicizzazione,
indicizza i Log da
LogStash
Obiettivo -> Rispettare la scalabilità richiesta dal
Software as a Service DriveFarm.
Conseguenza -> Istanziare dei LogStash sulle
macchine virtuali in cui viene eseguito DriveFarm
(AMI poichè si usa infrastruttura AWS) che inviino gli
eventi al Broker Redis presente in un calcolatore
centrale.
VANTAGGI
L integrazione di LogStash in
modalità «shipper» nelle
istanze di DriveFarm non
richiede l intervento umano
per la configurazione in
quanto tutti i log vengono
inviati ad un nodo centrale
per l elaborazione.
SVANTAGGI
Nell attuale architettura è
prevista solo un istanza
centrale di Log Stash
designata alla manipolazione
dei Log. Questa
configurazione può
rappresentare un possibile
collo di bottiglia nell attività di
Log Analysis
Classificazione e gestione Log
Gli Eventi raccolti dal LogStash « indexer » devono subire due processi:
ElasticSearch: per indicizzare i
Log e richiederli attraverso
Kibana.
GESTIONE ALLE USCITE:
Grep: per rimuovere o marchiare degli eventi.
Grok: per istaurare campi di metadati e
trasformare gli Eventi in Log.
Multiline: per gestire la presenza di StackTrace
attraverso Regexp.
Advisor: per la temporizzazione di messaggi da
inviare in Output.
CLASSIFICAZIONE ATTRAVERSO FILTRI:
SNS: per inviare mail d avviso
contenenti messaggi di
Advisor.
S3: per lo stoccaggio dei Log
d interesse su un Bucket sicuro
Configurazione del LogStash Indexer
Causa:
Supportare SNS affinché limitasse lo spam d informazioni superflue.
Conservare Log importanti per future rivisitazioni. (Asincronicità)
Sviluppi:
• Advisor: due funzionalità principali gestite da un Thread
dormiente. La possibilità di clonare il primo diverso Evento che si
manifesta nell arco di un tempo t e spedirlo nella coda di LogStash.
La costruzione di un evento il cui corpo è un elenco del numero di
diversi eventi raccolti in un tempo t.
• S3: implementare le API di Amazon e costruire un estensione che:
Spedisca sul Bucket file di Log dopo un tempo t o una dimensione
m.
Introduca un sistema «Restore» e uno standard di denominazione
file.
Modifiche:
Multiline per bug su StackTrace, SNS per bug ARN e link http Kibana.
Estensione software
Diagramma progettuale di Advisor. Diagramma progettuale di S3.
Es. «advisor_first»
• Email inviata da SNS.
• Primo diverso evento,
clonato (viene scartato da
ElasticSearch) ed inviato.
• Filtro Multiline per
StackTrace.
• Si ripresenta se incombe
allo scadere di «time_adv».
• Link Kibana per UI rapida.
Es. «advisor_info»
• Email inviata da SNS.
• Racchiude il numero di
eventi che si sono
manifestati.
• Il corpo degli eventi è
limitato (taglia di SNS).
• Allo scadere di «time_adv»
il ciclo si ripete per i nuovi
eventi
Risultati
Benefici per zero12
Contributo community logstash:
Lo sviluppo del sistema di log Analysis ha permesso di:
• Ricevere notifiche tramite e-mail in tempo reale in caso di errori sul
servizio DriveFarm
• Disponendo di un infrastruttura scalabile in cui le risorse possono
essere rilasciate è stato possibile conservare i log di errori per la loro
risoluzione anche dopo il termine di una risorsa di computazione
• Garantire una risposta tempestiva agli errori migliorando il servizio al
cliente
• Sviluppare statistiche sui LogLevel d arrivo e sull accesso
all applicativo.
• Disporre di un ambiente di log analysis flessbile e dinamico in base alle
diverse sorgenti da monitorare.
L attività e la qualità del servizio prodotto con questa attività di sviluppo
è stata riconosciuta dalla comunità di logstash che ha approvato nel
repository ufficiale i plugin sviluppati:
https://github.com/logstash/logstash/blob/master/lib/logstash/filters/
advisor.rb
https://github.com/logstash/logstash/blob/master/lib/logstash/outputs/
s3.rb

Contenu connexe

En vedette

Presentacion minusvalidos
Presentacion minusvalidosPresentacion minusvalidos
Presentacion minusvalidosvachtm
 
Actividades dentro de un proyecto de trabajo
Actividades dentro de un proyecto de trabajoActividades dentro de un proyecto de trabajo
Actividades dentro de un proyecto de trabajoMari Carmen Diaz Garcia
 
Cuaderno de Campo del patrimonio natural de la sierra sur de jaén
Cuaderno de Campo del patrimonio natural de la sierra sur de jaénCuaderno de Campo del patrimonio natural de la sierra sur de jaén
Cuaderno de Campo del patrimonio natural de la sierra sur de jaénTúRInnova @tecnico_turismo
 
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job Growth
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job GrowthAPI Report: Oil and Natural Gas Stimulate Ohio Economic and Job Growth
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job GrowthMarcellus Drilling News
 
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...Victor Nieto
 
Elastic Search Indexing Internals
Elastic Search Indexing InternalsElastic Search Indexing Internals
Elastic Search Indexing InternalsGaurav Kukal
 
Guia Reflujo Vesicoureteral Primario (actualización 2014)
Guia Reflujo Vesicoureteral Primario (actualización 2014)Guia Reflujo Vesicoureteral Primario (actualización 2014)
Guia Reflujo Vesicoureteral Primario (actualización 2014)Cristobal Buñuel
 
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...Ricardo Restrepo
 
I fondi comunitari per sperimentare nuove politiche sociali
I fondi comunitari per sperimentare nuove politiche socialiI fondi comunitari per sperimentare nuove politiche sociali
I fondi comunitari per sperimentare nuove politiche socialiIris Network
 
Elastic search Walkthrough
Elastic search WalkthroughElastic search Walkthrough
Elastic search WalkthroughSuhel Meman
 
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...Sematext Group, Inc.
 

En vedette (19)

Presentacion minusvalidos
Presentacion minusvalidosPresentacion minusvalidos
Presentacion minusvalidos
 
Actividades dentro de un proyecto de trabajo
Actividades dentro de un proyecto de trabajoActividades dentro de un proyecto de trabajo
Actividades dentro de un proyecto de trabajo
 
Coda Cv
Coda CvCoda Cv
Coda Cv
 
Doc pintura2
Doc pintura2Doc pintura2
Doc pintura2
 
Cuaderno de Campo del patrimonio natural de la sierra sur de jaén
Cuaderno de Campo del patrimonio natural de la sierra sur de jaénCuaderno de Campo del patrimonio natural de la sierra sur de jaén
Cuaderno de Campo del patrimonio natural de la sierra sur de jaén
 
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job Growth
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job GrowthAPI Report: Oil and Natural Gas Stimulate Ohio Economic and Job Growth
API Report: Oil and Natural Gas Stimulate Ohio Economic and Job Growth
 
Avances en el cultivo del ciruelo japonés. Selección de variedades polinizado...
Avances en el cultivo del ciruelo japonés. Selección de variedades polinizado...Avances en el cultivo del ciruelo japonés. Selección de variedades polinizado...
Avances en el cultivo del ciruelo japonés. Selección de variedades polinizado...
 
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...
Informe de pasantía Victor Nieto. Factibilidad de implementación técnica d...
 
Chapter 08 10
Chapter 08 10Chapter 08 10
Chapter 08 10
 
Elastic search
Elastic searchElastic search
Elastic search
 
Herramientas de modelización para la gestión de los riesgos de inundación
Herramientas de modelización para la gestión de los riesgos de inundaciónHerramientas de modelización para la gestión de los riesgos de inundación
Herramientas de modelización para la gestión de los riesgos de inundación
 
Europa in Stuttgart 2010
Europa in Stuttgart 2010Europa in Stuttgart 2010
Europa in Stuttgart 2010
 
Elastic Search Indexing Internals
Elastic Search Indexing InternalsElastic Search Indexing Internals
Elastic Search Indexing Internals
 
Tema 03 mg-estudio rocas
Tema 03 mg-estudio rocasTema 03 mg-estudio rocas
Tema 03 mg-estudio rocas
 
Guia Reflujo Vesicoureteral Primario (actualización 2014)
Guia Reflujo Vesicoureteral Primario (actualización 2014)Guia Reflujo Vesicoureteral Primario (actualización 2014)
Guia Reflujo Vesicoureteral Primario (actualización 2014)
 
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...
Guía de campo de los macroinvertebrados acuáticos de la quebrada Menzuly – Sa...
 
I fondi comunitari per sperimentare nuove politiche sociali
I fondi comunitari per sperimentare nuove politiche socialiI fondi comunitari per sperimentare nuove politiche sociali
I fondi comunitari per sperimentare nuove politiche sociali
 
Elastic search Walkthrough
Elastic search WalkthroughElastic search Walkthrough
Elastic search Walkthrough
 
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...
From Zero to Production Hero: Log Analysis with Elasticsearch (from Velocity ...
 

Similaire à Logstash: Progetto open per l'analisi dei log in tempo reale di architetture Cloud

Mulesoft milano meetup #5 florence consulting
Mulesoft milano meetup #5 florence consultingMulesoft milano meetup #5 florence consulting
Mulesoft milano meetup #5 florence consultingFlorence Consulting
 
Big data analytics quanto vale e come sfruttarlo con stream analytics e power bi
Big data analytics quanto vale e come sfruttarlo con stream analytics e power biBig data analytics quanto vale e come sfruttarlo con stream analytics e power bi
Big data analytics quanto vale e come sfruttarlo con stream analytics e power biMarco Pozzan
 
SQL Saturday 2019 - Event Processing with Spark
SQL Saturday 2019 - Event Processing with SparkSQL Saturday 2019 - Event Processing with Spark
SQL Saturday 2019 - Event Processing with SparkAlessio Biasiutti
 
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...azuredayit
 
SQL Server Workload Profiling
SQL Server Workload ProfilingSQL Server Workload Profiling
SQL Server Workload ProfilingGianluca Hotz
 
Kubernetes as HA time series server, a proposal
Kubernetes as HA time series server, a proposalKubernetes as HA time series server, a proposal
Kubernetes as HA time series server, a proposalGiuliano Latini
 
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...Data Driven Innovation
 
Azure dayroma java, il lato oscuro del cloud
Azure dayroma   java, il lato oscuro del cloudAzure dayroma   java, il lato oscuro del cloud
Azure dayroma java, il lato oscuro del cloudRiccardo Zamana
 
Sviluppo di servizi REST per Android - Luca Masini
Sviluppo di servizi REST per Android - Luca Masini Sviluppo di servizi REST per Android - Luca Masini
Sviluppo di servizi REST per Android - Luca Masini Whymca
 
SVILUPPO DI SERVIZI REST PER ANDROID
SVILUPPO DI SERVIZI REST PER ANDROIDSVILUPPO DI SERVIZI REST PER ANDROID
SVILUPPO DI SERVIZI REST PER ANDROIDLuca Masini
 
Cv 2014 richard_gennaro_ eur_it
Cv 2014 richard_gennaro_ eur_itCv 2014 richard_gennaro_ eur_it
Cv 2014 richard_gennaro_ eur_itRichard Gennaro
 
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSAmazon Web Services
 
Modi innovativi per costruire App
Modi innovativi per costruire AppModi innovativi per costruire App
Modi innovativi per costruire AppCommit University
 
Soluzioni ot per digicamere giugno 2010
Soluzioni ot per digicamere giugno 2010Soluzioni ot per digicamere giugno 2010
Soluzioni ot per digicamere giugno 2010Giuseppe Bottasini
 
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open source
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open sourceLinux Day 2014 - Napoli - Programma Il Futuro: una scelta open source
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open sourceMario Rossano
 
Programma il futuro: una scelta open source
Programma il futuro: una scelta open sourceProgramma il futuro: una scelta open source
Programma il futuro: una scelta open sourceMarco Ferrigno
 
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2MongoDB
 
OCP-Architettura e caratteristiche della PaaS
OCP-Architettura e caratteristiche della PaaSOCP-Architettura e caratteristiche della PaaS
OCP-Architettura e caratteristiche della PaaSopencityplatform
 
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFS
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFSLa nostra infrastruttura di produzione a container con Docker, Rancher e ZFS
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFSMorlini Gabriele
 

Similaire à Logstash: Progetto open per l'analisi dei log in tempo reale di architetture Cloud (20)

Mulesoft milano meetup #5 florence consulting
Mulesoft milano meetup #5 florence consultingMulesoft milano meetup #5 florence consulting
Mulesoft milano meetup #5 florence consulting
 
Big data analytics quanto vale e come sfruttarlo con stream analytics e power bi
Big data analytics quanto vale e come sfruttarlo con stream analytics e power biBig data analytics quanto vale e come sfruttarlo con stream analytics e power bi
Big data analytics quanto vale e come sfruttarlo con stream analytics e power bi
 
SQL Saturday 2019 - Event Processing with Spark
SQL Saturday 2019 - Event Processing with SparkSQL Saturday 2019 - Event Processing with Spark
SQL Saturday 2019 - Event Processing with Spark
 
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...
Azure Day Rome Reloaded 2019 - Ingestion nel datalake passando tramite API Ma...
 
SQL Server Workload Profiling
SQL Server Workload ProfilingSQL Server Workload Profiling
SQL Server Workload Profiling
 
Kubernetes as HA time series server, a proposal
Kubernetes as HA time series server, a proposalKubernetes as HA time series server, a proposal
Kubernetes as HA time series server, a proposal
 
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...
Sistema di logging applicativo per ambienti distribuiti Hadoop-based - Monica...
 
Azure dayroma java, il lato oscuro del cloud
Azure dayroma   java, il lato oscuro del cloudAzure dayroma   java, il lato oscuro del cloud
Azure dayroma java, il lato oscuro del cloud
 
Sviluppo di servizi REST per Android - Luca Masini
Sviluppo di servizi REST per Android - Luca Masini Sviluppo di servizi REST per Android - Luca Masini
Sviluppo di servizi REST per Android - Luca Masini
 
SVILUPPO DI SERVIZI REST PER ANDROID
SVILUPPO DI SERVIZI REST PER ANDROIDSVILUPPO DI SERVIZI REST PER ANDROID
SVILUPPO DI SERVIZI REST PER ANDROID
 
Cv 2014 richard_gennaro_ eur_it
Cv 2014 richard_gennaro_ eur_itCv 2014 richard_gennaro_ eur_it
Cv 2014 richard_gennaro_ eur_it
 
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ciò che serve nella confusione: comprendere i Big Data con l'analisi AWS
 
Modi innovativi per costruire App
Modi innovativi per costruire AppModi innovativi per costruire App
Modi innovativi per costruire App
 
Soluzioni ot per digicamere giugno 2010
Soluzioni ot per digicamere giugno 2010Soluzioni ot per digicamere giugno 2010
Soluzioni ot per digicamere giugno 2010
 
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open source
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open sourceLinux Day 2014 - Napoli - Programma Il Futuro: una scelta open source
Linux Day 2014 - Napoli - Programma Il Futuro: una scelta open source
 
Programma il futuro: una scelta open source
Programma il futuro: una scelta open sourceProgramma il futuro: una scelta open source
Programma il futuro: una scelta open source
 
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
 
OCP-Architettura e caratteristiche della PaaS
OCP-Architettura e caratteristiche della PaaSOCP-Architettura e caratteristiche della PaaS
OCP-Architettura e caratteristiche della PaaS
 
DDive - 8.5.2 Xpages - L'evoluzione continua
DDive - 8.5.2 Xpages - L'evoluzione continuaDDive - 8.5.2 Xpages - L'evoluzione continua
DDive - 8.5.2 Xpages - L'evoluzione continua
 
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFS
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFSLa nostra infrastruttura di produzione a container con Docker, Rancher e ZFS
La nostra infrastruttura di produzione a container con Docker, Rancher e ZFS
 

Plus de Stefano Dindo

Big Data: Come usare le Machine Learning per migliorare il business
Big Data: Come usare le Machine Learning per migliorare il businessBig Data: Come usare le Machine Learning per migliorare il business
Big Data: Come usare le Machine Learning per migliorare il businessStefano Dindo
 
Business Agility - Come competere nell'Era Digitale
Business Agility - Come competere nell'Era DigitaleBusiness Agility - Come competere nell'Era Digitale
Business Agility - Come competere nell'Era DigitaleStefano Dindo
 
Business Agility - come competere nell'Era Digitale
Business Agility - come competere nell'Era DigitaleBusiness Agility - come competere nell'Era Digitale
Business Agility - come competere nell'Era DigitaleStefano Dindo
 
MongoDB Solution for Internet of Things and Big Data
MongoDB Solution for Internet of Things and Big DataMongoDB Solution for Internet of Things and Big Data
MongoDB Solution for Internet of Things and Big DataStefano Dindo
 
Come creare infrastrutture Cloud Sicure
Come creare infrastrutture Cloud SicureCome creare infrastrutture Cloud Sicure
Come creare infrastrutture Cloud SicureStefano Dindo
 
Proximity marketing
Proximity marketing Proximity marketing
Proximity marketing Stefano Dindo
 
Cloud App: Vantaggi per il Business
Cloud App: Vantaggi per il BusinessCloud App: Vantaggi per il Business
Cloud App: Vantaggi per il BusinessStefano Dindo
 
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...Stefano Dindo
 
Deploy MongoDB su Infrastruttura Amazon Web Services
Deploy MongoDB su Infrastruttura Amazon Web ServicesDeploy MongoDB su Infrastruttura Amazon Web Services
Deploy MongoDB su Infrastruttura Amazon Web ServicesStefano Dindo
 
Cultura Digitale e Data Design
Cultura Digitale e Data DesignCultura Digitale e Data Design
Cultura Digitale e Data DesignStefano Dindo
 
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...Stefano Dindo
 
Business attraverso i Big Data
Business attraverso i Big DataBusiness attraverso i Big Data
Business attraverso i Big DataStefano Dindo
 
Introduzione all'Agile Coaching
Introduzione all'Agile CoachingIntroduzione all'Agile Coaching
Introduzione all'Agile CoachingStefano Dindo
 
Aperitivo Innovativo: Mobile Strategy & Development
Aperitivo Innovativo: Mobile Strategy & DevelopmentAperitivo Innovativo: Mobile Strategy & Development
Aperitivo Innovativo: Mobile Strategy & DevelopmentStefano Dindo
 
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendale
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendaleGoogle Glass e le tecnologie indossabili: alcuni esempi in ambito aziendale
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendaleStefano Dindo
 
MongoDB User Group Padova - Overviews iniziale su MongoDB
MongoDB User Group Padova - Overviews iniziale su MongoDBMongoDB User Group Padova - Overviews iniziale su MongoDB
MongoDB User Group Padova - Overviews iniziale su MongoDBStefano Dindo
 
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...Stefano Dindo
 
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglio
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglioMobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglio
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglioStefano Dindo
 
Better Software 2012 - Dall'Idea all'App
Better Software 2012  - Dall'Idea all'AppBetter Software 2012  - Dall'Idea all'App
Better Software 2012 - Dall'Idea all'AppStefano Dindo
 

Plus de Stefano Dindo (20)

Big Data: Come usare le Machine Learning per migliorare il business
Big Data: Come usare le Machine Learning per migliorare il businessBig Data: Come usare le Machine Learning per migliorare il business
Big Data: Come usare le Machine Learning per migliorare il business
 
Business Agility - Come competere nell'Era Digitale
Business Agility - Come competere nell'Era DigitaleBusiness Agility - Come competere nell'Era Digitale
Business Agility - Come competere nell'Era Digitale
 
Business Agility - come competere nell'Era Digitale
Business Agility - come competere nell'Era DigitaleBusiness Agility - come competere nell'Era Digitale
Business Agility - come competere nell'Era Digitale
 
MongoDB Solution for Internet of Things and Big Data
MongoDB Solution for Internet of Things and Big DataMongoDB Solution for Internet of Things and Big Data
MongoDB Solution for Internet of Things and Big Data
 
Come creare infrastrutture Cloud Sicure
Come creare infrastrutture Cloud SicureCome creare infrastrutture Cloud Sicure
Come creare infrastrutture Cloud Sicure
 
Proximity marketing
Proximity marketing Proximity marketing
Proximity marketing
 
Cloud App: Vantaggi per il Business
Cloud App: Vantaggi per il BusinessCloud App: Vantaggi per il Business
Cloud App: Vantaggi per il Business
 
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...
Proximity Marketing - che cos'è, come funziona e come realizzarlo tecnologica...
 
Deploy MongoDB su Infrastruttura Amazon Web Services
Deploy MongoDB su Infrastruttura Amazon Web ServicesDeploy MongoDB su Infrastruttura Amazon Web Services
Deploy MongoDB su Infrastruttura Amazon Web Services
 
Cultura Digitale e Data Design
Cultura Digitale e Data DesignCultura Digitale e Data Design
Cultura Digitale e Data Design
 
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...
Internet of Things e manutenzione a distanza: 
disponibilità di nuove tecnolo...
 
Business attraverso i Big Data
Business attraverso i Big DataBusiness attraverso i Big Data
Business attraverso i Big Data
 
Introduzione all'Agile Coaching
Introduzione all'Agile CoachingIntroduzione all'Agile Coaching
Introduzione all'Agile Coaching
 
Aperitivo Innovativo: Mobile Strategy & Development
Aperitivo Innovativo: Mobile Strategy & DevelopmentAperitivo Innovativo: Mobile Strategy & Development
Aperitivo Innovativo: Mobile Strategy & Development
 
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendale
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendaleGoogle Glass e le tecnologie indossabili: alcuni esempi in ambito aziendale
Google Glass e le tecnologie indossabili: alcuni esempi in ambito aziendale
 
Overview di MongoDB
Overview di MongoDBOverview di MongoDB
Overview di MongoDB
 
MongoDB User Group Padova - Overviews iniziale su MongoDB
MongoDB User Group Padova - Overviews iniziale su MongoDBMongoDB User Group Padova - Overviews iniziale su MongoDB
MongoDB User Group Padova - Overviews iniziale su MongoDB
 
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...
Keep Calm & dai uno sguardo al futuro con nuove strategie di relazione con gl...
 
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglio
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglioMobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglio
Mobile & Cloud: quali servizi sono disponibili e come sfruttarli al meglio
 
Better Software 2012 - Dall'Idea all'App
Better Software 2012  - Dall'Idea all'AppBetter Software 2012  - Dall'Idea all'App
Better Software 2012 - Dall'Idea all'App
 

Logstash: Progetto open per l'analisi dei log in tempo reale di architetture Cloud

  • 1. Tutor: Stefano Dindo Follow me on Twitter @stefanodindo Progetto Open per l analisi dei log in tempo reale di architetture Cloud Laureando: Mattia Peterle Site: www.zero12.it Twitter: @zero12srl LOGSTASH:
  • 2. Realizzare un sistema di log Analysis: • Dinamico • Scalabile • Portabile su diversi servizi con un unico backend • Autonomo • Capace di monitorare in tempo reale i log dei server di DriveFarm con notifiche tramite email e conservazione dei log anche dopo il termine di una risorsa di computazione Scopo del progetto ( Istanze EC2 di Amazon Web Services )
  • 4. L architettura alla base del sistema di Log Analysis prevede l utilizzo di: REDIS: Database utilizzato come Broker per la trasmissione degli Eventi LOGSTASH: Software principale per la manipolazione degli Eventi
  • 5. L architettura alla base del sistema di Log Analysis prevede l utilizzo di: KIBANA: Web-App per la visualizzazione dei Log, effettua query ad ElasticSearch ELASTICSEARCH: Motore di ricerca e indicizzazione, indicizza i Log da LogStash
  • 6. Obiettivo -> Rispettare la scalabilità richiesta dal Software as a Service DriveFarm. Conseguenza -> Istanziare dei LogStash sulle macchine virtuali in cui viene eseguito DriveFarm (AMI poichè si usa infrastruttura AWS) che inviino gli eventi al Broker Redis presente in un calcolatore centrale. VANTAGGI L integrazione di LogStash in modalità «shipper» nelle istanze di DriveFarm non richiede l intervento umano per la configurazione in quanto tutti i log vengono inviati ad un nodo centrale per l elaborazione. SVANTAGGI Nell attuale architettura è prevista solo un istanza centrale di Log Stash designata alla manipolazione dei Log. Questa configurazione può rappresentare un possibile collo di bottiglia nell attività di Log Analysis
  • 7. Classificazione e gestione Log Gli Eventi raccolti dal LogStash « indexer » devono subire due processi: ElasticSearch: per indicizzare i Log e richiederli attraverso Kibana. GESTIONE ALLE USCITE: Grep: per rimuovere o marchiare degli eventi. Grok: per istaurare campi di metadati e trasformare gli Eventi in Log. Multiline: per gestire la presenza di StackTrace attraverso Regexp. Advisor: per la temporizzazione di messaggi da inviare in Output. CLASSIFICAZIONE ATTRAVERSO FILTRI: SNS: per inviare mail d avviso contenenti messaggi di Advisor. S3: per lo stoccaggio dei Log d interesse su un Bucket sicuro
  • 9. Causa: Supportare SNS affinché limitasse lo spam d informazioni superflue. Conservare Log importanti per future rivisitazioni. (Asincronicità) Sviluppi: • Advisor: due funzionalità principali gestite da un Thread dormiente. La possibilità di clonare il primo diverso Evento che si manifesta nell arco di un tempo t e spedirlo nella coda di LogStash. La costruzione di un evento il cui corpo è un elenco del numero di diversi eventi raccolti in un tempo t. • S3: implementare le API di Amazon e costruire un estensione che: Spedisca sul Bucket file di Log dopo un tempo t o una dimensione m. Introduca un sistema «Restore» e uno standard di denominazione file. Modifiche: Multiline per bug su StackTrace, SNS per bug ARN e link http Kibana. Estensione software
  • 10. Diagramma progettuale di Advisor. Diagramma progettuale di S3.
  • 11. Es. «advisor_first» • Email inviata da SNS. • Primo diverso evento, clonato (viene scartato da ElasticSearch) ed inviato. • Filtro Multiline per StackTrace. • Si ripresenta se incombe allo scadere di «time_adv». • Link Kibana per UI rapida.
  • 12. Es. «advisor_info» • Email inviata da SNS. • Racchiude il numero di eventi che si sono manifestati. • Il corpo degli eventi è limitato (taglia di SNS). • Allo scadere di «time_adv» il ciclo si ripete per i nuovi eventi
  • 13. Risultati Benefici per zero12 Contributo community logstash: Lo sviluppo del sistema di log Analysis ha permesso di: • Ricevere notifiche tramite e-mail in tempo reale in caso di errori sul servizio DriveFarm • Disponendo di un infrastruttura scalabile in cui le risorse possono essere rilasciate è stato possibile conservare i log di errori per la loro risoluzione anche dopo il termine di una risorsa di computazione • Garantire una risposta tempestiva agli errori migliorando il servizio al cliente • Sviluppare statistiche sui LogLevel d arrivo e sull accesso all applicativo. • Disporre di un ambiente di log analysis flessbile e dinamico in base alle diverse sorgenti da monitorare. L attività e la qualità del servizio prodotto con questa attività di sviluppo è stata riconosciuta dalla comunità di logstash che ha approvato nel repository ufficiale i plugin sviluppati: https://github.com/logstash/logstash/blob/master/lib/logstash/filters/ advisor.rb https://github.com/logstash/logstash/blob/master/lib/logstash/outputs/ s3.rb