SlideShare una empresa de Scribd logo
1 de 14
¿Storm? ¿Qué es?
Conceptos básicos
Apache Storm
● Sistema de computación distribuida en tiempo real y tolerante a
fallos.
● Storm hace fácil la tarea de procesar streams de datos
● El procesado hace en tiempo real lo que Hadoop hace en
procesos batch
● Simple, se puede utilizar cualquier lenguaje de programación
● Libre y Open Source (Licencia Apache).
Apache Storm
● General: Soporta una variedad de casos de uso posibles.
● Escalabilidad: Simplemente añadiendo nuevas máquinas e incrementado
la configuración de paralelismo de la topología. Primeras implementaciones
1M msg/seg en un cluster 10 máquinas.
● Garantía de no perder datos: A diferencia de otros sistemas como S4,
Storm garantiza que no hay perdida de mensajes.
● Robusto: Los clusters se pueden configurar de forma sencilla.
● Tolerante a fallos: Si existen fallos, storm re-asigna las tareas.
● Agnóstico del lenguaje: Los componentes de storm se pueden definir en
cualquier lenguaje de programación.
Casos de uso
● Procesamiento de Streams: Con Storm no es necesario mantener colas
intermedias para realizar el procesamiento de streams.
● Computación continua: Permite enviar datos de forma continua para y por
tanto actualizar y mostrar resultados en tiempo real (Como métricas web).
● Llamadas a procedimientos remotos distribuidos: Permite paralelizar de
forma muy sencilla operaciones costosas de CPU.
Componentes Cluster Storm
● En Hadoop se ejecutan M-R Jobs; en Storm se ejecutan topologies. La
principal diferencia es que un job M-R termina y un topologie se ejecuta
indefinidamente.
● Dos tipos de nodos: master node y worker node.
● El master node ejecuta el demonio “Nimbus” (~jobtracker en Hadoop).
● Cada worker node ejecuta un demonio llamado “Supervisor”. El
supervisor escucha trabajos asignados a su máquina y arranca y detiene
procesos worker. Cada proceso worker ejecuta un subconjunto de la
topología.
● Una topología en ejecución consiste en muchos procesos worker a lo largo
de muchas máquinas.
Coordinación Cluster Storm
● Una topologie es un grafo de computación. Cada nodo en la topologie
contiene lógica de procesado y enlaces entre nodos para indicar cómo los
datos se deben comunicar.
● Para ejecutar una topología se empaqueta todo el código y sus
dependencias en un jar.
storm jar allmycode.jar backtype.storm.MyTopology arg1 arg2
● Ejecuta la clase bactype.storm.MyTopology con sus argumentos y la envía
al cluster storm.
● Las definiciones de las topologías son estructuras Thrift y como Nimbus es
un servicio Thrift se pueden crear topologías utilizando cualquier lenguaje.
Streams
● Es la abstracción principal en Storm. Se trata de una secuencia sin límite de
tuplas.
● Storm proporciona abstracciones para transformar streams.
● Las abstracciones básicas son spouts y bolts. Spouts y bolts tienen
interfaces que hay que implementar para ejecutar la lógica de aplicación
específica.
Spout
● El Spout es una fuente de streams en un topology.
● Generalmente leen tuplas de la fuente externa y los emiten en la topología.
● Un spout es una secuencia de streams. Por ejemplo un spout puede leer
tuplas de una queue y emitirlas como stream o bien conectarse a la twitter
API y emitir un stream de tweets
Bolt
● Todo el procesamiento del topology se hace en los Bolts. Los Bolts pueden
realizar operaciones de filtrado, funciones, agregados, conexiones con BBDD y
más.
● Un bolt consume cualquier número de streams de entrada, realiza algún
procesado sobre ellos y posiblemente emite nuevos streams.
● Transformaciones de stream complejas como calcular un trending topic de un
stream de tweets requieren múltiples pasos y múltiples bolts.
Topologies
● Las redes de Spouts y Bolts se empaquetan en una Topologie. Una
topologie es un grafo donde cada nodo es un Spout o Bolt.
● Enlaces entre nodos indican como se pasan las tuplas.
● Cada nodo en la topología se ejecuta en paralelo.
● En la topología se puede especificar cuanto paralelismo se desea para cada
nodo.
● Todos los nodos de la topología deben ser capaces de ejecutarse de forma
individual.
Modelo de datos
● Storm utiliza tuplas como modelo de datos. Una tupla es una lista de valores
con nombre, cada campo en una tupla puede ser un objeto de cualquier
tipo.
● Storm soporta todos los tipos primitivos y se pueden crear nuevos
implementando un serializador.
● Cada nodo en una topology debe declarar los campos de salida para las
tuplas que emite.
Ejecución Spouts y Bolts
www.TodoBI.com
info@stratebi.co
m
www.stratebi.com
Mas información
Tfno:
91.788.34.10
Madrid: Pº de la Castellana, 164, 1º
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar
Stratebi: Quiénes somos

Más contenido relacionado

La actualidad más candente

Administración de procesos en el S.O.
Administración de procesos en el S.O.Administración de procesos en el S.O.
Administración de procesos en el S.O.Carlos Solano
 
Sistemas operativos mapa mental
Sistemas operativos mapa mentalSistemas operativos mapa mental
Sistemas operativos mapa mentaljuliana bello
 
Cuadro comparativo de sistemas operativos
Cuadro comparativo de sistemas operativosCuadro comparativo de sistemas operativos
Cuadro comparativo de sistemas operativospanda_emilly123
 
Linea de tiempo sistemas operativos
Linea de tiempo sistemas operativosLinea de tiempo sistemas operativos
Linea de tiempo sistemas operativosjoselias79
 
Metodologia xp cortesserranoeliud
Metodologia xp cortesserranoeliudMetodologia xp cortesserranoeliud
Metodologia xp cortesserranoeliudEliud Cortes
 
Sistemas y Tecnologias de la Información
Sistemas y Tecnologias de la InformaciónSistemas y Tecnologias de la Información
Sistemas y Tecnologias de la Informaciónprofgloria
 
Sistemas operativos-para-servidores
Sistemas operativos-para-servidoresSistemas operativos-para-servidores
Sistemas operativos-para-servidorespelaodioses
 
Computacion en la Nube
Computacion en la NubeComputacion en la Nube
Computacion en la NubeDilcia Mejia
 
Monitoreo de una red
Monitoreo de una redMonitoreo de una red
Monitoreo de una redDylan Real G
 
Sistemas de informacion estrategicos
Sistemas de informacion estrategicosSistemas de informacion estrategicos
Sistemas de informacion estrategicosjloaiza8
 
Apache Storm: Instalación
Apache Storm: InstalaciónApache Storm: Instalación
Apache Storm: InstalaciónStratebi
 
Mapa Conceptual Sistemas de Información Gerencial
Mapa Conceptual Sistemas de Información GerencialMapa Conceptual Sistemas de Información Gerencial
Mapa Conceptual Sistemas de Información GerencialRosanapa Parra
 
Topología de doble anillo
Topología de doble anilloTopología de doble anillo
Topología de doble anilloJuan Carlo N
 
Sistemas operativos,características,tipos, clasificación, etc
Sistemas operativos,características,tipos, clasificación, etcSistemas operativos,características,tipos, clasificación, etc
Sistemas operativos,características,tipos, clasificación, etcJuan Pablo Ramírez García
 

La actualidad más candente (20)

Sistemas operativos centralizados
Sistemas operativos centralizadosSistemas operativos centralizados
Sistemas operativos centralizados
 
Administración de procesos en el S.O.
Administración de procesos en el S.O.Administración de procesos en el S.O.
Administración de procesos en el S.O.
 
Sistemas operativos mapa mental
Sistemas operativos mapa mentalSistemas operativos mapa mental
Sistemas operativos mapa mental
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
 
Utilitarios
UtilitariosUtilitarios
Utilitarios
 
Cuadro comparativo de sistemas operativos
Cuadro comparativo de sistemas operativosCuadro comparativo de sistemas operativos
Cuadro comparativo de sistemas operativos
 
Linea de tiempo sistemas operativos
Linea de tiempo sistemas operativosLinea de tiempo sistemas operativos
Linea de tiempo sistemas operativos
 
Metodologia xp cortesserranoeliud
Metodologia xp cortesserranoeliudMetodologia xp cortesserranoeliud
Metodologia xp cortesserranoeliud
 
Sistema empresarial
Sistema empresarialSistema empresarial
Sistema empresarial
 
Sistemas y Tecnologias de la Información
Sistemas y Tecnologias de la InformaciónSistemas y Tecnologias de la Información
Sistemas y Tecnologias de la Información
 
Los servicios de la nube
Los servicios de la nubeLos servicios de la nube
Los servicios de la nube
 
Sistemas operativos-para-servidores
Sistemas operativos-para-servidoresSistemas operativos-para-servidores
Sistemas operativos-para-servidores
 
Computacion en la Nube
Computacion en la NubeComputacion en la Nube
Computacion en la Nube
 
Monitoreo de una red
Monitoreo de una redMonitoreo de una red
Monitoreo de una red
 
Sistemas de informacion estrategicos
Sistemas de informacion estrategicosSistemas de informacion estrategicos
Sistemas de informacion estrategicos
 
Apache Storm: Instalación
Apache Storm: InstalaciónApache Storm: Instalación
Apache Storm: Instalación
 
Mapa Conceptual Sistemas de Información Gerencial
Mapa Conceptual Sistemas de Información GerencialMapa Conceptual Sistemas de Información Gerencial
Mapa Conceptual Sistemas de Información Gerencial
 
Topología de doble anillo
Topología de doble anilloTopología de doble anillo
Topología de doble anillo
 
Sistemas operativos,características,tipos, clasificación, etc
Sistemas operativos,características,tipos, clasificación, etcSistemas operativos,características,tipos, clasificación, etc
Sistemas operativos,características,tipos, clasificación, etc
 
Xampp
XamppXampp
Xampp
 

Similar a Apache Storm: Introduccion

Similar a Apache Storm: Introduccion (20)

Storm
StormStorm
Storm
 
De Threads a CompletableFutures
De Threads a CompletableFuturesDe Threads a CompletableFutures
De Threads a CompletableFutures
 
Lab5 guia
Lab5 guiaLab5 guia
Lab5 guia
 
Switches gestionables
Switches gestionablesSwitches gestionables
Switches gestionables
 
Openmp
OpenmpOpenmp
Openmp
 
Estudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y HiveEstudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y Hive
 
T0 -arquitectura de internet
T0  -arquitectura de internetT0  -arquitectura de internet
T0 -arquitectura de internet
 
Thread
ThreadThread
Thread
 
Tema 3 -_switches_gestionables
Tema 3 -_switches_gestionablesTema 3 -_switches_gestionables
Tema 3 -_switches_gestionables
 
Switch
SwitchSwitch
Switch
 
Ud3 inocente alcaide
Ud3 inocente alcaideUd3 inocente alcaide
Ud3 inocente alcaide
 
Arqui hardware
Arqui hardwareArqui hardware
Arqui hardware
 
Funcionamiento Del Switch Y Del Router
Funcionamiento Del Switch Y Del RouterFuncionamiento Del Switch Y Del Router
Funcionamiento Del Switch Y Del Router
 
Clase 4 redes
Clase 4 redesClase 4 redes
Clase 4 redes
 
Prototipo de informe laboratorio nat
Prototipo de informe laboratorio natPrototipo de informe laboratorio nat
Prototipo de informe laboratorio nat
 
Información básica
Información básicaInformación básica
Información básica
 
Docker y Kubernetes, en busca de la alta disponibilidad
Docker y Kubernetes, en busca de la alta disponibilidadDocker y Kubernetes, en busca de la alta disponibilidad
Docker y Kubernetes, en busca de la alta disponibilidad
 
Hilos con Posix
Hilos con PosixHilos con Posix
Hilos con Posix
 
Practica4jpmstp
Practica4jpmstpPractica4jpmstp
Practica4jpmstp
 
Arquitectura de Protocolos.pptx
Arquitectura de Protocolos.pptxArquitectura de Protocolos.pptx
Arquitectura de Protocolos.pptx
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Último

PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfeluniversocom
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
la-antigua-Grecia, datos y curiosidades mas relevantes
la-antigua-Grecia, datos y curiosidades mas relevantesla-antigua-Grecia, datos y curiosidades mas relevantes
la-antigua-Grecia, datos y curiosidades mas relevantesalvarojosephyucracol
 
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdf
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdfcuadernillo_tareas_funciones_estructuras_medias_psuv.pdf
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdfeduingonzalez3
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoSantiagoRodriguezLoz
 
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdf
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdfSesion1_Ciencia_de_Datos-Introduccion a Pithon.pdf
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdfMarxx4
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
49906_TE_RETO_juegos_criminales,juego.pdf
49906_TE_RETO_juegos_criminales,juego.pdf49906_TE_RETO_juegos_criminales,juego.pdf
49906_TE_RETO_juegos_criminales,juego.pdfceliajuliacarmen29
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Las Características Principales de las Redes.pptx
Las Características Principales de las Redes.pptxLas Características Principales de las Redes.pptx
Las Características Principales de las Redes.pptxecarvictoriajhan
 
Secuencia Uso del calendario. Segundo ciclo.docx
Secuencia Uso del calendario. Segundo ciclo.docxSecuencia Uso del calendario. Segundo ciclo.docx
Secuencia Uso del calendario. Segundo ciclo.docxcandevillarruel
 
SESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docSESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docrobinsonsjuan
 
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptxceliajessicapinedava
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024eluniversocom
 
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptx
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptxTALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptx
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptxDiegoRuizRios
 
Politicas publicas un balance necesario Bolivia
Politicas publicas un balance necesario BoliviaPoliticas publicas un balance necesario Bolivia
Politicas publicas un balance necesario BoliviaAlfredo Zaconeta
 
Metodología del trabajo universitario pt 1
Metodología del trabajo universitario pt 1Metodología del trabajo universitario pt 1
Metodología del trabajo universitario pt 1gostingsoto
 
La factura..............................!
La factura..............................!La factura..............................!
La factura..............................!AndresBarrientosSile
 
ANALISIS DE LA LITERATURA DEL RENACIMIENTO
ANALISIS DE LA LITERATURA DEL RENACIMIENTOANALISIS DE LA LITERATURA DEL RENACIMIENTO
ANALISIS DE LA LITERATURA DEL RENACIMIENTOELIZABETHTINOCO10
 
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptx
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptxTEORIA DEL DEFICIT DEL AUTOCUIDADO .pptx
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptxmarinosudarioneyer
 

Último (20)

PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
la-antigua-Grecia, datos y curiosidades mas relevantes
la-antigua-Grecia, datos y curiosidades mas relevantesla-antigua-Grecia, datos y curiosidades mas relevantes
la-antigua-Grecia, datos y curiosidades mas relevantes
 
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdf
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdfcuadernillo_tareas_funciones_estructuras_medias_psuv.pdf
cuadernillo_tareas_funciones_estructuras_medias_psuv.pdf
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
 
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdf
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdfSesion1_Ciencia_de_Datos-Introduccion a Pithon.pdf
Sesion1_Ciencia_de_Datos-Introduccion a Pithon.pdf
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 
49906_TE_RETO_juegos_criminales,juego.pdf
49906_TE_RETO_juegos_criminales,juego.pdf49906_TE_RETO_juegos_criminales,juego.pdf
49906_TE_RETO_juegos_criminales,juego.pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Las Características Principales de las Redes.pptx
Las Características Principales de las Redes.pptxLas Características Principales de las Redes.pptx
Las Características Principales de las Redes.pptx
 
Secuencia Uso del calendario. Segundo ciclo.docx
Secuencia Uso del calendario. Segundo ciclo.docxSecuencia Uso del calendario. Segundo ciclo.docx
Secuencia Uso del calendario. Segundo ciclo.docx
 
SESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docSESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.doc
 
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
 
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptx
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptxTALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptx
TALLER DE PLAN DE SOPORTE SOCIOEMOCIONAL.pptx
 
Politicas publicas un balance necesario Bolivia
Politicas publicas un balance necesario BoliviaPoliticas publicas un balance necesario Bolivia
Politicas publicas un balance necesario Bolivia
 
Metodología del trabajo universitario pt 1
Metodología del trabajo universitario pt 1Metodología del trabajo universitario pt 1
Metodología del trabajo universitario pt 1
 
La factura..............................!
La factura..............................!La factura..............................!
La factura..............................!
 
ANALISIS DE LA LITERATURA DEL RENACIMIENTO
ANALISIS DE LA LITERATURA DEL RENACIMIENTOANALISIS DE LA LITERATURA DEL RENACIMIENTO
ANALISIS DE LA LITERATURA DEL RENACIMIENTO
 
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptx
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptxTEORIA DEL DEFICIT DEL AUTOCUIDADO .pptx
TEORIA DEL DEFICIT DEL AUTOCUIDADO .pptx
 

Apache Storm: Introduccion

  • 3. Apache Storm ● Sistema de computación distribuida en tiempo real y tolerante a fallos. ● Storm hace fácil la tarea de procesar streams de datos ● El procesado hace en tiempo real lo que Hadoop hace en procesos batch ● Simple, se puede utilizar cualquier lenguaje de programación ● Libre y Open Source (Licencia Apache).
  • 4. Apache Storm ● General: Soporta una variedad de casos de uso posibles. ● Escalabilidad: Simplemente añadiendo nuevas máquinas e incrementado la configuración de paralelismo de la topología. Primeras implementaciones 1M msg/seg en un cluster 10 máquinas. ● Garantía de no perder datos: A diferencia de otros sistemas como S4, Storm garantiza que no hay perdida de mensajes. ● Robusto: Los clusters se pueden configurar de forma sencilla. ● Tolerante a fallos: Si existen fallos, storm re-asigna las tareas. ● Agnóstico del lenguaje: Los componentes de storm se pueden definir en cualquier lenguaje de programación.
  • 5. Casos de uso ● Procesamiento de Streams: Con Storm no es necesario mantener colas intermedias para realizar el procesamiento de streams. ● Computación continua: Permite enviar datos de forma continua para y por tanto actualizar y mostrar resultados en tiempo real (Como métricas web). ● Llamadas a procedimientos remotos distribuidos: Permite paralelizar de forma muy sencilla operaciones costosas de CPU.
  • 6. Componentes Cluster Storm ● En Hadoop se ejecutan M-R Jobs; en Storm se ejecutan topologies. La principal diferencia es que un job M-R termina y un topologie se ejecuta indefinidamente. ● Dos tipos de nodos: master node y worker node. ● El master node ejecuta el demonio “Nimbus” (~jobtracker en Hadoop). ● Cada worker node ejecuta un demonio llamado “Supervisor”. El supervisor escucha trabajos asignados a su máquina y arranca y detiene procesos worker. Cada proceso worker ejecuta un subconjunto de la topología. ● Una topología en ejecución consiste en muchos procesos worker a lo largo de muchas máquinas.
  • 7. Coordinación Cluster Storm ● Una topologie es un grafo de computación. Cada nodo en la topologie contiene lógica de procesado y enlaces entre nodos para indicar cómo los datos se deben comunicar. ● Para ejecutar una topología se empaqueta todo el código y sus dependencias en un jar. storm jar allmycode.jar backtype.storm.MyTopology arg1 arg2 ● Ejecuta la clase bactype.storm.MyTopology con sus argumentos y la envía al cluster storm. ● Las definiciones de las topologías son estructuras Thrift y como Nimbus es un servicio Thrift se pueden crear topologías utilizando cualquier lenguaje.
  • 8. Streams ● Es la abstracción principal en Storm. Se trata de una secuencia sin límite de tuplas. ● Storm proporciona abstracciones para transformar streams. ● Las abstracciones básicas son spouts y bolts. Spouts y bolts tienen interfaces que hay que implementar para ejecutar la lógica de aplicación específica.
  • 9. Spout ● El Spout es una fuente de streams en un topology. ● Generalmente leen tuplas de la fuente externa y los emiten en la topología. ● Un spout es una secuencia de streams. Por ejemplo un spout puede leer tuplas de una queue y emitirlas como stream o bien conectarse a la twitter API y emitir un stream de tweets
  • 10. Bolt ● Todo el procesamiento del topology se hace en los Bolts. Los Bolts pueden realizar operaciones de filtrado, funciones, agregados, conexiones con BBDD y más. ● Un bolt consume cualquier número de streams de entrada, realiza algún procesado sobre ellos y posiblemente emite nuevos streams. ● Transformaciones de stream complejas como calcular un trending topic de un stream de tweets requieren múltiples pasos y múltiples bolts.
  • 11. Topologies ● Las redes de Spouts y Bolts se empaquetan en una Topologie. Una topologie es un grafo donde cada nodo es un Spout o Bolt. ● Enlaces entre nodos indican como se pasan las tuplas. ● Cada nodo en la topología se ejecuta en paralelo. ● En la topología se puede especificar cuanto paralelismo se desea para cada nodo. ● Todos los nodos de la topología deben ser capaces de ejecutarse de forma individual.
  • 12. Modelo de datos ● Storm utiliza tuplas como modelo de datos. Una tupla es una lista de valores con nombre, cada campo en una tupla puede ser un objeto de cualquier tipo. ● Storm soporta todos los tipos primitivos y se pueden crear nuevos implementando un serializador. ● Cada nodo en una topology debe declarar los campos de salida para las tuplas que emite.
  • 14. www.TodoBI.com info@stratebi.co m www.stratebi.com Mas información Tfno: 91.788.34.10 Madrid: Pº de la Castellana, 164, 1º Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar Stratebi: Quiénes somos