SlideShare une entreprise Scribd logo
1  sur  31
Télécharger pour lire hors ligne
www.consultec.es
Introducción a Big Data
www.consultec.es
¿Quiénes somos?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
Índice
1. Introducción
1. ¿Qué no es Big Data?
2. Situación actual
3. ¿Y entonces qué es Big Data exactamente?
4. Las 3 Vs de Big Data
5. Retos actuales
2. Big Data llevado a la práctica
1. Utilidades
2. Ejemplo real: Walmart
3. ¿Qué mueve Big Data?
1. Características Técnicas
2. Software
3. Markets de Datos
4. Hadoop
5. Microsoft HDInsight
4. Demos
www.consultec.es
Introducción
“Big Data” es desde hace dos o tres años una de las grandes
tendencias dentro del mundo de la tecnología y del marketing, uno
de esos “buzzwords” que en un momento dado empiezan a
propagarse y aparecer por todo internet, las grandes empresas se
interesan por ello, se crea una industria alrededor y, de repente,
todo el mundo sabe lo que es Big Data. O no …
BIG DATA
www.consultec.es
¿Qué no es Big Data?
Antes de empezar, lo primero es desengañarnos.
• Big Data no es una base de datos enorme
• Big Data no es un data warehouse enorme
• Big Data no es una nueva forma de Business Intelligence
• Big Data no es llevar las base de datos a la nube
• …
www.consultec.es
Situación actual
Bases de
Datos
Relacionales
Bases de
Datos
Analíticas
(Data
Warehouse)
Archivos
(XML,
Logs, …)
ERP/CRM
Redes Sociales
Base de
Datos NoSQL
APIs
Sensores
RFID
Información
generada por
apps móviles
Y mucho más.
Y lo que está
por venir …
Big Data
GPS
Internet de
las Cosas
Información
generada por
máquinas
eMails
www.consultec.es
¿Y entonces qué es Big Data exactamente?
• Definiciones encontradas en internet
• Información que tiene un orden de magnitud más grande de lo que
estamos acostumbrados.
• Información que es muy grande, se mueve muy rápido y no se ajusta a
las estructuras de las base de datos actuales.
• Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la
mayoría de los software utilizados para capturar, gestionar y procesar la
información dentro de un lapso tolerable de tiempo.
www.consultec.es
Las 3 Vs de Big Data
Volume: grandes volúmenes de información
• Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de
Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
www.consultec.es
Las 3 Vs de Big Data
Variety: información de tipos muy diversos
• Ya no solo tenemos información estructurada en Bases de Datos o Archivos.
Ahora empezamos a tener información con tipos diferentes y totalmente
desestructurada.
www.consultec.es
Las 3 Vs de Big Data
Velocity: velocidad con la que se genera la información
• La velocidad a la que se genera esta información hace imposible gestionarla
con sistemas de base de datos convencionales. Las empresas y las personas
ya no quieren estar al día, quieren “estar al segundo”.
www.consultec.es
Retos actuales
• Dar sentido al gran volumen de datos
• Necesitamos las herramientas adecuadas para dar sentido de la abrumadora
cantidad de datos generados por la disminución de los costos de hardware y de las
fuentes de datos “complejas”.
• La comprensión de una variedad cada vez mayor de datos
• Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85%
de los datos capturados son desestructurados.
• Habilitación de análisis en tiempo real de los datos
• Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo
volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar
eficazmente mediante procesos por lotes normales.
www.consultec.es
Utilidades
Toma de decisiones
El valor del Big Data no es la información, sino la nueva forma de toma de
decisiones basada en evidencias y datos empíricos.
Tomar decisiones en base a datos empíricos y tendencias
Tomar decisiones en base a corazonadas, instinto o
experiencias pasadas
www.consultec.es
Utilidades
Experimentación
Una vez recopilados los datos que nos
interesan, la experimentación y la
exploración de los mismos puede
mostrarnos información que a primera vista
nunca hubiésemos encontrado o que nunca
se nos hubiese ocurrido buscar.
www.consultec.es
Utilidades
Transparencia
Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas
y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
www.consultec.es
Utilidades
Innovación
Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear
nuevos modelos de negocio.
www.consultec.es
Ejemplo real: Walmart
• Walmart es una multinacional de grandes almacenes
• Es la segunda mayor empresa del mundo por ingresos
www.consultec.es
Ejemplo real: Walmart
• Algunos datos:
• 200 millones de clientes a la semana
• 10700 tiendas
• 27 países
• 2 millones de trabajadores
• 1,5 millones de transacciones por hora
• Varios Terabytes de información generada en tiempo real
• Base de datos de 3 Petabytes
www.consultec.es
Ejemplo real: Walmart
Guardando todas las compras de todos los clientes se dieron cuenta que
en época de huracanes los Walmart de las zonas afectadas vendían más
cajas de Pop-Tarts que en otras épocas.
Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los
Pop-Tarts en la entrada de las tiendas.
Resultado: Aumento extraordinario de las ventas
¿A quién se le hubiese ocurrido cruzar los
datos de ventas con los datos meteorológicos
o con los calendarios de huracanes?
www.consultec.es
Ejemplo real: Walmart
Hanna twitea:
“I love Salt!”.
En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y
unos minutos más tarde le llega a una amiga suya el siguiente email:
“Buenos días!
Nos pediste que te avisásemos cuando fuese el cumpleaños
de Hanna. Pues ya está aquí y acaba de tweetear algo
bueno sobre la película “Salt” de Angelina Jolie.
¿Quieres regalarle algo relacionado con ello?
Tenemos algunas sugerencias que hacerte …”
www.consultec.es
Ejemplo real: Walmart
• Social Genome
Base de conocimiento que captura entidades y relaciones del mundo
social.
Obtiene información de su base de datos, de otros datos tanto públicos
como privados y de redes sociales.
A partir de ahí identifican entidades “interesantes” y las relacionan
entre sí, consiguiendo toda la información de la que son capaces.
Es un sistema vivo, en constante evolución.
www.consultec.es
Ejemplo real: Walmart
• Entidades: • Relaciones
• Una persona interesada en un tema
• Una persona que asiste a un evento
• Un evento sobre un tema
• Una asociación entre empresa y
producto
www.consultec.es
Ejemplo real: Walmart
• Resumiendo
www.consultec.es
Características Técnicas
Arquitectura
• Alta escalabilidad
• Procesamiento paralelo
• Baja latencia
• Datos no estructurados y estructurados
• NoSQL
• By-pass de datos – Alta disponibilidad
www.consultec.es
Markets de Datos
Además de las fuentes de datos que tengamos en nuestra organización:
bases de datos, emails, logs, documentos, etc … Podemos acceder a
grandes volúmenes de datos (Data Sets) en los markets.
Hay gratuitos y de pago.
www.consultec.es
Hadoop
• Es una plataforma diseñada para almacenar y analizar grandes
volúmenes de datos de diferentes tipos. Basada en Google
Map/Reduce y Google Filesystem.
• Map/Reduce:
• Map: recoger los datos, estructurarlos, extraer la
información interesante, etc … para poder trabajar con
ellos.
Los trabajos se distribuyen en los nodos para
procesarse paralelamente.
• Reduce: combina la información generada en los Map.
• HDFS (Hadoop Distributed File System):
• Sistema de archivos distribuidos, con replicación
automática y optimizado para lectura. Cada fichero se
particiona y se distribuye en todos los servidores.
www.consultec.es
Hadoop
• Otros proyectos alrededor de Hadoop
• Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”).
• Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado
por Yahoo!.
• Sqoop: Framework para la integración de bases de datos relacionales con
Hadoop
• Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos
de eventos/logs y streaming.
• …
www.consultec.es
Microsoft HDInsight
• Servicio basado en Hadoop.
• Dos versiones:
• Windows Azure HDInsight (on-demand)
• HDInsight Server (on-premise)
www.consultec.es
Microsoft HDInsight
• Acceso a todo tipo de usuarios, incluidos desarrolladores y
profesionales IT. Fácil instalación, administración y configuración.
• Integración con herramientas conocidas como Excel, PowerPivot,
PowerView, SQL Server Analysis Services o Reporting Services.
• .NET SDK para Hadoop (a través e NuGet):
• Map/Reduce
• LINQ to Hive
• WebHDFS Client
www.consultec.es
Microsoft HDInsight
www.consultec.es
¿Dudas?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
www.consultec.es
Gracias!

Contenu connexe

Tendances

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpGrupo DIRCOM
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataEmilio del Prado
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empiezaKEEDIO
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Carlos Cuesta
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos Luis Joyanes
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesamdia
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponencialesLeonardo Clavijo
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBig-Data-Summit
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoAndres Karp
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big DataGrupo DIRCOM
 
Big data
Big dataBig data
Big dataTaniaQu
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales.. ..
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCJosep Curto
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?Carla Buj
 

Tendances (20)

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 
Big data
Big data Big data
Big data
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos
 
Big Data
Big DataBig Data
Big Data
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminado
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big Data
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOC
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
 

En vedette

En vedette (8)

Big Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy GrailBig Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy Grail
 
Empresa nike
Empresa nikeEmpresa nike
Empresa nike
 
Trabajo de huawey
Trabajo de huaweyTrabajo de huawey
Trabajo de huawey
 
Huawei diapositiva
Huawei diapositivaHuawei diapositiva
Huawei diapositiva
 
Huawei
HuaweiHuawei
Huawei
 
Huawei en Entel Summit 2010
Huawei en Entel Summit 2010Huawei en Entel Summit 2010
Huawei en Entel Summit 2010
 
Big Data World
Big Data WorldBig Data World
Big Data World
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 

Similaire à Big Data Introducción

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataAlfredo Vela Zancada
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdflaubritez2001
 

Similaire à Big Data Introducción (20)

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
El big data
El big dataEl big data
El big data
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Big data
Big dataBig data
Big data
 
big data
big  databig  data
big data
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 

Dernier

data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024analiticaydatos
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,EmmanuelDelJessGonza
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIAEduardo Ferreira
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024OBSERVATORIOREGIONAL
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointaria66611782972
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeklebersky23
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfsmilagrossmedina23
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfJC Díaz Herrera
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 

Dernier (20)

data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 

Big Data Introducción

  • 2. www.consultec.es ¿Quiénes somos? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications
  • 3. Índice 1. Introducción 1. ¿Qué no es Big Data? 2. Situación actual 3. ¿Y entonces qué es Big Data exactamente? 4. Las 3 Vs de Big Data 5. Retos actuales 2. Big Data llevado a la práctica 1. Utilidades 2. Ejemplo real: Walmart 3. ¿Qué mueve Big Data? 1. Características Técnicas 2. Software 3. Markets de Datos 4. Hadoop 5. Microsoft HDInsight 4. Demos
  • 4. www.consultec.es Introducción “Big Data” es desde hace dos o tres años una de las grandes tendencias dentro del mundo de la tecnología y del marketing, uno de esos “buzzwords” que en un momento dado empiezan a propagarse y aparecer por todo internet, las grandes empresas se interesan por ello, se crea una industria alrededor y, de repente, todo el mundo sabe lo que es Big Data. O no … BIG DATA
  • 5. www.consultec.es ¿Qué no es Big Data? Antes de empezar, lo primero es desengañarnos. • Big Data no es una base de datos enorme • Big Data no es un data warehouse enorme • Big Data no es una nueva forma de Business Intelligence • Big Data no es llevar las base de datos a la nube • …
  • 6. www.consultec.es Situación actual Bases de Datos Relacionales Bases de Datos Analíticas (Data Warehouse) Archivos (XML, Logs, …) ERP/CRM Redes Sociales Base de Datos NoSQL APIs Sensores RFID Información generada por apps móviles Y mucho más. Y lo que está por venir … Big Data GPS Internet de las Cosas Información generada por máquinas eMails
  • 7. www.consultec.es ¿Y entonces qué es Big Data exactamente? • Definiciones encontradas en internet • Información que tiene un orden de magnitud más grande de lo que estamos acostumbrados. • Información que es muy grande, se mueve muy rápido y no se ajusta a las estructuras de las base de datos actuales. • Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la mayoría de los software utilizados para capturar, gestionar y procesar la información dentro de un lapso tolerable de tiempo.
  • 8. www.consultec.es Las 3 Vs de Big Data Volume: grandes volúmenes de información • Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
  • 9. www.consultec.es Las 3 Vs de Big Data Variety: información de tipos muy diversos • Ya no solo tenemos información estructurada en Bases de Datos o Archivos. Ahora empezamos a tener información con tipos diferentes y totalmente desestructurada.
  • 10. www.consultec.es Las 3 Vs de Big Data Velocity: velocidad con la que se genera la información • La velocidad a la que se genera esta información hace imposible gestionarla con sistemas de base de datos convencionales. Las empresas y las personas ya no quieren estar al día, quieren “estar al segundo”.
  • 11. www.consultec.es Retos actuales • Dar sentido al gran volumen de datos • Necesitamos las herramientas adecuadas para dar sentido de la abrumadora cantidad de datos generados por la disminución de los costos de hardware y de las fuentes de datos “complejas”. • La comprensión de una variedad cada vez mayor de datos • Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85% de los datos capturados son desestructurados. • Habilitación de análisis en tiempo real de los datos • Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar eficazmente mediante procesos por lotes normales.
  • 12. www.consultec.es Utilidades Toma de decisiones El valor del Big Data no es la información, sino la nueva forma de toma de decisiones basada en evidencias y datos empíricos. Tomar decisiones en base a datos empíricos y tendencias Tomar decisiones en base a corazonadas, instinto o experiencias pasadas
  • 13. www.consultec.es Utilidades Experimentación Una vez recopilados los datos que nos interesan, la experimentación y la exploración de los mismos puede mostrarnos información que a primera vista nunca hubiésemos encontrado o que nunca se nos hubiese ocurrido buscar.
  • 14. www.consultec.es Utilidades Transparencia Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
  • 15. www.consultec.es Utilidades Innovación Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear nuevos modelos de negocio.
  • 16. www.consultec.es Ejemplo real: Walmart • Walmart es una multinacional de grandes almacenes • Es la segunda mayor empresa del mundo por ingresos
  • 17. www.consultec.es Ejemplo real: Walmart • Algunos datos: • 200 millones de clientes a la semana • 10700 tiendas • 27 países • 2 millones de trabajadores • 1,5 millones de transacciones por hora • Varios Terabytes de información generada en tiempo real • Base de datos de 3 Petabytes
  • 18. www.consultec.es Ejemplo real: Walmart Guardando todas las compras de todos los clientes se dieron cuenta que en época de huracanes los Walmart de las zonas afectadas vendían más cajas de Pop-Tarts que en otras épocas. Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los Pop-Tarts en la entrada de las tiendas. Resultado: Aumento extraordinario de las ventas ¿A quién se le hubiese ocurrido cruzar los datos de ventas con los datos meteorológicos o con los calendarios de huracanes?
  • 19. www.consultec.es Ejemplo real: Walmart Hanna twitea: “I love Salt!”. En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y unos minutos más tarde le llega a una amiga suya el siguiente email: “Buenos días! Nos pediste que te avisásemos cuando fuese el cumpleaños de Hanna. Pues ya está aquí y acaba de tweetear algo bueno sobre la película “Salt” de Angelina Jolie. ¿Quieres regalarle algo relacionado con ello? Tenemos algunas sugerencias que hacerte …”
  • 20. www.consultec.es Ejemplo real: Walmart • Social Genome Base de conocimiento que captura entidades y relaciones del mundo social. Obtiene información de su base de datos, de otros datos tanto públicos como privados y de redes sociales. A partir de ahí identifican entidades “interesantes” y las relacionan entre sí, consiguiendo toda la información de la que son capaces. Es un sistema vivo, en constante evolución.
  • 21. www.consultec.es Ejemplo real: Walmart • Entidades: • Relaciones • Una persona interesada en un tema • Una persona que asiste a un evento • Un evento sobre un tema • Una asociación entre empresa y producto
  • 23. www.consultec.es Características Técnicas Arquitectura • Alta escalabilidad • Procesamiento paralelo • Baja latencia • Datos no estructurados y estructurados • NoSQL • By-pass de datos – Alta disponibilidad
  • 24. www.consultec.es Markets de Datos Además de las fuentes de datos que tengamos en nuestra organización: bases de datos, emails, logs, documentos, etc … Podemos acceder a grandes volúmenes de datos (Data Sets) en los markets. Hay gratuitos y de pago.
  • 25. www.consultec.es Hadoop • Es una plataforma diseñada para almacenar y analizar grandes volúmenes de datos de diferentes tipos. Basada en Google Map/Reduce y Google Filesystem. • Map/Reduce: • Map: recoger los datos, estructurarlos, extraer la información interesante, etc … para poder trabajar con ellos. Los trabajos se distribuyen en los nodos para procesarse paralelamente. • Reduce: combina la información generada en los Map. • HDFS (Hadoop Distributed File System): • Sistema de archivos distribuidos, con replicación automática y optimizado para lectura. Cada fichero se particiona y se distribuye en todos los servidores.
  • 26. www.consultec.es Hadoop • Otros proyectos alrededor de Hadoop • Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”). • Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado por Yahoo!. • Sqoop: Framework para la integración de bases de datos relacionales con Hadoop • Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos de eventos/logs y streaming. • …
  • 27. www.consultec.es Microsoft HDInsight • Servicio basado en Hadoop. • Dos versiones: • Windows Azure HDInsight (on-demand) • HDInsight Server (on-premise)
  • 28. www.consultec.es Microsoft HDInsight • Acceso a todo tipo de usuarios, incluidos desarrolladores y profesionales IT. Fácil instalación, administración y configuración. • Integración con herramientas conocidas como Excel, PowerPivot, PowerView, SQL Server Analysis Services o Reporting Services. • .NET SDK para Hadoop (a través e NuGet): • Map/Reduce • LINQ to Hive • WebHDFS Client
  • 30. www.consultec.es ¿Dudas? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications