SlideShare une entreprise Scribd logo
1  sur  148
Télécharger pour lire hors ligne
11
Prof. Luis Joyanes Aguilar
BIG DATA: Análisis de los datos
como nuevos pilares de la gestión
empresarial
Escuela Politécnica
12 de junio 2014
22
ESTADO DEL ARTE DE
CLOUD COMPUTING
Prof. Luis Joyanes Aguilar
COMPUTACIÓN
EN LA NUBE
La nueva era de la
computación
3
4
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA NUBE: ESE GRAN INVENTO
Página –5–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –6–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
INTRODUCCIÓN
La Nube o la Computación en Nube (Cloud
Computing) es uno de los términos tecnológicos
(buzzwords) que más se repite en todo tipo de
medios de comunicación en los tres últimos años.
Las empresas, las organizaciones y los negocios en general,
están viendo en esta tecnología la resolución de muchos de
sus problemas, sobre todo, económicos pero también de
infraestructuras tecnológicas.
EL MODELO DE LA NUBE ES UN MODELO DE
SERVICIOS COMO LA LUZ, EL AGUA, EL TELÉFONO,
EL GAS…
Página –7–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –8–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
BusinessWeek, Rachael King, August 04, 2008
Página –9–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE CLOUD COMPUTING
 Para una definición más técnica de Cloud Computing o
nube sin más, podríamos decir que se trata del conjunto
de programas y servicios alojados en servidores
conectados a la Red, accesibles desde cualquier
computador (sea cual sea el sistema operativo que
este ejecute) con conexión a Internet sin necesidad
de instalar aplicaciones ejecutables en su disco duro y
donde también se almacena la información generada
por estas mismas aplicaciones o servicios.
Cloud Computing ha transformado de forma radical
el modelo de negocio, "Este modelo de tecnología se
adapta a las necesidades de la empresa en todo
momento, que sólo paga por los servicios que usa"
Página –10–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –11–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Terminología de la NUBE (NIST)
 El NIST recomienda utilizar los siguientes términos
Consumidor de la nube o cliente: una
persona u organización que es cliente de una
nube: observes que un cliente de una nube
puede ser de una nube y de otras nubes que
ofrecen otros servicios
Dispositivo Cliente: Una máquina o aplicación
de software que accede a una nube en una
conexión de red
Proveedor de la nube o proveedor: una
organización que proporciona servicios de la nube
Página –12–
1313
UNIVERSIDAD
EUROPEA DE MADRID
Prof. Luis Joyanes Aguilar
BIG DATA
El universo digital de
datos
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Harvard Business Review, octubre 2012
Página –14–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Foreign Affairs, mayo 2013
Página –15–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Revista BBVA, innovation edge, junio 2013
Página –16–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
EL ECONOMISTA, HOY 12 DE JUNIO 2014
 … La culpa la tiene el Big Data, un fenómeno de
moda cuyas herramientas convierten cantidades
abrumadoras de conocimiento en información útil
para cada momento y entorno. La receta mágica
para resolver los desafíos de todas las
organizaciones se reduce a dos palabras: Business
Intelligence.
Las compañías fichan con puntería
gracias al 'Gran Hermano' –
 http://www.eleconomista.es/tecnologia-
internet/noticias/5855592/06/14/Las-companias-
fichan-con-punteria-graciasal-Gran-Hermano.html
Página –17–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA ERA DEL PETABYTE (1.000 TB),
Wired , julio 2008 (www.wired.com)
Sensores en todas partes, almacenamiento infinito
y Nubes (clouds) de procesadores
 Nuestra capacidad para capturar, almacenar y comprender
cantidades masivas de datos está cambiando la ciencia,
medicina, negocios y tecnología. A medida que aumenta
nuestra colección de hechos y figuras, crece la oportunidad
de encontrar respuestas a preguntas fundamentales.
Because in the era of big data,
more isn´t just more. More is
different
Página –18–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA ERA DEL PETABYTE -2- . Wired ,
julio 2008 (www.wired.com)
 1TB (250.000 canciones)
20 TB (fotos “uploaded” a Facebook
cada mes)
 120 TB (todos los datos e imágenes recogidos por el telescopio
espacial Hubble) ; 460 TB (todos los datos del tiempo climático en
EEUÜ compilados por el National Climatic Data Center); 530 TB
(Todos los vídeos de YouTube); 600 TB (base de datos de
genealogía, incluye todos los censos de EEUU 1790-2000)
1 PB (datos procesados por los
servidores de Google cada 75 minutos)
Página –19–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Tabla de unidades de almacenamiento
(The Economist, febrero 2010): “data, data everywhere”
www.economist.com/specialreports/displaystory.cfm?story_id=15557421
Página –20–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
El Universo Digital – EMC / IDC
Página –21–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
El Universo Digital – EMC / IDC
Página –22–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
El universo digital de datos, IDC 2013
Pina –23–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
El universo digital de datos, 2013
Página –24–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA ERA DEL EXABYTE/ZETTABYTE CISCO
LA ERA DEL EXABYTE, CISCO . Estudio
“Cisco Visual Networking Index (VNI)
2007-2012. Tráfico mundial de datos.
LA ERA DEL ZETTABYTE:Cisco VNI:
Forecast and Methodology 2012:
22017. Tráfico mundial de datos
(publicado en 2013)

Página –25–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA / DILUVIO DE DATOS
Twitter: (redes sociales)
 90 millones de tuits (tweets) por día que representan 12
Terabytes (datos de 2011)
Boeing: (industria)
 Vuelo transoceánico de un jumbo puede generar 640
Terabytes.
Wal-Mart: (comercio)
 1 millón de transacciones por hora que se estima que
alimenta una base de datos de 2.5 petabytes.
Google procesa al día 20 PB de información
Página –26–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA / DILUVIO DE DATOS
El 90% de los datos acumulados en todo el
mundo se han creado en los dos últimos
años. Cada día se escriben 400 millones de
tuits, cada minuto se crean 600 nuevos
blogs y cada segundo se registran 10.000
transacciones de pagos con tarjetas.
Objetos cotidianos como los carros, los
relojes o las gafas están comenzando a
conectarse a Internet para alimentar
nuevos servicios que requieren un
constante intercambio de información.
Página –27–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA / DILUVIO DE DATOS
Los Ayuntamientos siembran las calles con sensores
de recogida de datos para facilitar la vida de los
ciudadanos. Cada día se recogen 2,5 trillones de
bytes de datos, y los directivos de las empresas
apenas pueden manejar la mitad de los generados
en su entorno porque el 80% de ellos están
“desestructurados·.
 El número de dispositivos en red duplicará a
la población mundial en 2015 y los datos que
generen se convertirán en información utilizada por las
empresas para anticipar las necesidades de los
consumidores.
Página –28–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA / DILUVIO DE DATOS
La respuesta para ordenar este caos es big
data, la nueva herramienta para
sistematizar los datos procedentes de
cualquier soporte —incluyendo imagen
sonido, fotos, textos…— y convertirlos de
forma automática en información.
Big data ayudó a ganar las elecciones a
Barak Obama y ha reducido de días a
minutos la detección de uso de información
privilegiada en Wall Street
Página –29–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA / DILUVIO DE DATOS
En torno a ella se está creando un
mercado evaluado por la firma de
análisis Gartner en 132.000 millones de
dólares para 2015. Ese año se crearán
4,4 millones de puestos de trabajo para
abastecerlo. Los expertos comparan la
herramienta con una revolución
industrial en el mundo de los datos y
afirman que con ella cambiará nuestra
forma de vida.
Página –30–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
EL NEXO DE LAS FUERZAS-
GARTNER (2012)
Página –31–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
El nexo de las fuerzas-
Gartner (2012)
 In the Nexus of Forces, information (Big Data) is
the context for delivering enhanced social and mobile
experiences. Mobile devices are a platform for
effective social networking and new ways of work.
Social links people to their work and each other in new
and unexpected ways. Cloud enables delivery of
information and functionality to users and systems. The
forces of the Nexus are intertwined to create a user-
driven ecosystem of modern computing.
 At the Core: Social, Mobile, Cloud and
Information. Converge and Reinforce
Página –32–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TENDENCIAS TECNOLÓGICAS DE
LA DÉCADA
 LAS CONSULTORAS IDC, GARTNER, FORRESTER,
MCKINSEY y otras, están de acuerdo:
Cloud Computing
Social Media (Medios sociales)
Movilidad: Localización, realidad aumentada,
realidad virtual…
Internet de las cosas (objetos)
 NFC, Bluetooth, RFID, QR, ZigBee, Sensores…
Big Data: Herramientas y Analítica
Página –33–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TENDENCIAS tecnológicas de 2014
“Lo móvil” (movilidad): Teléfonos
inteligentes (smartphones), tabletas (tablets),
videoconsolas,.. (geolocalización, realidad
aumentada, NFC, RFID, QR…)
Gamificación
Consumerización, BYOD (Bring
your own device)
Smart TV
BIG DATA (grandes volúmenes)
Página –34–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TECNOLOGÍAS PONIBLES (Wearables)
Gafas inteligentes
Relojes inteligentes
Pulseras inteligentes
Anillos inteligentes
Ropa inteligente
….
Página –35–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TECNOLOGÍAS MÓVILES ACTUALES
Tecnologías NFC
Chips RFID (Identificación por
radiofrecuencia)
Códigos QR
Sensores…
Redes Bluetooth (1.0, 2.0, 3.0, 4.0…)
Geolocalización
Realidad Aumentada
Página –36–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
EL TELÉFONO MÓVIL (CELULAR)
con NFC como medio de pago
Página –37–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TELÉFONO MÓVIL COMO MEDIO DE PAGO
Página –38–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Código QR (periodicos, documentos,..)
http://www.ticbeat.com/economia/auge-
codigosqr-espana-infografia/
Página –39–
http://wwhttp://
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
MACHINE TO MACHINE (M2M)
 Intercambio de información en formato de datos entre
dos puntos remotos, bien a través de red fija o móvil sin
interacción humana con características específicas en
cuanto a tráfico y tarjetas SIM e integradas en la
fabricación de dispositivos
 Automatización de los procesos de comunicación entre
máquinas, entre dispositivos móviles (celulares) y
máquinas (Mobile to Machine) y entre hombres y
máquinas (Man to Machine)
 En 2011 había más de 1.500 millones de dispositivos
alrededor del mundo conectados entre sí; 15.000 millones
en 2013. Previsiones de Cisco, 25.000 millones para 2015
Página –40–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
INTERNET DE LAS COSAS (OBJETOS)
Página –41–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
INTERNET DE LAS COSAS (OBJETOS)
Cada día aumenta el número de
dispositivos de todo tipo que proporcionan
acceso a Internet. Las “cosas” que
permiten y van a permitir estos accesos irá
aumentando con el tiempo. Ahora ya
tenemos videoconsolas, automóviles,
trenes, aviones, sensores, aparatos de
televisión, … y pronto el acceso se
realizará desde los electrodomésticos
Página –42–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
World Wide Web, Internet móvil, cloud
computing, INTERNET DE LAS COSAS
 Un mundo en el que miles de millones de objetos
informarán de su posición, identidad e historia a
través de conexiones inalámbricas … mediante
tecnologías RFID, bluetooth, sensores inalámbricos,
NFC, …
 La realización del “Internet de las cosas” , probablemente
requerirá cambios dramáticos en sistemas, arquitecturas y
comunicaciones,… Invisible es la descripción de las nuevas
tecnologías empotradas “Computación ubicua”… A
medida que avance su penetración:
 Producirá un CAMBIO SOCIAL, posiblemente,
de tanto impacto y tan poco previsible, como
las actuales tecnologías Web
Página –43–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE IMPACTO DEL IoT*
 Plataforma Satelise de Ferrovial (empresa multinacional
constructora de infraestructuras, líder en España)… Está
instalando en los peajes de autopistas una aplicación
basada en tecnología satelital (GPS) para el pago de
peajes sin barreras y la comunicación entre el conductor y
la concesionaria mediante teléfonos inteligentes….
Ofrecerá otros servicios de valor añadido: trayectos de
peaje y alternativos, información sobre el estado del
tráfico, meteorología o cualquier tipo de incidente…
pretende incorporar “comandos de voz” para evitar
distracciones del conductor al volante.
 *Actualidad económica, octubre 2013
Página –44–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE IMPACTO DEL IoT*
SHODAN, buscador en la Internet de las
cosas*
A Google for Hackers. Shodan es una nueva
herramienta utilizada por “los chicos buenos y
malos” para encontrar todos los dispositivos
conectados “ahora” a la Internet: luces de
tráficos, plantas de energía e incluso el monitor
de su bebé”
* Forbes, sección Technology. 23 de septiembre,
2013 (nº de esta semana en España)
Página –45–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
BUSCADOR SHODAN DE LA IoT
Página –46–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
VENTAJAS Y RIESGOS DE IoT
VENTAJAS Y OPORTUNIDADES
 CISCO, ERICSSON,… prevén que para el año 2020 habrá cerca
de 50 mil millones de dispositivos conectados a Internet, capaces
de comunicarse entre sí, desde automóviles, aparatos de
consumo en el hogar, teléfonos inteligentes, marcapasos,
televisores, carros (coches), ropa inteligente, electrodomésticos,
puertas - ventanas de hogares y edificios, PCs, tabletas…
Infinitas ventajas
RIESGOS*…
Hackers “maliciosos”, ciberespionaje …
* Cibereespionajes, piratas y mafias, El País, febrero 2013
http://elpais.com/elpais/2013/02/19/eps/1361281322_025092.html
Página –47–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
OPEN DATA (Datos abiertos)
Página –48–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
OPEN DATA (Datos abiertos)
Las administraciones públicas [de
cualquier organismo nacional e
internacional] generan gran cantidad de
información en formatos propios de difícil
acceso para la mayoría de los ciudadanos.
Bases de datos, listas, estudios, informes,
estadísticas, etc. son datos abiertos (open
data) en formatos propios que son de
difícil acceso para la mayoría de los
ciudadanos.
Página –49–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
OPEN DATA (Datos abiertos)
Evidentemente estos datos se almacenan
normalmente en centros de datos propios
de las administraciones que a su vez se
almacenan y gestionan en nubes públicas o
privadas
¿Qué necesitan los profesionales o las
empresas para sacar rentabilidad a esos
datos públicos? Evidentemente la
colaboración de las entidades públicas para
liberar cada día más información y crear
más oportunidades de negocio
Página –50–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
¿Qué son datos abiertos?
Los Datos Abiertos constituyen una iniciativa
de transparencia y Gobierno Abierto que
consiste en la liberación de conjuntos de
datos que son de interés público. Los Datos Abiertos
son puestos a disposición de la sociedad, se promueve su libre acceso y
reutilización, exceptuando aquellos datos que por razones de seguridad y
privacidad previstas en la normativas vigentes no puedan ser publicados;
La mayor parte de los datos generados o mantenidos por el
estado son públicos. Sin embargo, no sólo el estado puede abrir
sus datos: empresas, organizaciones y comunidades de
información que producen o mantienen datos pueden ponerlos a
disposición, siempre en formatos abiertos y bajo licencias libres.
Página –51–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
OPEN DATA (Datos abiertos)
La administración de Estados Unidos
inició la iniciativa Open Data y en
paralelo la Unión Europea ha ido
adoptando también la iniciativa.
En España los primeros gobiernos han
sido los Gobiernos Autonómicos de
El Principado de Asturias y el País
Vasco.
Página –52–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
OPEN DATA (Datos abiertos)
La iniciativa del Gobierno Vasco se ha
plasmado en la puesta en funcionamiento
de Open Data Euskadi que pretende crear
un sitio web donde la información
reutilizable (contenidos abiertos) estén al
alcance de cualquier ciudadano.
Un estudio de la UE(2010) estima que el
mercado de información pública podría
generar riqueza por valor de 27.000
millones de euros.
Página –53–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
INICIATIVAS PIONERAS
INTERNACIONALES EN OPEN DATA
En España… además de los gobiernos autonómicos
de Asturias, País Vasco y Cataluña, la fundación CTIC
ligada al consorcio W3C (www.fundacionctic.org).
http://datos.gob.es/datos/?q=node/232
En Estados Unidos data.gov, en Gran
Bretaña data.gov.uk
 En Google (abril 2011, del número 1) la revista de
negocios. //thinkquarterly.co.uk. El número 1 dedicado
a OPEN DATA.
En la Unión Europea (Iniciativa OPEN DATA):
http://open-data.europa.eu/es
Página –54–
5555
Prof. Luis Joyanes Aguilar
BIG DATA:
Fundamentos
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
MAPA DE ETIQUETAS DE BIG DATA
Página –56–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
ORIGEN DEL TÉRMINO
 Grandes volúmenes de datos
Datos masivos
Macrodatos (Fundación Fundeú BBVA)
“La era de los datos masivos se refiere a cosas
que se pueden hacer a gran escala, y pone en
cuestión la forma en que vivimos e
interactuamos con el mundo” (Mayer-Schömberg,
Cukier, The Economist)
Correlación: ya no importa el porqué sino sólo
el qué
Página –57–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
LA AVALANCHA DE DATOS
 Según Eric Schmidt, presidente ejecutivo de Google, entre el
origen de la tierra y el 2003 se crearon cinco exabytes de
información. Hoy en día creamos la misma cifra cada dos
días2. Las previsiones aseguran que en esta década
crearemos alrededor de 35 zettabytes (40 ZB, informe de
diciembre de 2012)
 Según la consultora IDC, cifran en 1,8 Zettabytes la
información generada en 2011. Si tratáramos de almacenar
esa información en iPads (del modelo de 32GB)
necesitaríamos 57.500 millones; puestos unos al lado de
otro formaríamos una línea que daría 3 veces la vuelta al
mundo y, si tratáramos de apilarlos, la “montaña” resultante
sería 25 veces más alta que el monte Fuji.
Página –58–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –59–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TRATAMIENTO DE LOS BIG DATA
Página –60–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –61–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
¿Qué sucede en 1´ en INTERNET (2012)
Página –62–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Informe de GP Bullhound, el banco de
inversión líder en Europa (2012 vs 2013)
Página –63–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Informe de GP Bullhound, el banco de
inversión líder en Europa (2012 vs 2013)
Página –64–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
http://blog.qmee.com/qmee-online-in-60-seconds/ (Noviembe-2013
Página –65–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Actividad de Internet en 1´. Qmee
 Se producen 2 millones de búsquedas en Google
 Se suben 72 horas de video de Youtube
 En Facebook, se producen 2.460.000 post, 1.8 Me Gustan y 350GB de Datos
 Se registran 70 nuevos dominios
 Se descargan 15.000 temas desde iTunes
 Se miran 20 millones de fotos en flickr
 Se producen 278.000 Tweets por minuto
 Se comparten por Snapchat 104.000 fotos
 Amazon vende u$s 83.000
 Se hacen 11.000 búsquedas de LinkedIn
 Hay 11.000 usuarios activos en Pinterest
 216.000 fotos nuevas en Instagram
 204 millones de mails enviados; 20.000 nuevas fotos en Tumblr
 571 nuevos sitios creados
Página –66–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –67–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –68–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
 Los Gigantes de Internet como Google, Amazon o Facebook
basan su éxito en el valor de los “big data” sin ellos tendrían
serias dudas de supervivencia.
Big data es el nuevo petróleo, oro o maná de
la década. IBM, SAP ,Oracle, Cisco… los han
sistematizado para adaptarlas a todo tipo de
empresas.
 Google comenzó a gestionar Big Data desde su
nacimiento en 1998, para indexar sus búsquedas”
 Big data ha saltado de Internet al mundo real, y las
empresas investigan sus aplicaciones para mejorar la gestión,
ahorrar consumos o lanzar nuevos servicios.
Página –69–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
 Big data empieza a dar los primeros pasos en Europa.
La británica Tesco, cuarta cadena minorista
mundial, lo acaba de implantar para controlar
la energía en 120 tiendas irlandesas y quiere
extenderlo a las 3.000 tiendas que tiene entre
Irlanda y Reino Unido para lograr un ahorro de
20 millones de euros en consumos energéticos.
 ING Direct ha lanzado en Holanda un servicio para
vigilar la interacción de los clientes con la web que
genera llamadas telefónicas automáticas para ayudar a
quienes no logran terminar su operación “una forma de
fidelizar clientes”
Página –70–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
La central de reservas Amadeus (líneas aéreas)
insta a las empresas a que incorporen la
herramienta junto con el uso ya creciente de
MINERÍA DE DATOS.
 Investigación realizada por el profesor Thomas Davenport, de
la escuela de negocios de Harvard, sobre la experiencia de Air
France-KLM, Lufthansa, British Airways, Cathay, Eurostar,
Hoteles Marriott, aeropuerto de Múnich.
 El informe indica que “las aerolíneas, los aeropuertos, los
hoteles, las empresas ferroviarias y los distribuidores
de productos turísticos deben plantearse una estrategia
big data para situarse a la vanguardia”.
Página –71–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
La industria aérea comercial podría ahorrar 30
millones de dólares en 15 años con la
recogida de datos realizada por los
sensores que GE coloca en los motores
de los aviones.
 Trece de las 25 mayores cadenas hoteleras de todo el
mundo efectúan ya sus inversiones y sus ofertas
comerciales, incluso el color de las paredes de los
restaurantes o las habitaciones, cada vez más en
función de sofisticados sistemas de análisis de
datos de clientes (MINERÍA DE DATOS)
Página –72–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
 En España, un sistema privado de seguridad, Sanitas
ha puesto en marcha un sistema para prevenir
enfermedades entre sus 2,3 millones de
clientes.
 “En un año hemos realizado 800.000
contactos a 100.000 clientes para darles
consejos o indicarles la conveniencia de hacer
pruebas de detección precoz cuando
detectamos que por su perfil puede ser
conveniente y ofrecer mejores servicios”
[Portavoz de Sanitas al periódico El País]
Página –73–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
Las farmacéuticas y las aseguradoras de
todo el mundo han sumado la fuerza de sus
datos para acelerar la investigación contra
el cáncer, el alzhéimer y otras lacras de la
sociedad.
“hacer predicciones de comportamientos
futuros de pacientes” son grandes
ventajas de big data, que puede
“mejorarnos la vida hasta límites
insospechados”.
Página –74–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
EXPANSIÓN, de Wall Street Journal, 1 de
abril 2013 (casos de estudio)
 UPS
UPS comenzó a instalar sensores en sus vehículos de
reparto para conocer su velocidad y ubicación, si el
cinturón de seguridad del conductor está abrochado... Al
combinar su información de GPS y los datos de sensores
sobre rendimiento en más de 46.000 vehículos, UPS
recortó 136 millones de kilómetros de sus rutas.
Página –75–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
APLICACIONES DE BIG DATA
Una línea de negocio importante de
big data estará en las empresas de
servicios.
Mezclarán la información procedente de
distintas fuentes y harán campañas de
marketing (mercadotecnia) personalizado
asociado a la geolocalización con datos de
su perfil de riesgo, sus gustos y sus hábitos
…
Página –76–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
Oportunidad profesional: En 2015, Gartner predice que
4,4 millones de empleos serán creados en torno a big
data. (Gartner, 2013)
Fuente: http://www.gartner.com/technology/topics/big-data.jsp
Página –77–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
 http://elpais.com/elpais/2013/12/02/vinetas/13
86011115_645213.html
El Roto
Viñeta de El Roto
3 de diciembre de 2013
Página –78–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
Página –79–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
RETOS Y OPORTUNIDADES
IDC entiende Big data como un nuevo valor
económico basado en la toma de decisiones a
partir del análisis de grandes volúmenes de
datos procedentes de una amplia variedad de
fuentes, desde las aplicaciones empresariales
convencionales a los datos móviles, los medios sociales y el
Internet de las Cosas, un campo aún incipiente donde en 2020
convivirán 212.000 millones de dispositivos conectados.
 BIG DATA TAMBIÉN OFRECE RIESGOS.
Fundamentalmente en privacidad y seguridad de los
datos. Normas legales de la Unión Europea, sus países
miembros, América…
Página –80–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
RETOS Y OPORTUNIDADES
 Sus ventajas para el negocio en áreas como la gestión de
las relaciones con el cliente, el desarrollo de nuevos
productos, la detección del fraude o la predicción del
comportamiento de los consumidores permiten a las
compañías obtener resultados financieros un 20% por encima
de sus competidores, según estimaciones de Gartner.
 Se entiende así que, una vez superada la fase de evaluación y
prueba en la que todavía nos encontramos, la adopción
creciente de Big data dispare un mercado que, de acuerdo con
la firma de investigación, cerró 2013 con un volumen de
negocio asociado de 34.000 millones de dólares,
6.000 millones más que en 2012.
Página –81–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
RETOS Y OPORTUNIDADES
 Las promesas de Big data alcanzan a
prácticamente todos los sectores de actividad,
como demuestran las primeras experiencias de
éxito emprendidas por organizaciones de finanzas,
sanidad, turismo, retail o telecomunicaciones. Y su
adopción se irá extendiendo a medida que los
responsables TI vayan asumiendo el valor que aportan
nuevos frameworks de software como Hadoop y los
nuevos sistemas avanzados de almacenamiento, bases de
datos, analítica y lenguajes de programación
especialmente orientados a los grandes datos.
Página –82–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
 Encierra esta idea el tratamiento de información que hace
evolucionar los métodos y recursos habituales para
hacerse cargo de grandes volúmenes de datos (de
terabytes pasamos a zetabytes). Estos se generan a gran
velocidad (pasamos de datos en lotes/archivos a datos
en “streaming”) y además se añade una posible
componente de complejidad y variabilidad en el formato
de esos datos (pasamos de datos estructurados a datos
semi-estructurados o no estructurados). Todo ello
requiere de técnicas y tecnologías específicas para su
captura, almacenamiento, distribución, gestión y análisis
de la información.
Página –83–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
 VOLUMEN de datos procesados por las
empresas ha crecido significativa y
exponencialmente.
Google procesa 20 petabytes al día
En 2020 se esperan 42.000 millones
de pagos electrónicos.
La Bolsa de Nueva York genera UN
terabyte de datos al día
Twitter genera 8 TB
Página –84–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
VELOCIDAD. Rapidez con la que se accede
a los datos. La velocidad del movimiento,
proceso y captura de datos, dentro y fuera
de la empresa ha aumentado
considerablemente.
Flujo de datos a alta velocidad.
eBay se enfrenta al fraude a través
de PayPal analizando cinco millones
de transacciones en tiempo real al día.
Página –85–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
VARIEDAD: Big data es cualquier tipo de
dato – estructurado y no estructurado - tales
como texto, datos de sensores, datos entre
máquinas (M2M), archivos “logs”, audio,
vídeo, flujos de clicks, XML, datos en
streaming, cotizaciones bursátiles, medios
sociales,
Una creciente variedad de datos
necesitan ser procesados y convertidos a
información
Página –86–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
Página –87–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
Página –88–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DEFINICIÓN DE BIG DATA: IBM
Según otras definiciones de Big Data
de fabricantes, consultoras, NIST, etc.
existen otras propiedades de los big
data:
Veracidad de los datos
Valor de los datos
Viabilidad de la infraestructuras y las
herramientas de almacenamiento
Página –89–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
Oportunidad profesional: En 2015, Gartner predice que
4,4 millones de empleos serán creados en torno a big
data. (Gartner, 2013)
Fuente: http://www.gartner.com/technology/topics/big-data.jsp
Página –90–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
 http://elpais.com/elpais/2013/12/02/vinetas/13
86011115_645213.html
El Roto
Viñeta de El Roto
3 de diciembre de 2013
Página –91–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Oportunidades en Big Data
Página –92–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Fuentes de Big Data
 Herramientas para análisis de datos en grandes
volúmenes de datos. Infraestructuras de Big Data
 Fuentes de Big Data (Soares 2012):
 Web y Social media
 Machine-to-Machine (M2M, Internet de
las cosas)
 Biometria
 Datos de transacciones de grandes datos
(salud, telecomunicaciones…)
 Datos generados por las personas
(humanos)
Página –93–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 1. Web y Social Media: Incluye contenido web e información
que es obtenida de las medios sociales como Facebook, Twitter,
LinkedIn, Foursquare, Tuenti, etc, blogs como Technorati, blogs
de periódicos y televisiones, wikis como MediaWiki, Wikipedia,
marcadores sociales como Del.icio.us, Stumbleupon…
agregadores de contenidos como Dig, Meneame… En esta
categoría los datos se capturan, almacenan o distribuyen
teniendo presente las características siguientes: Datos de los
flujos de clics, tuits, retuits o entradas en general (feeds) de
Twitter, Tumblr…, Entradas (posting) de Facebook y contenidos
web diversos.
Página –94–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 2. Machine-to-Machine (M2M)/ Internet de las
cosas: M2M se refiere a las tecnologías que permiten conectarse a
otros diferentes dispositivos entre sí. M2M utiliza dispositivos como
sensores o medidores que capturan algún evento en particular
(humedad, velocidad, temperatura, presión, variables meteorológicas,
variables químicas como la salinidad, etc.) los cuales transmiten a
través de cableadas, inalámbricas y móviles a otras aplicaciones que
traducen estos eventos en información significativa. La comunicación
M2M ha originado el conocido Internet de las cosas o de los objetos.
Entre los dispositivos que se emplean para capturar datos de esta
categoría podemos considerar chips o etiquetas RFID, chips NFC,
medidores (de temperaturas, de electricidad, presión…). sensores,
dispositivos GPS… y ocasionan la generación de datos mediante la
lectura de los medidores, lecturas de los RFID y NFC, lectura de los
sensores, señales GPS, señales de GIS, etc.
Página –95–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 3.Big Data transaccionales: Grandes datos transaccionales
procedentes de operaciones normales de transacciones de todo
tipo. Incluye registros de facturación, en telecomunicaciones
registros detallados de las llamadas (CDR), etc. Estos datos
transaccionales están disponibles en formatos tanto
semiestructurados como no estructurados. Los datos generados
procederán de registros de llamada de centros de llamada,
departamentos de facturación, reclamaciones de las personas,
presentación de documentos…
Página –96–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 4. Biometría: La biometría o reconocimiento biométrico.
La información biométrica se refiere a la identificación
automática de una persona basada en sus características
anatómicas o trazos personales. Los datos anatómicos se
crean a partir de las características físicas de una persona
incluyendo huellas digitales, iris, escaneo de la retina,
reconocimiento facial, genética, DNA, reconocimiento de
voz, incluso olor corporal etc. Los datos de
comportamiento incluyen análisis de pulsaciones y
escritura a mano. Los avances tecnológicos han
incrementado considerablemente los datos biométricos
disponibles
Página –97–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 . En el área de seguridad e inteligencia, los datos
biométricos han sido información importante para las
agencias de investigación. En el área de negocios y de
comercio electrónico los datos biométricos se pueden
combinar con datos procedentes de medios sociales lo
que hace aumentar el volumen de datos contenidos en los
datos biométricos. Los datos generados por la biometría
se pueden agrupar en dos grandes categorías: Genética y
Reconocimiento facial.
 “An Overview of Biometric Recognition”.
http://biometrics.cse.nsu.edu/info.html
Página –98–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Big Data. Joyanes, MéxicoDF: Alfaomega (2013)
 5. Datos generados por las personas: Las personas
generan enormes y diversas cantidades de datos como la
información que guarda un centro de llamadas telefónicas
(call center) al establecer una llamada telefónica, notas de
voz, correos electrónicos, documentos electrónicos,
estudios y registros médicos electrónicos, recetas
médicas, documentos papel, faxes, etc. El problema que
acompaña a los documentos generados por las personas es que
pueden contener información sensible de las personas que necesita,
normalmente ser oculta, enmascarada o cifrada de alguna forma para
conservar la privacidad de dichas personas. Estos datos al ser
sensibles necesitan ser protegidos por las leyes nacionales o
supranacionales (como es el caso de la Unión Europea o Mercosur)
relativas a protección de datos y privacidad.
Página –99–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Estructura de Big Data: tipos de datos
Estructurados
No estructurados
 No estructurados (texto, datos de vídeo, datos de audio,,,)
 Semiestructurados ( a veces se conocen como
“multiestructurados”. Tienen un formato y flujo lógico de modo
que pueden ser entendidos pero el formato no es amistoso al
usuario(HTML. XML…, datos de web logs)
 Normalmente, se suelen asociar los datos
estructurados a los tradicionales y los datos no
estructurados a los Big Data
 Objetivo principal de los sistemas de gestión de
datos: Integración de datos estructurados y no
estructurados
Página –100–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Bases de datos
In-Memory (en-memoria)
 SAP Hana
 Oracle Times Ten In-Memory Database
 IBM solidDB
Relacionales
 Sistemas RDBMS (SGBDR). Oracle, IBM, Microsoft…
 Transferencia de datos entre Hadoop y bases de datos
relacionales
Legacy (jerárquicas, en red… primeras relacionales…)
NoSQL (Cassandra, Hive, mongoDB,
CouchDB, Hbase…)
Página –101–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
BASES DE DATOS ANALÍTICAS
 Analíticas: para permitir a múltiples usuarios contestar
rápidamente preguntas de negocio que requieran de grandes
volúmenes de información.
Bases de datos de procesamiento
paralelo masivo (MPP)
Bases de datos “en memoria”
Almacenamiento en columnas
 Históricamente estas bases de datos tan especializadas
tenían un costo muy elevado, pero hoy el mercado nos
ofrece varias alternativas que se adaptan al presupuesto de
cada organización.
Página –102–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Bases de datos analíticas
 Bases de datos diseñadas específicamente para ser
utilizadas como motores de Data Warehouse.
 Estas bases de datos logran procesar grandes volúmenes de
información a velocidades asombrosas, gracias a la aplicación de
diferentes conceptos y tecnologías:
 Almacenamiento en columnas en lugar de filas
(registros)
 Massively parallel processing (MPP)
 In-Memory Analytics
Página –103–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –104–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Computación en memoria “In-Memory”
La computación en memoria es una
tecnología que permite el procesamiento de cantidades
masivas de datos en memoria principal para proporcionar
resultados inmediatos del análisis y de las transacciones.
Los datos a procesar, idealmente son datos en tiempo
real (es decir, datos que están disponibles para su
procesamiento o análisis inmediatamente después
que se han creado).
Existen un amplio conjunto de tecnologías que emplean
bases de datos en memoria. SAP HANA es una de las
más acreditadas y populares… (Oracle, IBM,…)
Página –105–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
BASES DE DATOS NoSQL
 Las bases de datos no-relacionales son comúnmente
llamadas bases de datos NoSQL ya que la gran mayoría
de ellas comparte el hecho de no utilizar el lenguaje SQL
para realizar las consultas
 Es una definición controvertida, aunque la definición más
aceptada es “Not only SQL”.
 Una de las características de las bases de datos no
relacionales es que la mayoría de ellas no utilizan
esquemas de datos rígidos como las bases de datos
relacionales. Esto hace que estas bases de datos también
se les llame “Schema-less” o “Schema-free
(“almacenamiento des-estructurado”).
Página –106–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Taxonomía de Bases de datos NoSQL
 Los principales tipos de BBDD de acuerdo con su
implementación son los siguientes:
 – Almacenes de Clave-Valor
 – Almacenes de Familia de Columnas (columnares)
 – Almacenes de documentos (orientadas a
documentos)
 – Almacenes de Grafos (orientadas a grafos)
 - Cachés de memoria
Página –107–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
SOLUCIONES DE BASES DE DATOS NoSQL
Página –108–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Integración con Big Data. FUENTE: datalytics.com
Página –109–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Integración con Big Data. FUENTE: datalytics.com
Página –110–
111111
Prof. Luis Joyanes Aguilar
Tecnologías BIG DATA
HADOOP
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Logo de HADOOP
Página –112–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Logo de HADOOP
Página –113–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –114–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
TECNOLOGÍAS BIG DATA (HADOOP)
 Datos de la consultora IDC de agosto de 2012 prevén que el
mercado del software relacionado con los framework
open source Apache Hadoop y el MapReduce de
Google crecerá a un ritmo anual de más del 60% hasta el
año 2016.
 La popularidad de Hadoop se ha ido incrementando durante
los últimos meses, a medida que las empresas necesitan
manejar grandes cantidades de datos estructurados y no
estructurados para después analizarlos y ser capaces de
tomar decisiones lo más favorables posible para sus negocios.
 IDC también espera que el mercado de Hadoop-MapReduce evolucione y
que poco a poco comienza a introducirse en los sistemas empresariales.
Página –115–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Hadoop
“The Apache Hadoop software library is a
framework that allows for the distributed
processing of large data sets across
clusters of computers using a simple
Programming model”
 De la página de Hadoop
Página –116–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Historia de Hadoop: Doug Cutting
Página –117–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Fundación Apache: proyectos open source
 The Apache Software Foundation provides support
for the Apache community of open-source software
projects, which provide software products for the
public good
 The Apache Software Foundation provides support for the
Apache community of open-source software projects,
which provide software products for the public good
Página –118–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –119–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Hadoop en la actualidad
 Actualmente Hadoop es un framework muy extendido en
el ámbito empresarial, sobre todo en compañías que
manejan grandes volúmenes de datos. Entre las que
podemos descarta las siguientes empresas:
 Yahoo: La aplicación Yahoo! Search Webmap está
implementado con Hadoop sobre un clúster de mas de
10.000 nodos Linux y la información que produce es la
utilizada por el buscador de Yahoo.
 Facebook: Tiene ha día de hoy el mayor clúster Hadoop
del mundo que almacena hasta 30 peta bytes de
información
 Amazon A9: Se utiliza para la generar índices de búsqueda de los
productos ofertados en el portal. Disponen de varios clústeres de entre 1 y
100 nodos
 cada uno.
Página –120–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Hadoop en la actualidad
 The New York Times: Utiliza Hadoop y EC2 (Amazon
Elastic Compute Cloud) para convertir 4 Tera bytes de
imágenes TIFF en imágenes PNG de 800 K para ser
mostradas en la Web en 36 horas.
 Además existen compañías cuyo negocio es principal es
Hadoop, como Cloudera, que comercializa CDH
(Cloudera's Distribution including Apache Hadoop), que da
soporte en la configuración y despliegue de clústeres
 Hadoop. Además proporciona servicios de consultoría y
formación en estas tecnología. Todo el software que
distribuyen es Open Source.
Página –121–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Proveedores de Big Data
 Algunos han desarrollado sus propias distribuciones de
Hadoop (con diferentes niveles de personalización:
disponibilidad, rendimiento, replicas …). Una distribución
muy popular
 Otros ejemplos: MapR, Greenplum,
Hortonworks, …
 Hay docenas
Página –122–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
The landscape of Big Data
Página –123–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Lenguaje R
R ofrece una gran variedad de técnicas
estadísticas (modelos lineales y no
lineales, tests estadísticos, análisis de
series temporales, clasificación,
clustering, ...) y técnicas gráficas, y es
altamente extensible.
R está disponible como software libre bajo
licencia de GNU Free Software Foundation. Se
compila y ejecuta en una variedad de plataformas UNIX y
sistemas similares (incluyendo FreeBSD y Linux), Windows y
MacOS.
Página –124–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
INTELIGENCIA DE NEGOCIOS Y ANALYTICS
 (Analytics) Es un término comercial, definido por
diferentes proveedores de soluciones de inteligencia de
negocios y de sistemas de información para referirse a las
herramientas y técnicas para analizar y entender los
datos.
 Se compone de herramientas de procesamiento analítico
en línea (OLAP), herramientas estadísticas, minería de
datos, etc.
 La analítica de negocios implica el uso de modelos y datos
para mejora el desempeño de una organización o su
posición competitiva. En analítica de negocios el foco está
en el uso de modelos incluso aunque estén
profundamente internos al sistemas.
Página –125–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Business Analytics (Analytics)
 Los modelos analíticos se utilizan para realizar análisis de
datos. Incluyen modelos estadísticos, modelos de gestión
científica, algoritmos de minería de datos, modelos
financieros, etc.
 A veces se integran con otros modelos, tales como
modelos de planificación estratégica.
 Los modelos de analítica de negocios (incluyendo analítica
predictiva) abarcar numerosos modelos analíticos.
Página –126–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Business Analytics (Analytics)
 Se necesita entender no solo QUÉ está pasando,
sino CUÁNDO, DÓNDE, QUIÉN Y PORQUÉ.
 Solución a los requerimientos de información con
OPORTUNIDAD
 Escalar, contribuir y compartir a todos los tipos de
usuarios en la organización
 Se necesita información y conocimiento a partir de
los datos de la empresa.
Página –127–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
ANALÍTICA DE NEGOCIOS (Analytics)
 Analítica descriptiva (Descriptive analytics): Logra un
profundo conocimiento a partir de datos históricos con
informes, cuadros de mando, agrupación, etc.
 Analítica predictiva (Predictive analytics): Diseño y uso
de modelos predictivos a partir de técnicas de aprendizaje
automática/minería de datos.
 Analítica prescriptiva/perceptiva (Prescriptive
analytics): Sugiere opciones de decisión acerca de la manera
de aprovechar una oportunidad de futuro o mitigar un riesgo
futuro y muestra las consecuencias de cada decisión.
 Analítica de diagnóstico (de descubrimiento). ¿Porqué ha
sucedido?
Página –128–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
ANALÍTICA DE NEGOCIOS (Analytics)
 El análisis descriptivo responde a las preguntas ¿qué
pasó y por qué sucedió?
 El análisis predictivo responde a la pregunta
¿qué va a pasar?.
 Análisis perceptivo responde a la pregunta ¿por qué va
a pasar? Sugiere opciones de decisión acerca de la
manera de aprovechar una oportunidad de futuro o
mitigar un riesgo futuro y muestra las consecuencias de
cada decisión
Página –129–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Analítica predictiva
 El término analítica predictiva describe el método de
analítica de negocios de predicción o previsión de
problemas y oportunidades en lugar de simplemente de
emitir informes (reportes) a medida que se producen.
 La analítica predictiva utiliza predicciones avanzadas y
modelos de simulación.
 Forecasting (predicción) es la predicción del futro. Esta
forma de analítica predictiva es esencial para la
construcción y manipulación de modelos, ya que cuando
una decisión se implementa los resultados normalmente
ocurren en el futuro
Página –130–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Analítica predictiva
 La analítica predictiva utiliza técnicas de minería de datos,
datos históricos y suposiciones sobre futuras condiciones
para predecir resultados de eventos, tales como la
probabilidad de que un cliente responderá a una oferta o
compra de un producto específico.
Página –131–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
ANALÍTICA DE BIG DATA
 Big Data y la nube podrían reemplazar a las ‘cajas negras’
de los aviones
 A raíz de la trágica desaparición del vuelo MH370 de
Malaysian Airlines el 8 de marzo, Malasia ha pedido a ITU
que elabore normas para facilitar la transmisión de datos
de vuelo en tiempo real. La solución podría basarse en Big
Data y la nube.
 “Creo que los datos de las aeronaves, incluidos los de las cajas
negras, podrían transmitirse en flujo continuo y almacenarse en
centros de datos en tierra. Insto a la UIT a trabajar con las empresas
privadas para buscar la mejor manera de controlar constantemente
los datos de vuelo y lo que ocurre en la cabina de pilotaje. Con los
adelantos de las TIC actuales deberíamos poder extraer y analizar
esos datos sin necesidad de encontrar las cajas negras.
Página –132–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
ANALÍTICA DE BIG DATA
 Todas las aerolíneas comerciales y los aviones privados
están obligados a instalar y utilizar “cajas negras” para
registrar diversos parámetros de vuelo. El registrador de
datos de vuelo está concebido para grabar los datos operativos
de los sistemas del avión, incluida la altitud, la velocidad, la
aceleración vertical, el rumbo y la posición de los sistemas de
control. El registrador de voz de la cabina de pilotaje graba la
voz de la tripulación y los sonidos dentro de la cabina de
pilotaje. Estos equipos de control dan a los investigadores
datos esenciales sobre las causas de un accidente. “ITU invitará
a los fabricantes de aviónica y aviones, así como a los operadores
de satélites y las aerolíneas, a trabajar sobre nuevas normas para
el rastreo de aeronaves en tiempo real
Página –133–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
C. M. de Gartner 2014. BI y Analytics
Página –134–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
C. M. de Gartner 2014. BI y Analytics
 Jaspersoft y Pentaho, se mantienen en su cuadrante
de jugadores de nicho, desplazándose más hacia arriba y
a la derecha.
 SAP, SAS, Qlikview, IBM, MicroStrategy y Microsoft
se mantienen en el mismo cuadrante de líderes.
 Tableau y Tibco Spotfire, que entraron el año pasado,
sigen en el cuadrante de líderes. Tableau ahora con más
valoración en “integridad de la visión”.
 GoodData, que debutó el año pasado en el cuadrante de
jugadores de nicho, se desplaza considerablemente hacia
el centro.
 Alteryx y Panorama, se desplazan al cuadrante de
visionarios.
 Página –135–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
CIENCIA DE DATOS (DATA SCIENCE)
Página –136–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
CIENCIA DE DATOS
Ciencia de datos es la extracción de información
útil de grandes volúmenes de datos. La ciencia de
datos necesita acceder a los datos, a la ingeniería
de datos y a las tecnologías de procesamiento de
datos.
 La Ciencia de Datos es una especialización
creciente que toca muchos de los siguientes temas:
Computación en nube, big data, matemáticas,
estadística, métodos de optimización, teoría de
negocios y teoría de ciencias de la computación.
Página –137–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
CIENTÍFICO DE DATOS
 EL CIENTÍFICO DE DATOS (Data Scientist). Un
profesional con formación de Informática,
Estadística, Analítica, Ciencias Físicas y
Biológicas… que analizará los Big Data para la
toma de decisiones eficientes y obtener
rentabilidad en los negocios.
 Lenguajes que deberá conocer: Python, R, SQL,
NoSQL…
Página –138–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
DISCIPLINAS CLAVE DE DATA SCIENCE
Página –139–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
NECESIDAD DE FORMACIÓN PROFESIONAL
AVANZADA EN CLOUD COMPUTING-BIG
DATA
 El mercado tiene carencia de especialistas en Cloud
Computing y sobre todo en Big Data. Hay miles de puestos que se
deberán cubrir en los próximos cinco años según estadísticas fiables de IDC,
Gartner, Forrester, McKinsey…
 UNA DE LAS PROFESIONES MÁS DEMANDADAS SERÁ DE
ESPECIALISTAS EN CIENCIAS DE DATOS (Científicos de
datos) y además ANALISTAS DE DATOS (formados en
Analytics y tecnologías Big Data ·Hadoop”, “InMemory”…)
 Se necesitan certificaciones profesionales en CLOUD
COMPUTING Y BIG DATA… “TECNOLÓGICAS Y DE
NEGOCIOS”
Página –140–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
NUEVAS CARRERAS UNIVERSITARIAS:
maestrias,ingeniería, diplomados…
Community Manager, Social Media Manager y
Analista Web y SEO
Ingeniero y Analistas de Cloud Computing (En
España hay una universidad privada que lo lanza el
próximo curso)
Analista e Ingeniero de negocios digitales (Digital
Business Intelligence)
Analista e Ingeniero de datos (Infraestructuras,
Bases de datos NoSQL, Hadoop, Tecnologías “in-
memory”…)
Analista de datos y Analista de Big Data
Página –141–
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
NUEVAS CARRERAS Y PROFESIONES
 Sin embargo la profesión del futuro será:
EL CIENTÍFICO DE DATOS (Data Scientist). Un
profesional con formación de Sistemas,
Estadística, Analítica, Ciencias Físicas y
Biológicas… que analizará los Big Data para la
toma de decisiones eficientes y obtener
rentabilidad en los negocios.
HBR (Harvard Business Review lo declaró
la profesión “MÁS SEXY del siglo XXI”…)
Página –142–
143
Prof. Luis Joyanes Aguilar
BIBLIOGRAFÍA
144144
ESTADO DEL ARTE DE
CLOUD COMPUTING
Prof. Luis Joyanes Aguilar
COMPUTACIÓN
EN LA NUBE
La nueva era de la
computación
145
146
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –147–
MUCHAS GRACIAS … ¿Preguntas?
Portal tecnológico y de conocimiento
www.mhe.es/ joyanes
Portal GISSIC “El Ágora de
Latinoamérica”: gissic.wordpress.com
Twitter:@luisjoyanes
www.slideshare.net/ joyanes
www.facebook.com/ joyanesluis
CORREO-e: joyanes@gmail.com
© Luis Joyanes Aguilar
Universidad Europea de Madrid
12 de junio, 2013
Página –148–Página –148–
BIBLIOGRAFÍA BÁSICA
 JOYANES, Luis (2014). Computación en la nube.
Estrategias de cloud computing en las empresas.
Barcelona: Marcombo; México DF: Alfaometa
 JOYANES, Luis (2014). Inteligencia de negocios. Un
enfoque móvil, en la nube y de big data. Barcelona:
Marcombo; México DF: Alfaomega
 TURBAN, Efraim, SHARDA, Ramesh, DELEN, Dursun
Decision Support and Business Intelligence Systems.
Ninth edition. New Jersey: Pearson/Prentice-Hall
 JOYANES, Luis (2013). Big Data. El análisis de los
grandes volúmenes de datos. Barcelona: Marcombo;
México DF: Alfaomega.

Contenu connexe

Tendances

Big data&data science vfinal
Big data&data science vfinalBig data&data science vfinal
Big data&data science vfinalLuis Joyanes
 
Computación en La Nube - Funglode - Santo Domingo, República Dominicana
Computación en La Nube - Funglode - Santo Domingo, República DominicanaComputación en La Nube - Funglode - Santo Domingo, República Dominicana
Computación en La Nube - Funglode - Santo Domingo, República DominicanaLuis Joyanes
 
Inteligencia denegocios versus analítica de negocios
Inteligencia denegocios versus analítica de negociosInteligencia denegocios versus analítica de negocios
Inteligencia denegocios versus analítica de negociosLuis Joyanes
 
Computación en la nube: Estado de arte (Octubre 2012)
Computación en la nube: Estado de arte (Octubre 2012)Computación en la nube: Estado de arte (Octubre 2012)
Computación en la nube: Estado de arte (Octubre 2012)Luis Joyanes
 
Innovaciones Tecnológicas - Master UPSA
Innovaciones Tecnológicas - Master UPSA Innovaciones Tecnológicas - Master UPSA
Innovaciones Tecnológicas - Master UPSA Luis Joyanes
 
Ciberseguridad: Estado del arte y futuro, mayo 2014
Ciberseguridad: Estado del arte y futuro, mayo 2014Ciberseguridad: Estado del arte y futuro, mayo 2014
Ciberseguridad: Estado del arte y futuro, mayo 2014Luis Joyanes
 
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...Luis Joyanes
 
Big Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosBig Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosLuis Joyanes
 
Curso de big data
Curso de big data Curso de big data
Curso de big data Luis Joyanes
 
Big data medellin_seminario_internacional
Big data medellin_seminario_internacionalBig data medellin_seminario_internacional
Big data medellin_seminario_internacionalLuis Joyanes
 
Computacion en la nube
Computacion en la nubeComputacion en la nube
Computacion en la nubejony luna
 
Introducción a la computacion en la Nube
Introducción a la computacion en la NubeIntroducción a la computacion en la Nube
Introducción a la computacion en la Nubeciyopi19
 
Presentación bigdata
Presentación bigdataPresentación bigdata
Presentación bigdataLuis Joyanes
 
Estrategias Digitales Desarrollos Devastadores
Estrategias Digitales Desarrollos DevastadoresEstrategias Digitales Desarrollos Devastadores
Estrategias Digitales Desarrollos Devastadoresintl
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos Luis Joyanes
 
Presentacion capitulo 1 perspectiva
Presentacion capitulo 1 perspectivaPresentacion capitulo 1 perspectiva
Presentacion capitulo 1 perspectivaKeidyYeseniaCoelloGa
 
Perspectivas de la tecnologia Informatica cap1-nelly cardenas
Perspectivas de la tecnologia Informatica cap1-nelly cardenasPerspectivas de la tecnologia Informatica cap1-nelly cardenas
Perspectivas de la tecnologia Informatica cap1-nelly cardenasNelly Cárdenas
 

Tendances (20)

Big data&data science vfinal
Big data&data science vfinalBig data&data science vfinal
Big data&data science vfinal
 
Computación en La Nube - Funglode - Santo Domingo, República Dominicana
Computación en La Nube - Funglode - Santo Domingo, República DominicanaComputación en La Nube - Funglode - Santo Domingo, República Dominicana
Computación en La Nube - Funglode - Santo Domingo, República Dominicana
 
Inteligencia denegocios versus analítica de negocios
Inteligencia denegocios versus analítica de negociosInteligencia denegocios versus analítica de negocios
Inteligencia denegocios versus analítica de negocios
 
Computación en la nube: Estado de arte (Octubre 2012)
Computación en la nube: Estado de arte (Octubre 2012)Computación en la nube: Estado de arte (Octubre 2012)
Computación en la nube: Estado de arte (Octubre 2012)
 
Innovaciones Tecnológicas - Master UPSA
Innovaciones Tecnológicas - Master UPSA Innovaciones Tecnológicas - Master UPSA
Innovaciones Tecnológicas - Master UPSA
 
Ciberseguridad: Estado del arte y futuro, mayo 2014
Ciberseguridad: Estado del arte y futuro, mayo 2014Ciberseguridad: Estado del arte y futuro, mayo 2014
Ciberseguridad: Estado del arte y futuro, mayo 2014
 
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...
Conferencia ciberseguridad 360º bis: Impacto Big Data, Cloud e Internet de la...
 
Big Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosBig Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datos
 
Curso de big data
Curso de big data Curso de big data
Curso de big data
 
Big data medellin_seminario_internacional
Big data medellin_seminario_internacionalBig data medellin_seminario_internacional
Big data medellin_seminario_internacional
 
Computacion en la nube
Computacion en la nubeComputacion en la nube
Computacion en la nube
 
Introducción a la computacion en la Nube
Introducción a la computacion en la NubeIntroducción a la computacion en la Nube
Introducción a la computacion en la Nube
 
Presentación bigdata
Presentación bigdataPresentación bigdata
Presentación bigdata
 
1048
10481048
1048
 
Computacion en NUBE
Computacion en NUBEComputacion en NUBE
Computacion en NUBE
 
Estrategias Digitales Desarrollos Devastadores
Estrategias Digitales Desarrollos DevastadoresEstrategias Digitales Desarrollos Devastadores
Estrategias Digitales Desarrollos Devastadores
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos
 
Capitulo1 Computacion en la Nube
Capitulo1 Computacion en la NubeCapitulo1 Computacion en la Nube
Capitulo1 Computacion en la Nube
 
Presentacion capitulo 1 perspectiva
Presentacion capitulo 1 perspectivaPresentacion capitulo 1 perspectiva
Presentacion capitulo 1 perspectiva
 
Perspectivas de la tecnologia Informatica cap1-nelly cardenas
Perspectivas de la tecnologia Informatica cap1-nelly cardenasPerspectivas de la tecnologia Informatica cap1-nelly cardenas
Perspectivas de la tecnologia Informatica cap1-nelly cardenas
 

Similaire à Conferencia bigdata uem

Big data en la era de la nube
Big data en la era de la nubeBig data en la era de la nube
Big data en la era de la nubeLuis Joyanes
 
Hacia la quinta revolución industrial
Hacia la quinta revolución industrialHacia la quinta revolución industrial
Hacia la quinta revolución industrialHugo Guerra
 
Innovaciones tecnológicas qbit
Innovaciones tecnológicas qbitInnovaciones tecnológicas qbit
Innovaciones tecnológicas qbitLuis Joyanes
 
Innovaciones tecnológicas qbit
Innovaciones tecnológicas qbitInnovaciones tecnológicas qbit
Innovaciones tecnológicas qbitLuis Joyanes
 
Conferencia Magistral José Alonso Ibañez
Conferencia Magistral José Alonso IbañezConferencia Magistral José Alonso Ibañez
Conferencia Magistral José Alonso Ibañezlideresacademicos
 
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)afrodriguezpascual
 
Curso de innovaciones tecnológicas y cloud computing
Curso de innovaciones tecnológicas y cloud computingCurso de innovaciones tecnológicas y cloud computing
Curso de innovaciones tecnológicas y cloud computingLuis Joyanes
 
Conferencia cloucomputing utp-fisc (1)
Conferencia cloucomputing utp-fisc (1)Conferencia cloucomputing utp-fisc (1)
Conferencia cloucomputing utp-fisc (1)elescorpiano27
 
Presentación capítulo 1 Computación en la nube
Presentación capítulo 1 Computación en la nubePresentación capítulo 1 Computación en la nube
Presentación capítulo 1 Computación en la nubeDayann Briceño
 
Negocio Electronico
Negocio ElectronicoNegocio Electronico
Negocio ElectronicoUJAP
 
Introducción a la Computación en la Nube Cap. #1
Introducción a la Computación en la Nube Cap. #1Introducción a la Computación en la Nube Cap. #1
Introducción a la Computación en la Nube Cap. #1ivanramos1989
 
Tec monterrey ciudadanía_inclusion_digital
Tec monterrey ciudadanía_inclusion_digitalTec monterrey ciudadanía_inclusion_digital
Tec monterrey ciudadanía_inclusion_digitalLuis Joyanes
 
Informe sobre Big Data - Cotec
Informe sobre Big Data - CotecInforme sobre Big Data - Cotec
Informe sobre Big Data - CotecEduardo Reig
 
Big Data: Impacto del Procesamiento masivo de datos
Big Data: Impacto del Procesamiento masivo de datosBig Data: Impacto del Procesamiento masivo de datos
Big Data: Impacto del Procesamiento masivo de datosEnrique Onieva
 

Similaire à Conferencia bigdata uem (19)

Big data en la era de la nube
Big data en la era de la nubeBig data en la era de la nube
Big data en la era de la nube
 
San luis bigdata
San luis bigdataSan luis bigdata
San luis bigdata
 
Hacia la quinta revolución industrial
Hacia la quinta revolución industrialHacia la quinta revolución industrial
Hacia la quinta revolución industrial
 
Innovaciones tecnológicas qbit
Innovaciones tecnológicas qbitInnovaciones tecnológicas qbit
Innovaciones tecnológicas qbit
 
Innovaciones tecnológicas qbit
Innovaciones tecnológicas qbitInnovaciones tecnológicas qbit
Innovaciones tecnológicas qbit
 
Conferencia Magistral José Alonso Ibañez
Conferencia Magistral José Alonso IbañezConferencia Magistral José Alonso Ibañez
Conferencia Magistral José Alonso Ibañez
 
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)
20150921 La Directiva INSPIRE y la Ley 14/2010 (LISIGE)
 
Curso de innovaciones tecnológicas y cloud computing
Curso de innovaciones tecnológicas y cloud computingCurso de innovaciones tecnológicas y cloud computing
Curso de innovaciones tecnológicas y cloud computing
 
Conferencia cloucomputing utp-fisc (1)
Conferencia cloucomputing utp-fisc (1)Conferencia cloucomputing utp-fisc (1)
Conferencia cloucomputing utp-fisc (1)
 
Presentación capítulo 1 Computación en la nube
Presentación capítulo 1 Computación en la nubePresentación capítulo 1 Computación en la nube
Presentación capítulo 1 Computación en la nube
 
Negocio Electronico
Negocio ElectronicoNegocio Electronico
Negocio Electronico
 
Informaticia y convergencia
Informaticia y convergenciaInformaticia y convergencia
Informaticia y convergencia
 
Perspectiva capitulo 1 cloud computing
Perspectiva capitulo 1 cloud computingPerspectiva capitulo 1 cloud computing
Perspectiva capitulo 1 cloud computing
 
Introducción a la Computación en la Nube Cap. #1
Introducción a la Computación en la Nube Cap. #1Introducción a la Computación en la Nube Cap. #1
Introducción a la Computación en la Nube Cap. #1
 
Capitulo 1 Resumen
Capitulo 1 ResumenCapitulo 1 Resumen
Capitulo 1 Resumen
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Tec monterrey ciudadanía_inclusion_digital
Tec monterrey ciudadanía_inclusion_digitalTec monterrey ciudadanía_inclusion_digital
Tec monterrey ciudadanía_inclusion_digital
 
Informe sobre Big Data - Cotec
Informe sobre Big Data - CotecInforme sobre Big Data - Cotec
Informe sobre Big Data - Cotec
 
Big Data: Impacto del Procesamiento masivo de datos
Big Data: Impacto del Procesamiento masivo de datosBig Data: Impacto del Procesamiento masivo de datos
Big Data: Impacto del Procesamiento masivo de datos
 

Plus de Luis Joyanes

Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentes
Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentesCiberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentes
Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentesLuis Joyanes
 
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en R
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en RInteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en R
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en RLuis Joyanes
 
Master UPSA - Social Media II
Master UPSA - Social Media IIMaster UPSA - Social Media II
Master UPSA - Social Media IILuis Joyanes
 
Master UPSA- Social Media -I
Master UPSA- Social Media -IMaster UPSA- Social Media -I
Master UPSA- Social Media -ILuis Joyanes
 
Conferencia Analítica Datos y Cloud Computing
Conferencia Analítica Datos y Cloud ComputingConferencia Analítica Datos y Cloud Computing
Conferencia Analítica Datos y Cloud ComputingLuis Joyanes
 
Seminario Analítica Social - ITESCO, México Noviembre 2012
Seminario Analítica Social - ITESCO, México Noviembre 2012Seminario Analítica Social - ITESCO, México Noviembre 2012
Seminario Analítica Social - ITESCO, México Noviembre 2012Luis Joyanes
 
Presentación del libro "Computación en la Nube"
Presentación del libro "Computación en la Nube"Presentación del libro "Computación en la Nube"
Presentación del libro "Computación en la Nube"Luis Joyanes
 

Plus de Luis Joyanes (7)

Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentes
Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentesCiberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentes
Ciberseguridad: Retos, oportunidades y riesgos de las tecnologías emergentes
 
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en R
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en RInteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en R
Inteligencia de negocios (BI) y Analítica de negocios (BA): Un enfoque en R
 
Master UPSA - Social Media II
Master UPSA - Social Media IIMaster UPSA - Social Media II
Master UPSA - Social Media II
 
Master UPSA- Social Media -I
Master UPSA- Social Media -IMaster UPSA- Social Media -I
Master UPSA- Social Media -I
 
Conferencia Analítica Datos y Cloud Computing
Conferencia Analítica Datos y Cloud ComputingConferencia Analítica Datos y Cloud Computing
Conferencia Analítica Datos y Cloud Computing
 
Seminario Analítica Social - ITESCO, México Noviembre 2012
Seminario Analítica Social - ITESCO, México Noviembre 2012Seminario Analítica Social - ITESCO, México Noviembre 2012
Seminario Analítica Social - ITESCO, México Noviembre 2012
 
Presentación del libro "Computación en la Nube"
Presentación del libro "Computación en la Nube"Presentación del libro "Computación en la Nube"
Presentación del libro "Computación en la Nube"
 

Conferencia bigdata uem

  • 1. 11 Prof. Luis Joyanes Aguilar BIG DATA: Análisis de los datos como nuevos pilares de la gestión empresarial Escuela Politécnica 12 de junio 2014
  • 2. 22 ESTADO DEL ARTE DE CLOUD COMPUTING Prof. Luis Joyanes Aguilar COMPUTACIÓN EN LA NUBE La nueva era de la computación
  • 3. 3
  • 4. 4
  • 5. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA NUBE: ESE GRAN INVENTO Página –5–
  • 6. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –6–
  • 7. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 INTRODUCCIÓN La Nube o la Computación en Nube (Cloud Computing) es uno de los términos tecnológicos (buzzwords) que más se repite en todo tipo de medios de comunicación en los tres últimos años. Las empresas, las organizaciones y los negocios en general, están viendo en esta tecnología la resolución de muchos de sus problemas, sobre todo, económicos pero también de infraestructuras tecnológicas. EL MODELO DE LA NUBE ES UN MODELO DE SERVICIOS COMO LA LUZ, EL AGUA, EL TELÉFONO, EL GAS… Página –7–
  • 8. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –8–
  • 9. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 BusinessWeek, Rachael King, August 04, 2008 Página –9–
  • 10. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE CLOUD COMPUTING  Para una definición más técnica de Cloud Computing o nube sin más, podríamos decir que se trata del conjunto de programas y servicios alojados en servidores conectados a la Red, accesibles desde cualquier computador (sea cual sea el sistema operativo que este ejecute) con conexión a Internet sin necesidad de instalar aplicaciones ejecutables en su disco duro y donde también se almacena la información generada por estas mismas aplicaciones o servicios. Cloud Computing ha transformado de forma radical el modelo de negocio, "Este modelo de tecnología se adapta a las necesidades de la empresa en todo momento, que sólo paga por los servicios que usa" Página –10–
  • 11. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –11–
  • 12. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Terminología de la NUBE (NIST)  El NIST recomienda utilizar los siguientes términos Consumidor de la nube o cliente: una persona u organización que es cliente de una nube: observes que un cliente de una nube puede ser de una nube y de otras nubes que ofrecen otros servicios Dispositivo Cliente: Una máquina o aplicación de software que accede a una nube en una conexión de red Proveedor de la nube o proveedor: una organización que proporciona servicios de la nube Página –12–
  • 13. 1313 UNIVERSIDAD EUROPEA DE MADRID Prof. Luis Joyanes Aguilar BIG DATA El universo digital de datos
  • 14. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Harvard Business Review, octubre 2012 Página –14–
  • 15. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Foreign Affairs, mayo 2013 Página –15–
  • 16. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Revista BBVA, innovation edge, junio 2013 Página –16–
  • 17. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 EL ECONOMISTA, HOY 12 DE JUNIO 2014  … La culpa la tiene el Big Data, un fenómeno de moda cuyas herramientas convierten cantidades abrumadoras de conocimiento en información útil para cada momento y entorno. La receta mágica para resolver los desafíos de todas las organizaciones se reduce a dos palabras: Business Intelligence. Las compañías fichan con puntería gracias al 'Gran Hermano' –  http://www.eleconomista.es/tecnologia- internet/noticias/5855592/06/14/Las-companias- fichan-con-punteria-graciasal-Gran-Hermano.html Página –17–
  • 18. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA ERA DEL PETABYTE (1.000 TB), Wired , julio 2008 (www.wired.com) Sensores en todas partes, almacenamiento infinito y Nubes (clouds) de procesadores  Nuestra capacidad para capturar, almacenar y comprender cantidades masivas de datos está cambiando la ciencia, medicina, negocios y tecnología. A medida que aumenta nuestra colección de hechos y figuras, crece la oportunidad de encontrar respuestas a preguntas fundamentales. Because in the era of big data, more isn´t just more. More is different Página –18–
  • 19. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA ERA DEL PETABYTE -2- . Wired , julio 2008 (www.wired.com)  1TB (250.000 canciones) 20 TB (fotos “uploaded” a Facebook cada mes)  120 TB (todos los datos e imágenes recogidos por el telescopio espacial Hubble) ; 460 TB (todos los datos del tiempo climático en EEUÜ compilados por el National Climatic Data Center); 530 TB (Todos los vídeos de YouTube); 600 TB (base de datos de genealogía, incluye todos los censos de EEUU 1790-2000) 1 PB (datos procesados por los servidores de Google cada 75 minutos) Página –19–
  • 20. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Tabla de unidades de almacenamiento (The Economist, febrero 2010): “data, data everywhere” www.economist.com/specialreports/displaystory.cfm?story_id=15557421 Página –20–
  • 21. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 El Universo Digital – EMC / IDC Página –21–
  • 22. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 El Universo Digital – EMC / IDC Página –22–
  • 23. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 El universo digital de datos, IDC 2013 Pina –23–
  • 24. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 El universo digital de datos, 2013 Página –24–
  • 25. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA ERA DEL EXABYTE/ZETTABYTE CISCO LA ERA DEL EXABYTE, CISCO . Estudio “Cisco Visual Networking Index (VNI) 2007-2012. Tráfico mundial de datos. LA ERA DEL ZETTABYTE:Cisco VNI: Forecast and Methodology 2012: 22017. Tráfico mundial de datos (publicado en 2013)  Página –25–
  • 26. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA / DILUVIO DE DATOS Twitter: (redes sociales)  90 millones de tuits (tweets) por día que representan 12 Terabytes (datos de 2011) Boeing: (industria)  Vuelo transoceánico de un jumbo puede generar 640 Terabytes. Wal-Mart: (comercio)  1 millón de transacciones por hora que se estima que alimenta una base de datos de 2.5 petabytes. Google procesa al día 20 PB de información Página –26–
  • 27. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA / DILUVIO DE DATOS El 90% de los datos acumulados en todo el mundo se han creado en los dos últimos años. Cada día se escriben 400 millones de tuits, cada minuto se crean 600 nuevos blogs y cada segundo se registran 10.000 transacciones de pagos con tarjetas. Objetos cotidianos como los carros, los relojes o las gafas están comenzando a conectarse a Internet para alimentar nuevos servicios que requieren un constante intercambio de información. Página –27–
  • 28. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA / DILUVIO DE DATOS Los Ayuntamientos siembran las calles con sensores de recogida de datos para facilitar la vida de los ciudadanos. Cada día se recogen 2,5 trillones de bytes de datos, y los directivos de las empresas apenas pueden manejar la mitad de los generados en su entorno porque el 80% de ellos están “desestructurados·.  El número de dispositivos en red duplicará a la población mundial en 2015 y los datos que generen se convertirán en información utilizada por las empresas para anticipar las necesidades de los consumidores. Página –28–
  • 29. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA / DILUVIO DE DATOS La respuesta para ordenar este caos es big data, la nueva herramienta para sistematizar los datos procedentes de cualquier soporte —incluyendo imagen sonido, fotos, textos…— y convertirlos de forma automática en información. Big data ayudó a ganar las elecciones a Barak Obama y ha reducido de días a minutos la detección de uso de información privilegiada en Wall Street Página –29–
  • 30. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA / DILUVIO DE DATOS En torno a ella se está creando un mercado evaluado por la firma de análisis Gartner en 132.000 millones de dólares para 2015. Ese año se crearán 4,4 millones de puestos de trabajo para abastecerlo. Los expertos comparan la herramienta con una revolución industrial en el mundo de los datos y afirman que con ella cambiará nuestra forma de vida. Página –30–
  • 31. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 EL NEXO DE LAS FUERZAS- GARTNER (2012) Página –31–
  • 32. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 El nexo de las fuerzas- Gartner (2012)  In the Nexus of Forces, information (Big Data) is the context for delivering enhanced social and mobile experiences. Mobile devices are a platform for effective social networking and new ways of work. Social links people to their work and each other in new and unexpected ways. Cloud enables delivery of information and functionality to users and systems. The forces of the Nexus are intertwined to create a user- driven ecosystem of modern computing.  At the Core: Social, Mobile, Cloud and Information. Converge and Reinforce Página –32–
  • 33. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TENDENCIAS TECNOLÓGICAS DE LA DÉCADA  LAS CONSULTORAS IDC, GARTNER, FORRESTER, MCKINSEY y otras, están de acuerdo: Cloud Computing Social Media (Medios sociales) Movilidad: Localización, realidad aumentada, realidad virtual… Internet de las cosas (objetos)  NFC, Bluetooth, RFID, QR, ZigBee, Sensores… Big Data: Herramientas y Analítica Página –33–
  • 34. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TENDENCIAS tecnológicas de 2014 “Lo móvil” (movilidad): Teléfonos inteligentes (smartphones), tabletas (tablets), videoconsolas,.. (geolocalización, realidad aumentada, NFC, RFID, QR…) Gamificación Consumerización, BYOD (Bring your own device) Smart TV BIG DATA (grandes volúmenes) Página –34–
  • 35. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TECNOLOGÍAS PONIBLES (Wearables) Gafas inteligentes Relojes inteligentes Pulseras inteligentes Anillos inteligentes Ropa inteligente …. Página –35–
  • 36. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TECNOLOGÍAS MÓVILES ACTUALES Tecnologías NFC Chips RFID (Identificación por radiofrecuencia) Códigos QR Sensores… Redes Bluetooth (1.0, 2.0, 3.0, 4.0…) Geolocalización Realidad Aumentada Página –36–
  • 37. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 EL TELÉFONO MÓVIL (CELULAR) con NFC como medio de pago Página –37–
  • 38. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TELÉFONO MÓVIL COMO MEDIO DE PAGO Página –38–
  • 39. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Código QR (periodicos, documentos,..) http://www.ticbeat.com/economia/auge- codigosqr-espana-infografia/ Página –39– http://wwhttp://
  • 40. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 MACHINE TO MACHINE (M2M)  Intercambio de información en formato de datos entre dos puntos remotos, bien a través de red fija o móvil sin interacción humana con características específicas en cuanto a tráfico y tarjetas SIM e integradas en la fabricación de dispositivos  Automatización de los procesos de comunicación entre máquinas, entre dispositivos móviles (celulares) y máquinas (Mobile to Machine) y entre hombres y máquinas (Man to Machine)  En 2011 había más de 1.500 millones de dispositivos alrededor del mundo conectados entre sí; 15.000 millones en 2013. Previsiones de Cisco, 25.000 millones para 2015 Página –40–
  • 41. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 INTERNET DE LAS COSAS (OBJETOS) Página –41–
  • 42. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 INTERNET DE LAS COSAS (OBJETOS) Cada día aumenta el número de dispositivos de todo tipo que proporcionan acceso a Internet. Las “cosas” que permiten y van a permitir estos accesos irá aumentando con el tiempo. Ahora ya tenemos videoconsolas, automóviles, trenes, aviones, sensores, aparatos de televisión, … y pronto el acceso se realizará desde los electrodomésticos Página –42–
  • 43. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 World Wide Web, Internet móvil, cloud computing, INTERNET DE LAS COSAS  Un mundo en el que miles de millones de objetos informarán de su posición, identidad e historia a través de conexiones inalámbricas … mediante tecnologías RFID, bluetooth, sensores inalámbricos, NFC, …  La realización del “Internet de las cosas” , probablemente requerirá cambios dramáticos en sistemas, arquitecturas y comunicaciones,… Invisible es la descripción de las nuevas tecnologías empotradas “Computación ubicua”… A medida que avance su penetración:  Producirá un CAMBIO SOCIAL, posiblemente, de tanto impacto y tan poco previsible, como las actuales tecnologías Web Página –43–
  • 44. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE IMPACTO DEL IoT*  Plataforma Satelise de Ferrovial (empresa multinacional constructora de infraestructuras, líder en España)… Está instalando en los peajes de autopistas una aplicación basada en tecnología satelital (GPS) para el pago de peajes sin barreras y la comunicación entre el conductor y la concesionaria mediante teléfonos inteligentes…. Ofrecerá otros servicios de valor añadido: trayectos de peaje y alternativos, información sobre el estado del tráfico, meteorología o cualquier tipo de incidente… pretende incorporar “comandos de voz” para evitar distracciones del conductor al volante.  *Actualidad económica, octubre 2013 Página –44–
  • 45. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE IMPACTO DEL IoT* SHODAN, buscador en la Internet de las cosas* A Google for Hackers. Shodan es una nueva herramienta utilizada por “los chicos buenos y malos” para encontrar todos los dispositivos conectados “ahora” a la Internet: luces de tráficos, plantas de energía e incluso el monitor de su bebé” * Forbes, sección Technology. 23 de septiembre, 2013 (nº de esta semana en España) Página –45–
  • 46. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 BUSCADOR SHODAN DE LA IoT Página –46–
  • 47. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 VENTAJAS Y RIESGOS DE IoT VENTAJAS Y OPORTUNIDADES  CISCO, ERICSSON,… prevén que para el año 2020 habrá cerca de 50 mil millones de dispositivos conectados a Internet, capaces de comunicarse entre sí, desde automóviles, aparatos de consumo en el hogar, teléfonos inteligentes, marcapasos, televisores, carros (coches), ropa inteligente, electrodomésticos, puertas - ventanas de hogares y edificios, PCs, tabletas… Infinitas ventajas RIESGOS*… Hackers “maliciosos”, ciberespionaje … * Cibereespionajes, piratas y mafias, El País, febrero 2013 http://elpais.com/elpais/2013/02/19/eps/1361281322_025092.html Página –47–
  • 48. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 OPEN DATA (Datos abiertos) Página –48–
  • 49. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 OPEN DATA (Datos abiertos) Las administraciones públicas [de cualquier organismo nacional e internacional] generan gran cantidad de información en formatos propios de difícil acceso para la mayoría de los ciudadanos. Bases de datos, listas, estudios, informes, estadísticas, etc. son datos abiertos (open data) en formatos propios que son de difícil acceso para la mayoría de los ciudadanos. Página –49–
  • 50. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 OPEN DATA (Datos abiertos) Evidentemente estos datos se almacenan normalmente en centros de datos propios de las administraciones que a su vez se almacenan y gestionan en nubes públicas o privadas ¿Qué necesitan los profesionales o las empresas para sacar rentabilidad a esos datos públicos? Evidentemente la colaboración de las entidades públicas para liberar cada día más información y crear más oportunidades de negocio Página –50–
  • 51. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ¿Qué son datos abiertos? Los Datos Abiertos constituyen una iniciativa de transparencia y Gobierno Abierto que consiste en la liberación de conjuntos de datos que son de interés público. Los Datos Abiertos son puestos a disposición de la sociedad, se promueve su libre acceso y reutilización, exceptuando aquellos datos que por razones de seguridad y privacidad previstas en la normativas vigentes no puedan ser publicados; La mayor parte de los datos generados o mantenidos por el estado son públicos. Sin embargo, no sólo el estado puede abrir sus datos: empresas, organizaciones y comunidades de información que producen o mantienen datos pueden ponerlos a disposición, siempre en formatos abiertos y bajo licencias libres. Página –51–
  • 52. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 OPEN DATA (Datos abiertos) La administración de Estados Unidos inició la iniciativa Open Data y en paralelo la Unión Europea ha ido adoptando también la iniciativa. En España los primeros gobiernos han sido los Gobiernos Autonómicos de El Principado de Asturias y el País Vasco. Página –52–
  • 53. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 OPEN DATA (Datos abiertos) La iniciativa del Gobierno Vasco se ha plasmado en la puesta en funcionamiento de Open Data Euskadi que pretende crear un sitio web donde la información reutilizable (contenidos abiertos) estén al alcance de cualquier ciudadano. Un estudio de la UE(2010) estima que el mercado de información pública podría generar riqueza por valor de 27.000 millones de euros. Página –53–
  • 54. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 INICIATIVAS PIONERAS INTERNACIONALES EN OPEN DATA En España… además de los gobiernos autonómicos de Asturias, País Vasco y Cataluña, la fundación CTIC ligada al consorcio W3C (www.fundacionctic.org). http://datos.gob.es/datos/?q=node/232 En Estados Unidos data.gov, en Gran Bretaña data.gov.uk  En Google (abril 2011, del número 1) la revista de negocios. //thinkquarterly.co.uk. El número 1 dedicado a OPEN DATA. En la Unión Europea (Iniciativa OPEN DATA): http://open-data.europa.eu/es Página –54–
  • 55. 5555 Prof. Luis Joyanes Aguilar BIG DATA: Fundamentos
  • 56. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 MAPA DE ETIQUETAS DE BIG DATA Página –56–
  • 57. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ORIGEN DEL TÉRMINO  Grandes volúmenes de datos Datos masivos Macrodatos (Fundación Fundeú BBVA) “La era de los datos masivos se refiere a cosas que se pueden hacer a gran escala, y pone en cuestión la forma en que vivimos e interactuamos con el mundo” (Mayer-Schömberg, Cukier, The Economist) Correlación: ya no importa el porqué sino sólo el qué Página –57–
  • 58. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 LA AVALANCHA DE DATOS  Según Eric Schmidt, presidente ejecutivo de Google, entre el origen de la tierra y el 2003 se crearon cinco exabytes de información. Hoy en día creamos la misma cifra cada dos días2. Las previsiones aseguran que en esta década crearemos alrededor de 35 zettabytes (40 ZB, informe de diciembre de 2012)  Según la consultora IDC, cifran en 1,8 Zettabytes la información generada en 2011. Si tratáramos de almacenar esa información en iPads (del modelo de 32GB) necesitaríamos 57.500 millones; puestos unos al lado de otro formaríamos una línea que daría 3 veces la vuelta al mundo y, si tratáramos de apilarlos, la “montaña” resultante sería 25 veces más alta que el monte Fuji. Página –58–
  • 59. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –59–
  • 60. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TRATAMIENTO DE LOS BIG DATA Página –60–
  • 61. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –61–
  • 62. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ¿Qué sucede en 1´ en INTERNET (2012) Página –62–
  • 63. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Informe de GP Bullhound, el banco de inversión líder en Europa (2012 vs 2013) Página –63–
  • 64. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Informe de GP Bullhound, el banco de inversión líder en Europa (2012 vs 2013) Página –64–
  • 65. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 http://blog.qmee.com/qmee-online-in-60-seconds/ (Noviembe-2013 Página –65–
  • 66. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Actividad de Internet en 1´. Qmee  Se producen 2 millones de búsquedas en Google  Se suben 72 horas de video de Youtube  En Facebook, se producen 2.460.000 post, 1.8 Me Gustan y 350GB de Datos  Se registran 70 nuevos dominios  Se descargan 15.000 temas desde iTunes  Se miran 20 millones de fotos en flickr  Se producen 278.000 Tweets por minuto  Se comparten por Snapchat 104.000 fotos  Amazon vende u$s 83.000  Se hacen 11.000 búsquedas de LinkedIn  Hay 11.000 usuarios activos en Pinterest  216.000 fotos nuevas en Instagram  204 millones de mails enviados; 20.000 nuevas fotos en Tumblr  571 nuevos sitios creados Página –66–
  • 67. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –67–
  • 68. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –68–
  • 69. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA  Los Gigantes de Internet como Google, Amazon o Facebook basan su éxito en el valor de los “big data” sin ellos tendrían serias dudas de supervivencia. Big data es el nuevo petróleo, oro o maná de la década. IBM, SAP ,Oracle, Cisco… los han sistematizado para adaptarlas a todo tipo de empresas.  Google comenzó a gestionar Big Data desde su nacimiento en 1998, para indexar sus búsquedas”  Big data ha saltado de Internet al mundo real, y las empresas investigan sus aplicaciones para mejorar la gestión, ahorrar consumos o lanzar nuevos servicios. Página –69–
  • 70. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA  Big data empieza a dar los primeros pasos en Europa. La británica Tesco, cuarta cadena minorista mundial, lo acaba de implantar para controlar la energía en 120 tiendas irlandesas y quiere extenderlo a las 3.000 tiendas que tiene entre Irlanda y Reino Unido para lograr un ahorro de 20 millones de euros en consumos energéticos.  ING Direct ha lanzado en Holanda un servicio para vigilar la interacción de los clientes con la web que genera llamadas telefónicas automáticas para ayudar a quienes no logran terminar su operación “una forma de fidelizar clientes” Página –70–
  • 71. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA La central de reservas Amadeus (líneas aéreas) insta a las empresas a que incorporen la herramienta junto con el uso ya creciente de MINERÍA DE DATOS.  Investigación realizada por el profesor Thomas Davenport, de la escuela de negocios de Harvard, sobre la experiencia de Air France-KLM, Lufthansa, British Airways, Cathay, Eurostar, Hoteles Marriott, aeropuerto de Múnich.  El informe indica que “las aerolíneas, los aeropuertos, los hoteles, las empresas ferroviarias y los distribuidores de productos turísticos deben plantearse una estrategia big data para situarse a la vanguardia”. Página –71–
  • 72. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA La industria aérea comercial podría ahorrar 30 millones de dólares en 15 años con la recogida de datos realizada por los sensores que GE coloca en los motores de los aviones.  Trece de las 25 mayores cadenas hoteleras de todo el mundo efectúan ya sus inversiones y sus ofertas comerciales, incluso el color de las paredes de los restaurantes o las habitaciones, cada vez más en función de sofisticados sistemas de análisis de datos de clientes (MINERÍA DE DATOS) Página –72–
  • 73. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA  En España, un sistema privado de seguridad, Sanitas ha puesto en marcha un sistema para prevenir enfermedades entre sus 2,3 millones de clientes.  “En un año hemos realizado 800.000 contactos a 100.000 clientes para darles consejos o indicarles la conveniencia de hacer pruebas de detección precoz cuando detectamos que por su perfil puede ser conveniente y ofrecer mejores servicios” [Portavoz de Sanitas al periódico El País] Página –73–
  • 74. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA Las farmacéuticas y las aseguradoras de todo el mundo han sumado la fuerza de sus datos para acelerar la investigación contra el cáncer, el alzhéimer y otras lacras de la sociedad. “hacer predicciones de comportamientos futuros de pacientes” son grandes ventajas de big data, que puede “mejorarnos la vida hasta límites insospechados”. Página –74–
  • 75. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 EXPANSIÓN, de Wall Street Journal, 1 de abril 2013 (casos de estudio)  UPS UPS comenzó a instalar sensores en sus vehículos de reparto para conocer su velocidad y ubicación, si el cinturón de seguridad del conductor está abrochado... Al combinar su información de GPS y los datos de sensores sobre rendimiento en más de 46.000 vehículos, UPS recortó 136 millones de kilómetros de sus rutas. Página –75–
  • 76. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 APLICACIONES DE BIG DATA Una línea de negocio importante de big data estará en las empresas de servicios. Mezclarán la información procedente de distintas fuentes y harán campañas de marketing (mercadotecnia) personalizado asociado a la geolocalización con datos de su perfil de riesgo, sus gustos y sus hábitos … Página –76–
  • 77. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data Oportunidad profesional: En 2015, Gartner predice que 4,4 millones de empleos serán creados en torno a big data. (Gartner, 2013) Fuente: http://www.gartner.com/technology/topics/big-data.jsp Página –77–
  • 78. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data  http://elpais.com/elpais/2013/12/02/vinetas/13 86011115_645213.html El Roto Viñeta de El Roto 3 de diciembre de 2013 Página –78–
  • 79. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data Página –79–
  • 80. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 RETOS Y OPORTUNIDADES IDC entiende Big data como un nuevo valor económico basado en la toma de decisiones a partir del análisis de grandes volúmenes de datos procedentes de una amplia variedad de fuentes, desde las aplicaciones empresariales convencionales a los datos móviles, los medios sociales y el Internet de las Cosas, un campo aún incipiente donde en 2020 convivirán 212.000 millones de dispositivos conectados.  BIG DATA TAMBIÉN OFRECE RIESGOS. Fundamentalmente en privacidad y seguridad de los datos. Normas legales de la Unión Europea, sus países miembros, América… Página –80–
  • 81. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 RETOS Y OPORTUNIDADES  Sus ventajas para el negocio en áreas como la gestión de las relaciones con el cliente, el desarrollo de nuevos productos, la detección del fraude o la predicción del comportamiento de los consumidores permiten a las compañías obtener resultados financieros un 20% por encima de sus competidores, según estimaciones de Gartner.  Se entiende así que, una vez superada la fase de evaluación y prueba en la que todavía nos encontramos, la adopción creciente de Big data dispare un mercado que, de acuerdo con la firma de investigación, cerró 2013 con un volumen de negocio asociado de 34.000 millones de dólares, 6.000 millones más que en 2012. Página –81–
  • 82. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 RETOS Y OPORTUNIDADES  Las promesas de Big data alcanzan a prácticamente todos los sectores de actividad, como demuestran las primeras experiencias de éxito emprendidas por organizaciones de finanzas, sanidad, turismo, retail o telecomunicaciones. Y su adopción se irá extendiendo a medida que los responsables TI vayan asumiendo el valor que aportan nuevos frameworks de software como Hadoop y los nuevos sistemas avanzados de almacenamiento, bases de datos, analítica y lenguajes de programación especialmente orientados a los grandes datos. Página –82–
  • 83. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM  Encierra esta idea el tratamiento de información que hace evolucionar los métodos y recursos habituales para hacerse cargo de grandes volúmenes de datos (de terabytes pasamos a zetabytes). Estos se generan a gran velocidad (pasamos de datos en lotes/archivos a datos en “streaming”) y además se añade una posible componente de complejidad y variabilidad en el formato de esos datos (pasamos de datos estructurados a datos semi-estructurados o no estructurados). Todo ello requiere de técnicas y tecnologías específicas para su captura, almacenamiento, distribución, gestión y análisis de la información. Página –83–
  • 84. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM  VOLUMEN de datos procesados por las empresas ha crecido significativa y exponencialmente. Google procesa 20 petabytes al día En 2020 se esperan 42.000 millones de pagos electrónicos. La Bolsa de Nueva York genera UN terabyte de datos al día Twitter genera 8 TB Página –84–
  • 85. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM VELOCIDAD. Rapidez con la que se accede a los datos. La velocidad del movimiento, proceso y captura de datos, dentro y fuera de la empresa ha aumentado considerablemente. Flujo de datos a alta velocidad. eBay se enfrenta al fraude a través de PayPal analizando cinco millones de transacciones en tiempo real al día. Página –85–
  • 86. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM VARIEDAD: Big data es cualquier tipo de dato – estructurado y no estructurado - tales como texto, datos de sensores, datos entre máquinas (M2M), archivos “logs”, audio, vídeo, flujos de clicks, XML, datos en streaming, cotizaciones bursátiles, medios sociales, Una creciente variedad de datos necesitan ser procesados y convertidos a información Página –86–
  • 87. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM Página –87–
  • 88. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM Página –88–
  • 89. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DEFINICIÓN DE BIG DATA: IBM Según otras definiciones de Big Data de fabricantes, consultoras, NIST, etc. existen otras propiedades de los big data: Veracidad de los datos Valor de los datos Viabilidad de la infraestructuras y las herramientas de almacenamiento Página –89–
  • 90. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data Oportunidad profesional: En 2015, Gartner predice que 4,4 millones de empleos serán creados en torno a big data. (Gartner, 2013) Fuente: http://www.gartner.com/technology/topics/big-data.jsp Página –90–
  • 91. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data  http://elpais.com/elpais/2013/12/02/vinetas/13 86011115_645213.html El Roto Viñeta de El Roto 3 de diciembre de 2013 Página –91–
  • 92. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Oportunidades en Big Data Página –92–
  • 93. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Fuentes de Big Data  Herramientas para análisis de datos en grandes volúmenes de datos. Infraestructuras de Big Data  Fuentes de Big Data (Soares 2012):  Web y Social media  Machine-to-Machine (M2M, Internet de las cosas)  Biometria  Datos de transacciones de grandes datos (salud, telecomunicaciones…)  Datos generados por las personas (humanos) Página –93–
  • 94. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  1. Web y Social Media: Incluye contenido web e información que es obtenida de las medios sociales como Facebook, Twitter, LinkedIn, Foursquare, Tuenti, etc, blogs como Technorati, blogs de periódicos y televisiones, wikis como MediaWiki, Wikipedia, marcadores sociales como Del.icio.us, Stumbleupon… agregadores de contenidos como Dig, Meneame… En esta categoría los datos se capturan, almacenan o distribuyen teniendo presente las características siguientes: Datos de los flujos de clics, tuits, retuits o entradas en general (feeds) de Twitter, Tumblr…, Entradas (posting) de Facebook y contenidos web diversos. Página –94–
  • 95. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  2. Machine-to-Machine (M2M)/ Internet de las cosas: M2M se refiere a las tecnologías que permiten conectarse a otros diferentes dispositivos entre sí. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (humedad, velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.) los cuales transmiten a través de cableadas, inalámbricas y móviles a otras aplicaciones que traducen estos eventos en información significativa. La comunicación M2M ha originado el conocido Internet de las cosas o de los objetos. Entre los dispositivos que se emplean para capturar datos de esta categoría podemos considerar chips o etiquetas RFID, chips NFC, medidores (de temperaturas, de electricidad, presión…). sensores, dispositivos GPS… y ocasionan la generación de datos mediante la lectura de los medidores, lecturas de los RFID y NFC, lectura de los sensores, señales GPS, señales de GIS, etc. Página –95–
  • 96. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  3.Big Data transaccionales: Grandes datos transaccionales procedentes de operaciones normales de transacciones de todo tipo. Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semiestructurados como no estructurados. Los datos generados procederán de registros de llamada de centros de llamada, departamentos de facturación, reclamaciones de las personas, presentación de documentos… Página –96–
  • 97. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  4. Biometría: La biometría o reconocimiento biométrico. La información biométrica se refiere a la identificación automática de una persona basada en sus características anatómicas o trazos personales. Los datos anatómicos se crean a partir de las características físicas de una persona incluyendo huellas digitales, iris, escaneo de la retina, reconocimiento facial, genética, DNA, reconocimiento de voz, incluso olor corporal etc. Los datos de comportamiento incluyen análisis de pulsaciones y escritura a mano. Los avances tecnológicos han incrementado considerablemente los datos biométricos disponibles Página –97–
  • 98. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  . En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación. En el área de negocios y de comercio electrónico los datos biométricos se pueden combinar con datos procedentes de medios sociales lo que hace aumentar el volumen de datos contenidos en los datos biométricos. Los datos generados por la biometría se pueden agrupar en dos grandes categorías: Genética y Reconocimiento facial.  “An Overview of Biometric Recognition”. http://biometrics.cse.nsu.edu/info.html Página –98–
  • 99. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Big Data. Joyanes, MéxicoDF: Alfaomega (2013)  5. Datos generados por las personas: Las personas generan enormes y diversas cantidades de datos como la información que guarda un centro de llamadas telefónicas (call center) al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios y registros médicos electrónicos, recetas médicas, documentos papel, faxes, etc. El problema que acompaña a los documentos generados por las personas es que pueden contener información sensible de las personas que necesita, normalmente ser oculta, enmascarada o cifrada de alguna forma para conservar la privacidad de dichas personas. Estos datos al ser sensibles necesitan ser protegidos por las leyes nacionales o supranacionales (como es el caso de la Unión Europea o Mercosur) relativas a protección de datos y privacidad. Página –99–
  • 100. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Estructura de Big Data: tipos de datos Estructurados No estructurados  No estructurados (texto, datos de vídeo, datos de audio,,,)  Semiestructurados ( a veces se conocen como “multiestructurados”. Tienen un formato y flujo lógico de modo que pueden ser entendidos pero el formato no es amistoso al usuario(HTML. XML…, datos de web logs)  Normalmente, se suelen asociar los datos estructurados a los tradicionales y los datos no estructurados a los Big Data  Objetivo principal de los sistemas de gestión de datos: Integración de datos estructurados y no estructurados Página –100–
  • 101. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Bases de datos In-Memory (en-memoria)  SAP Hana  Oracle Times Ten In-Memory Database  IBM solidDB Relacionales  Sistemas RDBMS (SGBDR). Oracle, IBM, Microsoft…  Transferencia de datos entre Hadoop y bases de datos relacionales Legacy (jerárquicas, en red… primeras relacionales…) NoSQL (Cassandra, Hive, mongoDB, CouchDB, Hbase…) Página –101–
  • 102. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 BASES DE DATOS ANALÍTICAS  Analíticas: para permitir a múltiples usuarios contestar rápidamente preguntas de negocio que requieran de grandes volúmenes de información. Bases de datos de procesamiento paralelo masivo (MPP) Bases de datos “en memoria” Almacenamiento en columnas  Históricamente estas bases de datos tan especializadas tenían un costo muy elevado, pero hoy el mercado nos ofrece varias alternativas que se adaptan al presupuesto de cada organización. Página –102–
  • 103. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Bases de datos analíticas  Bases de datos diseñadas específicamente para ser utilizadas como motores de Data Warehouse.  Estas bases de datos logran procesar grandes volúmenes de información a velocidades asombrosas, gracias a la aplicación de diferentes conceptos y tecnologías:  Almacenamiento en columnas en lugar de filas (registros)  Massively parallel processing (MPP)  In-Memory Analytics Página –103–
  • 104. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –104–
  • 105. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Computación en memoria “In-Memory” La computación en memoria es una tecnología que permite el procesamiento de cantidades masivas de datos en memoria principal para proporcionar resultados inmediatos del análisis y de las transacciones. Los datos a procesar, idealmente son datos en tiempo real (es decir, datos que están disponibles para su procesamiento o análisis inmediatamente después que se han creado). Existen un amplio conjunto de tecnologías que emplean bases de datos en memoria. SAP HANA es una de las más acreditadas y populares… (Oracle, IBM,…) Página –105–
  • 106. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 BASES DE DATOS NoSQL  Las bases de datos no-relacionales son comúnmente llamadas bases de datos NoSQL ya que la gran mayoría de ellas comparte el hecho de no utilizar el lenguaje SQL para realizar las consultas  Es una definición controvertida, aunque la definición más aceptada es “Not only SQL”.  Una de las características de las bases de datos no relacionales es que la mayoría de ellas no utilizan esquemas de datos rígidos como las bases de datos relacionales. Esto hace que estas bases de datos también se les llame “Schema-less” o “Schema-free (“almacenamiento des-estructurado”). Página –106–
  • 107. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Taxonomía de Bases de datos NoSQL  Los principales tipos de BBDD de acuerdo con su implementación son los siguientes:  – Almacenes de Clave-Valor  – Almacenes de Familia de Columnas (columnares)  – Almacenes de documentos (orientadas a documentos)  – Almacenes de Grafos (orientadas a grafos)  - Cachés de memoria Página –107–
  • 108. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 SOLUCIONES DE BASES DE DATOS NoSQL Página –108–
  • 109. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Integración con Big Data. FUENTE: datalytics.com Página –109–
  • 110. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Integración con Big Data. FUENTE: datalytics.com Página –110–
  • 111. 111111 Prof. Luis Joyanes Aguilar Tecnologías BIG DATA HADOOP
  • 112. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Logo de HADOOP Página –112–
  • 113. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Logo de HADOOP Página –113–
  • 114. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –114–
  • 115. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 TECNOLOGÍAS BIG DATA (HADOOP)  Datos de la consultora IDC de agosto de 2012 prevén que el mercado del software relacionado con los framework open source Apache Hadoop y el MapReduce de Google crecerá a un ritmo anual de más del 60% hasta el año 2016.  La popularidad de Hadoop se ha ido incrementando durante los últimos meses, a medida que las empresas necesitan manejar grandes cantidades de datos estructurados y no estructurados para después analizarlos y ser capaces de tomar decisiones lo más favorables posible para sus negocios.  IDC también espera que el mercado de Hadoop-MapReduce evolucione y que poco a poco comienza a introducirse en los sistemas empresariales. Página –115–
  • 116. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Hadoop “The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple Programming model”  De la página de Hadoop Página –116–
  • 117. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Historia de Hadoop: Doug Cutting Página –117–
  • 118. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Fundación Apache: proyectos open source  The Apache Software Foundation provides support for the Apache community of open-source software projects, which provide software products for the public good  The Apache Software Foundation provides support for the Apache community of open-source software projects, which provide software products for the public good Página –118–
  • 119. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –119–
  • 120. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Hadoop en la actualidad  Actualmente Hadoop es un framework muy extendido en el ámbito empresarial, sobre todo en compañías que manejan grandes volúmenes de datos. Entre las que podemos descarta las siguientes empresas:  Yahoo: La aplicación Yahoo! Search Webmap está implementado con Hadoop sobre un clúster de mas de 10.000 nodos Linux y la información que produce es la utilizada por el buscador de Yahoo.  Facebook: Tiene ha día de hoy el mayor clúster Hadoop del mundo que almacena hasta 30 peta bytes de información  Amazon A9: Se utiliza para la generar índices de búsqueda de los productos ofertados en el portal. Disponen de varios clústeres de entre 1 y 100 nodos  cada uno. Página –120–
  • 121. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Hadoop en la actualidad  The New York Times: Utiliza Hadoop y EC2 (Amazon Elastic Compute Cloud) para convertir 4 Tera bytes de imágenes TIFF en imágenes PNG de 800 K para ser mostradas en la Web en 36 horas.  Además existen compañías cuyo negocio es principal es Hadoop, como Cloudera, que comercializa CDH (Cloudera's Distribution including Apache Hadoop), que da soporte en la configuración y despliegue de clústeres  Hadoop. Además proporciona servicios de consultoría y formación en estas tecnología. Todo el software que distribuyen es Open Source. Página –121–
  • 122. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Proveedores de Big Data  Algunos han desarrollado sus propias distribuciones de Hadoop (con diferentes niveles de personalización: disponibilidad, rendimiento, replicas …). Una distribución muy popular  Otros ejemplos: MapR, Greenplum, Hortonworks, …  Hay docenas Página –122–
  • 123. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 The landscape of Big Data Página –123–
  • 124. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Lenguaje R R ofrece una gran variedad de técnicas estadísticas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, clasificación, clustering, ...) y técnicas gráficas, y es altamente extensible. R está disponible como software libre bajo licencia de GNU Free Software Foundation. Se compila y ejecuta en una variedad de plataformas UNIX y sistemas similares (incluyendo FreeBSD y Linux), Windows y MacOS. Página –124–
  • 125. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 INTELIGENCIA DE NEGOCIOS Y ANALYTICS  (Analytics) Es un término comercial, definido por diferentes proveedores de soluciones de inteligencia de negocios y de sistemas de información para referirse a las herramientas y técnicas para analizar y entender los datos.  Se compone de herramientas de procesamiento analítico en línea (OLAP), herramientas estadísticas, minería de datos, etc.  La analítica de negocios implica el uso de modelos y datos para mejora el desempeño de una organización o su posición competitiva. En analítica de negocios el foco está en el uso de modelos incluso aunque estén profundamente internos al sistemas. Página –125–
  • 126. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Business Analytics (Analytics)  Los modelos analíticos se utilizan para realizar análisis de datos. Incluyen modelos estadísticos, modelos de gestión científica, algoritmos de minería de datos, modelos financieros, etc.  A veces se integran con otros modelos, tales como modelos de planificación estratégica.  Los modelos de analítica de negocios (incluyendo analítica predictiva) abarcar numerosos modelos analíticos. Página –126–
  • 127. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Business Analytics (Analytics)  Se necesita entender no solo QUÉ está pasando, sino CUÁNDO, DÓNDE, QUIÉN Y PORQUÉ.  Solución a los requerimientos de información con OPORTUNIDAD  Escalar, contribuir y compartir a todos los tipos de usuarios en la organización  Se necesita información y conocimiento a partir de los datos de la empresa. Página –127–
  • 128. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ANALÍTICA DE NEGOCIOS (Analytics)  Analítica descriptiva (Descriptive analytics): Logra un profundo conocimiento a partir de datos históricos con informes, cuadros de mando, agrupación, etc.  Analítica predictiva (Predictive analytics): Diseño y uso de modelos predictivos a partir de técnicas de aprendizaje automática/minería de datos.  Analítica prescriptiva/perceptiva (Prescriptive analytics): Sugiere opciones de decisión acerca de la manera de aprovechar una oportunidad de futuro o mitigar un riesgo futuro y muestra las consecuencias de cada decisión.  Analítica de diagnóstico (de descubrimiento). ¿Porqué ha sucedido? Página –128–
  • 129. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ANALÍTICA DE NEGOCIOS (Analytics)  El análisis descriptivo responde a las preguntas ¿qué pasó y por qué sucedió?  El análisis predictivo responde a la pregunta ¿qué va a pasar?.  Análisis perceptivo responde a la pregunta ¿por qué va a pasar? Sugiere opciones de decisión acerca de la manera de aprovechar una oportunidad de futuro o mitigar un riesgo futuro y muestra las consecuencias de cada decisión Página –129–
  • 130. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Analítica predictiva  El término analítica predictiva describe el método de analítica de negocios de predicción o previsión de problemas y oportunidades en lugar de simplemente de emitir informes (reportes) a medida que se producen.  La analítica predictiva utiliza predicciones avanzadas y modelos de simulación.  Forecasting (predicción) es la predicción del futro. Esta forma de analítica predictiva es esencial para la construcción y manipulación de modelos, ya que cuando una decisión se implementa los resultados normalmente ocurren en el futuro Página –130–
  • 131. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Analítica predictiva  La analítica predictiva utiliza técnicas de minería de datos, datos históricos y suposiciones sobre futuras condiciones para predecir resultados de eventos, tales como la probabilidad de que un cliente responderá a una oferta o compra de un producto específico. Página –131–
  • 132. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ANALÍTICA DE BIG DATA  Big Data y la nube podrían reemplazar a las ‘cajas negras’ de los aviones  A raíz de la trágica desaparición del vuelo MH370 de Malaysian Airlines el 8 de marzo, Malasia ha pedido a ITU que elabore normas para facilitar la transmisión de datos de vuelo en tiempo real. La solución podría basarse en Big Data y la nube.  “Creo que los datos de las aeronaves, incluidos los de las cajas negras, podrían transmitirse en flujo continuo y almacenarse en centros de datos en tierra. Insto a la UIT a trabajar con las empresas privadas para buscar la mejor manera de controlar constantemente los datos de vuelo y lo que ocurre en la cabina de pilotaje. Con los adelantos de las TIC actuales deberíamos poder extraer y analizar esos datos sin necesidad de encontrar las cajas negras. Página –132–
  • 133. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 ANALÍTICA DE BIG DATA  Todas las aerolíneas comerciales y los aviones privados están obligados a instalar y utilizar “cajas negras” para registrar diversos parámetros de vuelo. El registrador de datos de vuelo está concebido para grabar los datos operativos de los sistemas del avión, incluida la altitud, la velocidad, la aceleración vertical, el rumbo y la posición de los sistemas de control. El registrador de voz de la cabina de pilotaje graba la voz de la tripulación y los sonidos dentro de la cabina de pilotaje. Estos equipos de control dan a los investigadores datos esenciales sobre las causas de un accidente. “ITU invitará a los fabricantes de aviónica y aviones, así como a los operadores de satélites y las aerolíneas, a trabajar sobre nuevas normas para el rastreo de aeronaves en tiempo real Página –133–
  • 134. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 C. M. de Gartner 2014. BI y Analytics Página –134–
  • 135. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 C. M. de Gartner 2014. BI y Analytics  Jaspersoft y Pentaho, se mantienen en su cuadrante de jugadores de nicho, desplazándose más hacia arriba y a la derecha.  SAP, SAS, Qlikview, IBM, MicroStrategy y Microsoft se mantienen en el mismo cuadrante de líderes.  Tableau y Tibco Spotfire, que entraron el año pasado, sigen en el cuadrante de líderes. Tableau ahora con más valoración en “integridad de la visión”.  GoodData, que debutó el año pasado en el cuadrante de jugadores de nicho, se desplaza considerablemente hacia el centro.  Alteryx y Panorama, se desplazan al cuadrante de visionarios.  Página –135–
  • 136. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 CIENCIA DE DATOS (DATA SCIENCE) Página –136–
  • 137. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 CIENCIA DE DATOS Ciencia de datos es la extracción de información útil de grandes volúmenes de datos. La ciencia de datos necesita acceder a los datos, a la ingeniería de datos y a las tecnologías de procesamiento de datos.  La Ciencia de Datos es una especialización creciente que toca muchos de los siguientes temas: Computación en nube, big data, matemáticas, estadística, métodos de optimización, teoría de negocios y teoría de ciencias de la computación. Página –137–
  • 138. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 CIENTÍFICO DE DATOS  EL CIENTÍFICO DE DATOS (Data Scientist). Un profesional con formación de Informática, Estadística, Analítica, Ciencias Físicas y Biológicas… que analizará los Big Data para la toma de decisiones eficientes y obtener rentabilidad en los negocios.  Lenguajes que deberá conocer: Python, R, SQL, NoSQL… Página –138–
  • 139. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 DISCIPLINAS CLAVE DE DATA SCIENCE Página –139–
  • 140. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 NECESIDAD DE FORMACIÓN PROFESIONAL AVANZADA EN CLOUD COMPUTING-BIG DATA  El mercado tiene carencia de especialistas en Cloud Computing y sobre todo en Big Data. Hay miles de puestos que se deberán cubrir en los próximos cinco años según estadísticas fiables de IDC, Gartner, Forrester, McKinsey…  UNA DE LAS PROFESIONES MÁS DEMANDADAS SERÁ DE ESPECIALISTAS EN CIENCIAS DE DATOS (Científicos de datos) y además ANALISTAS DE DATOS (formados en Analytics y tecnologías Big Data ·Hadoop”, “InMemory”…)  Se necesitan certificaciones profesionales en CLOUD COMPUTING Y BIG DATA… “TECNOLÓGICAS Y DE NEGOCIOS” Página –140–
  • 141. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 NUEVAS CARRERAS UNIVERSITARIAS: maestrias,ingeniería, diplomados… Community Manager, Social Media Manager y Analista Web y SEO Ingeniero y Analistas de Cloud Computing (En España hay una universidad privada que lo lanza el próximo curso) Analista e Ingeniero de negocios digitales (Digital Business Intelligence) Analista e Ingeniero de datos (Infraestructuras, Bases de datos NoSQL, Hadoop, Tecnologías “in- memory”…) Analista de datos y Analista de Big Data Página –141–
  • 142. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 NUEVAS CARRERAS Y PROFESIONES  Sin embargo la profesión del futuro será: EL CIENTÍFICO DE DATOS (Data Scientist). Un profesional con formación de Sistemas, Estadística, Analítica, Ciencias Físicas y Biológicas… que analizará los Big Data para la toma de decisiones eficientes y obtener rentabilidad en los negocios. HBR (Harvard Business Review lo declaró la profesión “MÁS SEXY del siglo XXI”…) Página –142–
  • 143. 143 Prof. Luis Joyanes Aguilar BIBLIOGRAFÍA
  • 144. 144144 ESTADO DEL ARTE DE CLOUD COMPUTING Prof. Luis Joyanes Aguilar COMPUTACIÓN EN LA NUBE La nueva era de la computación
  • 145. 145
  • 146. 146
  • 147. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –147– MUCHAS GRACIAS … ¿Preguntas? Portal tecnológico y de conocimiento www.mhe.es/ joyanes Portal GISSIC “El Ágora de Latinoamérica”: gissic.wordpress.com Twitter:@luisjoyanes www.slideshare.net/ joyanes www.facebook.com/ joyanesluis CORREO-e: joyanes@gmail.com
  • 148. © Luis Joyanes Aguilar Universidad Europea de Madrid 12 de junio, 2013 Página –148–Página –148– BIBLIOGRAFÍA BÁSICA  JOYANES, Luis (2014). Computación en la nube. Estrategias de cloud computing en las empresas. Barcelona: Marcombo; México DF: Alfaometa  JOYANES, Luis (2014). Inteligencia de negocios. Un enfoque móvil, en la nube y de big data. Barcelona: Marcombo; México DF: Alfaomega  TURBAN, Efraim, SHARDA, Ramesh, DELEN, Dursun Decision Support and Business Intelligence Systems. Ninth edition. New Jersey: Pearson/Prentice-Hall  JOYANES, Luis (2013). Big Data. El análisis de los grandes volúmenes de datos. Barcelona: Marcombo; México DF: Alfaomega.