SlideShare una empresa de Scribd logo
1 de 41
Big Data y Análisis Predictivo
Esteban Moro
(UC3M+IIC)

Big Data
Potencial para predicción en modelos de
comportamiento
Esteban Moro Egido
UC3M + IIC
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Qué Big Data?
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
http://blogs.msdn.com/b/data__knowledge__intelligence/archive/2013/02/18/big-data-big-deal.aspx
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIChttp://blog.qmee.com/wp-content/uploads/2013/07/Qmee-Online-In-60-Seconds21.png
Every 60 seconds
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Por qué ahora?
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Tecnología / Recursos
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Company A
 Company B
APIs
APP
Flujo de BigData y valor
Other sources
Transactional
operational
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Fuentes de datos
Operacional
Transaccional
Comunicaciones
Tiempo / Mercados
Sensores
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Tipos de datos
v4
v5
v
ariables Modelo
v
v3
4
v
Disponemos de datos sociales, de movilidad y otros patrones de comportamiento
Interacción social
Patrones de 
comportamiento
 Movilidad geográfica
Estas tres marcan el día a día de las personas
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
McKinsey Global Institute Big Data Report 2011
http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
•  Creando transparencia
•  Reducir ineficiencias
•  Permitiendo la experimentación para descubrir necesidades,
exponer variabilidad y mejorar el rendimiento de procesos 
•  Reemplazar o ayudar decisiones humanas por algoritmos
automatizados
•  Crear nuevos modelos de negocio, productos o servicios
•  McKinsey Global Institute Big Data Report 2011
•  http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
•  

Demystifying Big Data: A Practical Guide To Transforming The Business of Government
•  TechAmerica Foundation: Federal Big Data Commission 
•  
Valor
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
•  Social networks
•  Movie recommendation
•  Retail habits
•  http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html?
pagewanted=1&_r=2&hp&pagewanted=all&
•  Political campaigns
•  http://www.technologyreview.com/featuredstory/508836/how-obama-
used-big-data-to-rally-voters-part-1/
•  Location-based new products
•  Telefónica “Smart Steps”
•  BBVA “Commerce360”
Casos de uso
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Big data y predicción
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Los pasos 
Data
What are the
available
and
important
sources of
data?
Reporting
What
happened
and why?
Monitoring
What is
happening
now?
Predicting
What is
going to
happen in
future?
Hacia un modelo predictivo
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Dónde se aplican los modelos
predictivos? 
•  Finanzas
•  Detección de fraude
•  Gestión riesgo
•  Seguros 
•  Marketing
•  Adopción productos/servicios
•  Mejora campañas
•  Sistemas de recomendación
•  Salud
•  Deportes
•  Administración
•  Ciencia
•  LHC
•  Biología
http://squawka.com
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
•  Datos ≠ Información ≠ Valor 
Lo importante es el valor
Acción
Decisión
Datos
Conoci-
miento
Infor-
mación
ML
SNA
NLP
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
NLP
SNA
Tweets sobre 
marca/evento/tema
Análisis lingüístico
del contenido
Clasificación del "
contenido. Generación
de alertas
Interacción con "
usuarios
•  Datos ≠ Información ≠ Valor 
Lo importante es el valor
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Ejemplos
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 1: Telco
CRM
Predict adoption of product/services including social influence
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 1: Telco
17 million of relationships
6 million users
6 months of data

+ CRM
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 1: Telco
Tasa de adopción de producto a partir de una 
Campaña de marketing
MAAIS Metodología, IIC
www.iic.uam.es
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 1: Telco
Usar las llamadas de teléfono para proyectos de desarrollo 
CALLER ID CALLER CELL TOWER
LOCATION
RECIPIENT PHONE RECIPIENT CELL
TOWER LOCATION
X76VG588RLPQ 2°24’ 22.14”,
35°49’ 56.54”
A81UTC93KK52 3°26’ 30.47”,
31°12’ 18.01”
01:12:02
While at first glance it is difficult to assess the value of this rather rudimentary data, remarkably useful information on
human behavior may be derived from large sets of de-identified CDRs. There are at least three types of indicators that
can be extracted:
1. As mobile phone users send and receive calls and messages through different
cell towers, it is possible to “connect the dots” and reconstruct the movement patterns
of a community. This information may be used to visualize daily rhythms of commuting
to and from home, work, school, markets or clinics, but also has applications in
modeling everything from the spread of disease to the movements of a disaster-affected
population.
2. The geographic distribution of one’s social connections may
be useful both for building demographic profiles of aggregated call traffic and
understanding changes in behavior. Studies have shown that men and women tend
to use their phones differently, as do different age groups. Frequently making and
receiving calls with contacts outside of one’s immediate community is correlated with
higher socio-economic class.
$$$
$$$
$$
$$
$$
$
$
$
3. Mobile network operators use monthly airtime expenses to estimate
the household income of anonymous subscribers in order to target appropriate services
to them through advertising. When people in developing economies have more money
to spend, they tend to spend a significant portion of it on topping off their mobile
airtime credit. Monitoring airtime expenses for trends and sudden changes could prove
useful for detecting the early impact of an economic crisis, as well as for measuring the
impact of programmes designed to improve livelihoods.
Mobility
Social 

Interaction
Economical 
activity
www.unglobalpulse.org 3
After the Haitian earthquake in 2010, many people moved away from the capital city, Port Au Prince. Researchers
asked Digicell, Haiti’s biggest mobile phone operator, to share de-identified information about the cell towers that
subscribers were using when making calls. The data included the position of 1.9 million subscriber identity modules
(SIMs) in Haiti from 42 days before the earthquake to 158 days afterwards, allowing researchers to compare people’s
movement in the days preceding and following the earthquake. This study proved more accurate in measuring the
number of displaced people and their destinations than the studies by the Haitian Civil Protection Agency, and the
estimates of geographical distribution of people across Haiti were matched by estimates from a retrospective United
Nations Population Fund study.
A follow-up study (Lu et al., 2012) found that the destinations of people who left the capital during the first three
weeks after the earthquake were correlated with the locations to which they had significant social bonds. This
research has shown that in the event of another natural disaster, population movement patterns may be significantly
more predictable than has been previously understood. This type of analysis could be used to plan relief efforts more
precisely.
The visualization shows the distribution
of population migration from Port au Prince
(PaP) after the Haiti earthquake obtained by
analyzing CDRs. The circles represent locations
that received at least 500 people from the
estimated distribution of those in PaP on the day
of the earthquake, but outside the city 19 days
after the earthquake. Source: Lu et al., 2012.
Mobility patterns have
been identified by
analyzing CDRs, providing
more accurate
post-analysis of
population migration
during the Haiti
earthquake.
Rapid urbanization in developing countries has increased pressure on infrastructure such as road networks. Roads
and public transportation systems become saturated, and people lose a great deal of time traveling from home to
work, which in turn has a collective cost on the burgeoning economies. Researchers at IBM’s AllAboard project
have shown it is possible to monitor citizens’ travel routes and use data-driven insights to better plan and manage
transportation services (Berlingerio et al., 2013). The data analyzed included CDRs shared by Orange for 500,000
users over a five month period, which were used to pinpoint locations based on cell towers used when making calls
or using a mobile-based service. The researchers studied CDR data, mapped against 85 bus routes in Abidjan,
Ivory Coast’s largest city, where the bus transport network spans 539 buses, 5,000 mini-buses and 11,000 shared
taxis. Their findings allowed the researchers to suggest a partial solution to the city’s congestion: add four routes to
Abidjan’s existing infrastructure and extend another route. This optimized network would reduce travel time by 10%.
Such a provisioning method using CDRs would be useful for better urban planning and public transportation.
This image shows the existing public
transport network (SOTRA) in Abidjan and
additional routes suggested by the study.
Source: Berlingerio et al., 2013.
By analyzing CDR data, scientists mapped new
routes to decongest Abidjan’s crowded roads,
which would reduce travel time by 10%.
www.unglobalpulse.org 7
CÔTE D’IVOIRE
In another study (Smith et al., 2012), researchers used CDRs to map
poverty levels in Côte d’Ivoire. No full survey of the country’s population
has been published since a civil war in the 1990s. Researchers used
anonymized CDRs of five million Orange telecommunications customers
between December 2011 and April 2012 to assess both the level of activity
among subscribers and locations where calls were made. Higher levels of
mobile communication and wider range of calls are a proxy indicator for
prosperity. Using this data, poverty levels of eleven regions of Côte d’Ivoire
were quantified. The estimate was validated when compared with a multi-
dimensional poverty index created by University of Oxford, which uses
indicators such as poor health, lack of education, inadequate living standard
and threat from violence among other factors. This research validated the
possibility of making poverty maps using CDRs.
CDRs can provide a proxy
indicator for assessing
regional poverty levels,
and can valuably augment
national surveys in
estimating changes
associated with a growing
economy.
Figure 5. Figure 5A shows poverty map estimated
based on the antennas in the eleven major
regions of Cote d’Ivoire, where the darker areas
indicate higher estimated poverty level. Figure
5B shows the Department poverty levels as
approximated by the model used on regional
level indicating the finer granularity possible
when using CDRs. Source: Smith et al., 2012.
B
The previous three studies show that in countries where information regarding
census, socioeconomic levels or poverty indicators is lacking, CDRs may be
used to estimate these variables on an ongoing basis, thus augmenting and
complementing survey data.
Migración emergencia en Haiti
Niveles de pobreza en 

Costa de Marfil
Optimización rutas transporte en Abidjan
UN GlobalPulse, 2013. MOBILE PHONE NETWORK
DATA FOR DEVELOPMENT
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Bank

Predicting future purchases volume/money in city areas 
CRM
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Geomarketing/Bank
Predicting place of next purchase
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Geomarketing/Bank
We visit mostly the same shops
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Geomarketing/Bank
Predicting future area purchases
131Millions of transactions
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Media company
Segmentación automática de clientes de acuerdo a sus patrones de
navegación online de un medio de comunicación online 



~ 0.5 Millones de usuarios
~ 17 Millones de accesos al mes










CRM
140 variables nuevas
Horas a las que el usuario se conecta a la web,
número de visitas, accesos únicos, categorías
(política, economía, deportes, cultura…),
dispositivo, localización…


•  Detección de heavy users
•  Usuarios multicanal
•  Publicación de contenidos por
franjas horarias
•  Segmentación por intereses
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 2: Media company
Segmentación automática de clientes de acuerdo a sus patrones de
navegación online de un medio de comunicación online 

~ 0.5 Millones de usuarios
~ 17 Millones de accesos al mes










Usuarios
solo
deportes
Usuarios
economía,
ciencia y
tecnología
Usuarios
cultura,
cine y
viajes
Usuarios
política,
economía y
AAPP
Identificación y clasificación de usuarios en grupos ocultos difícilmente
alcanzables por métodos tradicionales.
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 3: Opinion analysis in SM 
Automatic detection of opinion, sentiment, brands, etc. in real time during
the WorldCup 2014

~ 10Million tweets per game
~ Peaks of 5000 tweets per minute
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 3: Opinion analysis in SM 
Automatic detection of opinion, sentiment, brands, etc. in real time during
the WorldCup 2014

We can detect the different categories of the conversation










http://mundial2014.iic.uam.es
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Example 3: Opinion analysis in SM 
Automatic detection of opinion, sentiment, brands, etc. in real time during
the WorldCup 2014

Also the sentiment about teams, brands, events, etc.










http://mundial2014.iic.uam.es
http://mundial2014.iic.uam.es
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
LAB
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Predicción éxito contenidos en SM
¿Podemos medir el éxito/alcance/engagement de contenidos en las redes sociales?
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Predicción éxito contenidos en SM
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Predicción éxito contenidos en SM
Publicación
tweet en
una cuenta
0 hrs
 48 h
0.75 hrs
Horizonte de
entrenamiento
RTs: 61
•  Variables de evolución.
!  RTs en los primeros
minutos.
•  Variables sociales.
!  Followers y followees.
!  Número de tweets.
!  Listas en las que aparecen.
!  Klout.
Número de
RTs final:
726
Modelo
predictivo
Predicción de
RTs:
682
Con 45’ predecimos el éxito
final de un tweet
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Predicción éxito contenidos en SM
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Monitorización de indicadores económicos 
Utilizar bigdata para crear indicadores económicos en tiempo real 

Movilidad + social + contenido tweets
20Millones tweets
200k usuarios
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
Monitorización de indicadores económicos 
Utilizar bigdata para crear indicadores económicos en tiempo real 

Mobilidad + interacción social + contenido tweets
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
BigData o el pulpo Paul?
“Es difícil hacer predicciones, 
sobre todo sobre el futuro”
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
BigData o el pulpo Paul?
Los peligros de usar BigData en predicción

•  Predecir supone decir lo que va a pasar y
con qué probabilidad
•  No ignoremos los falsos positivos de
nuestros algoritmos


•  Los modelos de hoy no valdrán mañana


•  Correlación ≠ Causalidad 
•  Aunque ciertas variables muestren
poder predictivo, eso no significa que
hayamos encontrado un mecanismo que
explica lo sucedido


•  Big no es All (sesgos poblacionales)
•  Incluso aunque tengamos millones de
usuarios o de eventos puede ser que no
tengamos todos
http://www.ft.com/cms/s/2/21a6e7d8-
b479-11e3-a09a-00144feabdc0.html
@estebanmoro 
Big Data
Potencial para predicció
comportamiento
Esteban Moro Egido
UC3M + IIC
BigData o el pulpo Paul?
Tenemos que:

Comprobar las hipótesis

Utilizar modelos nulos para descartar
efectos espúreos, correlaciones no deseadas,
etc.

A/B testing para aislar las causas de las
correlaciones

Experimentar es la única manera de
encontrar las causas

Demografía

Preguntémosnos sobre el origen de los
datos y su representatividad.

Método Científico, por favor!


http://www.ft.com/cms/s/2/21a6e7d8-
b479-11e3-a09a-00144feabdc0.html
http://en.wikipedia.org/wiki/Deferent_and_epicycle

Más contenido relacionado

Destacado

Mateo Valero - Big data: de la investigación científica a la gestión empresarial
Mateo Valero - Big data: de la investigación científica a la gestión empresarialMateo Valero - Big data: de la investigación científica a la gestión empresarial
Mateo Valero - Big data: de la investigación científica a la gestión empresarialFundación Ramón Areces
 
Aressy regards croises_2014_programme_conference
Aressy regards croises_2014_programme_conferenceAressy regards croises_2014_programme_conference
Aressy regards croises_2014_programme_conferencearessy
 
Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceAlex Rayón Jerez
 
G te c sesion1a-bioinformatica y big data
G te c sesion1a-bioinformatica y big dataG te c sesion1a-bioinformatica y big data
G te c sesion1a-bioinformatica y big dataVictoria López
 
IBM Big Data for Social Good Challenge - Submission Showcase
IBM Big Data for Social Good Challenge - Submission ShowcaseIBM Big Data for Social Good Challenge - Submission Showcase
IBM Big Data for Social Good Challenge - Submission ShowcaseIBM Analytics
 
Maximize the value of Earth Observation Data in a Big Data World
Maximize the value of Earth Observation Data in a Big Data WorldMaximize the value of Earth Observation Data in a Big Data World
Maximize the value of Earth Observation Data in a Big Data WorldBYTE Project
 
Big data medellin_seminario_internacional
Big data medellin_seminario_internacionalBig data medellin_seminario_internacional
Big data medellin_seminario_internacionalLuis Joyanes
 
BigDataEurope - Big Data & Climate Change
BigDataEurope - Big Data & Climate ChangeBigDataEurope - Big Data & Climate Change
BigDataEurope - Big Data & Climate ChangeBigData_Europe
 
How Machine Learning and Big Data can Help Us with the Human Learning
How Machine Learning and Big Data can Help Us with the Human LearningHow Machine Learning and Big Data can Help Us with the Human Learning
How Machine Learning and Big Data can Help Us with the Human LearningSvet Ivantchev
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
Working With Big Data
Working With Big DataWorking With Big Data
Working With Big DataSeth Familian
 

Destacado (16)

Mateo Valero - Big data: de la investigación científica a la gestión empresarial
Mateo Valero - Big data: de la investigación científica a la gestión empresarialMateo Valero - Big data: de la investigación científica a la gestión empresarial
Mateo Valero - Big data: de la investigación científica a la gestión empresarial
 
Nowcasting, sociedades para nuevas formas de organización
Nowcasting, sociedades para nuevas formas de organizaciónNowcasting, sociedades para nuevas formas de organización
Nowcasting, sociedades para nuevas formas de organización
 
Aressy regards croises_2014_programme_conference
Aressy regards croises_2014_programme_conferenceAressy regards croises_2014_programme_conference
Aressy regards croises_2014_programme_conference
 
Fernando Belda-Big Data y cambio climático
Fernando Belda-Big Data y cambio climáticoFernando Belda-Big Data y cambio climático
Fernando Belda-Big Data y cambio climático
 
Introducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business IntelligenceIntroducción al Big Data y el Business Intelligence
Introducción al Big Data y el Business Intelligence
 
G te c sesion1a-bioinformatica y big data
G te c sesion1a-bioinformatica y big dataG te c sesion1a-bioinformatica y big data
G te c sesion1a-bioinformatica y big data
 
IBM Big Data for Social Good Challenge - Submission Showcase
IBM Big Data for Social Good Challenge - Submission ShowcaseIBM Big Data for Social Good Challenge - Submission Showcase
IBM Big Data for Social Good Challenge - Submission Showcase
 
Maximize the value of Earth Observation Data in a Big Data World
Maximize the value of Earth Observation Data in a Big Data WorldMaximize the value of Earth Observation Data in a Big Data World
Maximize the value of Earth Observation Data in a Big Data World
 
Big data medellin_seminario_internacional
Big data medellin_seminario_internacionalBig data medellin_seminario_internacional
Big data medellin_seminario_internacional
 
BigDataEurope - Big Data & Climate Change
BigDataEurope - Big Data & Climate ChangeBigDataEurope - Big Data & Climate Change
BigDataEurope - Big Data & Climate Change
 
How Machine Learning and Big Data can Help Us with the Human Learning
How Machine Learning and Big Data can Help Us with the Human LearningHow Machine Learning and Big Data can Help Us with the Human Learning
How Machine Learning and Big Data can Help Us with the Human Learning
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
Working With Big Data
Working With Big DataWorking With Big Data
Working With Big Data
 

Similar a Esteban Moro - Big data: de la investigación científica a la gestión empresarial

Similar a Esteban Moro - Big data: de la investigación científica a la gestión empresarial (20)

¿Qué es el Big Data?
¿Qué es el Big Data?¿Qué es el Big Data?
¿Qué es el Big Data?
 
Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
Big Problem Data
Big Problem DataBig Problem Data
Big Problem Data
 
Dossier i+d
Dossier i+dDossier i+d
Dossier i+d
 
Big Data en Beneficio del Ciudadano
Big Data en Beneficio del CiudadanoBig Data en Beneficio del Ciudadano
Big Data en Beneficio del Ciudadano
 
Internet of Things (IoT)
Internet of Things (IoT)Internet of Things (IoT)
Internet of Things (IoT)
 
Trabajo práctico final tics
Trabajo práctico final ticsTrabajo práctico final tics
Trabajo práctico final tics
 
Trabajo práctico final tics
Trabajo práctico final ticsTrabajo práctico final tics
Trabajo práctico final tics
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big Data para la lucha contra la delincuencia
Big Data para la lucha contra la delincuenciaBig Data para la lucha contra la delincuencia
Big Data para la lucha contra la delincuencia
 
Tendencias_Tecnol_grupal_Exposición.pptx
Tendencias_Tecnol_grupal_Exposición.pptxTendencias_Tecnol_grupal_Exposición.pptx
Tendencias_Tecnol_grupal_Exposición.pptx
 
Geo presentación carranza_colombia2
Geo presentación carranza_colombia2Geo presentación carranza_colombia2
Geo presentación carranza_colombia2
 
Internet de-las-cosas
Internet de-las-cosasInternet de-las-cosas
Internet de-las-cosas
 
El internet de las cosas
El internet de las cosasEl internet de las cosas
El internet de las cosas
 
Categorización de usuarios de Twitter
Categorización de usuarios de TwitterCategorización de usuarios de Twitter
Categorización de usuarios de Twitter
 
VY&R
VY&RVY&R
VY&R
 
Revista Guia Comercial
Revista Guia ComercialRevista Guia Comercial
Revista Guia Comercial
 
Tema1
Tema1Tema1
Tema1
 
Revista ContactForum No. 51 Edición Enero - Febrero 2013 CRM, Tendencias en T...
Revista ContactForum No. 51 Edición Enero - Febrero 2013 CRM, Tendencias en T...Revista ContactForum No. 51 Edición Enero - Febrero 2013 CRM, Tendencias en T...
Revista ContactForum No. 51 Edición Enero - Febrero 2013 CRM, Tendencias en T...
 

Más de Fundación Ramón Areces

Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...
Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...
Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...Fundación Ramón Areces
 
Dominique L. Monnet Director del programa ARHAI (Antimicrobial Resistance an...
Dominique L. Monnet  Director del programa ARHAI (Antimicrobial Resistance an...Dominique L. Monnet  Director del programa ARHAI (Antimicrobial Resistance an...
Dominique L. Monnet Director del programa ARHAI (Antimicrobial Resistance an...Fundación Ramón Areces
 
Antonio Cabrales -University College of London.
Antonio Cabrales -University College of London. Antonio Cabrales -University College of London.
Antonio Cabrales -University College of London. Fundación Ramón Areces
 
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...Fundación Ramón Areces
 
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...Fundación Ramón Areces
 
Jonathan D. Ostry - Fondo Monetario Internacional (FMI).
Jonathan D. Ostry - Fondo Monetario Internacional (FMI). Jonathan D. Ostry - Fondo Monetario Internacional (FMI).
Jonathan D. Ostry - Fondo Monetario Internacional (FMI). Fundación Ramón Areces
 
Juan Carlos López-Gutiérrez - Unidad de Anomalías Vasculares, Hospital Unive...
Juan Carlos López-Gutiérrez  - Unidad de Anomalías Vasculares, Hospital Unive...Juan Carlos López-Gutiérrez  - Unidad de Anomalías Vasculares, Hospital Unive...
Juan Carlos López-Gutiérrez - Unidad de Anomalías Vasculares, Hospital Unive...Fundación Ramón Areces
 
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM). I...
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM).  I...Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM).  I...
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM). I...Fundación Ramón Areces
 
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...Fundación Ramón Areces
 
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research.
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research. Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research.
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research. Fundación Ramón Areces
 
Diego Valero - Presidente del Grupo Novaster.
Diego Valero - Presidente del Grupo Novaster. Diego Valero - Presidente del Grupo Novaster.
Diego Valero - Presidente del Grupo Novaster. Fundación Ramón Areces
 
Nicholas Barr - Profesor de Economía Pública, London School of Economics.
Nicholas Barr - Profesor de Economía Pública, London School of Economics. Nicholas Barr - Profesor de Economía Pública, London School of Economics.
Nicholas Barr - Profesor de Economía Pública, London School of Economics. Fundación Ramón Areces
 
Juan Manuel Sarasua - Comunicador y periodista científico.
Juan Manuel Sarasua - Comunicador y periodista científico. Juan Manuel Sarasua - Comunicador y periodista científico.
Juan Manuel Sarasua - Comunicador y periodista científico. Fundación Ramón Areces
 
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...Fundación Ramón Areces
 
Frederic Lluis - Investigador principal en KU Leuven.
Frederic Lluis - Investigador principal en KU Leuven. Frederic Lluis - Investigador principal en KU Leuven.
Frederic Lluis - Investigador principal en KU Leuven. Fundación Ramón Areces
 

Más de Fundación Ramón Areces (20)

Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...
Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...
Jordi Torren - Coordinador del proyecto ESVAC. Agencia Europea de Medicamento...
 
Dominique L. Monnet Director del programa ARHAI (Antimicrobial Resistance an...
Dominique L. Monnet  Director del programa ARHAI (Antimicrobial Resistance an...Dominique L. Monnet  Director del programa ARHAI (Antimicrobial Resistance an...
Dominique L. Monnet Director del programa ARHAI (Antimicrobial Resistance an...
 
Antonio Cabrales -University College of London.
Antonio Cabrales -University College of London. Antonio Cabrales -University College of London.
Antonio Cabrales -University College of London.
 
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...
Teresa Puig - Institut de Ciència de Materials de Barcelona, ICMAB-CSIC, Espa...
 
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...
Elena Bascones - Instituto de Ciencia de Materiales de Madrid (ICMM-CSIC), Es...
 
Jonathan D. Ostry - Fondo Monetario Internacional (FMI).
Jonathan D. Ostry - Fondo Monetario Internacional (FMI). Jonathan D. Ostry - Fondo Monetario Internacional (FMI).
Jonathan D. Ostry - Fondo Monetario Internacional (FMI).
 
Martín Uribe - Universidad de Columbia.
Martín Uribe - Universidad de Columbia.Martín Uribe - Universidad de Columbia.
Martín Uribe - Universidad de Columbia.
 
Thomas S. Robertson - The Wharton School.
Thomas S. Robertson - The Wharton School. Thomas S. Robertson - The Wharton School.
Thomas S. Robertson - The Wharton School.
 
Diana Robertson - The Wharton School.
Diana Robertson - The Wharton School. Diana Robertson - The Wharton School.
Diana Robertson - The Wharton School.
 
Juan Carlos López-Gutiérrez - Unidad de Anomalías Vasculares, Hospital Unive...
Juan Carlos López-Gutiérrez  - Unidad de Anomalías Vasculares, Hospital Unive...Juan Carlos López-Gutiérrez  - Unidad de Anomalías Vasculares, Hospital Unive...
Juan Carlos López-Gutiérrez - Unidad de Anomalías Vasculares, Hospital Unive...
 
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM). I...
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM).  I...Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM).  I...
Víctor Martínez-Glez. - Instituto de Genética Médica y Molecular (INGEMM). I...
 
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...
Rudolf Happle - Dermatología, University of Freiburg Medical Center, Freiburg...
 
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research.
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research. Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research.
Rafael Doménech - Responsable de Análisis Macroeconómico, BBVA Research.
 
Diego Valero - Presidente del Grupo Novaster.
Diego Valero - Presidente del Grupo Novaster. Diego Valero - Presidente del Grupo Novaster.
Diego Valero - Presidente del Grupo Novaster.
 
Mercedes Ayuso - Universitat de Barcelona.
Mercedes Ayuso -  Universitat de Barcelona. Mercedes Ayuso -  Universitat de Barcelona.
Mercedes Ayuso - Universitat de Barcelona.
 
Nicholas Barr - Profesor de Economía Pública, London School of Economics.
Nicholas Barr - Profesor de Economía Pública, London School of Economics. Nicholas Barr - Profesor de Economía Pública, London School of Economics.
Nicholas Barr - Profesor de Economía Pública, London School of Economics.
 
Julia Campa - The Open University.
Julia Campa - The Open University. Julia Campa - The Open University.
Julia Campa - The Open University.
 
Juan Manuel Sarasua - Comunicador y periodista científico.
Juan Manuel Sarasua - Comunicador y periodista científico. Juan Manuel Sarasua - Comunicador y periodista científico.
Juan Manuel Sarasua - Comunicador y periodista científico.
 
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...
Marta Olivares - Investigadora Postdoctoral en Université catholique de Louva...
 
Frederic Lluis - Investigador principal en KU Leuven.
Frederic Lluis - Investigador principal en KU Leuven. Frederic Lluis - Investigador principal en KU Leuven.
Frederic Lluis - Investigador principal en KU Leuven.
 

Último

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 

Último (11)

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 

Esteban Moro - Big data: de la investigación científica a la gestión empresarial

  • 1. Big Data y Análisis Predictivo Esteban Moro (UC3M+IIC) Big Data Potencial para predicción en modelos de comportamiento Esteban Moro Egido UC3M + IIC
  • 2. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Qué Big Data?
  • 3. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC http://blogs.msdn.com/b/data__knowledge__intelligence/archive/2013/02/18/big-data-big-deal.aspx
  • 4. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIChttp://blog.qmee.com/wp-content/uploads/2013/07/Qmee-Online-In-60-Seconds21.png Every 60 seconds
  • 5. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Por qué ahora?
  • 6. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Tecnología / Recursos
  • 7. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Company A Company B APIs APP Flujo de BigData y valor Other sources Transactional operational
  • 8. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Fuentes de datos Operacional Transaccional Comunicaciones Tiempo / Mercados Sensores
  • 9. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Tipos de datos v4 v5 v ariables Modelo v v3 4 v Disponemos de datos sociales, de movilidad y otros patrones de comportamiento Interacción social Patrones de comportamiento Movilidad geográfica Estas tres marcan el día a día de las personas
  • 10. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC McKinsey Global Institute Big Data Report 2011 http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
  • 11. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC •  Creando transparencia •  Reducir ineficiencias •  Permitiendo la experimentación para descubrir necesidades, exponer variabilidad y mejorar el rendimiento de procesos •  Reemplazar o ayudar decisiones humanas por algoritmos automatizados •  Crear nuevos modelos de negocio, productos o servicios •  McKinsey Global Institute Big Data Report 2011 •  http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation •  
 Demystifying Big Data: A Practical Guide To Transforming The Business of Government •  TechAmerica Foundation: Federal Big Data Commission •  Valor
  • 12. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC •  Social networks •  Movie recommendation •  Retail habits •  http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html? pagewanted=1&_r=2&hp&pagewanted=all& •  Political campaigns •  http://www.technologyreview.com/featuredstory/508836/how-obama- used-big-data-to-rally-voters-part-1/ •  Location-based new products •  Telefónica “Smart Steps” •  BBVA “Commerce360” Casos de uso
  • 13. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Big data y predicción
  • 14. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Los pasos Data What are the available and important sources of data? Reporting What happened and why? Monitoring What is happening now? Predicting What is going to happen in future? Hacia un modelo predictivo
  • 15. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Dónde se aplican los modelos predictivos? •  Finanzas •  Detección de fraude •  Gestión riesgo •  Seguros •  Marketing •  Adopción productos/servicios •  Mejora campañas •  Sistemas de recomendación •  Salud •  Deportes •  Administración •  Ciencia •  LHC •  Biología http://squawka.com
  • 16. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC •  Datos ≠ Información ≠ Valor Lo importante es el valor Acción Decisión Datos Conoci- miento Infor- mación ML SNA NLP
  • 17. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC NLP SNA Tweets sobre marca/evento/tema Análisis lingüístico del contenido Clasificación del " contenido. Generación de alertas Interacción con " usuarios •  Datos ≠ Información ≠ Valor Lo importante es el valor
  • 18. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Ejemplos
  • 19. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 1: Telco CRM Predict adoption of product/services including social influence
  • 20. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 1: Telco 17 million of relationships 6 million users 6 months of data + CRM
  • 21. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 1: Telco Tasa de adopción de producto a partir de una Campaña de marketing MAAIS Metodología, IIC www.iic.uam.es
  • 22. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 1: Telco Usar las llamadas de teléfono para proyectos de desarrollo CALLER ID CALLER CELL TOWER LOCATION RECIPIENT PHONE RECIPIENT CELL TOWER LOCATION X76VG588RLPQ 2°24’ 22.14”, 35°49’ 56.54” A81UTC93KK52 3°26’ 30.47”, 31°12’ 18.01” 01:12:02 While at first glance it is difficult to assess the value of this rather rudimentary data, remarkably useful information on human behavior may be derived from large sets of de-identified CDRs. There are at least three types of indicators that can be extracted: 1. As mobile phone users send and receive calls and messages through different cell towers, it is possible to “connect the dots” and reconstruct the movement patterns of a community. This information may be used to visualize daily rhythms of commuting to and from home, work, school, markets or clinics, but also has applications in modeling everything from the spread of disease to the movements of a disaster-affected population. 2. The geographic distribution of one’s social connections may be useful both for building demographic profiles of aggregated call traffic and understanding changes in behavior. Studies have shown that men and women tend to use their phones differently, as do different age groups. Frequently making and receiving calls with contacts outside of one’s immediate community is correlated with higher socio-economic class. $$$ $$$ $$ $$ $$ $ $ $ 3. Mobile network operators use monthly airtime expenses to estimate the household income of anonymous subscribers in order to target appropriate services to them through advertising. When people in developing economies have more money to spend, they tend to spend a significant portion of it on topping off their mobile airtime credit. Monitoring airtime expenses for trends and sudden changes could prove useful for detecting the early impact of an economic crisis, as well as for measuring the impact of programmes designed to improve livelihoods. Mobility Social 
 Interaction Economical activity www.unglobalpulse.org 3 After the Haitian earthquake in 2010, many people moved away from the capital city, Port Au Prince. Researchers asked Digicell, Haiti’s biggest mobile phone operator, to share de-identified information about the cell towers that subscribers were using when making calls. The data included the position of 1.9 million subscriber identity modules (SIMs) in Haiti from 42 days before the earthquake to 158 days afterwards, allowing researchers to compare people’s movement in the days preceding and following the earthquake. This study proved more accurate in measuring the number of displaced people and their destinations than the studies by the Haitian Civil Protection Agency, and the estimates of geographical distribution of people across Haiti were matched by estimates from a retrospective United Nations Population Fund study. A follow-up study (Lu et al., 2012) found that the destinations of people who left the capital during the first three weeks after the earthquake were correlated with the locations to which they had significant social bonds. This research has shown that in the event of another natural disaster, population movement patterns may be significantly more predictable than has been previously understood. This type of analysis could be used to plan relief efforts more precisely. The visualization shows the distribution of population migration from Port au Prince (PaP) after the Haiti earthquake obtained by analyzing CDRs. The circles represent locations that received at least 500 people from the estimated distribution of those in PaP on the day of the earthquake, but outside the city 19 days after the earthquake. Source: Lu et al., 2012. Mobility patterns have been identified by analyzing CDRs, providing more accurate post-analysis of population migration during the Haiti earthquake. Rapid urbanization in developing countries has increased pressure on infrastructure such as road networks. Roads and public transportation systems become saturated, and people lose a great deal of time traveling from home to work, which in turn has a collective cost on the burgeoning economies. Researchers at IBM’s AllAboard project have shown it is possible to monitor citizens’ travel routes and use data-driven insights to better plan and manage transportation services (Berlingerio et al., 2013). The data analyzed included CDRs shared by Orange for 500,000 users over a five month period, which were used to pinpoint locations based on cell towers used when making calls or using a mobile-based service. The researchers studied CDR data, mapped against 85 bus routes in Abidjan, Ivory Coast’s largest city, where the bus transport network spans 539 buses, 5,000 mini-buses and 11,000 shared taxis. Their findings allowed the researchers to suggest a partial solution to the city’s congestion: add four routes to Abidjan’s existing infrastructure and extend another route. This optimized network would reduce travel time by 10%. Such a provisioning method using CDRs would be useful for better urban planning and public transportation. This image shows the existing public transport network (SOTRA) in Abidjan and additional routes suggested by the study. Source: Berlingerio et al., 2013. By analyzing CDR data, scientists mapped new routes to decongest Abidjan’s crowded roads, which would reduce travel time by 10%. www.unglobalpulse.org 7 CÔTE D’IVOIRE In another study (Smith et al., 2012), researchers used CDRs to map poverty levels in Côte d’Ivoire. No full survey of the country’s population has been published since a civil war in the 1990s. Researchers used anonymized CDRs of five million Orange telecommunications customers between December 2011 and April 2012 to assess both the level of activity among subscribers and locations where calls were made. Higher levels of mobile communication and wider range of calls are a proxy indicator for prosperity. Using this data, poverty levels of eleven regions of Côte d’Ivoire were quantified. The estimate was validated when compared with a multi- dimensional poverty index created by University of Oxford, which uses indicators such as poor health, lack of education, inadequate living standard and threat from violence among other factors. This research validated the possibility of making poverty maps using CDRs. CDRs can provide a proxy indicator for assessing regional poverty levels, and can valuably augment national surveys in estimating changes associated with a growing economy. Figure 5. Figure 5A shows poverty map estimated based on the antennas in the eleven major regions of Cote d’Ivoire, where the darker areas indicate higher estimated poverty level. Figure 5B shows the Department poverty levels as approximated by the model used on regional level indicating the finer granularity possible when using CDRs. Source: Smith et al., 2012. B The previous three studies show that in countries where information regarding census, socioeconomic levels or poverty indicators is lacking, CDRs may be used to estimate these variables on an ongoing basis, thus augmenting and complementing survey data. Migración emergencia en Haiti Niveles de pobreza en 
 Costa de Marfil Optimización rutas transporte en Abidjan UN GlobalPulse, 2013. MOBILE PHONE NETWORK DATA FOR DEVELOPMENT
  • 23. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Bank Predicting future purchases volume/money in city areas CRM
  • 24. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Geomarketing/Bank Predicting place of next purchase
  • 25. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Geomarketing/Bank We visit mostly the same shops
  • 26. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Geomarketing/Bank Predicting future area purchases 131Millions of transactions
  • 27. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Media company Segmentación automática de clientes de acuerdo a sus patrones de navegación online de un medio de comunicación online 
 
 ~ 0.5 Millones de usuarios ~ 17 Millones de accesos al mes CRM 140 variables nuevas Horas a las que el usuario se conecta a la web, número de visitas, accesos únicos, categorías (política, economía, deportes, cultura…), dispositivo, localización… •  Detección de heavy users •  Usuarios multicanal •  Publicación de contenidos por franjas horarias •  Segmentación por intereses
  • 28. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 2: Media company Segmentación automática de clientes de acuerdo a sus patrones de navegación online de un medio de comunicación online 
 ~ 0.5 Millones de usuarios ~ 17 Millones de accesos al mes Usuarios solo deportes Usuarios economía, ciencia y tecnología Usuarios cultura, cine y viajes Usuarios política, economía y AAPP Identificación y clasificación de usuarios en grupos ocultos difícilmente alcanzables por métodos tradicionales.
  • 29. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 3: Opinion analysis in SM Automatic detection of opinion, sentiment, brands, etc. in real time during the WorldCup 2014 ~ 10Million tweets per game ~ Peaks of 5000 tweets per minute
  • 30. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 3: Opinion analysis in SM Automatic detection of opinion, sentiment, brands, etc. in real time during the WorldCup 2014 We can detect the different categories of the conversation http://mundial2014.iic.uam.es
  • 31. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Example 3: Opinion analysis in SM Automatic detection of opinion, sentiment, brands, etc. in real time during the WorldCup 2014 Also the sentiment about teams, brands, events, etc. http://mundial2014.iic.uam.es http://mundial2014.iic.uam.es
  • 32. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC LAB
  • 33. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Predicción éxito contenidos en SM ¿Podemos medir el éxito/alcance/engagement de contenidos en las redes sociales?
  • 34. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Predicción éxito contenidos en SM
  • 35. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Predicción éxito contenidos en SM Publicación tweet en una cuenta 0 hrs 48 h 0.75 hrs Horizonte de entrenamiento RTs: 61 •  Variables de evolución. !  RTs en los primeros minutos. •  Variables sociales. !  Followers y followees. !  Número de tweets. !  Listas en las que aparecen. !  Klout. Número de RTs final: 726 Modelo predictivo Predicción de RTs: 682 Con 45’ predecimos el éxito final de un tweet
  • 36. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Predicción éxito contenidos en SM
  • 37. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Monitorización de indicadores económicos Utilizar bigdata para crear indicadores económicos en tiempo real Movilidad + social + contenido tweets 20Millones tweets 200k usuarios
  • 38. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC Monitorización de indicadores económicos Utilizar bigdata para crear indicadores económicos en tiempo real Mobilidad + interacción social + contenido tweets
  • 39. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC BigData o el pulpo Paul? “Es difícil hacer predicciones, sobre todo sobre el futuro”
  • 40. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC BigData o el pulpo Paul? Los peligros de usar BigData en predicción •  Predecir supone decir lo que va a pasar y con qué probabilidad •  No ignoremos los falsos positivos de nuestros algoritmos
 •  Los modelos de hoy no valdrán mañana •  Correlación ≠ Causalidad •  Aunque ciertas variables muestren poder predictivo, eso no significa que hayamos encontrado un mecanismo que explica lo sucedido
 •  Big no es All (sesgos poblacionales) •  Incluso aunque tengamos millones de usuarios o de eventos puede ser que no tengamos todos http://www.ft.com/cms/s/2/21a6e7d8- b479-11e3-a09a-00144feabdc0.html
  • 41. @estebanmoro Big Data Potencial para predicció comportamiento Esteban Moro Egido UC3M + IIC BigData o el pulpo Paul? Tenemos que: Comprobar las hipótesis Utilizar modelos nulos para descartar efectos espúreos, correlaciones no deseadas, etc. A/B testing para aislar las causas de las correlaciones Experimentar es la única manera de encontrar las causas Demografía Preguntémosnos sobre el origen de los datos y su representatividad. Método Científico, por favor! http://www.ft.com/cms/s/2/21a6e7d8- b479-11e3-a09a-00144feabdc0.html http://en.wikipedia.org/wiki/Deferent_and_epicycle