SlideShare une entreprise Scribd logo
1  sur  52
Télécharger pour lire hors ligne
1
Julio Iglesias
12 Junio 2014
Cuando Nemo encontró
a (su) patrón
Minería de datos
Minería de datos
 Definición y características
 Algoritmos
 Metodología
• Demos
Objetivos y agenda
Cuando Nemo encontró a su patrón
Evolución
37
Informes
barras verdes
Herramientas
primarias
1970s
Documentar
el negocio
E-comm
Merchandising
analítico
2000
OLAP
Reporting
Basado en
Web
Data Mining
1990s1980s
Primeros DWs
Data Marts
Hojas de cálculo
Informes
DSS
2010+
Big Data
Data Streaming
Comprender
el negocio
Mejorar
el negocio
Predecir
el negocio
Qué pasa
con el negocio
¿?
TECNOLOGIAS QUE PERMITEN “ABSTRAER” LA INFORMACION EN CONOCIMIENTO
Tecnologías de BI
¿Qué buscamos?
6
Análisis Predictivo
Predictive Analysis
Presentation Exploration Discovery
Passive
Interactive
Proactive
Role of Software
Business
Insight
Canned reporting
Ad-hoc reporting
OLAP
Data mining
Self-service Analysis
7
WH?
QUE
(What)
QUIEN
(Who)
DONDE
(Where)
CUANDO
(When)
CUAL
(Which)
POR
QUE?
(Why)
Otras tecnologías de BI no dan respuesta…
WH?
Minería de datos
Extracción y análisis de información oculta y predecible de grandes bases
de datos mediante identificación de modelos, patrones y relaciones.
Definición
También conocida por (KDD- Knowledge Discovery in Databases)
Ejemplo supermercado
11
Mediante el Data Mining seremos capaces de realizar acciones
específicas y personalizadas:
• Descubrir patrones de comportamiento
• Fidelizar a los “mejores” clientes
• Motivos de éxito o fracaso de un nuevo producto/medicamento
• Distinguir los clientes/pacientes potencialmente más compradores o usuarios
de un servicio/producto
• Predecir automáticamente los comportamientos y futuras compras de un
cliente comparando con clientes del mismo perfil
• Detección de fraude
• Conocer las características de los clientes desvinculados y sus motivos de
abandono
• Qué productos tienden a venderse con otros
• ¿A qué grupos de clientes debo lanzar una campaña específica?
• …
Posibles utilidades
Minería de datos
Componentes
Componentes
Algoritmos
(estadística)
Datos Modelo
Datos
Datos
Datos, necesito datos….
16
Tarjetas perforadas
5 ¼
3 ½ 20 Mb
100 Mb
600 Mb
1 Gb
4 Gb
4,7 Gb
9 Gb
16 Gb
1 Tb
<20 años 1 millón
Evolución capacidad
Datos, necesito datos…
Datos, muchos datos…
Algoritmos
Algoritmos
(estadística)
 Conjunto de herramientas y
técnicas para buscar
patrones.
 Componente estadística
 Algunos pueden producir
más de un resultado
 Utilizar diferentes
algoritmos para diferentes
tareas
 Combinar algoritmos para
solucionar un problema
particular
 Decision Trees
 Naïve Bayesian
 Clustering
 Sequence Clustering
 Association Rules
 Neural Network
 Time Series
 ….
Algoritmos de minería
 Qué clientes comprarán un determinado producto con una
probabilidad X?
Clasificación (Predicción)
 Probabilidad de que un cliente tenga un determinado perfil?
Segmentación
 Recomendar un producto a un cliente que realiza una determianda
compra
Asociación
 Probabilidad de que un cliente compre un producto en el futuro
Predicción de secuencias
 Predecir la venta de los próximos 5 meses y su error
Forecasting
Escenarios
√ √ √ √ √ √
√ √ √ √ √
√ √ √
√ √ √ √ √ √
√ √ √
√
√
Classification
Regression
Segmentaion
Assoc. Analysis
Anomaly Detect.
Seq. Analysis
Time series
√ - second choice√ - first choice
¿Cuál escoger?
Algorithm Description
Decision Trees Finds the odds of an outcome based on values in a training set
Association
Rules
Identifies relationships between cases
Clustering Classifies cases into distinctive groups based on any attribute sets
Naïve Bayes Clearly shows the differences in a particular variable for various data elements
Sequence
Clustering
Groups or clusters data based on a sequence of previous events
Time Series Analyzes and forecasts time-based data combining the powerof ARTXP (developed
by Microsoft Research) for short-term predictionswith ARIMA (in SQL 2008) for
long-term accuracy.
Neural Nets Seeks to uncover non-intuitive relationships in data
Linear
Regression
Determines the relationship between columns in order to predict an outcome
Logistic
Regression
Determines the relationship between columns in order to evaluate the probability
that a column will contain a specific state
Algoritmos/Técnicas
Veamos algunos ejemplos…
Arboles de decisión
Arboles de decisión
262626
 Arboles de Decisión (modelos predictivos)
 Son útiles para predecir el valor de ciertos valores
a partir de otros datos
 Se realiza una clasificación, empezando por los atributos más
significativos hasta terminar por los menos significativos.
 De esta manera es posible establecer una serie de reglas
sobre qué factores (atributos) afectan a cada caso del modelo
y tener una base a partir de la cual estimar como responderán
otros casos en el futuro (predicción)
Riesgo
Crediticio
Casados
Bajo:55%
Alto:45%
Solteros
Bajo:45%
Alto:55%
Asalariados
Bajo:65%
Alto:35%
Casados
Bajo:45%
Alto:55%
Solteros
Bajo:40%
Alto:60%
Autónomos
Bajo:50%
Alto:50%
DeudasBajas
Bajo:80%
Alto:20%
DeudasAltas
100%
Todos
100%
Componentes
Arboles de decisión
Asociación
Amazon y Netflix
Amazon: 35% de las ventas del producto
provienen de recomendaciones
Netflix: 75% del streaming de vídeo
viene de recomendaciones
Asociación
Cesta compra
Navegación Web
Componentes
Asociación
Series temporales
33
 Análisis de Series Temporales
Se utilizan para hallar predecir el comprotamiento de variables que
dependen del tiempo.
Se necesita una base de datos histórica.
Se utiliza para la pevisión de demanda o stocks en un almacén o
para la previsión del número de periódicos a enviar a un quiosco, etc.
tiempo
Ene Feb Mar Abr May Jun Jul Aug Sep Oct Nov Dic Ene
PresentePasado Futuro
?
Series temporales
Componentes
Previsión
Clústering
36
 Clustering
Utilizado para realizar agrupaciones de registros de acuerdo a
características comunes, obteniendo grupos de registros con
comportamiento o características parecidas entre entre ellos y
diferenciadas con los otros grupos..
El clustering es útil especialmente para realizar tareas de Marketing
tales como segmentación de clientes.
Clase1
Clase2
Clase3
Ingresos anuales
Edad
Clase1
Clase2
Clase3
Ingresos anuales
Edad
Clase1
Clase2
Clase3
Ingresos anuales
Edad
Clustering
Casos
Clústering
Componentes
Clustering
38
No todo es comercial….
Componentes
Breast Cancer
Modelo
Modelo
41
 ¿ Como se realiza el proceso de DM ?
Modelo
Motor
DM
Datos
a tratar
Motor
DM
Datos tratados
Datos de
entrenamiento
Modelo
Modelo
Creación de un modelo
42
 Uno de los pasos más importantes en un estudio es obtener la
base de datos para el estudio.
 Las bases de datos o muestras de estudio no sólo se elaboran con
información interna de la empresa, sino que muchas veces se
necesita de información externa.
 Si no se dispone de la información correcta o de la información
necesaria, el estudio o análisis puede resultar un fracaso o inducir a
conclusiones equivocadas. Importante dedicar un extenso tiempo en
obtener la información y también en validarla.
A tener en cuenta
43
El siguiente paso a realizar para obtener la base preparada para el
estudio es realizar unos procesos de calidad de los datos y de la
muestra.
• Comprobar que la muestra sea representativa (que represente a la población
que queremos analizar)
• Conocer cómo se han obtenido los datos, si han sido tratados o
manipulados con anterioridad, etc.
• Que no haya valores o registros erróneos
• Que no haya valores perdidos o missing
• …
Todos aquellos registros erróneos no se deben tener en cuenta en el
estudio.
Calidad de los datos
Estandarización Puntos de Tiempo
• Examinar los últimos meses antes de abandono
• Abandono de diferentes clientes ocurren en diferentes momentos
44
45
Interpretar los resultados
Resumen
47
Interpretar los resultados
“…no disponer de la información correcta / necesaria,
puede ser peor…”
Cuando Nemo encontró a (su) patrón
“…no disponer de la información es malo…”
Correlación vs Causalidad
La causalidad es una relación entre un evento (causa) y un segundo
evento (efecto), en la cual el segundo evento se entiende como
consecuencia del primero
Causalidad
Se considera que dos variables cuantitativas están correlacionadas cuando
los valores de una de ellas varían sistemáticamente con respecto a los
valores homónimos de las otras.
Correlación
Correlación vs Causalidad
http://www.tylervigen.com/
He visto la luz… ¿?
51
Conclusiones
• No es ciencia ficción, pero hay que trabajarlo
• VOLUMEN: Grandes volúmenes de datos.
• Minería no es necesariamente Big Data
• ALGORITMO:
• Cada algoritmo pudiera necesitar la información de entrada de una forma
determinada.
• Respuesta = ¿+? De un algoritmo
• INTERPRETACION: Se deben hacer preguntas concretas y saber interpretar las
respuestas.
• MODELO: Importante contar con alguien experto en el tema para validarlo
• MADUREZ en la empresa en proyectos de BI
www.eug.es
julio.iglesias@eug.es

Contenu connexe

Tendances

3.3 necesidades informacion
3.3 necesidades informacion3.3 necesidades informacion
3.3 necesidades informaciondarkneox
 
Requisitos funcionales y no funcionales
Requisitos funcionales y no funcionalesRequisitos funcionales y no funcionales
Requisitos funcionales y no funcionalesRene Guaman-Quinche
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
MODELO COCOMO (INGENIERA DE SOFTWARE)
MODELO COCOMO (INGENIERA DE SOFTWARE)MODELO COCOMO (INGENIERA DE SOFTWARE)
MODELO COCOMO (INGENIERA DE SOFTWARE)Yadith Miranda Silva
 
Elicitacion
ElicitacionElicitacion
Elicitacionaruedaj
 
Integridad Y Seguridad En Las Bases De Datos
Integridad Y Seguridad En Las Bases De DatosIntegridad Y Seguridad En Las Bases De Datos
Integridad Y Seguridad En Las Bases De DatosDrakonis11
 
Guía para prevenir y afrontar una crisis en redes sociales Sentisis
Guía para prevenir y afrontar una crisis en redes sociales SentisisGuía para prevenir y afrontar una crisis en redes sociales Sentisis
Guía para prevenir y afrontar una crisis en redes sociales SentisisFátima Martinez López
 
Fundamentos de muestreo
Fundamentos de muestreoFundamentos de muestreo
Fundamentos de muestreoDiego Millan
 
Requerimiento funcional y no funcional
Requerimiento funcional y no funcional Requerimiento funcional y no funcional
Requerimiento funcional y no funcional CristobalFicaV
 
Fundamentos De Muestreo
Fundamentos De MuestreoFundamentos De Muestreo
Fundamentos De MuestreoAna kristell
 
Caso de uso de biblioteca
Caso de uso de bibliotecaCaso de uso de biblioteca
Caso de uso de bibliotecapersye
 
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por miGonzalo Vazquez
 

Tendances (20)

3.3 necesidades informacion
3.3 necesidades informacion3.3 necesidades informacion
3.3 necesidades informacion
 
Arquitectura Cliente-Servidor
Arquitectura Cliente-ServidorArquitectura Cliente-Servidor
Arquitectura Cliente-Servidor
 
Interrupcion de Servicios
Interrupcion de ServiciosInterrupcion de Servicios
Interrupcion de Servicios
 
Requisitos funcionales y no funcionales
Requisitos funcionales y no funcionalesRequisitos funcionales y no funcionales
Requisitos funcionales y no funcionales
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Modelo en cascada pemo
Modelo en cascada pemoModelo en cascada pemo
Modelo en cascada pemo
 
MODELO COCOMO (INGENIERA DE SOFTWARE)
MODELO COCOMO (INGENIERA DE SOFTWARE)MODELO COCOMO (INGENIERA DE SOFTWARE)
MODELO COCOMO (INGENIERA DE SOFTWARE)
 
Ejemplos de requerimientos
Ejemplos de requerimientosEjemplos de requerimientos
Ejemplos de requerimientos
 
Elicitacion
ElicitacionElicitacion
Elicitacion
 
Integridad Y Seguridad En Las Bases De Datos
Integridad Y Seguridad En Las Bases De DatosIntegridad Y Seguridad En Las Bases De Datos
Integridad Y Seguridad En Las Bases De Datos
 
Guía para prevenir y afrontar una crisis en redes sociales Sentisis
Guía para prevenir y afrontar una crisis en redes sociales SentisisGuía para prevenir y afrontar una crisis en redes sociales Sentisis
Guía para prevenir y afrontar una crisis en redes sociales Sentisis
 
Fundamentos de muestreo
Fundamentos de muestreoFundamentos de muestreo
Fundamentos de muestreo
 
Requerimiento funcional y no funcional
Requerimiento funcional y no funcional Requerimiento funcional y no funcional
Requerimiento funcional y no funcional
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Fundamentos De Muestreo
Fundamentos De MuestreoFundamentos De Muestreo
Fundamentos De Muestreo
 
Tuning fondo-negro-2
Tuning fondo-negro-2Tuning fondo-negro-2
Tuning fondo-negro-2
 
Caso de uso de biblioteca
Caso de uso de bibliotecaCaso de uso de biblioteca
Caso de uso de biblioteca
 
estimacion
estimacionestimacion
estimacion
 
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por mi
 
Muestreo
MuestreoMuestreo
Muestreo
 

En vedette

Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datosasuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuencialesMarilyn Jaramillo
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 

En vedette (20)

Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Luis enrique
Luis enriqueLuis enrique
Luis enrique
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Datos mineria chilena cesco
Datos mineria chilena cescoDatos mineria chilena cesco
Datos mineria chilena cesco
 

Similaire à Minería de Datos: Qué significa realmente y ejemplos de utilización

Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxAnonymousEoGAaTF
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010cristian
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgSnoop Consulting
 
Herramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemasHerramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemasjameskeenandan
 
Customer Analytics; qué se necesita y cómo conseguirlo by Josep Curto
Customer Analytics; qué se necesita y cómo conseguirlo by Josep CurtoCustomer Analytics; qué se necesita y cómo conseguirlo by Josep Curto
Customer Analytics; qué se necesita y cómo conseguirlo by Josep CurtoSngular Meaning
 
No es business Intelligence todo lo que reluce
No es business Intelligence todo lo que reluceNo es business Intelligence todo lo que reluce
No es business Intelligence todo lo que reluceSalvador Ramos
 
Cómo aplicar el análisis predictivo en la empresa
Cómo aplicar el análisis predictivo en la empresaCómo aplicar el análisis predictivo en la empresa
Cómo aplicar el análisis predictivo en la empresaNexolution
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerEduardo Castro
 
Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Nestor Montaño
 
Presentación Quanam en Software Solution Forum 2013
Presentación Quanam en Software Solution Forum 2013Presentación Quanam en Software Solution Forum 2013
Presentación Quanam en Software Solution Forum 2013Quanam
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasFelipe Vera (Prodigio Consultores)
 
Evaluación. Herramienta de gestión en bibliotecas y centros de información
Evaluación. Herramienta de gestión en bibliotecas y centros de informaciónEvaluación. Herramienta de gestión en bibliotecas y centros de información
Evaluación. Herramienta de gestión en bibliotecas y centros de informaciónCiencias de la Información - PUCP
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
People Analytics: Prevención y predicción de rotación del personal
People Analytics: Prevención y predicción de rotación del personalPeople Analytics: Prevención y predicción de rotación del personal
People Analytics: Prevención y predicción de rotación del personalSoftware Guru
 
Procesos de Analítica Predictiva
Procesos de Analítica PredictivaProcesos de Analítica Predictiva
Procesos de Analítica PredictivaLPI ONG
 
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...ale_sifuentes
 

Similaire à Minería de Datos: Qué significa realmente y ejemplos de utilización (20)

Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Herramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemasHerramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemas
 
Herramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemasHerramientas de calidad para la resolución de problemas
Herramientas de calidad para la resolución de problemas
 
Customer Analytics; qué se necesita y cómo conseguirlo by Josep Curto
Customer Analytics; qué se necesita y cómo conseguirlo by Josep CurtoCustomer Analytics; qué se necesita y cómo conseguirlo by Josep Curto
Customer Analytics; qué se necesita y cómo conseguirlo by Josep Curto
 
No es business Intelligence todo lo que reluce
No es business Intelligence todo lo que reluceNo es business Intelligence todo lo que reluce
No es business Intelligence todo lo que reluce
 
Cómo aplicar el análisis predictivo en la empresa
Cómo aplicar el análisis predictivo en la empresaCómo aplicar el análisis predictivo en la empresa
Cómo aplicar el análisis predictivo en la empresa
 
Herramientas calidad abc
Herramientas calidad abc Herramientas calidad abc
Herramientas calidad abc
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...
 
Presentación Quanam en Software Solution Forum 2013
Presentación Quanam en Software Solution Forum 2013Presentación Quanam en Software Solution Forum 2013
Presentación Quanam en Software Solution Forum 2013
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Evaluación. Herramienta de gestión en bibliotecas y centros de información
Evaluación. Herramienta de gestión en bibliotecas y centros de informaciónEvaluación. Herramienta de gestión en bibliotecas y centros de información
Evaluación. Herramienta de gestión en bibliotecas y centros de información
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
People Analytics: Prevención y predicción de rotación del personal
People Analytics: Prevención y predicción de rotación del personalPeople Analytics: Prevención y predicción de rotación del personal
People Analytics: Prevención y predicción de rotación del personal
 
Procesos de Analítica Predictiva
Procesos de Analítica PredictivaProcesos de Analítica Predictiva
Procesos de Analítica Predictiva
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Dmaic revision de pasos
Dmaic   revision de pasosDmaic   revision de pasos
Dmaic revision de pasos
 
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...
2 noticias de la semana 11 SOLUCIÓN DE PROBLEMAS MEDIANTE TÉCNICAS DE INTELIG...
 

Plus de Escoles Universitàries Gimbernat i Tomàs Cerdà

Plus de Escoles Universitàries Gimbernat i Tomàs Cerdà (20)

Grau Informatica Serveis - Tomas Cerda.pdf
Grau Informatica Serveis - Tomas Cerda.pdfGrau Informatica Serveis - Tomas Cerda.pdf
Grau Informatica Serveis - Tomas Cerda.pdf
 
La nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivosLa nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivos
 
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de usoEl futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
 
Los datos genómicos en el ámbito de la salud
Los datos genómicos en el ámbito de la saludLos datos genómicos en el ámbito de la salud
Los datos genómicos en el ámbito de la salud
 
Módulo de BIOINFORMATICA
Módulo de BIOINFORMATICA Módulo de BIOINFORMATICA
Módulo de BIOINFORMATICA
 
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitatEU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
 
EUG Informatica Serveis a Empreses
EUG Informatica Serveis a EmpresesEUG Informatica Serveis a Empreses
EUG Informatica Serveis a Empreses
 
Big Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxitoBig Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxito
 
Diseño de videojuegos
Diseño de videojuegosDiseño de videojuegos
Diseño de videojuegos
 
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
 
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
 
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big dataSeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
 
El impacto tecnologico de la imagen para el diagnostico
El impacto tecnologico de la imagen para el diagnosticoEl impacto tecnologico de la imagen para el diagnostico
El impacto tecnologico de la imagen para el diagnostico
 
Business Intelligence con Excel
Business Intelligence con ExcelBusiness Intelligence con Excel
Business Intelligence con Excel
 
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
 
Experiencia del HSJD en el campo del eHealth
Experiencia del HSJD en el campo del eHealthExperiencia del HSJD en el campo del eHealth
Experiencia del HSJD en el campo del eHealth
 
Sesión técnica sobre gestion documental
Sesión técnica sobre gestion documentalSesión técnica sobre gestion documental
Sesión técnica sobre gestion documental
 
El camino para implantar soa con éxito
El camino para implantar soa con éxitoEl camino para implantar soa con éxito
El camino para implantar soa con éxito
 
Grado d'informàtica i serveis
Grado d'informàtica i serveisGrado d'informàtica i serveis
Grado d'informàtica i serveis
 
Guiametabolica org gimbernat enero 2013
Guiametabolica org  gimbernat enero 2013Guiametabolica org  gimbernat enero 2013
Guiametabolica org gimbernat enero 2013
 

Dernier

El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel tallerValentinaTabares11
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOnarvaezisabella21
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramDIDIERFERNANDOGUERRE
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 

Dernier (20)

El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ram
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 

Minería de Datos: Qué significa realmente y ejemplos de utilización

  • 1. 1 Julio Iglesias 12 Junio 2014 Cuando Nemo encontró a (su) patrón Minería de datos
  • 2. Minería de datos  Definición y características  Algoritmos  Metodología • Demos Objetivos y agenda Cuando Nemo encontró a su patrón
  • 3. Evolución 37 Informes barras verdes Herramientas primarias 1970s Documentar el negocio E-comm Merchandising analítico 2000 OLAP Reporting Basado en Web Data Mining 1990s1980s Primeros DWs Data Marts Hojas de cálculo Informes DSS 2010+ Big Data Data Streaming Comprender el negocio Mejorar el negocio Predecir el negocio Qué pasa con el negocio ¿?
  • 4. TECNOLOGIAS QUE PERMITEN “ABSTRAER” LA INFORMACION EN CONOCIMIENTO Tecnologías de BI
  • 6. 6 Análisis Predictivo Predictive Analysis Presentation Exploration Discovery Passive Interactive Proactive Role of Software Business Insight Canned reporting Ad-hoc reporting OLAP Data mining Self-service Analysis
  • 9. Extracción y análisis de información oculta y predecible de grandes bases de datos mediante identificación de modelos, patrones y relaciones. Definición También conocida por (KDD- Knowledge Discovery in Databases)
  • 11. 11 Mediante el Data Mining seremos capaces de realizar acciones específicas y personalizadas: • Descubrir patrones de comportamiento • Fidelizar a los “mejores” clientes • Motivos de éxito o fracaso de un nuevo producto/medicamento • Distinguir los clientes/pacientes potencialmente más compradores o usuarios de un servicio/producto • Predecir automáticamente los comportamientos y futuras compras de un cliente comparando con clientes del mismo perfil • Detección de fraude • Conocer las características de los clientes desvinculados y sus motivos de abandono • Qué productos tienden a venderse con otros • ¿A qué grupos de clientes debo lanzar una campaña específica? • … Posibles utilidades
  • 16. 16 Tarjetas perforadas 5 ¼ 3 ½ 20 Mb 100 Mb 600 Mb 1 Gb 4 Gb 4,7 Gb 9 Gb 16 Gb 1 Tb <20 años 1 millón Evolución capacidad
  • 19. Algoritmos Algoritmos (estadística)  Conjunto de herramientas y técnicas para buscar patrones.  Componente estadística  Algunos pueden producir más de un resultado  Utilizar diferentes algoritmos para diferentes tareas  Combinar algoritmos para solucionar un problema particular
  • 20.  Decision Trees  Naïve Bayesian  Clustering  Sequence Clustering  Association Rules  Neural Network  Time Series  …. Algoritmos de minería
  • 21.  Qué clientes comprarán un determinado producto con una probabilidad X? Clasificación (Predicción)  Probabilidad de que un cliente tenga un determinado perfil? Segmentación  Recomendar un producto a un cliente que realiza una determianda compra Asociación  Probabilidad de que un cliente compre un producto en el futuro Predicción de secuencias  Predecir la venta de los próximos 5 meses y su error Forecasting Escenarios
  • 22. √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ Classification Regression Segmentaion Assoc. Analysis Anomaly Detect. Seq. Analysis Time series √ - second choice√ - first choice ¿Cuál escoger?
  • 23. Algorithm Description Decision Trees Finds the odds of an outcome based on values in a training set Association Rules Identifies relationships between cases Clustering Classifies cases into distinctive groups based on any attribute sets Naïve Bayes Clearly shows the differences in a particular variable for various data elements Sequence Clustering Groups or clusters data based on a sequence of previous events Time Series Analyzes and forecasts time-based data combining the powerof ARTXP (developed by Microsoft Research) for short-term predictionswith ARIMA (in SQL 2008) for long-term accuracy. Neural Nets Seeks to uncover non-intuitive relationships in data Linear Regression Determines the relationship between columns in order to predict an outcome Logistic Regression Determines the relationship between columns in order to evaluate the probability that a column will contain a specific state Algoritmos/Técnicas
  • 26. Arboles de decisión 262626  Arboles de Decisión (modelos predictivos)  Son útiles para predecir el valor de ciertos valores a partir de otros datos  Se realiza una clasificación, empezando por los atributos más significativos hasta terminar por los menos significativos.  De esta manera es posible establecer una serie de reglas sobre qué factores (atributos) afectan a cada caso del modelo y tener una base a partir de la cual estimar como responderán otros casos en el futuro (predicción) Riesgo Crediticio Casados Bajo:55% Alto:45% Solteros Bajo:45% Alto:55% Asalariados Bajo:65% Alto:35% Casados Bajo:45% Alto:55% Solteros Bajo:40% Alto:60% Autónomos Bajo:50% Alto:50% DeudasBajas Bajo:80% Alto:20% DeudasAltas 100% Todos 100%
  • 29. Amazon y Netflix Amazon: 35% de las ventas del producto provienen de recomendaciones Netflix: 75% del streaming de vídeo viene de recomendaciones
  • 33. 33  Análisis de Series Temporales Se utilizan para hallar predecir el comprotamiento de variables que dependen del tiempo. Se necesita una base de datos histórica. Se utiliza para la pevisión de demanda o stocks en un almacén o para la previsión del número de periódicos a enviar a un quiosco, etc. tiempo Ene Feb Mar Abr May Jun Jul Aug Sep Oct Nov Dic Ene PresentePasado Futuro ? Series temporales
  • 36. 36  Clustering Utilizado para realizar agrupaciones de registros de acuerdo a características comunes, obteniendo grupos de registros con comportamiento o características parecidas entre entre ellos y diferenciadas con los otros grupos.. El clustering es útil especialmente para realizar tareas de Marketing tales como segmentación de clientes. Clase1 Clase2 Clase3 Ingresos anuales Edad Clase1 Clase2 Clase3 Ingresos anuales Edad Clase1 Clase2 Clase3 Ingresos anuales Edad Clustering Casos Clústering
  • 38. 38 No todo es comercial….
  • 41. 41  ¿ Como se realiza el proceso de DM ? Modelo Motor DM Datos a tratar Motor DM Datos tratados Datos de entrenamiento Modelo Modelo Creación de un modelo
  • 42. 42  Uno de los pasos más importantes en un estudio es obtener la base de datos para el estudio.  Las bases de datos o muestras de estudio no sólo se elaboran con información interna de la empresa, sino que muchas veces se necesita de información externa.  Si no se dispone de la información correcta o de la información necesaria, el estudio o análisis puede resultar un fracaso o inducir a conclusiones equivocadas. Importante dedicar un extenso tiempo en obtener la información y también en validarla. A tener en cuenta
  • 43. 43 El siguiente paso a realizar para obtener la base preparada para el estudio es realizar unos procesos de calidad de los datos y de la muestra. • Comprobar que la muestra sea representativa (que represente a la población que queremos analizar) • Conocer cómo se han obtenido los datos, si han sido tratados o manipulados con anterioridad, etc. • Que no haya valores o registros erróneos • Que no haya valores perdidos o missing • … Todos aquellos registros erróneos no se deben tener en cuenta en el estudio. Calidad de los datos
  • 44. Estandarización Puntos de Tiempo • Examinar los últimos meses antes de abandono • Abandono de diferentes clientes ocurren en diferentes momentos 44
  • 47. 47 Interpretar los resultados “…no disponer de la información correcta / necesaria, puede ser peor…” Cuando Nemo encontró a (su) patrón “…no disponer de la información es malo…”
  • 48. Correlación vs Causalidad La causalidad es una relación entre un evento (causa) y un segundo evento (efecto), en la cual el segundo evento se entiende como consecuencia del primero Causalidad Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de las otras. Correlación
  • 50. He visto la luz… ¿?
  • 51. 51 Conclusiones • No es ciencia ficción, pero hay que trabajarlo • VOLUMEN: Grandes volúmenes de datos. • Minería no es necesariamente Big Data • ALGORITMO: • Cada algoritmo pudiera necesitar la información de entrada de una forma determinada. • Respuesta = ¿+? De un algoritmo • INTERPRETACION: Se deben hacer preguntas concretas y saber interpretar las respuestas. • MODELO: Importante contar con alguien experto en el tema para validarlo • MADUREZ en la empresa en proyectos de BI