SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Minería de datos
● Introducción
● KDD: Proceso de Extracción de conocimiento
● Procesos de un proyecto de minería de datos
● Técnicas de minería de datos
● Ciclo de un Proyecto de Minería de Datos
Índice
De donde venimos y hacia dónde
vamos
● La minería de datos (DM, Data Mining) consiste en la
extracción no trivial de información que reside de
manera implícita en los datos. Dicha información era
previamente desconocida y podrá resultar útil para
algún proceso. En otras palabras, la minería de datos
prepara, sondea y explora los datos para sacar la
información oculta en ellos.
¿Qué es la Minería de Datos?
Fuente: wikipedia
● Deducir conocimiento examinando los datos y realizando
predicciones
○ «examinar datos» examinar ejemplos de hechos conocidos
sobre «casos» utilizando sus atributos – «variables»
○ «conocimiento»: Patrones, Clusters, Reglas, Árboles de
Decisión, Redes Neuronales, Reglas de Asociación,….
● OLAP: Análisis orientado al modelo
● DM: Análisis orientado al dato
● Nombres alternativos: Análisis Predictivo
¿Qué es la Minería de Datos?
● La minería de datos (es la etapa de análisis de "Knowledge Discovery in
Databases" o KDD)
● Proceso de detectar la información procesable de los conjuntos
grandes de datos.
● Utiliza el análisis matemático para deducir los patrones y tendencias
que existen en los datos.
● Estos patrones no se pueden detectar mediante la exploración
tradicional de los datos porque las relaciones son demasiado complejas o
porque hay demasiado datos.
● Estos patrones y tendencias se pueden recopilar y definir como un
modelo de minería de datos.
¿Qué es la Minería de Datos?
KDD: Proceso de Extracción de
conocimiento
Como muestra la figura, las etapas del proceso KDD se
dividen en 5 fases y son:
1. Selección de datos
2. Preprocesamiento
3. Transformación
4. Data Mining
5. Interpretación y Evaluación
Como muestra la figura anterior, las etapas del proceso KDD se dividen en 5 fases y son:
1. Selección de datos. En esta etapa se determinan las fuentes de datos y el tipo de información
a utilizar. Es la etapa donde los datos relevantes para el análisis son extraídos desde la o las
fuentes de datos.
2. Preprocesamiento. Esta etapa consiste en la preparación y limpieza de los datos extraídos
desde las distintas fuentes de datos en una forma manejable, necesaria para las fases
posteriores. En esta etapa se utilizan diversas estrategias para manejar datos faltantes o en
blanco, datos inconsistentes o que están fuera de rango, obteniéndose al final una estructura de
datos adecuada para su posterior transformación.
3. Transformación. Consiste en el tratamiento preliminar de los datos, transformación y
generación de nuevas variables a partir de las ya existentes con una estructura de datos
apropiada. Aquí se realizan operaciones de agregación o normalización, consolidando los
datos de una forma necesaria para la fase siguiente.
4. Data Mining. Es la fase de modelamiento propiamente tal, en donde métodos inteligentes son
aplicados con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos,
potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos.
5. Interpretación y Evaluación. Se identifican los patrones obtenidos y que son realmente
interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados
obtenidos.
KDD: Proceso de Extracción de
conocimiento
Un proyecto de minería de datos tiene varias fases
necesarias que son, esencialmente:
● Comprensión del negocio y del problema que se quiere
resolver.
● Determinación, obtención y limpieza de los datos
necesarios.
● Creación de modelos matemáticos.
● Validación, comunicación, etc. de los resultados
obtenidos.
● Integración, si procede, de los resultados en un
sistema transaccional o similar.
Procesos de un proyecto de minería
de datos
● La relación entre todas estas fases sólo es
lineal sobre el papel. En realidad, es mucho
más compleja y esconde toda una jerarquía
de subfases. A través de la experiencia
acumulada en proyectos de minería de
datos se han ido desarrollando
metodologías que permiten gestionar esta
complejidad de una manera más o menos
uniforme.
Procesos de un proyecto de minería
de datos
● Generación de Recomendaciones
○ ¿Qué productos o servicios deberíamos de ofrecer a nuestros
clientes?
● Detección de anomalías
○ Detección de fraude
● Análisis de Rotación
○ ¿Qué clientes son más proclives de irse a la competencia?
● Gestión de Riesgos
○ ¿Debería de concederse el crédito?
● Segmentación de clientes
○ Clasificación de nuestros clientes
● Anuncios Orientados
○ Personalización de anuncios, contenido,…
Procesos de un proyecto de minería
de datos
● Previsión
○ ¿Cuánto venderemos el próximo semestre?
● Clasificación
○ Se asigna una categoría a cada caso. Cada caso tiene un conjunto de
atributos uno de ellos es el atributo clase.
○ Se busca un modelo que describa el atributo clase como una función de los
atributos de salida
● Agrupación
○ También conocido como segmentación
○ Identifica grupos naturales basándose en un conjunto de atributos
● Asociación
○ También conocido como análisis de cesta de la compra
● Regresión
○ Similar a clasificación pero con el objetivo de buscar patrones para determinar
un valor numérico
○ Ej.: Predicción de la velocidad del viento basada en temperatura presión de
aire y humedad
Procesos de un proyecto de minería
de datos
Las técnicas de la minería de datos provienen
de la Inteligencia artificial y de la estadística,
dichas técnicas, no son más que algoritmos,
más o menos sofisticados que se aplican sobre
un conjunto de datos para obtener unos
resultados.
Técnicas de minería de datos
Las técnicas más representativas son
● Redes neuronales
● Árboles de decisión
● Modelos estadísticos
● Agrupamiento o Clustering
● Algoritmos supervisados (o predictivos)
● Algoritmos no supervisados (o del descubrimiento
del conocimiento)
Técnicas de minería de datos
Redes neuronales
Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el
sistema nervioso de los animales. Se trata de un sistema
de interconexión de neuronas en una red que colabora
para producir un estímulo de salida. Algunos ejemplos de
red neuronal son:
● El Perceptrón
● El Perceptrón multicapa.
● Los Mapas Autoorganizados, también conocidos como
redes de Kohonen.
Técnicas de minería de datos
Árboles de decisión
Un árbol de decisión es un modelo de predicción utilizado
en el ámbito de la inteligencia artificial, dada una base de
datos se construyen estos diagramas de construcciones
lógicas, muy similares a los sistemas de predicción
basados en reglas, que sirven para representar y
categorizar una serie de condiciones que suceden de
forma sucesiva, para la resolución de un problema.
Ejemplos:
● Algoritmo ID3.
● Algoritmo C4.5.
Técnicas de minería de datos
Modelos estadísticos
● Es una expresión simbólica en forma de
igualdad o ecuación que se emplea en todos
los diseños experimentales y en la regresión
para indicar los diferentes factores que
modifican la variable de respuesta.
Técnicas de minería de datos
Agrupamiento o Clustering
Es un procedimiento de agrupación de una serie de
vectores según criterios habitualmente de distancia; se
tratará de disponer los vectores de entrada de forma que
estén más cercanos aquellos que tengan características
comunes.
Ejemplos:
● Algoritmo K-means.
● Algoritmo K-medoids.
Técnicas de minería de datos
Según el objetivo del análisis de los datos, los
algoritmos utilizados se clasifican en supervisados y
no supervisados (Weiss y Indurkhya, 1998):
● Algoritmos supervisados (o predictivos)
○ Predicen un dato (o un conjunto de ellos)
desconocido a priori, a partir de otros conocidos.
● Algoritmos no supervisados (o del descubrimiento del
conocimiento)
○ Se descubren patrones y tendencias en los datos.
Técnicas de minería de datos
Técnicas de minería de datos
Ejemplo
Comprador potencial de bicis:
Provincia Ciudad Edad Coche Distancia trabajo Bici
Ciclo de un Proyecto de Minería de
Datos
GRACIAS POR SU ATENCIÓN
info@alianzo.com
www.alianzo.com

Contenu connexe

Tendances

Sistemas de informacion gerencial.pdf
Sistemas de informacion gerencial.pdfSistemas de informacion gerencial.pdf
Sistemas de informacion gerencial.pdfLuisZevallos23
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosValeria Gavilanes
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDavid Alayón
 
Mapa conceptual sobre Seguridad de la Información
Mapa conceptual sobre Seguridad de la InformaciónMapa conceptual sobre Seguridad de la Información
Mapa conceptual sobre Seguridad de la Informaciónjmarquez23
 
Aspectos éticos y sociales en los sistemas de información (capitulo 4)
Aspectos éticos y sociales en los sistemas de información (capitulo 4)Aspectos éticos y sociales en los sistemas de información (capitulo 4)
Aspectos éticos y sociales en los sistemas de información (capitulo 4)Oscar Barahona
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandezAMDIA-Integra
 
Aspectos éticos y sociales en los sistemas de información
Aspectos éticos y sociales en los sistemas de informaciónAspectos éticos y sociales en los sistemas de información
Aspectos éticos y sociales en los sistemas de informaciónWilfredo Lainez
 
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...Victor Vargas
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosJesús Tramullas
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
VPN / VLAN por Frey Alfonso Santamaría Buitrago
VPN / VLAN por Frey Alfonso Santamaría BuitragoVPN / VLAN por Frey Alfonso Santamaría Buitrago
VPN / VLAN por Frey Alfonso Santamaría BuitragoUPTC
 

Tendances (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data mart
Data martData mart
Data mart
 
Sistemas de informacion gerencial.pdf
Sistemas de informacion gerencial.pdfSistemas de informacion gerencial.pdf
Sistemas de informacion gerencial.pdf
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datos
 
Big data
Big dataBig data
Big data
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Mapa conceptual sobre Seguridad de la Información
Mapa conceptual sobre Seguridad de la InformaciónMapa conceptual sobre Seguridad de la Información
Mapa conceptual sobre Seguridad de la Información
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
 
Aspectos éticos y sociales en los sistemas de información (capitulo 4)
Aspectos éticos y sociales en los sistemas de información (capitulo 4)Aspectos éticos y sociales en los sistemas de información (capitulo 4)
Aspectos éticos y sociales en los sistemas de información (capitulo 4)
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Base de datos
Base de datosBase de datos
Base de datos
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandez
 
Aspectos éticos y sociales en los sistemas de información
Aspectos éticos y sociales en los sistemas de informaciónAspectos éticos y sociales en los sistemas de información
Aspectos éticos y sociales en los sistemas de información
 
Iso 9000-y-las-bases-de-datos
Iso 9000-y-las-bases-de-datosIso 9000-y-las-bases-de-datos
Iso 9000-y-las-bases-de-datos
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...
Desarrollo de una Solución de Inteligencia de Negocios para Gestión del Alcan...
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
VPN / VLAN por Frey Alfonso Santamaría Buitrago
VPN / VLAN por Frey Alfonso Santamaría BuitragoVPN / VLAN por Frey Alfonso Santamaría Buitrago
VPN / VLAN por Frey Alfonso Santamaría Buitrago
 

En vedette

Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datosasuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuencialesMarilyn Jaramillo
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con RSoftware Guru
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASDMC Perú
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datosiloylan
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...c09271
 

En vedette (20)

Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SAS
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Data mining
Data miningData mining
Data mining
 
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
 

Similaire à Minería de datos (20)

Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Parte1
Parte1Parte1
Parte1
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Data science. todo lo que necesitas saber
Data science. todo lo que necesitas saberData science. todo lo que necesitas saber
Data science. todo lo que necesitas saber
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Mineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdfMineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdf
 

Plus de Alianzo Networks

Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Alianzo Networks
 
Informe diputados España en social media 2016
Informe diputados España en social media 2016Informe diputados España en social media 2016
Informe diputados España en social media 2016Alianzo Networks
 
Informe atención al cliente banca española
Informe atención al cliente banca españolaInforme atención al cliente banca española
Informe atención al cliente banca españolaAlianzo Networks
 
Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Alianzo Networks
 
Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Alianzo Networks
 
Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Alianzo Networks
 
Informe Banca México en Social Media
Informe Banca México en Social MediaInforme Banca México en Social Media
Informe Banca México en Social MediaAlianzo Networks
 
Informe Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaInforme Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaAlianzo Networks
 
10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social MediaAlianzo Networks
 
Banca convencional España 2015 marzo
Banca convencional España 2015 marzoBanca convencional España 2015 marzo
Banca convencional España 2015 marzoAlianzo Networks
 
Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Alianzo Networks
 
Energy Industry - October 2014
Energy Industry -  October 2014Energy Industry -  October 2014
Energy Industry - October 2014Alianzo Networks
 
Informe de Periódicos Españoles
Informe de Periódicos EspañolesInforme de Periódicos Españoles
Informe de Periódicos EspañolesAlianzo Networks
 
Special Report: European Banks
Special Report: European BanksSpecial Report: European Banks
Special Report: European BanksAlianzo Networks
 
Informe sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaInforme sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaAlianzo Networks
 
Oficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaOficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaAlianzo Networks
 
Restaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesRestaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesAlianzo Networks
 

Plus de Alianzo Networks (20)

Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016
 
Informe diputados España en social media 2016
Informe diputados España en social media 2016Informe diputados España en social media 2016
Informe diputados España en social media 2016
 
Informe atención al cliente banca española
Informe atención al cliente banca españolaInforme atención al cliente banca española
Informe atención al cliente banca española
 
Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015
 
Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015
 
Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015
 
Informe Banca México en Social Media
Informe Banca México en Social MediaInforme Banca México en Social Media
Informe Banca México en Social Media
 
Informe Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaInforme Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social Media
 
10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media
 
Banca convencional España 2015 marzo
Banca convencional España 2015 marzoBanca convencional España 2015 marzo
Banca convencional España 2015 marzo
 
Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015
 
Energy Industry - October 2014
Energy Industry -  October 2014Energy Industry -  October 2014
Energy Industry - October 2014
 
Informe de Periódicos Españoles
Informe de Periódicos EspañolesInforme de Periódicos Españoles
Informe de Periódicos Españoles
 
Special Report: European Banks
Special Report: European BanksSpecial Report: European Banks
Special Report: European Banks
 
Informe sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaInforme sobre bancos españoles en social media
Informe sobre bancos españoles en social media
 
Oficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaOficinas de turismo españolas en social media
Oficinas de turismo españolas en social media
 
Restaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesRestaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios sociales
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
NLP
NLPNLP
NLP
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 

Minería de datos

  • 2. ● Introducción ● KDD: Proceso de Extracción de conocimiento ● Procesos de un proyecto de minería de datos ● Técnicas de minería de datos ● Ciclo de un Proyecto de Minería de Datos Índice
  • 3. De donde venimos y hacia dónde vamos
  • 4. ● La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. ¿Qué es la Minería de Datos? Fuente: wikipedia
  • 5. ● Deducir conocimiento examinando los datos y realizando predicciones ○ «examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables» ○ «conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,…. ● OLAP: Análisis orientado al modelo ● DM: Análisis orientado al dato ● Nombres alternativos: Análisis Predictivo ¿Qué es la Minería de Datos?
  • 6. ● La minería de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) ● Proceso de detectar la información procesable de los conjuntos grandes de datos. ● Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. ● Estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos. ● Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. ¿Qué es la Minería de Datos?
  • 7. KDD: Proceso de Extracción de conocimiento Como muestra la figura, las etapas del proceso KDD se dividen en 5 fases y son: 1. Selección de datos 2. Preprocesamiento 3. Transformación 4. Data Mining 5. Interpretación y Evaluación
  • 8. Como muestra la figura anterior, las etapas del proceso KDD se dividen en 5 fases y son: 1. Selección de datos. En esta etapa se determinan las fuentes de datos y el tipo de información a utilizar. Es la etapa donde los datos relevantes para el análisis son extraídos desde la o las fuentes de datos. 2. Preprocesamiento. Esta etapa consiste en la preparación y limpieza de los datos extraídos desde las distintas fuentes de datos en una forma manejable, necesaria para las fases posteriores. En esta etapa se utilizan diversas estrategias para manejar datos faltantes o en blanco, datos inconsistentes o que están fuera de rango, obteniéndose al final una estructura de datos adecuada para su posterior transformación. 3. Transformación. Consiste en el tratamiento preliminar de los datos, transformación y generación de nuevas variables a partir de las ya existentes con una estructura de datos apropiada. Aquí se realizan operaciones de agregación o normalización, consolidando los datos de una forma necesaria para la fase siguiente. 4. Data Mining. Es la fase de modelamiento propiamente tal, en donde métodos inteligentes son aplicados con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos. 5. Interpretación y Evaluación. Se identifican los patrones obtenidos y que son realmente interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados obtenidos. KDD: Proceso de Extracción de conocimiento
  • 9. Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente: ● Comprensión del negocio y del problema que se quiere resolver. ● Determinación, obtención y limpieza de los datos necesarios. ● Creación de modelos matemáticos. ● Validación, comunicación, etc. de los resultados obtenidos. ● Integración, si procede, de los resultados en un sistema transaccional o similar. Procesos de un proyecto de minería de datos
  • 10. ● La relación entre todas estas fases sólo es lineal sobre el papel. En realidad, es mucho más compleja y esconde toda una jerarquía de subfases. A través de la experiencia acumulada en proyectos de minería de datos se han ido desarrollando metodologías que permiten gestionar esta complejidad de una manera más o menos uniforme. Procesos de un proyecto de minería de datos
  • 11. ● Generación de Recomendaciones ○ ¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes? ● Detección de anomalías ○ Detección de fraude ● Análisis de Rotación ○ ¿Qué clientes son más proclives de irse a la competencia? ● Gestión de Riesgos ○ ¿Debería de concederse el crédito? ● Segmentación de clientes ○ Clasificación de nuestros clientes ● Anuncios Orientados ○ Personalización de anuncios, contenido,… Procesos de un proyecto de minería de datos
  • 12. ● Previsión ○ ¿Cuánto venderemos el próximo semestre? ● Clasificación ○ Se asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase. ○ Se busca un modelo que describa el atributo clase como una función de los atributos de salida ● Agrupación ○ También conocido como segmentación ○ Identifica grupos naturales basándose en un conjunto de atributos ● Asociación ○ También conocido como análisis de cesta de la compra ● Regresión ○ Similar a clasificación pero con el objetivo de buscar patrones para determinar un valor numérico ○ Ej.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad Procesos de un proyecto de minería de datos
  • 13. Las técnicas de la minería de datos provienen de la Inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Técnicas de minería de datos
  • 14. Las técnicas más representativas son ● Redes neuronales ● Árboles de decisión ● Modelos estadísticos ● Agrupamiento o Clustering ● Algoritmos supervisados (o predictivos) ● Algoritmos no supervisados (o del descubrimiento del conocimiento) Técnicas de minería de datos
  • 15. Redes neuronales Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: ● El Perceptrón ● El Perceptrón multicapa. ● Los Mapas Autoorganizados, también conocidos como redes de Kohonen. Técnicas de minería de datos
  • 16. Árboles de decisión Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Ejemplos: ● Algoritmo ID3. ● Algoritmo C4.5. Técnicas de minería de datos
  • 17. Modelos estadísticos ● Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. Técnicas de minería de datos
  • 18. Agrupamiento o Clustering Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: ● Algoritmo K-means. ● Algoritmo K-medoids. Técnicas de minería de datos
  • 19. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998): ● Algoritmos supervisados (o predictivos) ○ Predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. ● Algoritmos no supervisados (o del descubrimiento del conocimiento) ○ Se descubren patrones y tendencias en los datos. Técnicas de minería de datos
  • 20. Técnicas de minería de datos Ejemplo Comprador potencial de bicis: Provincia Ciudad Edad Coche Distancia trabajo Bici
  • 21. Ciclo de un Proyecto de Minería de Datos
  • 22. GRACIAS POR SU ATENCIÓN info@alianzo.com www.alianzo.com