SlideShare une entreprise Scribd logo
1  sur  30
Minería de datos
Dr. Francisco J. Mata
1
Introducción a laIntroducción a la
minería de datosminería de datos
Tema 1Tema 1
2
Minería de datos
Dr. Francisco J. Mata
TemarioTemario
 ¿Qué es minería de datos?¿Qué es minería de datos?
 ¿Quién usa minería de datos?¿Quién usa minería de datos?
 ¿Por qué de la minería de datos?¿Por qué de la minería de datos?
 Ciclo virtuoso de la minería de datosCiclo virtuoso de la minería de datos
 Resumen de principales técnicas de minería deResumen de principales técnicas de minería de
datosdatos
3
Minería de datos
Dr. Francisco J. Mata
Definición de minería de datosDefinición de minería de datos
 Minería de datos es la exploración y análisis deMinería de datos es la exploración y análisis de
grandes cantidades de datos con el objeto degrandes cantidades de datos con el objeto de
encontrar patrones y reglas significativasencontrar patrones y reglas significativas
(conocimiento)(conocimiento)
4
Minería de datos
Dr. Francisco J. Mata
Metas de la minería de datosMetas de la minería de datos
 Permitir a una organización MEJORAR _____Permitir a una organización MEJORAR _____
a través de un mejor CONOCIMIENTO dea través de un mejor CONOCIMIENTO de
______________
 Mejorar la ventaja competitivaMejorar la ventaja competitiva
5
Minería de datos
Dr. Francisco J. Mata
La minería de datos es un campoLa minería de datos es un campo
multidisciplinariomultidisciplinario
Minería de datos
Inteligencia
Artificial
(“Machine
Learning”)
Estadística
Bases de
Datos
(VLDB)
Graficación y
visualización
Ciencias de
la información
Otras
disciplinas
6
Minería de datos
Dr. Francisco J. Mata
La minería de datos es un subconjunto deLa minería de datos es un subconjunto de
la inteligencia de negociosla inteligencia de negocios
7
Minería de datos
Dr. Francisco J. Mata
Minería de datosMinería de datos
 Proceso de utilizar datos “crudos” para inferirProceso de utilizar datos “crudos” para inferir
importantes relaciones entre ellosimportantes relaciones entre ellos
 Colección de técnicas poderosas para analizar grandesColección de técnicas poderosas para analizar grandes
volúmenes de datosvolúmenes de datos
 No existe un solo enfoque para minería de datos sinoNo existe un solo enfoque para minería de datos sino
un conjunto de técnicas que se pueden utilizar deun conjunto de técnicas que se pueden utilizar de
manera independiente o en combinaciónmanera independiente o en combinación
 Existe una relación con la estadística, aunqueExiste una relación con la estadística, aunque
frecuentemente se separan las técnicas que no estánfrecuentemente se separan las técnicas que no están
basadas en métodos estadísticosbasadas en métodos estadísticos
8
Minería de datos
Dr. Francisco J. Mata
Tipos de aplicaciones de la mineríaTipos de aplicaciones de la minería
de datosde datos
 Aplicaciones o problemas de minería de datosAplicaciones o problemas de minería de datos
pueden clasificarse en las siguientes categoríaspueden clasificarse en las siguientes categorías
 ClasificaciónClasificación
 EstimaciónEstimación
 PronósticoPronóstico
 AsociaciónAsociación
 Agrupación o segmentaciónAgrupación o segmentación
9
Minería de datos
Dr. Francisco J. Mata
ClasificaciónClasificación
 Examinar las características de un nuevo objetoExaminar las características de un nuevo objeto
y asignarle una clase o categoría de acuerdo a uny asignarle una clase o categoría de acuerdo a un
conjunto de tales objetos previamente definidoconjunto de tales objetos previamente definido
 Ejemplos:Ejemplos:
 Clasificar aplicaciones a crédito como bajo, medio yClasificar aplicaciones a crédito como bajo, medio y
alto riesgoalto riesgo
 Detectar reclamos fraudulentos de segurosDetectar reclamos fraudulentos de seguros
10
Minería de datos
Dr. Francisco J. Mata
EstimaciónEstimación
 Relacionado con clasificaciónRelacionado con clasificación
 Mientras clasificación asigna un valor discreto,Mientras clasificación asigna un valor discreto,
estimación produce un valor continuoestimación produce un valor continuo
 Ejemplos:Ejemplos:
 Estimar el precio de una viviendaEstimar el precio de una vivienda
 Estimar el ingreso total de una familiaEstimar el ingreso total de una familia
11
Minería de datos
Dr. Francisco J. Mata
PronósticoPronóstico
 Predecir un valor futuro con base a valoresPredecir un valor futuro con base a valores
pasadospasados
 Ejemplos:Ejemplos:
 Predecir cuánto efectivo requerirá un cajeroPredecir cuánto efectivo requerirá un cajero
automático en un fin de semanaautomático en un fin de semana
12
Minería de datos
Dr. Francisco J. Mata
AsociaciónAsociación
 Determinar cosas u objetos que van juntosDeterminar cosas u objetos que van juntos
 Ejemplo:Ejemplo:
 Determinar que productos se adquierenDeterminar que productos se adquieren
conjuntamente en un supermercadoconjuntamente en un supermercado
13
Minería de datos
Dr. Francisco J. Mata
Agrupación o segmentaciónAgrupación o segmentación
 Dividir una población en un número de gruposDividir una población en un número de grupos
más homogéneosmás homogéneos
 No depende de clases pre-definidas a diferenciaNo depende de clases pre-definidas a diferencia
de clasificaciónde clasificación
 Ejemplo:Ejemplo:
 Dividir la base de clientes de acuerdo con los hábitosDividir la base de clientes de acuerdo con los hábitos
de consumode consumo
14
Minería de datos
Dr. Francisco J. Mata
Usos de la minería de datosUsos de la minería de datos
 Administración de la relación con los clientes:Administración de la relación con los clientes:
 Identificar nuevos clientes potenciales para aumentarIdentificar nuevos clientes potenciales para aumentar
ventasventas
 Ampliar la base de cliente con la mínima inversiónAmpliar la base de cliente con la mínima inversión
por parte de la empresapor parte de la empresa
 Retener clientes existentes evitando que se vayan a laRetener clientes existentes evitando que se vayan a la
competencia (“attrition”)competencia (“attrition”)
 Vender más a clientes existentes (“ventas cruzadas”)Vender más a clientes existentes (“ventas cruzadas”)
15
Minería de datos
Dr. Francisco J. Mata
Usos de la minería de datosUsos de la minería de datos
 Detección de fraudes en el uso de tarjetas deDetección de fraudes en el uso de tarjetas de
créditocrédito
 Determinar patrones que puedan estarDeterminar patrones que puedan estar
relacionados con lavado de dinerorelacionados con lavado de dinero
 Determinar el precio de una casa con base enDeterminar el precio de una casa con base en
sus características y el precio de otras casassus características y el precio de otras casas
vendidasvendidas
16
Minería de datos
Dr. Francisco J. Mata
Ejercicio en gruposEjercicio en grupos
 Equipos: 3 personas máximoEquipos: 3 personas máximo
 Objetivos:Objetivos:
 Identificar situaciones concretas para utilizar laIdentificar situaciones concretas para utilizar la
minería de datos (10 minutos)minería de datos (10 minutos)
 Reportar a la clase verbalmente (3 minutos)Reportar a la clase verbalmente (3 minutos)
 Las situaciones identificadasLas situaciones identificadas
 Tipo de aplicación o problema de minería de datosTipo de aplicación o problema de minería de datos
relacionadorelacionado
 Los beneficios esperados de aplicar la minería de datosLos beneficios esperados de aplicar la minería de datos
17
Minería de datos
Dr. Francisco J. Mata
Usos de la minería de datosUsos de la minería de datos
 Usos de la minería de datos se han ampliado conUsos de la minería de datos se han ampliado con
el comercio electrónicoel comercio electrónico
18
Minería de datos
Dr. Francisco J. Mata
RecomendacionesRecomendaciones
19
Minería de datos
Dr. Francisco J. Mata
Disponibilidad de datos deDisponibilidad de datos de
transaccionestransacciones
20
Minería de datos
Dr. Francisco J. Mata
¿Por qué de la minería de datos?¿Por qué de la minería de datos?
 Datos se encuentran disponiblesDatos se encuentran disponibles
 Poder computacional es cada vez menos costosoPoder computacional es cada vez menos costoso
 Las presiones competitivas son enormesLas presiones competitivas son enormes
 Software para minería de datos se encuentraSoftware para minería de datos se encuentra
disponibledisponible
21
Minería de datos
Dr. Francisco J. Mata
Ciclo virtuoso de la minería de datosCiclo virtuoso de la minería de datos
22
Minería de datos
Dr. Francisco J. Mata
Principales técnicas de minería dePrincipales técnicas de minería de
datosdatos
 Análisis de canasta de supermercadoAnálisis de canasta de supermercado
 K vecinos más cercanosK vecinos más cercanos
 Detección de gruposDetección de grupos
 Análisis de encadenamientoAnálisis de encadenamiento
 Árboles de decisiónÁrboles de decisión
 Redes neuronales artificialesRedes neuronales artificiales
 Algoritmos genéticosAlgoritmos genéticos
23
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Análisis de canasta de supermercadoAnálisis de canasta de supermercado
 Agrupar objetos que aparecen juntosAgrupar objetos que aparecen juntos
 Ejemplos:Ejemplos:
 Pañales y cervezasPañales y cervezas
24
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 K vecinos más cercanosK vecinos más cercanos
 Determinar los K vecinos más cercanos en instanciasDeterminar los K vecinos más cercanos en instancias
conocidos con el objeto de clasificar o hacer unaconocidos con el objeto de clasificar o hacer una
predicción sobre una instancia desconocidapredicción sobre una instancia desconocida
 Ejemplo: Dado un reclamo para un seguroEjemplo: Dado un reclamo para un seguro
determinar basado en reclamos similares (vecinos) sideterminar basado en reclamos similares (vecinos) si
se debe pagar o investigarse debe pagar o investigar
25
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Detección de gruposDetección de grupos
 Encontrar objetos similares entre síEncontrar objetos similares entre sí
 Ejemplos: tipificar clases de clientesEjemplos: tipificar clases de clientes
26
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Análisis de encadenamientoAnálisis de encadenamiento
 Encuentra relaciones entre objetos de acuerdo conEncuentra relaciones entre objetos de acuerdo con
patronespatrones
 Relacionado con la teoría de grafosRelacionado con la teoría de grafos
 Ejemplos:Ejemplos:
 Relaciones entre individuos basados en llamadasRelaciones entre individuos basados en llamadas
telefónicastelefónicas
 Relaciones entre casos criminales de acuerdo con susRelaciones entre casos criminales de acuerdo con sus
característicascaracterísticas
27
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Árboles de decisiónÁrboles de decisión
 Dividir objetos en grupos asociando reglas para laDividir objetos en grupos asociando reglas para la
asignación de los objetos en su correspondienteasignación de los objetos en su correspondiente
grupogrupo
 Ejemplos: determinar el sexo o grupo de edad deEjemplos: determinar el sexo o grupo de edad de
una persona en función a una serie de preguntasuna persona en función a una serie de preguntas
contestadascontestadas
28
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Redes neuronales artificialesRedes neuronales artificiales
 Más común de las técnicas y para algunos sinónimoMás común de las técnicas y para algunos sinónimo
de minería de datosde minería de datos
 Modelos simples de interconexiones neuronales en elModelos simples de interconexiones neuronales en el
cerebro que aprenden de un conjunto decerebro que aprenden de un conjunto de
adiestramiento y generalizan patrones dentro de éladiestramiento y generalizan patrones dentro de él
con el objeto de clasificar, estimar o predecircon el objeto de clasificar, estimar o predecir
 Ejemplo: estimar el valor de una casa tomando enEjemplo: estimar el valor de una casa tomando en
cuenta el precio pagado por casas similarescuenta el precio pagado por casas similares
29
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Algoritmos genéticosAlgoritmos genéticos
 Aplican la mecánica de la genética y la selecciónAplican la mecánica de la genética y la selección
natural para encontrar un conjunto de parámetrosnatural para encontrar un conjunto de parámetros
óptimos para una función predictivaóptimos para una función predictiva
 Utilizados para entrenar redes neuronales artificialesUtilizados para entrenar redes neuronales artificiales
30
Minería de datos
Dr. Francisco J. Mata
Resumen técnicas de minería deResumen técnicas de minería de
datosdatos
 Técnicas mencionadas pueden utilizarse en variasTécnicas mencionadas pueden utilizarse en varias
aplicaciones o problemas de minería de datosaplicaciones o problemas de minería de datos
 Ejemplo: árboles de decisión sirven para detectar grupos,Ejemplo: árboles de decisión sirven para detectar grupos,
clasificar y predecirclasificar y predecir
 Varias técnicas pueden ser utilizadas en una mismaVarias técnicas pueden ser utilizadas en una misma
aplicación o problema de minería de datosaplicación o problema de minería de datos
 Ejemplo: K vecinos más próximos, árboles de decisión yEjemplo: K vecinos más próximos, árboles de decisión y
redes neuronales artificiales pueden utilizarse pararedes neuronales artificiales pueden utilizarse para
clasificaciónclasificación

Contenu connexe

Tendances

Introducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftIntroducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftJOSE AHIAS LOPEZ PORTILLO
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
Introducción a la Ciencia de Datos
Introducción a la Ciencia de DatosIntroducción a la Ciencia de Datos
Introducción a la Ciencia de DatosEsteban Vallejo
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Data mining (lecture 1 & 2) conecpts and techniques
Data mining (lecture 1 & 2) conecpts and techniquesData mining (lecture 1 & 2) conecpts and techniques
Data mining (lecture 1 & 2) conecpts and techniquesSaif Ullah
 
Data Mining: Applying data mining
Data Mining: Applying data miningData Mining: Applying data mining
Data Mining: Applying data miningDataminingTools Inc
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
 
Sistemas de información típicos en la etapa de inicio (1)
Sistemas de información típicos en la etapa de inicio (1)Sistemas de información típicos en la etapa de inicio (1)
Sistemas de información típicos en la etapa de inicio (1)SamyNu
 
Base de Datos: introduccion a sistemas de base de datos
Base de Datos: introduccion a  sistemas de base de datosBase de Datos: introduccion a  sistemas de base de datos
Base de Datos: introduccion a sistemas de base de datosYefri Altamirano
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosFranklin Parrales Bravo
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid MinerLPI ONG
 

Tendances (20)

IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Introducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftIntroducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con Microsoft
 
Introducción a machine learning
Introducción a machine learningIntroducción a machine learning
Introducción a machine learning
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
Introducción a la Ciencia de Datos
Introducción a la Ciencia de DatosIntroducción a la Ciencia de Datos
Introducción a la Ciencia de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Data mining (lecture 1 & 2) conecpts and techniques
Data mining (lecture 1 & 2) conecpts and techniquesData mining (lecture 1 & 2) conecpts and techniques
Data mining (lecture 1 & 2) conecpts and techniques
 
Data Mining: Applying data mining
Data Mining: Applying data miningData Mining: Applying data mining
Data Mining: Applying data mining
 
Big data
Big dataBig data
Big data
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big Data
Big DataBig Data
Big Data
 
Fundamentos de las bases de datos
Fundamentos de las bases de datosFundamentos de las bases de datos
Fundamentos de las bases de datos
 
El conocimiento del cliente, clave de competitividad (1)
El conocimiento del cliente, clave de competitividad (1)El conocimiento del cliente, clave de competitividad (1)
El conocimiento del cliente, clave de competitividad (1)
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 
Sistemas de información típicos en la etapa de inicio (1)
Sistemas de información típicos en la etapa de inicio (1)Sistemas de información típicos en la etapa de inicio (1)
Sistemas de información típicos en la etapa de inicio (1)
 
Base de Datos: introduccion a sistemas de base de datos
Base de Datos: introduccion a  sistemas de base de datosBase de Datos: introduccion a  sistemas de base de datos
Base de Datos: introduccion a sistemas de base de datos
 
Md unidad 2 2.1 limpieza de datos
Md unidad 2   2.1 limpieza de datosMd unidad 2   2.1 limpieza de datos
Md unidad 2 2.1 limpieza de datos
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid Miner
 

En vedette (20)

mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 
Datamingse
DatamingseDatamingse
Datamingse
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentación colombia junio 2011
Presentación colombia   junio 2011Presentación colombia   junio 2011
Presentación colombia junio 2011
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 

Similaire à MIneria de datos

mineria de datos
mineria  de datosmineria  de datos
mineria de datosKaty Tumpi
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Daniela Bedascarrasbure
 
Tecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.pptTecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.pptVAOC1984
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010cristian
 
2. sistemas de información en marketing
2. sistemas de información en marketing2. sistemas de información en marketing
2. sistemas de información en marketingAlan Ms
 
Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Nestor Montaño
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...alexhernmora
 
Inv mercado inmediatas estratgicas 1234556
Inv mercado inmediatas estratgicas 1234556Inv mercado inmediatas estratgicas 1234556
Inv mercado inmediatas estratgicas 1234556BayardoPrado1
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Data Mining
Data MiningData Mining
Data Miningbrobelo
 

Similaire à MIneria de datos (20)

mineria de datos
mineria  de datosmineria  de datos
mineria de datos
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21
 
Tecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.pptTecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.ppt
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010
 
2. sistemas de información en marketing
2. sistemas de información en marketing2. sistemas de información en marketing
2. sistemas de información en marketing
 
Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...Importancia de la estadística en empresas e instituciones - Presente y futuro...
Importancia de la estadística en empresas e instituciones - Presente y futuro...
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Data Minig
Data MinigData Minig
Data Minig
 
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...
Caso practico 3 expocision de sistemas de informacion e inverstigacion de mer...
 
02 extraccion de conocimiento
02 extraccion de conocimiento02 extraccion de conocimiento
02 extraccion de conocimiento
 
Inv mercado inmediatas estratgicas 1234556
Inv mercado inmediatas estratgicas 1234556Inv mercado inmediatas estratgicas 1234556
Inv mercado inmediatas estratgicas 1234556
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Data mining
Data mining Data mining
Data mining
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
7[1]
7[1]7[1]
7[1]
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
 
Introduccion a big data clase 1
Introduccion a big data clase 1Introduccion a big data clase 1
Introduccion a big data clase 1
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Data Mining
Data MiningData Mining
Data Mining
 

Dernier

Corte de luz 2024 Guayaquil Guayas ecuad
Corte de luz 2024 Guayaquil Guayas ecuadCorte de luz 2024 Guayaquil Guayas ecuad
Corte de luz 2024 Guayaquil Guayas ecuadJonathanHctorSilvaRo
 
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...CENECOnline
 
Emprende en SPA Segundo día CENEC Mexico
Emprende en SPA Segundo día CENEC MexicoEmprende en SPA Segundo día CENEC Mexico
Emprende en SPA Segundo día CENEC MexicoCENECOnline
 
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdf
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdfAntenas, tipos de antenas, diseño basico de una antena y parámetros.pdf
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdfperezreyesalberto10
 
Presentacion Seguridad y Privacidad en la Web
Presentacion Seguridad y Privacidad en la WebPresentacion Seguridad y Privacidad en la Web
Presentacion Seguridad y Privacidad en la Webfernandalunag19
 
Biología Células Musculares presentación
Biología Células Musculares presentaciónBiología Células Musculares presentación
Biología Células Musculares presentaciónStephanyJara1
 

Dernier (6)

Corte de luz 2024 Guayaquil Guayas ecuad
Corte de luz 2024 Guayaquil Guayas ecuadCorte de luz 2024 Guayaquil Guayas ecuad
Corte de luz 2024 Guayaquil Guayas ecuad
 
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...
¡Descubre el Poder del Masaje Holístico en nuestra Primera Sesión del Seminar...
 
Emprende en SPA Segundo día CENEC Mexico
Emprende en SPA Segundo día CENEC MexicoEmprende en SPA Segundo día CENEC Mexico
Emprende en SPA Segundo día CENEC Mexico
 
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdf
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdfAntenas, tipos de antenas, diseño basico de una antena y parámetros.pdf
Antenas, tipos de antenas, diseño basico de una antena y parámetros.pdf
 
Presentacion Seguridad y Privacidad en la Web
Presentacion Seguridad y Privacidad en la WebPresentacion Seguridad y Privacidad en la Web
Presentacion Seguridad y Privacidad en la Web
 
Biología Células Musculares presentación
Biología Células Musculares presentaciónBiología Células Musculares presentación
Biología Células Musculares presentación
 

MIneria de datos

  • 1. Minería de datos Dr. Francisco J. Mata 1 Introducción a laIntroducción a la minería de datosminería de datos Tema 1Tema 1
  • 2. 2 Minería de datos Dr. Francisco J. Mata TemarioTemario  ¿Qué es minería de datos?¿Qué es minería de datos?  ¿Quién usa minería de datos?¿Quién usa minería de datos?  ¿Por qué de la minería de datos?¿Por qué de la minería de datos?  Ciclo virtuoso de la minería de datosCiclo virtuoso de la minería de datos  Resumen de principales técnicas de minería deResumen de principales técnicas de minería de datosdatos
  • 3. 3 Minería de datos Dr. Francisco J. Mata Definición de minería de datosDefinición de minería de datos  Minería de datos es la exploración y análisis deMinería de datos es la exploración y análisis de grandes cantidades de datos con el objeto degrandes cantidades de datos con el objeto de encontrar patrones y reglas significativasencontrar patrones y reglas significativas (conocimiento)(conocimiento)
  • 4. 4 Minería de datos Dr. Francisco J. Mata Metas de la minería de datosMetas de la minería de datos  Permitir a una organización MEJORAR _____Permitir a una organización MEJORAR _____ a través de un mejor CONOCIMIENTO dea través de un mejor CONOCIMIENTO de ______________  Mejorar la ventaja competitivaMejorar la ventaja competitiva
  • 5. 5 Minería de datos Dr. Francisco J. Mata La minería de datos es un campoLa minería de datos es un campo multidisciplinariomultidisciplinario Minería de datos Inteligencia Artificial (“Machine Learning”) Estadística Bases de Datos (VLDB) Graficación y visualización Ciencias de la información Otras disciplinas
  • 6. 6 Minería de datos Dr. Francisco J. Mata La minería de datos es un subconjunto deLa minería de datos es un subconjunto de la inteligencia de negociosla inteligencia de negocios
  • 7. 7 Minería de datos Dr. Francisco J. Mata Minería de datosMinería de datos  Proceso de utilizar datos “crudos” para inferirProceso de utilizar datos “crudos” para inferir importantes relaciones entre ellosimportantes relaciones entre ellos  Colección de técnicas poderosas para analizar grandesColección de técnicas poderosas para analizar grandes volúmenes de datosvolúmenes de datos  No existe un solo enfoque para minería de datos sinoNo existe un solo enfoque para minería de datos sino un conjunto de técnicas que se pueden utilizar deun conjunto de técnicas que se pueden utilizar de manera independiente o en combinaciónmanera independiente o en combinación  Existe una relación con la estadística, aunqueExiste una relación con la estadística, aunque frecuentemente se separan las técnicas que no estánfrecuentemente se separan las técnicas que no están basadas en métodos estadísticosbasadas en métodos estadísticos
  • 8. 8 Minería de datos Dr. Francisco J. Mata Tipos de aplicaciones de la mineríaTipos de aplicaciones de la minería de datosde datos  Aplicaciones o problemas de minería de datosAplicaciones o problemas de minería de datos pueden clasificarse en las siguientes categoríaspueden clasificarse en las siguientes categorías  ClasificaciónClasificación  EstimaciónEstimación  PronósticoPronóstico  AsociaciónAsociación  Agrupación o segmentaciónAgrupación o segmentación
  • 9. 9 Minería de datos Dr. Francisco J. Mata ClasificaciónClasificación  Examinar las características de un nuevo objetoExaminar las características de un nuevo objeto y asignarle una clase o categoría de acuerdo a uny asignarle una clase o categoría de acuerdo a un conjunto de tales objetos previamente definidoconjunto de tales objetos previamente definido  Ejemplos:Ejemplos:  Clasificar aplicaciones a crédito como bajo, medio yClasificar aplicaciones a crédito como bajo, medio y alto riesgoalto riesgo  Detectar reclamos fraudulentos de segurosDetectar reclamos fraudulentos de seguros
  • 10. 10 Minería de datos Dr. Francisco J. Mata EstimaciónEstimación  Relacionado con clasificaciónRelacionado con clasificación  Mientras clasificación asigna un valor discreto,Mientras clasificación asigna un valor discreto, estimación produce un valor continuoestimación produce un valor continuo  Ejemplos:Ejemplos:  Estimar el precio de una viviendaEstimar el precio de una vivienda  Estimar el ingreso total de una familiaEstimar el ingreso total de una familia
  • 11. 11 Minería de datos Dr. Francisco J. Mata PronósticoPronóstico  Predecir un valor futuro con base a valoresPredecir un valor futuro con base a valores pasadospasados  Ejemplos:Ejemplos:  Predecir cuánto efectivo requerirá un cajeroPredecir cuánto efectivo requerirá un cajero automático en un fin de semanaautomático en un fin de semana
  • 12. 12 Minería de datos Dr. Francisco J. Mata AsociaciónAsociación  Determinar cosas u objetos que van juntosDeterminar cosas u objetos que van juntos  Ejemplo:Ejemplo:  Determinar que productos se adquierenDeterminar que productos se adquieren conjuntamente en un supermercadoconjuntamente en un supermercado
  • 13. 13 Minería de datos Dr. Francisco J. Mata Agrupación o segmentaciónAgrupación o segmentación  Dividir una población en un número de gruposDividir una población en un número de grupos más homogéneosmás homogéneos  No depende de clases pre-definidas a diferenciaNo depende de clases pre-definidas a diferencia de clasificaciónde clasificación  Ejemplo:Ejemplo:  Dividir la base de clientes de acuerdo con los hábitosDividir la base de clientes de acuerdo con los hábitos de consumode consumo
  • 14. 14 Minería de datos Dr. Francisco J. Mata Usos de la minería de datosUsos de la minería de datos  Administración de la relación con los clientes:Administración de la relación con los clientes:  Identificar nuevos clientes potenciales para aumentarIdentificar nuevos clientes potenciales para aumentar ventasventas  Ampliar la base de cliente con la mínima inversiónAmpliar la base de cliente con la mínima inversión por parte de la empresapor parte de la empresa  Retener clientes existentes evitando que se vayan a laRetener clientes existentes evitando que se vayan a la competencia (“attrition”)competencia (“attrition”)  Vender más a clientes existentes (“ventas cruzadas”)Vender más a clientes existentes (“ventas cruzadas”)
  • 15. 15 Minería de datos Dr. Francisco J. Mata Usos de la minería de datosUsos de la minería de datos  Detección de fraudes en el uso de tarjetas deDetección de fraudes en el uso de tarjetas de créditocrédito  Determinar patrones que puedan estarDeterminar patrones que puedan estar relacionados con lavado de dinerorelacionados con lavado de dinero  Determinar el precio de una casa con base enDeterminar el precio de una casa con base en sus características y el precio de otras casassus características y el precio de otras casas vendidasvendidas
  • 16. 16 Minería de datos Dr. Francisco J. Mata Ejercicio en gruposEjercicio en grupos  Equipos: 3 personas máximoEquipos: 3 personas máximo  Objetivos:Objetivos:  Identificar situaciones concretas para utilizar laIdentificar situaciones concretas para utilizar la minería de datos (10 minutos)minería de datos (10 minutos)  Reportar a la clase verbalmente (3 minutos)Reportar a la clase verbalmente (3 minutos)  Las situaciones identificadasLas situaciones identificadas  Tipo de aplicación o problema de minería de datosTipo de aplicación o problema de minería de datos relacionadorelacionado  Los beneficios esperados de aplicar la minería de datosLos beneficios esperados de aplicar la minería de datos
  • 17. 17 Minería de datos Dr. Francisco J. Mata Usos de la minería de datosUsos de la minería de datos  Usos de la minería de datos se han ampliado conUsos de la minería de datos se han ampliado con el comercio electrónicoel comercio electrónico
  • 18. 18 Minería de datos Dr. Francisco J. Mata RecomendacionesRecomendaciones
  • 19. 19 Minería de datos Dr. Francisco J. Mata Disponibilidad de datos deDisponibilidad de datos de transaccionestransacciones
  • 20. 20 Minería de datos Dr. Francisco J. Mata ¿Por qué de la minería de datos?¿Por qué de la minería de datos?  Datos se encuentran disponiblesDatos se encuentran disponibles  Poder computacional es cada vez menos costosoPoder computacional es cada vez menos costoso  Las presiones competitivas son enormesLas presiones competitivas son enormes  Software para minería de datos se encuentraSoftware para minería de datos se encuentra disponibledisponible
  • 21. 21 Minería de datos Dr. Francisco J. Mata Ciclo virtuoso de la minería de datosCiclo virtuoso de la minería de datos
  • 22. 22 Minería de datos Dr. Francisco J. Mata Principales técnicas de minería dePrincipales técnicas de minería de datosdatos  Análisis de canasta de supermercadoAnálisis de canasta de supermercado  K vecinos más cercanosK vecinos más cercanos  Detección de gruposDetección de grupos  Análisis de encadenamientoAnálisis de encadenamiento  Árboles de decisiónÁrboles de decisión  Redes neuronales artificialesRedes neuronales artificiales  Algoritmos genéticosAlgoritmos genéticos
  • 23. 23 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Análisis de canasta de supermercadoAnálisis de canasta de supermercado  Agrupar objetos que aparecen juntosAgrupar objetos que aparecen juntos  Ejemplos:Ejemplos:  Pañales y cervezasPañales y cervezas
  • 24. 24 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  K vecinos más cercanosK vecinos más cercanos  Determinar los K vecinos más cercanos en instanciasDeterminar los K vecinos más cercanos en instancias conocidos con el objeto de clasificar o hacer unaconocidos con el objeto de clasificar o hacer una predicción sobre una instancia desconocidapredicción sobre una instancia desconocida  Ejemplo: Dado un reclamo para un seguroEjemplo: Dado un reclamo para un seguro determinar basado en reclamos similares (vecinos) sideterminar basado en reclamos similares (vecinos) si se debe pagar o investigarse debe pagar o investigar
  • 25. 25 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Detección de gruposDetección de grupos  Encontrar objetos similares entre síEncontrar objetos similares entre sí  Ejemplos: tipificar clases de clientesEjemplos: tipificar clases de clientes
  • 26. 26 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Análisis de encadenamientoAnálisis de encadenamiento  Encuentra relaciones entre objetos de acuerdo conEncuentra relaciones entre objetos de acuerdo con patronespatrones  Relacionado con la teoría de grafosRelacionado con la teoría de grafos  Ejemplos:Ejemplos:  Relaciones entre individuos basados en llamadasRelaciones entre individuos basados en llamadas telefónicastelefónicas  Relaciones entre casos criminales de acuerdo con susRelaciones entre casos criminales de acuerdo con sus característicascaracterísticas
  • 27. 27 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Árboles de decisiónÁrboles de decisión  Dividir objetos en grupos asociando reglas para laDividir objetos en grupos asociando reglas para la asignación de los objetos en su correspondienteasignación de los objetos en su correspondiente grupogrupo  Ejemplos: determinar el sexo o grupo de edad deEjemplos: determinar el sexo o grupo de edad de una persona en función a una serie de preguntasuna persona en función a una serie de preguntas contestadascontestadas
  • 28. 28 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Redes neuronales artificialesRedes neuronales artificiales  Más común de las técnicas y para algunos sinónimoMás común de las técnicas y para algunos sinónimo de minería de datosde minería de datos  Modelos simples de interconexiones neuronales en elModelos simples de interconexiones neuronales en el cerebro que aprenden de un conjunto decerebro que aprenden de un conjunto de adiestramiento y generalizan patrones dentro de éladiestramiento y generalizan patrones dentro de él con el objeto de clasificar, estimar o predecircon el objeto de clasificar, estimar o predecir  Ejemplo: estimar el valor de una casa tomando enEjemplo: estimar el valor de una casa tomando en cuenta el precio pagado por casas similarescuenta el precio pagado por casas similares
  • 29. 29 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Algoritmos genéticosAlgoritmos genéticos  Aplican la mecánica de la genética y la selecciónAplican la mecánica de la genética y la selección natural para encontrar un conjunto de parámetrosnatural para encontrar un conjunto de parámetros óptimos para una función predictivaóptimos para una función predictiva  Utilizados para entrenar redes neuronales artificialesUtilizados para entrenar redes neuronales artificiales
  • 30. 30 Minería de datos Dr. Francisco J. Mata Resumen técnicas de minería deResumen técnicas de minería de datosdatos  Técnicas mencionadas pueden utilizarse en variasTécnicas mencionadas pueden utilizarse en varias aplicaciones o problemas de minería de datosaplicaciones o problemas de minería de datos  Ejemplo: árboles de decisión sirven para detectar grupos,Ejemplo: árboles de decisión sirven para detectar grupos, clasificar y predecirclasificar y predecir  Varias técnicas pueden ser utilizadas en una mismaVarias técnicas pueden ser utilizadas en una misma aplicación o problema de minería de datosaplicación o problema de minería de datos  Ejemplo: K vecinos más próximos, árboles de decisión yEjemplo: K vecinos más próximos, árboles de decisión y redes neuronales artificiales pueden utilizarse pararedes neuronales artificiales pueden utilizarse para clasificaciónclasificación