SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
MINERIA DE DATOS
[Escribir el subtítulo del documento]

La minería de datos se engloba todo un conjunto de técnicas
encaminadas a la extracción de conocimientos procesables
implícitos en las bases de datos.

Edison Romero V.
30/07/2010
MINERIA DE DATOS

La minería de dat os (Dat a Mining) consiste en la extracción no trivial de información que reside de manera
implícita en los datos. En ot ras palabras, la minería de datos prepara, sondea y explora los datos para sacar
información oculta en ellos.

Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de
conocimient os procesables implícitos en las bases de datos. Esta fuert ement e ligado c on la supervisión de
procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.

Las bas es de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante
los modelos extraídos utilizando técnicas de minerías de datos que aborda la solución a problemas de
predicción, clasificación y segmentación.

¿Minería de datos o de scubrimiento de información o descubrimiento de conocimiento?

Minería de datos o descubrimiento de conocimiento son los nombres más utilizados y más apropiados para este
tipo de análisis, ya que lo que se busca es la obtención de modelos de conocimientos.

Nota: En adelante llamaremos Minería de Datos MD por efecto de simplific ación.

¿De dónde nació la MD?

Nace de la necesidad de explicar el porqué de unos sucesos, de unos comport amient os, los cuales están
ocultos en datos históric os.

Ahora, la MD no solo tiene un enfoque descriptivo o explicativo, sino también un enfoque predictivo, que suele
ser muy importante en algunos casos de negocio.

¿Para que la MD?

La minería de datos es el proceso sistemático que tiene como objetivo la exploración y la explotación de datos
para la generación de patrones y modelos de conocimientos . Está encaminada hacia el análisis de aquellas
bases de datos y conjuntos de datos cuya función está relacionada con otros intereses.

 Por ejemplo, análisis a bases de datos transaccionales que almacenan información relevante a la operación de
la empresa:

       Bases de datos bancarias.
       De registro académico.
       De ventas.
       De inventarios.
       De bibliotecas.
       De créditos, entre ot ras.

Es precisament e, un estudio y manipulación secuencial y organizada de las estructuras y relaciones que
presentan los datos, para la obtención de resultados que desde el punto de vista funcional de la empresa o
institución, puedan apoyar la toma de decisiones.

¿Cómo se lleva a cabo las MD?

Se puede afirmar que es una confluencia de las áreas estadística, inteligencia artificial y bases de datos pues
en cada una de sus etapas, varios conceptos pertenecient es a estas áreas, son involucrados. Como se ha
mencionado, es un proceso claro en el sentido de que se encuentran definidas cada una de las etapas a seguir
desde la identificación del problema hasta la obtención de los resultados. Y además es un proceso flexible en el
sentido de que no existe una única receta con la cual pueda llevarse a cabo dicho estudio. Así, la exploración
es uno de los as pectos más relevantes en dicho proces o, ya pe rmite la combinación de diversas estrat egias y
técnicas a fin de consolidar un modelo final que intente resolver el problema inicialment e plant eado.

Procesos de la MD.

Un proceso típico de minería de datos consta de los siguientes pasos generales:

    1. Selección del conjunto de datos
Variables Objetivos: Aquellas que se quiere predecir, calcular o inferir.

Variables dependientes: Las que sirven para hacer el cálculo o procesos.

Muestreo: De los registros disponibles.

    2. Análisi s de las propiedades de los da tos
En especial de los histogramas, diagramas de dispersión y ausencia de datos (valores nulos).

    3. Transformación del conjunto de datos de entrada
Se realizara de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la
técnica de minería de datos que mejor se adapte a los datos y al problema, a este pas o también se le conoce
como pre procesamiento de los datos.

    4. Seleccionar y aplicar las técnicas de minerías de datos
Se construye el modelo predictivo, de clasificación o segmentación.

    5. Extracción de conocimientos
Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representan patrones
de comportamiento observado en los valores de las variables del problema o relación de asociación de dichas
variables.

    6. Interpretación y evaluación de datos
Una vez obtenido el modelo se debe proceder a su validación comprobando que las conclusiones que arrojan
son validas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de
distintas técnicas, se deben compara los modelos en busca de aquel que se ajuste mejor al problema.



Las técnica s de minería de datos se pueden clasificar en dos tipos:

    Técnicas De scriptiva s
Segmentación
Análisis de asociaciones

       Técnicas Predictiva s

Clasificación/predicción
Análisis de secuencias/similitud de series temporales
La segmentación es muy importante, ya que sirve para detectar agrupamientos o estructuras intrínsecas en el
conjunto de datos. Puede llegar a identificar grupos homogéneos, propiedades que los caracteriz an y prototipos
representativos de cada grupo. La idea básica es agrupar en un mismo grupo a todos los objetos muy parecidos
entre si y muy diferente a los demás.
En cuanto a la clasificación y a la predicción que es lo que a nosotros más nos interesa, se basa en que
partiendo de un conjunto de datos, tenemos que conseguir un modelo que clasifique objet os en función de sus
características y un modelo que permit a calcular valores desconocidos de variables de salida.

Sistema s y herramientas de minerías de datos

Lo que se pretende conseguir es proporcionar información det allada sobre algunos ejemplos de software
diseñados para implementar la Minería de Datos.

Librerías: Las librerías de minerías de datos son un conjunto de métodos que implementan funcionalidades y
utilidades básicas como el acceso a datos, modelos de redes neuronales, métodos bayesianos, ex port ación de
resultados.
Las librerías se encargan principalmente de facilitar el desarrollo de las tareas de minerías de datos que son
más complejas, como el diseño de experimentos. El problema de las librerías, es que es precisa la comprensión
de conocimientos de programación.

Alguna s de las librerías más importante s son:

     XELOPES (extended library for prudys embedded solution)
Es una librería con licencia pública GNU para el desarrollo de aplicaciones de minerías de datos.
Principales características de las Minerías de Dat os:
        Acceso a datos
        Modelos de redes neuronales
        Métodos de agrupación
        Métodos de reglas de as ociación
        Arboles lineales
        Arboles no lineales
        Exportación de datos




     MLC++ (Mac hine learning library in c++)
Es un conjunto de librerías que fueron desarrolladas por la Universidad de Standford.
Principales características:
        Acceso a datos (archivos con formato plano)
        Trans formaciones de datos
        Métodos de aprendizaje mediante objetos

     SUITES
Las suites se destacan porque existe una interfaz que facilita la interacción entre el usuario y las herramientas.

     SPSS CLEMENTINE
Es uno de los sistemas de Minería de Datos más conocidos, posee una herramienta visual desarrollada por ISL
que tiene una arquitectura cliente/servidor.
Este sistema se caracteriza por:
          Acceso a datos (fuentes de datos archivos ASCII)
          Procesamiento de datos
          Técnicas de aprendizaje (redes neuronales, reglas de asociación)
          Técnicas de evaluación de modelos
          Visualización de resultados (histogramas, diagramas de dispersión)

       WEKA (Waikato environment for knowledge analysis)
Es una herramienta visual de libre distribución des arrollada por los investigadores de la Universidad de waikato
en Nueva Zelanda.
Sus principales característica son:
        Acceso de los datos desde un archivo en formato A RFF (es un archivo de t exto plano organizado en
        filas y columnas)
        Preprocesador de datos (selección, transformación de at ribut os)
        Visualización del entorno

     STA TIS TICA DA TA MINER
Es una potente herramienta con un sistema visual des arrollado y comercializado, en las que se destacas.
       Base de datos: Permite t rabajar con un gran volumen de información, así como importar los dat os en
       formatos Excel, Oracle, SQL.
       Preprocesado de datos: A través de la cual seleccionamos las característica, el muestreo de datos,
       realizamos operaciones de filtrado. Etc.

Ejemplo de uso de las Minería de Datos

Negocio._ Las empresas que emplean Minerías de Datos ven rápidament e el retorno de la inversión, pero
también reconoce que el número de modelos predictivos desarrollados pueden crecer rápidamente. En lugar de
crear modelos para predecir qué clientes pueden cambiar, la empresa podría construir modelos separados para
cada región y/o para cada tipo de cliente.

Hábit os de compra en supermercado:

Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que
adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado
padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y
viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza
colocándolas próximas a los pañales para fomentar las ventas compulsivas.

Patrones de fuga

Un ejemplo más habit ual es el de la detección de patrone s de fuga. En muchas industrias como la banca, las
telecomunicaciones, etc. Existe un comprensible interés en detectar cuanto antes aquellos clientes que puedan
estar pensando en rescindi r sus contratos para, posiblemente, pasarse a la competencia. La minería de datos
ayuda a determinar qué clientes son los más proclives a darse de baja estudiando sus pat rones de
comport amiento y comparándolos con muestras de client es que, efectivament e, s e dieron de baja en el pasado.

Fraudes

Un caso análogo es el de la det ección de transacciones de blanqueo de dinero o de fraude en el uso de tarjetas
de crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco.
Generalment e, estas operaciones fraudulent as o ilegales suelen seguir patrones característicos que permiten,
con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas
rápidas frent e a ellas.

Recursos Humanos

La minería de datos también puede ser útil para los depart amentos de recurs os humanos en la identificación de
las características de sus empleados de mayor éxito. La información obtenida puede ay udar a la contratación
de personal, centrándose en los es fuerzos de s us empleados y los resultados obtenidos por éstos. Además, la
ayuda ofrecida por las aplicaciones para Dirección estratégica en una empres a se traducen en la obtención de
ventajas a nivel corporativo, tales como mejorar el margen de beneficios o compartir objetivos; y en la mejora de
las decisiones operativas, tales como desarrollo de planes de producción o gestión de mano de obra.
ANEXOS
BIBLIOGRAFIA
http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

http://www.sinnexus.com/business_intelligence/datamining.aspx

http://www.sinnexus.com/business_intelligence/datamining.aspx/

http://www.daedalus.es/mineria-de-datos/

Más contenido relacionado

La actualidad más candente

Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningNicoleaks
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datosArnoldo Gil
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosValeria Gavilanes
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 

La actualidad más candente (20)

Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data Mining
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 

Similar a Mineria de datos

Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining PabloMolina111
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datosArlin11
 
La integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business IntelligenceLa integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business IntelligenceJesús Tramullas
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Universidad de Guadalajara
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 

Similar a Mineria de datos (20)

Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
La integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business IntelligenceLa integración de información en las herramientas de Business Intelligence
La integración de información en las herramientas de Business Intelligence
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 

Más de Yolanda Uruchima (13)

Bonos
BonosBonos
Bonos
 
Bonos
BonosBonos
Bonos
 
Proceso unificado
Proceso unificadoProceso unificado
Proceso unificado
 
Metodologia msf
Metodologia msfMetodologia msf
Metodologia msf
 
Metodologia msf
Metodologia msfMetodologia msf
Metodologia msf
 
Metodologia msf
Metodologia msfMetodologia msf
Metodologia msf
 
Bolsa de valores
Bolsa de valoresBolsa de valores
Bolsa de valores
 
La evaluación económica y social de
La evaluación económica y social deLa evaluación económica y social de
La evaluación económica y social de
 
Rendimiento financiero
Rendimiento financieroRendimiento financiero
Rendimiento financiero
 
SAP
SAPSAP
SAP
 
Modelo v y cascada
Modelo v y cascadaModelo v y cascada
Modelo v y cascada
 
IECE
IECEIECE
IECE
 
Acciones
AccionesAcciones
Acciones
 

Último

El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..RobertoGumucio2
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 

Último (20)

El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 

Mineria de datos

  • 1. MINERIA DE DATOS [Escribir el subtítulo del documento] La minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimientos procesables implícitos en las bases de datos. Edison Romero V. 30/07/2010
  • 2. MINERIA DE DATOS La minería de dat os (Dat a Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. En ot ras palabras, la minería de datos prepara, sondea y explora los datos para sacar información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimient os procesables implícitos en las bases de datos. Esta fuert ement e ligado c on la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos. Las bas es de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minerías de datos que aborda la solución a problemas de predicción, clasificación y segmentación. ¿Minería de datos o de scubrimiento de información o descubrimiento de conocimiento? Minería de datos o descubrimiento de conocimiento son los nombres más utilizados y más apropiados para este tipo de análisis, ya que lo que se busca es la obtención de modelos de conocimientos. Nota: En adelante llamaremos Minería de Datos MD por efecto de simplific ación. ¿De dónde nació la MD? Nace de la necesidad de explicar el porqué de unos sucesos, de unos comport amient os, los cuales están ocultos en datos históric os. Ahora, la MD no solo tiene un enfoque descriptivo o explicativo, sino también un enfoque predictivo, que suele ser muy importante en algunos casos de negocio. ¿Para que la MD? La minería de datos es el proceso sistemático que tiene como objetivo la exploración y la explotación de datos para la generación de patrones y modelos de conocimientos . Está encaminada hacia el análisis de aquellas bases de datos y conjuntos de datos cuya función está relacionada con otros intereses. Por ejemplo, análisis a bases de datos transaccionales que almacenan información relevante a la operación de la empresa:  Bases de datos bancarias.  De registro académico.  De ventas.  De inventarios.  De bibliotecas.  De créditos, entre ot ras. Es precisament e, un estudio y manipulación secuencial y organizada de las estructuras y relaciones que presentan los datos, para la obtención de resultados que desde el punto de vista funcional de la empresa o institución, puedan apoyar la toma de decisiones. ¿Cómo se lleva a cabo las MD? Se puede afirmar que es una confluencia de las áreas estadística, inteligencia artificial y bases de datos pues en cada una de sus etapas, varios conceptos pertenecient es a estas áreas, son involucrados. Como se ha mencionado, es un proceso claro en el sentido de que se encuentran definidas cada una de las etapas a seguir desde la identificación del problema hasta la obtención de los resultados. Y además es un proceso flexible en el
  • 3. sentido de que no existe una única receta con la cual pueda llevarse a cabo dicho estudio. Así, la exploración es uno de los as pectos más relevantes en dicho proces o, ya pe rmite la combinación de diversas estrat egias y técnicas a fin de consolidar un modelo final que intente resolver el problema inicialment e plant eado. Procesos de la MD. Un proceso típico de minería de datos consta de los siguientes pasos generales: 1. Selección del conjunto de datos Variables Objetivos: Aquellas que se quiere predecir, calcular o inferir. Variables dependientes: Las que sirven para hacer el cálculo o procesos. Muestreo: De los registros disponibles. 2. Análisi s de las propiedades de los da tos En especial de los histogramas, diagramas de dispersión y ausencia de datos (valores nulos). 3. Transformación del conjunto de datos de entrada Se realizara de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este pas o también se le conoce como pre procesamiento de los datos. 4. Seleccionar y aplicar las técnicas de minerías de datos Se construye el modelo predictivo, de clasificación o segmentación. 5. Extracción de conocimientos Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representan patrones de comportamiento observado en los valores de las variables del problema o relación de asociación de dichas variables. 6. Interpretación y evaluación de datos Una vez obtenido el modelo se debe proceder a su validación comprobando que las conclusiones que arrojan son validas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben compara los modelos en busca de aquel que se ajuste mejor al problema. Las técnica s de minería de datos se pueden clasificar en dos tipos:  Técnicas De scriptiva s Segmentación Análisis de asociaciones  Técnicas Predictiva s Clasificación/predicción Análisis de secuencias/similitud de series temporales
  • 4. La segmentación es muy importante, ya que sirve para detectar agrupamientos o estructuras intrínsecas en el conjunto de datos. Puede llegar a identificar grupos homogéneos, propiedades que los caracteriz an y prototipos representativos de cada grupo. La idea básica es agrupar en un mismo grupo a todos los objetos muy parecidos entre si y muy diferente a los demás. En cuanto a la clasificación y a la predicción que es lo que a nosotros más nos interesa, se basa en que partiendo de un conjunto de datos, tenemos que conseguir un modelo que clasifique objet os en función de sus características y un modelo que permit a calcular valores desconocidos de variables de salida. Sistema s y herramientas de minerías de datos Lo que se pretende conseguir es proporcionar información det allada sobre algunos ejemplos de software diseñados para implementar la Minería de Datos. Librerías: Las librerías de minerías de datos son un conjunto de métodos que implementan funcionalidades y utilidades básicas como el acceso a datos, modelos de redes neuronales, métodos bayesianos, ex port ación de resultados. Las librerías se encargan principalmente de facilitar el desarrollo de las tareas de minerías de datos que son más complejas, como el diseño de experimentos. El problema de las librerías, es que es precisa la comprensión de conocimientos de programación. Alguna s de las librerías más importante s son:  XELOPES (extended library for prudys embedded solution) Es una librería con licencia pública GNU para el desarrollo de aplicaciones de minerías de datos. Principales características de las Minerías de Dat os: Acceso a datos Modelos de redes neuronales Métodos de agrupación Métodos de reglas de as ociación Arboles lineales Arboles no lineales Exportación de datos  MLC++ (Mac hine learning library in c++) Es un conjunto de librerías que fueron desarrolladas por la Universidad de Standford. Principales características: Acceso a datos (archivos con formato plano) Trans formaciones de datos Métodos de aprendizaje mediante objetos  SUITES Las suites se destacan porque existe una interfaz que facilita la interacción entre el usuario y las herramientas.  SPSS CLEMENTINE Es uno de los sistemas de Minería de Datos más conocidos, posee una herramienta visual desarrollada por ISL que tiene una arquitectura cliente/servidor. Este sistema se caracteriza por: Acceso a datos (fuentes de datos archivos ASCII) Procesamiento de datos Técnicas de aprendizaje (redes neuronales, reglas de asociación) Técnicas de evaluación de modelos Visualización de resultados (histogramas, diagramas de dispersión)  WEKA (Waikato environment for knowledge analysis)
  • 5. Es una herramienta visual de libre distribución des arrollada por los investigadores de la Universidad de waikato en Nueva Zelanda. Sus principales característica son: Acceso de los datos desde un archivo en formato A RFF (es un archivo de t exto plano organizado en filas y columnas) Preprocesador de datos (selección, transformación de at ribut os) Visualización del entorno  STA TIS TICA DA TA MINER Es una potente herramienta con un sistema visual des arrollado y comercializado, en las que se destacas. Base de datos: Permite t rabajar con un gran volumen de información, así como importar los dat os en formatos Excel, Oracle, SQL. Preprocesado de datos: A través de la cual seleccionamos las característica, el muestreo de datos, realizamos operaciones de filtrado. Etc. Ejemplo de uso de las Minería de Datos Negocio._ Las empresas que emplean Minerías de Datos ven rápidament e el retorno de la inversión, pero también reconoce que el número de modelos predictivos desarrollados pueden crecer rápidamente. En lugar de crear modelos para predecir qué clientes pueden cambiar, la empresa podría construir modelos separados para cada región y/o para cada tipo de cliente. Hábit os de compra en supermercado: Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas. Patrones de fuga Un ejemplo más habit ual es el de la detección de patrone s de fuga. En muchas industrias como la banca, las telecomunicaciones, etc. Existe un comprensible interés en detectar cuanto antes aquellos clientes que puedan estar pensando en rescindi r sus contratos para, posiblemente, pasarse a la competencia. La minería de datos ayuda a determinar qué clientes son los más proclives a darse de baja estudiando sus pat rones de comport amiento y comparándolos con muestras de client es que, efectivament e, s e dieron de baja en el pasado. Fraudes Un caso análogo es el de la det ección de transacciones de blanqueo de dinero o de fraude en el uso de tarjetas de crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco. Generalment e, estas operaciones fraudulent as o ilegales suelen seguir patrones característicos que permiten, con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas rápidas frent e a ellas. Recursos Humanos La minería de datos también puede ser útil para los depart amentos de recurs os humanos en la identificación de las características de sus empleados de mayor éxito. La información obtenida puede ay udar a la contratación de personal, centrándose en los es fuerzos de s us empleados y los resultados obtenidos por éstos. Además, la ayuda ofrecida por las aplicaciones para Dirección estratégica en una empres a se traducen en la obtención de ventajas a nivel corporativo, tales como mejorar el margen de beneficios o compartir objetivos; y en la mejora de las decisiones operativas, tales como desarrollo de planes de producción o gestión de mano de obra.