Los primeros 60 países por IDH en el año (2024).pdf
Mineria de datos ensayo
1. Yerannys Carimi Terrero Pérez
15-EISP-1-011
Carimit7@hotmail.com
Ensayo 6, 25 – Julio – 2015
MINERIA DE DATOS
1
La minería de datos consiste en extraer información de un conjunto de datos y
transformarla en una estructura comprensible para su uso posterior.
Las bases de datos es una herramienta fundamental que ha permitido la evolución de
la ciencia de la minería de datos. En ocasiones se usa el término “KDD” (Knowledge
Discovery in DataBases o Descubrimiento de Conocimiento en Bases de Datos) como
sinónimo de minería de datos. Las bases de datos puede decirse que son una de las
tres en que se apoya la minería de datos, que son: 1. Bases de datos 2. Estadística y 3.
Algoritmia
Una aplicación curiosa de la minería de datos es obtener imágenes representativas
para realizar el análisis de datos. Esto permite mostrar lo que ocurre con miles de
datos de forma gráfica.
La tarea de minería de datos real es el análisis automático o semi-automático de
grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (análisis clúster), registros poco
usuales (la detección de anomalías) y dependencias (minería por reglas de asociación).
Las grandes tecnológicas como Oracle o Microsoft (con SQLServer) tienen
herramientas para hacer minería de datos. También hay herramientas para la minería
de datos en el ámbito del software libre.
Las técnicas de la minería de datos provienen de la inteligencia artificial y de la
estadística, las cuales no son más que algoritmos, más o menos sofisticados que se
aplican sobre un conjunto de datos para obtener unos resultados.
Las técnicas más representativas son:
Redes neuronales: Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el sistema nervioso de los
animales. Se trata de un sistema de interconexión de neuronas en una red que
colabora para producir un estímulo de salida.
Regresión lineal: Es la más utilizada para formar relaciones entre datos. Rápida
y eficaz pero insuficiente en espacios multidimensionales donde puedan
relacionarse más de 2 variables.
Árboles de decisión: Modelo de predicción utilizado en el ámbito de la
inteligencia artificial, dada una base de datos se construyen estos diagramas de
construcciones lógicas, muy similares a los sistemas de predicción basados en
reglas, que sirven para representar y categorizar una serie de condiciones que
suceden de forma sucesiva, para la resolución de un problema.
2. Yerannys Carimi Terrero Pérez
15-EISP-1-011
Carimit7@hotmail.com
Ensayo 6, 25 – Julio – 2015
MINERIA DE DATOS
2
Modelos estadísticos: Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la variable de respuesta.
Agrupamiento o Clustering: Es un procedimiento de agrupación de una serie de
vectores según criterios habitualmente de distancia; se tratará de disponer los
vectores de entrada de forma que estén más cercanos aquellos que tengan
características comunes.
Reglas de asociación: Se utilizan para descubrir hechos que ocurren en común
dentro de un determinado conjunto de datos.
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en:
Algoritmos supervisados: predicen un dato o un conjunto de ellos, desconocido
a priori, a partir de otros conocidos.
Algoritmos no supervisados: se descubren patrones y tendencias en los datos.
Un proceso típico de minería de datos consta de los siguientes pasos generales:
1. Selección del conjunto de datos.
2. Análisis de las propiedades de los datos.
3. Transformación del conjunto de datos de entrada.
4. Seleccionar y aplicar la técnica de minería de datos.
5. Extracción de conocimiento.
6. Interpretación y evaluación de datos.
Las fases necesarias de un proyecto de minería de datos tiene son:
Comprensión.
Determinación, obtención y limpieza.
Creación de modelos matemáticos.
Validación, comunicación.
Integración.
3. Yerannys Carimi Terrero Pérez
15-EISP-1-011
Carimit7@hotmail.com
Ensayo 6, 25 – Julio – 2015
MINERIA DE DATOS
3
BIBLIOGRAFIA
http://www.aprenderaprogramar.com/index.php?option=com_attachments&task=do
wnload&id=203
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos