2. MINERÍA DE DATOS
Minería de datos es el conjunto de técnicas y
tecnologías que permiten explorar grandes
bases de datos, que intenta descubrir
patrones en grandes volúmenes de
conjuntos de datos.
3. MÉTODOS QUE UTILIZA DATAMINING
Inteligencia artificial
Aprendizaje automático
Estadística
Sistemas de bases de datos.
4. ETAPAS
Determinación de los objetivos. Trata de la
delimitación de los objetivos que el cliente
desea bajo la orientación del especialista en
minería de datos.
Preprocesamiento de los datos. Se refiere a
la selección, la limpieza, el enriquecimiento, la
reducción y la transformación de las bases de
datos. Esta etapa consume generalmente
alrededor del setenta por ciento del tiempo
total de un proyecto de minería de datos.
5. Determinación del modelo. Se comienza
realizando unos análisis estadísticos de los datos, y
después se lleva a cabo una visualización gráfica
de los mismos para tener una primera
aproximación. Según los objetivos planteados y la
tarea que debe llevarse a cabo, pueden utilizarse
algoritmos desarrollados en diferentes áreas de la
Inteligencia Artificial.
Análisis de los resultados. Verifica si los
resultados obtenidos son coherentes y los coteja
con los obtenidos por los análisis estadísticos y de
visualización gráfica. El cliente determina si son
novedosos y si le aportan un nuevo conocimiento
que le permita considerar sus decisiones.
6. LAS TÉCNICAS
+ Redes Neuronales.
+ Regresión Lineal.
+ Árboles de Decisión.
+ Modelos Estadísticos.
+ Reglas de Asociación.
7.
8. REDES NEURONALES
Es un paradigma de aprendizaje y
procesamiento automático. Trata de un
sistema de interconexión de neuronas que
colaboran entre sí para producir un estímulo
de salida.
9. ÁRBOL DE DECISIÓN
Son representaciones
gráficas y analíticas de
datos ya establecidos
mediante una base de datos.
Ayuda en la toma de
decisiones, desde un punto
de vista probabilístico,
con el fin de obtener la opción
que mejor convenga.
10. REGRESIÓN LINEAL
Es la más utilizada para formar relaciones
entre datos.
Rápida y eficaz pero insuficiente en
espacios multidimensionales donde
puedan relacionarse más de 2 variables.
11. MARKET BASKET ANALYSIS
Permite detectar que productos se
adquieren conjuntamente, permite
incorporar variables técnicas que ayudan
en la interpretación.
12. TÉCNICAS DE CLUSTERING
Son técnicas que parten de una medida de
proximidad entre individuos y a partir de
ahí, buscar los grupos de individuos más
parecidos entre sí, según una serie de
variables mesuradas.
13. REDES BAYESIANAS
Consiste en representar todos los posibles
sucesos en que estamos interesados
mediante un grafo de probabilidades
condicionales de transición entre sucesos.
14. MODELOS LINEALES GENERALIZADOS
Son modelos que permiten tratar diferentes
tipos de variables de respuesta, por
ejemplo la preferencia entre productos
concurrentes en el mercado.
15. PREVISIÓN LOCAL
La idea de base es que individuos
parecidos tendrán comportamientos
similares respecto de una cierta variable de
respuesta.