1. MINERIA DE DATOS.
JOSE BENAVIDES
ARNOLDO GIL
RAFAEL ORTEGA
JESUS OVIEDO
CRISTIAN MARTINEZ
2. Definición:
Es un mecanismo de explotación, consistente en la búsqueda de información valiosa
en grandes volúmenes de datos. La minería de datos se centra en llenar la necesidad
de descubrir el por que, para luego predecir y pronosticar las posibles acciones con
cierto factor de confianza para cada predicción.
Es el análisis de archivos y bitácoras de transacciones, trabaja a nivel del
conocimiento con el fin de descubrir patrones, relaciones, reglas, asociaciones o
incluso excepciones útiles para la toma de decisiones.
3. Orígenes de la Minería de Datos
La minería de datos se ha insertado desde los años 90 en el contexto de las
tecnologías de la información, algoritmia y desarrollo de software.
Las líneas de desarrollo en el ámbito de minería de datos tienen sus
orígenes en tres conceptos importantes:
• Estadística Clásica
• Inteligencia Artificial
• Aprendizaje Automático
4. La Minería de datos puede ser dividida en:
• Minería de datos predictiva (MDP): Usa
primordialmente técnicas estadísticas
• Minería de datos para descubrimiento de conocimiento
(MDDC): Usa principalmente técnicas de inteligencia
artificial
5. Características de la Minería de Datos
Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse
rápidamente.
Explorar los datos se encuentran en las profundidades de las bases de datos, como los almacenes
de datos, que algunas veces contienen información almacenadadurante varios años.
El entorno de la minería de datos suele tener una arquitecturacliente servidor.
Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en
paralelopara la minería de datos.
Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosose inesperados.
En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en
otros, se mantienen en servidores de Internete Intranet.
La minería de datos produce cinco tipos de información:
• — Asociaciones. — Secuencias.— Clasificaciones.— Agrupamientos. — Pronósticos.
7. Técnicas de minería de datos
Provienen de la inteligencia artificial y de la estadística, dichas técnicas,
no son mas que algoritmos mas i menos sofisticados que se aplican sobre
un conjunto de datos para obtener unos resultados. Las mas
representativas son:
• Redes neuronales
• Regresión lineal
• Arboles de decisión
• Modelos estadísticos
• Agrupamiento o clustering.
8. Ventajas de la minería de datos
•Ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades
de negocios.
•Contribuye a la toma de decisiones tácticas y estratégicas.
•Proporciona poder de decisión a los usuarios del negocio, y es capaz de medir las
acciones y resultados de la mejor forma.
•Genera Modelos descriptivos: permite a empresas, explorar y comprender los
datos e identificar patrones, relaciones y dependencias que impactan en los
resultados finales .
•Genera Modelos predictivos: permite que relaciones no descubiertas través del
proceso de la Minería de Datos sean expresadas como reglas de negocio.