13. Metodología de Kimball (Bottom-up) 27/11/09 Administración de las Tecnologías de la Información
14. Metodología agil para la implementación de un dw 27/11/09 Administración de las Tecnologías de la Información
15. Page Arquitectura de un Data Warehouse 27/11/09 Administración de las Tecnologías de la Información
16. Production systems Other sources CRM Billing Activation systems Other DBs… Files ETL DataWarehouse OLAP cubes Business Users Querying & Reporting tools Acquisition Storage / Archiving Restitution Datamarts Flujo de Datos de un DW 27/11/09 Administración de las Tecnologías de la Información
17.
18.
19.
20.
21.
22.
23. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administración de las Tecnologías de la Información 3 ESTRATEGIAS PARA EL DISEÑO DE UN DATA WAREHOUSE 1ra. : Los usuarios de los data warehouses usualmente no conocen mucho sobre sus requerimientos y necesidades como los usuarios operacionales. 2da.: El diseño de un data warehouse, con frecuencia involucra lo que se piensa en términos más amplios y con conceptos del negocio más difíciles de definir que en el diseño de un sistema operacional. Al respecto, un data warehouse está bastante cerca a Reingeniería de los Procesos del Negocio (Business Process Reengineering). 3ra.: Finalmente, la estrategia de diseño ideal para un data warehousing es generalmente de afuera hacia adentro (outside-in) a diferencia de arriba hacia abajo (top-down). 27/11/09
24. PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Administración de las Tecnologías de la Información 4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE 1ra.: Un data warehouse es una inversión buena sólo si los usuarios finales realmente pueden conseguir información vital más rápida y más barata de lo que obtienen con la tecnología actual. 2da.: La administración debe reconocer que el mantenimiento de la estructura del data warehouse es tan crítico como el mantenimiento de cualquier otra aplicación de misión-crítica. 3ra.: La gestión debe comprender también que si se embarcan sobre un programa data warehousing, se crearán nuevas demandas sobre sus sistemas operacionales, que son: Demandas para mejorar datos Demandas para una data consistente Demandas para diferentes tipos de datos, etc. 27/11/09
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37. Importante: El Modelo de Datos Es el modelo por el cual se diseña el esquema de funcionamiento de la Base de Datos que provee al Data Warehouse. Existen varios enfoques en este sentido: Fábrica de información corporativa (CIF): incluyen ODS, data warehouse y data marts, junto con otras varias interfaces de aplicaciones y el ambiente operacional, fue desarrollada por Bill Inmon, Claudia Imhoff, y Ryan Sousa Esquema en estrella: Este método replica las estructuras multidimensionales de hechos y dimensiones, pero usa tablas de RDBMS, específicamente tablas de hechos y tablas de dimensiones. Se dejan de lado las reglas de normalización de base de datos y se ponen los datos donde tienen más sentido Data vault (Arquitectura de modelado fundacional común -CFIMA): Esta es una arquitectura de integración de datos que contiene una base de datos orientada al detalle que contiene un conjunto de tablas normalizadas únicamente enlazadas que soportan una o más áreas funcionales de las tablas de negocio con tablas satélites para rastrear cambios históricos. Este enfoque híbrido reúne lo mejor del cruce entre la tercera forma normal (3NF) 27/11/09 Administración de las Tecnologías de la Información
38. Page DATA WAREHOUSE VS BD OPERACIONAL 27/11/09 Administración de las Tecnologías de la Información Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeñas de datos resumidas. Cantidades grandes de datos resumidas. Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos
39. Modelo de Estrella 27/11/09 Administración de las Tecnologías de la Información
49. Data Warehouses Vs. Data Marts Data Mart Departamental Un solo tema Pocos < 100 GB Meses Data Warehouse Propiedad Alcance Tema Fuente de datos Tamaño (típico) Tiempo de implementación Data Warehouse Empresarial Múltiples Muchas 100 GB to > 1 TB Meses a años 27/11/09 Administración de las Tecnologías de la Información Data Mart
50. Su objetivo es agilizar la consulta de grandes cantidades de datos. Caracteriza la Arquitectura necesaria para la implementación de un sistema de ayuda en la toma de decisiones. La consultas son pocas pero son muy consumidoras de tiempo (pueden correr horas), las actualizaciones son menos frecuentes y/o la respuesta a la consulta no depende del hecho de tener actualizada la base de datos. Soporte análisis multidimensional y procesamiento analítico en línea ( OLAP ) 27/11/09 Administración de las Tecnologías de la Información
51.
52. Clasificación según el tipo de motor en el que estén almacenados los datos: 27/11/09 Administración de las Tecnologías de la Información ROLAP (Relational OLAP) MOLAP (multidimensional OLAP) Almacena los datos en un motor relacional Almacena los datos en una base de datos multidimensional Muchas dimensiones Diez o menos dimensiones Soportan analisis OLAP contra grandes volumenens de datos Se comportan razonablemente en volumenes de datos mas reducidos (menos de 5Gb) Herramienta flexible y general Solución particular con volúmenes de información y numero de dimensiones mas modestos
53. Consultando un cubo Trim4 Trim1 Trim2 Trim3 Dimensión tiempo Santiago Quito Arequipa Dimensión Ciudad Manzana Pañal Yogurt Lima Melon Dimensión Producto 27/11/09 Administración de las Tecnologías de la Información Ventas Fact
54. LA ESTRUCTURA DE UN CUBO 27/11/09 Administración de las Tecnologías de la Información
57. Medida : cuenta de suscriptor x mes (para agilizar cálculos) 27/11/09 Administración de las Tecnologías de la Información
58. Medida: Tasa de cambio de moneda, esta se expresa en una sola, independientemente de la divisa de pago. 27/11/09 Administración de las Tecnologías de la Información
59. Dimensiones La Dimensión fecha se usa más de una vez (dimensión con rol) 27/11/09 Administración de las Tecnologías de la Información
60. Relaciones Una relación regular 27/11/09 Administración de las Tecnologías de la Información
61. The cube structure Relaciones Una relación de hecho 27/11/09 Administración de las Tecnologías de la Información
62. Relaciones Una relación referenciada 27/11/09 Administración de las Tecnologías de la Información
63. The cube structure Relaciones Una relación de « muchos a muchos » Dim Product Fact Charges Fact Charges Dim Subscriber Dim Subscriber Fact Subscriber 27/11/09 Administración de las Tecnologías de la Información
64. DATA MINING Minería de Datos Administración de las Tecnologías de la Información 27/11/09
65.
66.
67.
68. Tres pasos Preparación de los datos Análisis de datos Toma de decisiones Redes Neuronales 27/11/09 Administración de las Tecnologías de la Información
69. Preparación de datos Extracción / Integración Transformación Selección Limpieza Data warehouse 50-80% tiempo del proyecto 27/11/09 Administración de las Tecnologías de la Información
76. Relación Administración de las Tecnologías de la Información 27/11/09 Relación con el Data Mining Está asociado al escalón más alto de la pirámide (Nivel Estratégico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos. Mientras en Data Warehousing, se basan en estructuras multidimensionales, en las que se almacena la información calculando previamente todas las combinaciones de todos los niveles de todas las aperturas de análisis. Aunque este método se puede considerar como exagerado, nunca será tan caro, como lo que le costaría a la organización el tomar las decisiones equivocadas.
77.
78. Data Mining un proceso Administración de las Tecnologías de la Información 27/11/09 Pasos
79. Data Mining un proceso Administración de las Tecnologías de la Información 27/11/09 Identificar un problema Usar data mining para transformar los datos en información Actuar basándonos en la información Medir los resultados
84. Importante Administración de las Tecnologías de la Información 27/11/09 La promesa de Data Mining es encontrar los patrones Simplemente el hallazgo de los patrones no es suficiente Debemos ser capaces de entender los patrones, responder a ellos, actuar sobre ellos, para finalmente convertir los datos en información, la información en acción y la acción en valor para la empresa
85.
86. Conclusiones Administración de las Tecnologías de la Información 27/11/09 El concepto de DWH está teniendo una gran aplicación en la actualidad para el desarrollo de las empresas, como almacén de datos. Sus objetivos incluyen la reducción de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre años, más que sobre meses de información. Para diseñar una buena arquitectura de DWH es necesario como primer paso conocer bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas que nos van a suministrar los datos. Además, hacer un buen diseño del área de transformación de datos, cuáles son las transformaciones que se van a realizar y cómo se va a implementar el modelo dimensional con sus tablas de hechos y de dimensiones es el segundo paso a seguir.
87. Resumiendo los beneficios de la arquitectura del DWH : Administración de las Tecnologías de la Información 27/11/09 Provee un esquema de organización – cuáles son los componentes que la forman, cómo ellos se interrelacionan, quién es el dueño de cada parte y cuáles son las prioridades. Mejora la flexibilidad – permite que rápidamente se añadan nuevas fuentes de datos. Desarrollo rápido y reuso – los desarrolladores de DWH son más capaces de comprender el proceso de DWH , los contenidos de las bases de datos y las reglas del negocio más rápidamente. Herramientas de comunicaciones – define y comunica la dirección y el alcance de las expectativas , identifica los roles y responsabilidades y comunica los requerimientos al proveedor.
88. Que la tecnología no te entierre¡¡¡ Administración de las Tecnologías de la Información Thank You ! 27/11/09
89. ANEXOS REDES NEURONALES 27/11/09 Administración de las Tecnologías de la Información Fuente: José Ignacio Latorre Universitat de Barcelona http://sophia.ecm.ub.es/latorre /
92. ¿Qué es una red neuronal? Datos Datos históricos variables objetivos Datos nuevos variables ?? Las redes neuronales aprenden a partir de ejemplos Economista/Matemático/Físico/Analista Aproximante universal (Permiten un ajuste a partir de ejemplos en un gran espacio de funciones sin sesgo, robusto, flexible que implementa inferencia bayesiana) Economista/Empresario Herramienta de predicción (objetivo, consolidado, adaptable a problemas complejos, integrable) Modelo del cerebro Redes neuronales 27/11/09 Administración de las Tecnologías de la Información
93.
94. ¿Cómo funciona una red neuronal? capa 1 capa 2 capa l ..... Red neuronal feedforward multicapa Redes neuronales 27/11/09 Administración de las Tecnologías de la Información
95.
96.
97. Redes neuronales Belgrado 19/04/1999 Una red neuronal es entrenada con patrones de aviones La red detecta un avión militar escondido bajo un avión comercial 27/11/09 Administración de las Tecnologías de la Información
98. Finanzas Data Mining Divorcios Ciencia Banca Reconocimiento de patrones 27/11/09 Administración de las Tecnologías de la Información
99.
100. Ejemplos Lift Chart % de clientes contactados % de Respuestas positivas retenidas 27/11/09 Administración de las Tecnologías de la Información
101.
102.
Notes de l'éditeur
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Administración de las Tecnologías de la Información Data Mining
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información
Data Mining Administración de las Tecnologías de la Información