El documento proporciona una introducción al data warehouse. Explica que un data warehouse es una base de datos que almacena datos históricos de toda la empresa de forma consolidada y consistente para su análisis. También describe los componentes clave de un data warehouse como las tablas de hechos, las tablas dimensiones y el proceso ETL. Además, explica conceptos como data marts, el ciclo de vida de un proyecto de data warehouse y herramientas comunes para su desarrollo e implementación.
3. Contenido
Qué es Data Warehouse ?
Por qué construir un Data WareHouse ?
Data Marts y Data Warehouses
El Ciclo de Vida de un Data Warehouse
Datos
D t en un D t Warehouse
Data W h
http://rimenri.blogspot.com
4. Qué es un Data WareHouse ?
Definiendo Data Warehouse
Sistemas Operacionales: Una Solución Transaccional
Sistemas Analíticos: Una Solución Data Warehousing
Comparación entre Solución Transaccional y Solución
Data Warehousing
http://rimenri.blogspot.com
5. Definiendo Data Warehouse
Un Data Warehouse es una Base de Datos (BD) que
contiene:
Datos Empresariales
Integrar colección de datos históricos.
Datos: dirigidos al usuario, consolidados y consistentes
Datos estructurados para distribución y consultas
Una l ió d D t Warehousing
U solución de Data W h i (ETL) es un Proceso P
que:
Recupera –desde un OLTP-, transforma datos y carga
p , g
datos a un Data WareHouse. En terminos generales lleva
datos desde un origen a un destino.
Usa herramientas para construir y manejar el data
warehouse
Corresponde a la Categoria de los Sistemas de Soporte
de Decisiones
http://rimenri.blogspot.com
6. Sistemas Operacionales: Una Solución
Transaccional
Sigue eventos Individuales
Diseñado para Real-time Data Entry y Edición de Datos
Ejemplos:
j
Aplicación de Almacenes
Sistema de pedido de p
p productos
Atención de Reclamos: empresa de servicios
Bancos
Operaciones de Bancos.
http://rimenri.blogspot.com
7. Sistemas Analíticos: Una Solución de Data
Warehousing
Asiste como Soporte de Decisiones Estratégicas.
Proporciona Diferentes Niveles de Análisis
Permite a los usuarios Navegar en diferentes Niveles de
Datos
D t
Permite a los Sistemas Búsquedas para hallar nuevas
Relaciones.
Relaciones
Ejemplos:
Aplicaciones de gestión de unidades de negocio.
Aplicaciones de rendimiento de un proceso de produccion.
http://rimenri.blogspot.com
8. Comparando Soluciones Transaccionales y Data
Warehousing
Soluciones Soluciones en
Transactionales Data warehousing
Frecuencia de
Tiempo Real Periódicamente
Actualización
Estructurado para Integridad de Datos Facilidad de consultas
Procesamiento de Performance de
Optimizado para
Transacciones Consultas.
http://rimenri.blogspot.com
9. Por qué Construir un Data WareHouse ?
Permite ejecutar análisis rápidamente
Permite el Acceso a los datos de toda la Empresa
Permite tener datos consistentes
Su gran almacen de datos permite responder en qué
objetos del negocio se pueden hacer mejoras
mejoras.
http://rimenri.blogspot.com
10. Data Marts y Data Warehouses
Qué es un Data Mart
Moviendo Datos desde un Data Warehouse a Data Marts
Moviendo Datos desde Data Marts a un Data Warehouse
http://rimenri.blogspot.com
11. Qué es un Data Mart
Qué es un Data Mart
Una parte de un data warehouse
Para temas particulares o Actividades específicas de
negocios.
g
Puede ser una solución táctica
Por qué Construir Data Marts
q
Consultas rápidas y pocos usuarios
Tiempo de desarrollo rápido
http://rimenri.blogspot.com
12. Moviendo Datos de un Data Warehouse a Data Marts
Origen1 Ventas Mart
Origen 2 Data
Finanzas Mart
Warehouse
Origen 3
Servicio
Cliente Mart
Ventajas Desventaja
Campos Compartidos Tiempo largo de
Orígen Común desarrollo
Procesamiento
Distribuído
http://rimenri.blogspot.com
13. Moviendo Datos desde Data Marts a un Data
Warehouse
Origen1 Ventas Mart
Origen 2 Finanzas M t
Fi Mart
Data
Warehouse
Origen 3 Atención Cliente
Mart
Ventajas Desventajas
Simple and rápido Duplicación de Data
Datos Departamen tales
Departamen-tales Data marts Incompatibles
http://rimenri.blogspot.com
14. El Ciclo de Vida de un Data Warehousing
Elementos Básicos
Herramientas para Manejar el Proceso
http://rimenri.blogspot.com
15. Elementos Básicos
Orígen: OLTP
Oí Data M t
D t Marts
Sistemas
Cubo
OLAP
Clientes
Data
Warehouse
1 3 4 5 6
Recuperar Data Poblar Data Poblar Procesar Consultar
2 Transform Data Warehouse Data Mart Cubos Data
http://rimenri.blogspot.com
16. Elementos Básicos de un Data Mart
Sistemas Data Staging Data Marts Datos en Aplicaciones de
Operationales Servidor de un Entorno Usuario Final
(Legacy System) Presentación OLAP
Almacenamiento Reporteadores
OLTP •Archivos
Planos
•Archivos XML
Archivos
Intefaces de
Proceso Data Mart
Usuario Final
OLTP •Limpieza
•Depuración
Herramientas de
ETL Consulta AD
OLTP • Extraer HOC
•Transformar
• Cargar
http://rimenri.blogspot.com
17. Herramientas para Manejar el Proceso
SQL Server Management Studio
SQL Server Integration Services
SQL Server Analysis Services
Microsoft Repository
PivotTable Service
Pi tT bl S i
MS Office 2003
Visual Studio NET 2005 – usando componentes para
explotar los servicios OLAP como el owc
http://rimenri.blogspot.com
18. Datos en un Data Warehouse
Características de la Data
Componentes de un Data WareHouse
Ejemplo de Organizar Datos
http://rimenri.blogspot.com
19. Características de la Data
Caracteristícas Descripción
p
Consolidada Centraliza toda la empresa
Consistente En el data warehouse
Organizado en la perspectiva
Subject-oriented
S bj t i t d
del usuario
Histórica Fotografía del tiempo
Read-only No debe ser modificable
Apropiada en función al nivel
Summarizada
de detalle
http://rimenri.blogspot.com
20. Componentes Internos del Data WareHouse
Tabla Hecho : Medidas Qué analizar ?
Montos Vendidos
Montos Cobrados
Peso Materia Prima
Horas Hombre
Nro de Reclamos
Tablas Dimension : Dimensiones Cómo Analizar?
Producto
Tiempo
Ti
Cliente
Organización
http://rimenri.blogspot.com
21. Ejemplo de Organización de Datos
Reporte Venta Mensual: Región Norte -
Mensual: Agosto 2007
Región Ciudad Detergente Aceites Total $
NORO Tumbes 2,750 20,100 22,850
NORO Pi
Piura 2 500
2,500 11 635
11,635 14,135
14 135
Total NORO 5,250 31,735 36,985
NOR Chiclayo 1 725
1,725 15,075
15 075 16,800
16 800
NOR Cajamarc 2,200 6,943 9,143
Total NOR 3,925
3 925 22 018
22,018 25,943
25 943
NORM Trujillo 4,950 34,645 39,595
NORM Chimbote 1,900 15,105 17,005
Total NORM 6,850 49,750 56,600
Total Región Norte ,
16,025 ,
103,503 ,
119,528
http://rimenri.blogspot.com
22. Revisión
Qué es Data Warehouse
Por qué construir un Data WareHouse?
Data Marts y Data Warehouses
El Ciclo de Vida de un Data Warehouse
Datos
D t en un D t Warehouse
Data W h
http://rimenri.blogspot.com
23. Demostración: Creando un Cubo OLAP
•Visualizando una Base de Datos
Multidimensional.
• Construyendo un Cubo OLAP
•Requisitos Previos
SQL Server 2005 Instalado
Base de Datos AdventureWorkDW (Data
Mart) dentro del SQL Server
http://rimenri.blogspot.com