SlideShare une entreprise Scribd logo
1  sur  74
Data Warehouse y
Sistemas de Soporte a la
Decisión
Un Enfoque Práctico
Hugo M. Castro
El Caso
 RapiServ es una empresa de comidas
rápidas con 20 locales que se
distribuyen en tres zonas:
 Capital
 Provincia de Buenos Aires
 Interior
RapiServ
 Sus menúes comprenden platos de
carne y pollo, papas fritas y una
variedad de ensaladas y postres
 Por supuesto ofrecen bebidas frías
(gaseosas y agua mineral) y también
bebidas calientes (té, café) y pastelería,
principalmente a la mañana.
RapiServ
 Pero su plato distintivo es una
especialidad que recibe el nombre de
Cordon Bleu, una comida con carne y
verduras que tiene bastante
aceptación.
RapiServ
 José, el Presidente,
dice: Hay que
aumentar las ventas
RapiServ
 Mario, Director de
Marketing, se
pregunta: ¿Qué
podemos ofrecer a
nuestros clientes?
RapiServ
 Para responder a esa pregunta, Mario
necesita saber:
 ¿Qué productos se venden más?
 ¿Qué sucursales venden mejor?
 ¿En qué horas hay más clientes?
 ¿Qué días de la semana son más
flojos?
RapiServ
 ¿Quién puede darle esa información?
 Mario sabe que Sistemas procesa los
tickets de las sucursales en los
procesos de stock de mercadería y
contabilidad
 Por eso se dirige a Carlos, Encargado
de Sistemas
RapiServ
 Carlos, el
Encargado de
Sistemas, recibe el
pedido y estima que
tendrá lista la
información en un
plazo de veinte días
a un mes
RapiServ
 Mario pregunta:
¿Cómo un mes?
¿Acaso la
información no está
dentro de su
computadora?
RapiServ
 Carlos responde:
Sí, los datos están
en la computadora,
pero no tienen la
estructura adecuada
para contestar esas
preguntas
RapiServ
 Mario queda
convencido de que
si los datos están
guardados en la
computadora tan
difícil no debe ser
obtener las
respuestas que
busca
RapiServ
 Carlos queda
convencido de que
Mario siempre pide
cosas diferentes y
todo lo quiere para
ayer
RapiServ
Este es el momento
en que recurren a
nosotros para que
los ayudemos
RapiServ
Antes de actuar analicemos la situación
¿Dónde está el problema?
 Mario tiene razón en que los datos
están en la computadora
 Y Carlos tiene razón en que no es fácil
darles la forma que Mario necesita
RapiServ
Ambos hacen uso de los mismos
datos, pero...
 Mario necesita analizar la información
para saber qué ocurre y tomar
decisiones estratégicas
 Carlos necesita llevar a cabo los
procesos que requiere la operatoria
diaria de la empresa
RapiServ
Hay una diferencia fundamental
 A Carlos le basta con manejar datos
 Mario necesita extraer información de
esos datos
Cadena de Valores
DatosDatos
• Sucursales
• Poductos
• Franjas Horarias
• Estacionamiento
• Servicio en auto
InformaciónInformación
• La sucursal X está en el
distrito Z de la zona W
• El producto P cuesta $Q
• La franja horaria 1
comprende las horas de la
mañana
ConocimientoConocimiento
• En la zona Capital hubo H
• pedidos del producto X
• En la franja horaria 1 se vende
menos que en la 2
DecisiónDecisión
• Hagan propaganda del producto
X en la zona Capital
• Estudien promociones para la
franja horaria 1
• Ofrezcan el servicio en auto en
la zona Buenos Aires
El proceso de toma de
decisiones
 Se encuentran hechos destacados
 Se explican en términos de negocios
 Se toman las decisiones
correspondientes
Una Nueva Estructura
Si los datos están en la computadora
pero la forma no es la adecuada, la
solución es
 CREAR UNA BASE DE DATOS CON
LA FORMA ADECUADA
Un Nuevo Tipo de BD
La base de datos con la estructura
adecuada es lo que se denomina
DATA WAREHOUSE
Es una base de datos separada de los
sistemas transaccionales e
independiente de ellos.
Data Warehouse
Un Data Warehouse es una Base de
Datos con una estructura
 Orientada al negocio
 Integrada
 Variable en el tiempo
 No Volátil
Orientada al negocio
 Organiza y presenta los datos desde la
perspectiva de los conceptos que maneja la
empresa (fecha, franja horaria, producto,
sucursal, ventas).
 Los datos tienen el nivel de detalle y la
estructura que necesitan los que toman
decisiones
Integrada
 Se construye a partir de fuentes de datos
heterogéneas
 Bases de datos relacionales, archivos
planos, hojas de cálculo, documentos
impresos
 Se unifican denominaciones,
codificaciones, formatos
 Limpieza
 Integración
Variable en el Tiempo
 El horizonte temporal del Data Warehouse
es más amplio que el de los sistemas
transaccionales
 Vida útil de los datos
 Datos históricos
 La fecha es un dato fundamental
 Marcación temporal
No Volátil
 En el Data Warehouse los datos no se
modifican
 El Data Warehouse se renueva
 Los datos permanecen intactos entre
renovaciones
 Sólo existen dos operaciones
 Carga
 Acceso
Data Warehouse
 UN DATA WAREHOUSE CONTIENE
 Información histórica
 Para visualizar tendencias y efectuar
comparaciones
 Información consolidada
 Para acelerar la respuesta a las consultas
Las bases de datos más
voluminosas son Data
Warehouses
Procesos
Extracción, Transformación y Carga
 Extracción
 Se eligen qué datos se van a llevar al DWh desde
las diversas fuentes
 Transformación
 Los datos se depuran, completan y transforman
 Carga
 Los datos se ordenan, se consolidan, se calculan
los datos derivados, severifica la integridad y se
incorporan al DWh
Este es un proceso repetitivo
Procesos
Explotación de datos
 Guardar y estructurar los datos en un
Data Warehouse es sólo parte de la
tarea
 Necesitamos analizar los datos para la
toma de decisiones
Explotación de datos
 Herramienta de redacción de informes
orientada al usuario
 Empezamos por producir los mismos
informes que el profesional de negocios
estaba recibiendo hasta ahora
 Pero ahora él puede armarlos en forma
interactiva
Informes
 Para obtener los informes no es
necesario escribir ningún programa
 Lo puede definir el propio profesional
de negocios
 La herramienta que produce los
informes está preparada para que él la
utilice
Informes
El profesional de negocios decide
 Qué criterios de selección va a usar
sobre la base de datos
 Qué datos va a incluir en el informe
 Cómo se van a ordenar los datos
 Cómo se van a agrupar los datos
Informes
 Con estas herramientas queda resuelto
el problema de la producción de
informes, pero Mario y su gente
encuentran que
LAS RESPUESTAS GENERAN
PREGUNTAS
Preguntas
 ¿Cómo se vende en cada sucursal por
franja horaria?
 ¿Qué productos se venden más en las
tardes?
 ¿Venden más las sucursales que
tienen servicio en el auto?
 ¿Y las que tienen estacionamiento?
Modelo de datos
 Modelo de Entidad-Relación
 Orientado a la implementación de los
procesos transaccionales
 Tareas operativas
 Modelo dimensional
 Orientado a las características del negocio
(variables del negocio)
 Tareas de análisis
Modelo dimensional
 Dimensiones
 Variables del negocio
 Productos, sucursales, fechas
 Medidas
 Valores numéricos
 Sumas, consolidaciones, operaciones
aritméticas
Modelo dimensional
 Cantidad de pedidos por fecha, producto
y sucursal
Producto
Sucursal
Fecha
Dimensiones: Producto, Sucursal,
Fecha
Estructura Jerárquica
Categoría Zona Año
Subcategoría Distrito Trimestre
Producto Sucursal Mes
Día
Cubo
 Es una forma de presentar los datos al
usuario
 No existe físicamente
 El usuario puede trabajar con los datos
como si existiera
 Es independiente de la forma en que
realmente se almacenan los datos
OLAP
 Sistemas transaccionales: OLTP
 T identifica transacciones
 Sistema de Análisis: OLAP
 A identifica análisis
OLAP
 Es el proceso de almacenar y
administrar datos sobre la base de las
variables del negocio (dimensiones),
para permitir a los profesionales de
negocios visualizarlos y analizarlos
para entender cuál es su significado
Preguntas
 ¿Cómo se vende en cada sucursal por
franja horaria?
 ¿ Qué productos se venden más en las
tardes?
 ¿Venden más las sucursales que
tienen servicio en el auto?
 ¿Y las que tienen estacionamiento?
Navegación
 Cambio de dimensiones
 Cambio de ejes
 Cambio de forma de presentación
 Cambio de medidas
 Cambio de nivel de detalle
 Drill down
 Drill up
 Conexión con otras tablas de hechos
 Drill across
 Conexión con tablas externas
 Drill through/Drill Out
Análisis OLAP
FECHA
ARTICULO
SUCURSAL
VENTAS
UNIDADES
TICKETS
DIMENSIONES MEDIDAS
ARTICULO
FECHA
Se elige la dimensión para las
filasSe elige la dimensión para las columnas
Se elige la medida a representar
Unidades vendidas por tipo de
artículo durante 2004
“Drill down”: Mayor detalle
sobre Comestibles
Unidades de comestibles
vendidas por ciudad
“Drill down”: unidades de
comestibles vendidas en
sucursales de Capital
Tablero de Comando
Enfoque tradicional
 Indicadores financieros
 Ventas
 Ganancias
 Cobranza
 Stock valorizado
 El resto carece de importancia
Tablero de Comando
Enfoque tradicional
 No tiene en cuenta aspectos tales
como
 Relación con los clientes
 Análisis de los procesos internos
 Capacitación y crecimiento del personal
 Descubrir esta falta demasiado tarde
puede traer graves consecuencias
Tablero de Comando Integral
(BSC)
 Distintas perspectivas
 Fijación de objetivos
 Máximo (ej. gastos)
 Mínimo (ej. ventas)
 Establecimiento de metas y tolerancias
Tablero de Comando
Tablero de Comando
Colores
Mínimo
MetaTolerancia
Máximo Meta Tolerancia
Tablero de Comando
Perspectivas (Cobranza, Ventas)
Tablero de Comando
Indicadores
ComponentesComponentes
Data
Warehouse
Extracción
Transformación
Carga
Renovación
Motor OLAP
Informes
Consultas
OLAP
Data mining
Mecanismo
de
Integración
Metadatos
Fuentes de
Datos
Explotación
Sirve para
Data Marts
BD
Transaccionales
Otras
Fuentes
de Datos
Almacenamiento
Servidor
OLAP
Metadatos
Son datos que describen objetos del data warehouse
 Estructura del Data Warehouse

Esquema, visiones, dimensiones, datos derivados, ubicación y
contenido de los data mart
 Datos sobre los datos

Origen de los datos

Validez de los datos (activo, histórico, eliminado)

Información de control (estadísticas de uso, errores, información de
auditoría)
 Algoritmos que se usan para la consolidación
 Correspondencia entre datos operativos y los del data warehouse
 Datos de Negocios

Definiciones de términos del negocio, dueños de los datos
Tres Alternativas
 Data warehouse
 Recoge información de toda la empresa
 Data Mart
 Sirve a un grupo específico de usuarios. Su alcance se reduce a un
área en particular (p.ej. Marketing)

Independiente: Se genera a través de un proceso de ETL
 Dependiente : Se toma del Data Warehouse
 Data warehouse virtual

Se forma a partir de distintos Data Marts
¿Y ahora?
 Mario sabe que con OLAP puede
contestar todas las preguntas que
puede formular, pero...
 ¿y las que no puede formular?
Preguntas
 ¿A qué clientes me conviene ofrecer
este nuevo producto?
 ¿Cuántos pedidos de pollo vamos a
recibir durante las vacaciones de
invierno?
 ¿La compra de Cordon Bleu influye en
la compra de papas fritas?
Preguntas
La respuesta a esas preguntas van a salir
de un proceso llamado
DATA MINING
Data Mining
 Es un proceso automático que permite
extraer esquemas interesantes y no
triviales de los datos y descubrir
relaciones entre variables
 Estamos ahogados en datos, pero
sedientos de información
Selección y
Preprocesamiento
Data Mining
Interpretación y
Evaluación
Consolidación de
Datos
Conocimiento
p(x)=0.02
Warehouse
Datos Originales
Esquemas y
Modelos
Datos
Preparados
Datos
Consolidados
El Proceso de
Data Mining
Ejemplo
Veamos cómo un modelo de Data Mining
ayuda a Mario a contestar una de las
preguntas que se formulaba
¿La compra de Cordon Bleu influye en la
compra de papas fritas?
Ejemplo
Del análisis del contenido de los tickets
surge que
De un total de 500.000 tickets
 Hay 60.000 que contienen Cordon Bleu
 Hay 40.000 que contienen papas fritas
 De esos tickets hay 30.000 que
contienen ambos productos
Ejemplo
En este caso:
¿Qué proporción de todos los tickets
tienen Cordon Bleu y papas fritas?
30.000/500.000
o sea el 6% de los tickets
Ejemplo
Pregunta:
 ¿Qué proporción de clientes en general
compra papas fritas?
 40.000/500.000 o sea el 8%
Ejemplo
¿Qué proporción de los compradores de
Cordon Bleu compran además papas
fritas?
30.000/60.000
o sea que el 50% de los compradores de
Cordon Bleu piden papas fritas
Ejemplo
 La conclusión es que el empuje de
Cordon Bleu sobre las papas fritas es
de 50/8 o sea 6,25
 Esto quiere decir que la gente que
compra Cordon Bleu compra 6,25
veces más papas fritas que el promedio
de los clientes
Uso del Data Warehouse
 Tres clases de aplicaciones del Data Warehouse
 Procesamiento de Información

Consultas, análisis estadísticos sencillos, informes

Tablas, diagramas, gráficos
 Procesamiento Analítico

Análisis multidimensional de datos

Operaciones OLAP: slice-dice, drilling, rotaciones
 Data mining

Descubrimiento de esquemas ocultos

Modelos analíticos: predicción, asociación, segmentación
Potencial
de Soporte
a la Decisión
Alta Gerencia
Profesional de Negocios
Analista de Datos
Administrador
de
Datos
Decisiones
de Marketing
Presentación
Visualización
Data Mining
Descubrimiento de Información
Exploración de datos
Análisis Estadístico-Consultas-Informes
OLAP – Análisis Multidimensional
Data Warehouses / Data Marts
Fuentes de Datos
Papel, Archivos Planos,Planillas de Cálculo, BD, OLTP
Inteligencia de Negocios
José
Mario
Carlos
RapiServ
 José, el Presidente,
obtiene la
información que
necesita en tiempo y
forma
RapiServ
 Mario, Director de
Marketing, tiene a
su gente analizando
la información y no
imaginando qué
informes deberían
pedir
RapiServ
 A Carlos, el
Encargado de
Sistemas, también
le mejoró la vida: ya
no le llegan pedidos
de marketing con
plazos imposibles
de cumplir
En Resumen
 La información adecuada
 En el plazo adecuado
 Para la persona adecuada
MEJORES DECISIONES
En Resumen
LA INTUICIÓN INFORMADA ES
INSUPERABLE

Contenu connexe

Tendances (7)

Bussiness intelligent
Bussiness intelligentBussiness intelligent
Bussiness intelligent
 
Clase2
Clase2Clase2
Clase2
 
Seminario De Tecnologia
Seminario De TecnologiaSeminario De Tecnologia
Seminario De Tecnologia
 
Keimer pitre 2
Keimer pitre 2Keimer pitre 2
Keimer pitre 2
 
Key
KeyKey
Key
 
business intelligence
business intelligencebusiness intelligence
business intelligence
 
Sistemas Logisticos
Sistemas LogisticosSistemas Logisticos
Sistemas Logisticos
 

En vedette

Pfc itziar angoitia_espinosa
Pfc itziar angoitia_espinosaPfc itziar angoitia_espinosa
Pfc itziar angoitia_espinosa
Cesar Crespo
 
Inteligancia de negocios
Inteligancia de negociosInteligancia de negocios
Inteligancia de negocios
Edgar Barrios
 
Implementación de un Data Warehouse-Planificación
Implementación de un Data Warehouse-PlanificaciónImplementación de un Data Warehouse-Planificación
Implementación de un Data Warehouse-Planificación
Dharma Consulting
 
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – IniciaciónCaso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
Dharma Consulting
 

En vedette (16)

Jornal prodac
Jornal prodacJornal prodac
Jornal prodac
 
2. Cicloria Arp Jc J Mota
2. Cicloria Arp Jc J Mota2. Cicloria Arp Jc J Mota
2. Cicloria Arp Jc J Mota
 
Pfc itziar angoitia_espinosa
Pfc itziar angoitia_espinosaPfc itziar angoitia_espinosa
Pfc itziar angoitia_espinosa
 
Recetas Curso de cocina mayo 2016
Recetas Curso de cocina mayo 2016Recetas Curso de cocina mayo 2016
Recetas Curso de cocina mayo 2016
 
Inteligancia de negocios
Inteligancia de negociosInteligancia de negocios
Inteligancia de negocios
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
 
BUSINESS INTELIGENCE
BUSINESS INTELIGENCEBUSINESS INTELIGENCE
BUSINESS INTELIGENCE
 
Sap bi conceptos
Sap bi conceptosSap bi conceptos
Sap bi conceptos
 
Open Source Business Intelligence 2013 (spanish)
Open Source Business Intelligence 2013 (spanish)Open Source Business Intelligence 2013 (spanish)
Open Source Business Intelligence 2013 (spanish)
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
Fundamentos dw
Fundamentos dwFundamentos dw
Fundamentos dw
 
Diseño Dimensional
Diseño DimensionalDiseño Dimensional
Diseño Dimensional
 
Implementación de un Data Warehouse-Planificación
Implementación de un Data Warehouse-PlanificaciónImplementación de un Data Warehouse-Planificación
Implementación de un Data Warehouse-Planificación
 
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – IniciaciónCaso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
Caso Completo – Construcción de Complejo Habitacional AQUAMARINA – Iniciación
 

Similaire à D wh.introj

Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
romangm
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
UJAP
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
perezparga
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
jarmendipg
 
Conceptos claros ERP, CRM y Data Warehouse
Conceptos claros ERP, CRM y Data WarehouseConceptos claros ERP, CRM y Data Warehouse
Conceptos claros ERP, CRM y Data Warehouse
CvCisneros
 

Similaire à D wh.introj (20)

Introducción a Business Intelligence
Introducción a Business IntelligenceIntroducción a Business Intelligence
Introducción a Business Intelligence
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
 
963002 inteligencia-de-negocios
963002 inteligencia-de-negocios963002 inteligencia-de-negocios
963002 inteligencia-de-negocios
 
Inteligencia de Negocios presentacion
Inteligencia de Negocios presentacionInteligencia de Negocios presentacion
Inteligencia de Negocios presentacion
 
Inteligencia negocios y productos
Inteligencia negocios y productosInteligencia negocios y productos
Inteligencia negocios y productos
 
Sistemas de información_en_los_negocios_globales_actuales_
Sistemas de información_en_los_negocios_globales_actuales_Sistemas de información_en_los_negocios_globales_actuales_
Sistemas de información_en_los_negocios_globales_actuales_
 
Introduccion BI
Introduccion BIIntroduccion BI
Introduccion BI
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
¿Qué es SAP? Más allá del ERP
¿Qué es SAP? Más allá del ERP¿Qué es SAP? Más allá del ERP
¿Qué es SAP? Más allá del ERP
 
Conceptos de Data Warehouse.ppt
Conceptos de Data Warehouse.pptConceptos de Data Warehouse.ppt
Conceptos de Data Warehouse.ppt
 
Diseñando la Experiencia de los Usuarios - Facultad de Informática - UNLP
Diseñando la Experiencia de los Usuarios - Facultad de Informática - UNLPDiseñando la Experiencia de los Usuarios - Facultad de Informática - UNLP
Diseñando la Experiencia de los Usuarios - Facultad de Informática - UNLP
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Copy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.pptCopy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.ppt
 
Iii jornada sesión 2 - experiencia cliente assa implantación sap business one
Iii jornada   sesión 2 - experiencia cliente assa implantación sap business oneIii jornada   sesión 2 - experiencia cliente assa implantación sap business one
Iii jornada sesión 2 - experiencia cliente assa implantación sap business one
 
Conceptos claros ERP, CRM y Data Warehouse
Conceptos claros ERP, CRM y Data WarehouseConceptos claros ERP, CRM y Data Warehouse
Conceptos claros ERP, CRM y Data Warehouse
 
Proyectofinaldeti empresaautomotriz-110505115141-phpapp02
Proyectofinaldeti empresaautomotriz-110505115141-phpapp02Proyectofinaldeti empresaautomotriz-110505115141-phpapp02
Proyectofinaldeti empresaautomotriz-110505115141-phpapp02
 

Dernier

Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdfComparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
AJYSCORP
 
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptxsenati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
nathalypaolaacostasu
 
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.pptRENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
administracion46
 
Ejemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociaciónEjemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociación
licmarinaglez
 

Dernier (20)

Tarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.pptTarea-4-Estadistica-Descriptiva-Materia.ppt
Tarea-4-Estadistica-Descriptiva-Materia.ppt
 
implemenatcion de un data mart en logistica
implemenatcion de un data mart en logisticaimplemenatcion de un data mart en logistica
implemenatcion de un data mart en logistica
 
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsxINFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
INFORMATIVO CIRCULAR FISCAL - RENTA 2023.ppsx
 
Empresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercadoEmpresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercado
 
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdfComparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
 
DERECHO EMPRESARIAL - SEMANA 01 UNIVERSIDAD CESAR VALLEJO
DERECHO EMPRESARIAL - SEMANA 01 UNIVERSIDAD CESAR VALLEJODERECHO EMPRESARIAL - SEMANA 01 UNIVERSIDAD CESAR VALLEJO
DERECHO EMPRESARIAL - SEMANA 01 UNIVERSIDAD CESAR VALLEJO
 
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptxsenati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
 
Maria_diaz.pptx mapa conceptual gerencia industral
Maria_diaz.pptx mapa conceptual   gerencia industralMaria_diaz.pptx mapa conceptual   gerencia industral
Maria_diaz.pptx mapa conceptual gerencia industral
 
TEORÍAS DE LA MOTIVACIÓN Recursos Humanos.pptx
TEORÍAS DE LA MOTIVACIÓN Recursos Humanos.pptxTEORÍAS DE LA MOTIVACIÓN Recursos Humanos.pptx
TEORÍAS DE LA MOTIVACIÓN Recursos Humanos.pptx
 
2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptx2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptx
 
el impuesto genera A LAS LAS lasventas IGV
el impuesto genera A LAS  LAS lasventas IGVel impuesto genera A LAS  LAS lasventas IGV
el impuesto genera A LAS LAS lasventas IGV
 
Caja nacional de salud 0&!(&:(_5+:;?)8-!!(
Caja nacional de salud 0&!(&:(_5+:;?)8-!!(Caja nacional de salud 0&!(&:(_5+:;?)8-!!(
Caja nacional de salud 0&!(&:(_5+:;?)8-!!(
 
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.pptRENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
RENTAS_EXENTAS_Y_GASTOS_NO_DEDUCIBLES_ut.ppt
 
Manual para las 3 clases de tsunami de ventas.pdf
Manual para las 3 clases de tsunami de ventas.pdfManual para las 3 clases de tsunami de ventas.pdf
Manual para las 3 clases de tsunami de ventas.pdf
 
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedadesLas sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
 
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptxINTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
INTERESES Y MULTAS DEL IMPUESTO A LA RENTA POWER POINT.pptx
 
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwwwS05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
 
Ejemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociaciónEjemplo Caso: El Juego de la negociación
Ejemplo Caso: El Juego de la negociación
 
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptxSostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
 
La Cadena de suministro CocaCola Co.pptx
La Cadena de suministro CocaCola Co.pptxLa Cadena de suministro CocaCola Co.pptx
La Cadena de suministro CocaCola Co.pptx
 

D wh.introj

  • 1. Data Warehouse y Sistemas de Soporte a la Decisión Un Enfoque Práctico Hugo M. Castro
  • 2. El Caso  RapiServ es una empresa de comidas rápidas con 20 locales que se distribuyen en tres zonas:  Capital  Provincia de Buenos Aires  Interior
  • 3. RapiServ  Sus menúes comprenden platos de carne y pollo, papas fritas y una variedad de ensaladas y postres  Por supuesto ofrecen bebidas frías (gaseosas y agua mineral) y también bebidas calientes (té, café) y pastelería, principalmente a la mañana.
  • 4. RapiServ  Pero su plato distintivo es una especialidad que recibe el nombre de Cordon Bleu, una comida con carne y verduras que tiene bastante aceptación.
  • 5. RapiServ  José, el Presidente, dice: Hay que aumentar las ventas
  • 6. RapiServ  Mario, Director de Marketing, se pregunta: ¿Qué podemos ofrecer a nuestros clientes?
  • 7. RapiServ  Para responder a esa pregunta, Mario necesita saber:  ¿Qué productos se venden más?  ¿Qué sucursales venden mejor?  ¿En qué horas hay más clientes?  ¿Qué días de la semana son más flojos?
  • 8. RapiServ  ¿Quién puede darle esa información?  Mario sabe que Sistemas procesa los tickets de las sucursales en los procesos de stock de mercadería y contabilidad  Por eso se dirige a Carlos, Encargado de Sistemas
  • 9. RapiServ  Carlos, el Encargado de Sistemas, recibe el pedido y estima que tendrá lista la información en un plazo de veinte días a un mes
  • 10. RapiServ  Mario pregunta: ¿Cómo un mes? ¿Acaso la información no está dentro de su computadora?
  • 11. RapiServ  Carlos responde: Sí, los datos están en la computadora, pero no tienen la estructura adecuada para contestar esas preguntas
  • 12. RapiServ  Mario queda convencido de que si los datos están guardados en la computadora tan difícil no debe ser obtener las respuestas que busca
  • 13. RapiServ  Carlos queda convencido de que Mario siempre pide cosas diferentes y todo lo quiere para ayer
  • 14. RapiServ Este es el momento en que recurren a nosotros para que los ayudemos
  • 15. RapiServ Antes de actuar analicemos la situación ¿Dónde está el problema?  Mario tiene razón en que los datos están en la computadora  Y Carlos tiene razón en que no es fácil darles la forma que Mario necesita
  • 16. RapiServ Ambos hacen uso de los mismos datos, pero...  Mario necesita analizar la información para saber qué ocurre y tomar decisiones estratégicas  Carlos necesita llevar a cabo los procesos que requiere la operatoria diaria de la empresa
  • 17. RapiServ Hay una diferencia fundamental  A Carlos le basta con manejar datos  Mario necesita extraer información de esos datos
  • 18. Cadena de Valores DatosDatos • Sucursales • Poductos • Franjas Horarias • Estacionamiento • Servicio en auto InformaciónInformación • La sucursal X está en el distrito Z de la zona W • El producto P cuesta $Q • La franja horaria 1 comprende las horas de la mañana ConocimientoConocimiento • En la zona Capital hubo H • pedidos del producto X • En la franja horaria 1 se vende menos que en la 2 DecisiónDecisión • Hagan propaganda del producto X en la zona Capital • Estudien promociones para la franja horaria 1 • Ofrezcan el servicio en auto en la zona Buenos Aires
  • 19. El proceso de toma de decisiones  Se encuentran hechos destacados  Se explican en términos de negocios  Se toman las decisiones correspondientes
  • 20. Una Nueva Estructura Si los datos están en la computadora pero la forma no es la adecuada, la solución es  CREAR UNA BASE DE DATOS CON LA FORMA ADECUADA
  • 21. Un Nuevo Tipo de BD La base de datos con la estructura adecuada es lo que se denomina DATA WAREHOUSE Es una base de datos separada de los sistemas transaccionales e independiente de ellos.
  • 22. Data Warehouse Un Data Warehouse es una Base de Datos con una estructura  Orientada al negocio  Integrada  Variable en el tiempo  No Volátil
  • 23. Orientada al negocio  Organiza y presenta los datos desde la perspectiva de los conceptos que maneja la empresa (fecha, franja horaria, producto, sucursal, ventas).  Los datos tienen el nivel de detalle y la estructura que necesitan los que toman decisiones
  • 24. Integrada  Se construye a partir de fuentes de datos heterogéneas  Bases de datos relacionales, archivos planos, hojas de cálculo, documentos impresos  Se unifican denominaciones, codificaciones, formatos  Limpieza  Integración
  • 25. Variable en el Tiempo  El horizonte temporal del Data Warehouse es más amplio que el de los sistemas transaccionales  Vida útil de los datos  Datos históricos  La fecha es un dato fundamental  Marcación temporal
  • 26. No Volátil  En el Data Warehouse los datos no se modifican  El Data Warehouse se renueva  Los datos permanecen intactos entre renovaciones  Sólo existen dos operaciones  Carga  Acceso
  • 27. Data Warehouse  UN DATA WAREHOUSE CONTIENE  Información histórica  Para visualizar tendencias y efectuar comparaciones  Información consolidada  Para acelerar la respuesta a las consultas Las bases de datos más voluminosas son Data Warehouses
  • 28. Procesos Extracción, Transformación y Carga  Extracción  Se eligen qué datos se van a llevar al DWh desde las diversas fuentes  Transformación  Los datos se depuran, completan y transforman  Carga  Los datos se ordenan, se consolidan, se calculan los datos derivados, severifica la integridad y se incorporan al DWh Este es un proceso repetitivo
  • 29. Procesos Explotación de datos  Guardar y estructurar los datos en un Data Warehouse es sólo parte de la tarea  Necesitamos analizar los datos para la toma de decisiones
  • 30. Explotación de datos  Herramienta de redacción de informes orientada al usuario  Empezamos por producir los mismos informes que el profesional de negocios estaba recibiendo hasta ahora  Pero ahora él puede armarlos en forma interactiva
  • 31. Informes  Para obtener los informes no es necesario escribir ningún programa  Lo puede definir el propio profesional de negocios  La herramienta que produce los informes está preparada para que él la utilice
  • 32. Informes El profesional de negocios decide  Qué criterios de selección va a usar sobre la base de datos  Qué datos va a incluir en el informe  Cómo se van a ordenar los datos  Cómo se van a agrupar los datos
  • 33. Informes  Con estas herramientas queda resuelto el problema de la producción de informes, pero Mario y su gente encuentran que LAS RESPUESTAS GENERAN PREGUNTAS
  • 34. Preguntas  ¿Cómo se vende en cada sucursal por franja horaria?  ¿Qué productos se venden más en las tardes?  ¿Venden más las sucursales que tienen servicio en el auto?  ¿Y las que tienen estacionamiento?
  • 35. Modelo de datos  Modelo de Entidad-Relación  Orientado a la implementación de los procesos transaccionales  Tareas operativas  Modelo dimensional  Orientado a las características del negocio (variables del negocio)  Tareas de análisis
  • 36. Modelo dimensional  Dimensiones  Variables del negocio  Productos, sucursales, fechas  Medidas  Valores numéricos  Sumas, consolidaciones, operaciones aritméticas
  • 37. Modelo dimensional  Cantidad de pedidos por fecha, producto y sucursal Producto Sucursal Fecha Dimensiones: Producto, Sucursal, Fecha Estructura Jerárquica Categoría Zona Año Subcategoría Distrito Trimestre Producto Sucursal Mes Día
  • 38. Cubo  Es una forma de presentar los datos al usuario  No existe físicamente  El usuario puede trabajar con los datos como si existiera  Es independiente de la forma en que realmente se almacenan los datos
  • 39. OLAP  Sistemas transaccionales: OLTP  T identifica transacciones  Sistema de Análisis: OLAP  A identifica análisis
  • 40. OLAP  Es el proceso de almacenar y administrar datos sobre la base de las variables del negocio (dimensiones), para permitir a los profesionales de negocios visualizarlos y analizarlos para entender cuál es su significado
  • 41. Preguntas  ¿Cómo se vende en cada sucursal por franja horaria?  ¿ Qué productos se venden más en las tardes?  ¿Venden más las sucursales que tienen servicio en el auto?  ¿Y las que tienen estacionamiento?
  • 42. Navegación  Cambio de dimensiones  Cambio de ejes  Cambio de forma de presentación  Cambio de medidas  Cambio de nivel de detalle  Drill down  Drill up  Conexión con otras tablas de hechos  Drill across  Conexión con tablas externas  Drill through/Drill Out
  • 43. Análisis OLAP FECHA ARTICULO SUCURSAL VENTAS UNIDADES TICKETS DIMENSIONES MEDIDAS ARTICULO FECHA Se elige la dimensión para las filasSe elige la dimensión para las columnas Se elige la medida a representar
  • 44. Unidades vendidas por tipo de artículo durante 2004
  • 45. “Drill down”: Mayor detalle sobre Comestibles
  • 47. “Drill down”: unidades de comestibles vendidas en sucursales de Capital
  • 48. Tablero de Comando Enfoque tradicional  Indicadores financieros  Ventas  Ganancias  Cobranza  Stock valorizado  El resto carece de importancia
  • 49. Tablero de Comando Enfoque tradicional  No tiene en cuenta aspectos tales como  Relación con los clientes  Análisis de los procesos internos  Capacitación y crecimiento del personal  Descubrir esta falta demasiado tarde puede traer graves consecuencias
  • 50. Tablero de Comando Integral (BSC)  Distintas perspectivas  Fijación de objetivos  Máximo (ej. gastos)  Mínimo (ej. ventas)  Establecimiento de metas y tolerancias Tablero de Comando
  • 52. Tablero de Comando Perspectivas (Cobranza, Ventas)
  • 54. ComponentesComponentes Data Warehouse Extracción Transformación Carga Renovación Motor OLAP Informes Consultas OLAP Data mining Mecanismo de Integración Metadatos Fuentes de Datos Explotación Sirve para Data Marts BD Transaccionales Otras Fuentes de Datos Almacenamiento Servidor OLAP
  • 55. Metadatos Son datos que describen objetos del data warehouse  Estructura del Data Warehouse  Esquema, visiones, dimensiones, datos derivados, ubicación y contenido de los data mart  Datos sobre los datos  Origen de los datos  Validez de los datos (activo, histórico, eliminado)  Información de control (estadísticas de uso, errores, información de auditoría)  Algoritmos que se usan para la consolidación  Correspondencia entre datos operativos y los del data warehouse  Datos de Negocios  Definiciones de términos del negocio, dueños de los datos
  • 56. Tres Alternativas  Data warehouse  Recoge información de toda la empresa  Data Mart  Sirve a un grupo específico de usuarios. Su alcance se reduce a un área en particular (p.ej. Marketing)  Independiente: Se genera a través de un proceso de ETL  Dependiente : Se toma del Data Warehouse  Data warehouse virtual  Se forma a partir de distintos Data Marts
  • 57. ¿Y ahora?  Mario sabe que con OLAP puede contestar todas las preguntas que puede formular, pero...  ¿y las que no puede formular?
  • 58. Preguntas  ¿A qué clientes me conviene ofrecer este nuevo producto?  ¿Cuántos pedidos de pollo vamos a recibir durante las vacaciones de invierno?  ¿La compra de Cordon Bleu influye en la compra de papas fritas?
  • 59. Preguntas La respuesta a esas preguntas van a salir de un proceso llamado DATA MINING
  • 60. Data Mining  Es un proceso automático que permite extraer esquemas interesantes y no triviales de los datos y descubrir relaciones entre variables  Estamos ahogados en datos, pero sedientos de información
  • 61. Selección y Preprocesamiento Data Mining Interpretación y Evaluación Consolidación de Datos Conocimiento p(x)=0.02 Warehouse Datos Originales Esquemas y Modelos Datos Preparados Datos Consolidados El Proceso de Data Mining
  • 62. Ejemplo Veamos cómo un modelo de Data Mining ayuda a Mario a contestar una de las preguntas que se formulaba ¿La compra de Cordon Bleu influye en la compra de papas fritas?
  • 63. Ejemplo Del análisis del contenido de los tickets surge que De un total de 500.000 tickets  Hay 60.000 que contienen Cordon Bleu  Hay 40.000 que contienen papas fritas  De esos tickets hay 30.000 que contienen ambos productos
  • 64. Ejemplo En este caso: ¿Qué proporción de todos los tickets tienen Cordon Bleu y papas fritas? 30.000/500.000 o sea el 6% de los tickets
  • 65. Ejemplo Pregunta:  ¿Qué proporción de clientes en general compra papas fritas?  40.000/500.000 o sea el 8%
  • 66. Ejemplo ¿Qué proporción de los compradores de Cordon Bleu compran además papas fritas? 30.000/60.000 o sea que el 50% de los compradores de Cordon Bleu piden papas fritas
  • 67. Ejemplo  La conclusión es que el empuje de Cordon Bleu sobre las papas fritas es de 50/8 o sea 6,25  Esto quiere decir que la gente que compra Cordon Bleu compra 6,25 veces más papas fritas que el promedio de los clientes
  • 68. Uso del Data Warehouse  Tres clases de aplicaciones del Data Warehouse  Procesamiento de Información  Consultas, análisis estadísticos sencillos, informes  Tablas, diagramas, gráficos  Procesamiento Analítico  Análisis multidimensional de datos  Operaciones OLAP: slice-dice, drilling, rotaciones  Data mining  Descubrimiento de esquemas ocultos  Modelos analíticos: predicción, asociación, segmentación
  • 69. Potencial de Soporte a la Decisión Alta Gerencia Profesional de Negocios Analista de Datos Administrador de Datos Decisiones de Marketing Presentación Visualización Data Mining Descubrimiento de Información Exploración de datos Análisis Estadístico-Consultas-Informes OLAP – Análisis Multidimensional Data Warehouses / Data Marts Fuentes de Datos Papel, Archivos Planos,Planillas de Cálculo, BD, OLTP Inteligencia de Negocios José Mario Carlos
  • 70. RapiServ  José, el Presidente, obtiene la información que necesita en tiempo y forma
  • 71. RapiServ  Mario, Director de Marketing, tiene a su gente analizando la información y no imaginando qué informes deberían pedir
  • 72. RapiServ  A Carlos, el Encargado de Sistemas, también le mejoró la vida: ya no le llegan pedidos de marketing con plazos imposibles de cumplir
  • 73. En Resumen  La información adecuada  En el plazo adecuado  Para la persona adecuada MEJORES DECISIONES
  • 74. En Resumen LA INTUICIÓN INFORMADA ES INSUPERABLE