2. El Caso
RapiServ es una empresa de comidas
rápidas con 20 locales que se
distribuyen en tres zonas:
Capital
Provincia de Buenos Aires
Interior
3. RapiServ
Sus menúes comprenden platos de
carne y pollo, papas fritas y una
variedad de ensaladas y postres
Por supuesto ofrecen bebidas frías
(gaseosas y agua mineral) y también
bebidas calientes (té, café) y pastelería,
principalmente a la mañana.
4. RapiServ
Pero su plato distintivo es una
especialidad que recibe el nombre de
Cordon Bleu, una comida con carne y
verduras que tiene bastante
aceptación.
7. RapiServ
Para responder a esa pregunta, Mario
necesita saber:
¿Qué productos se venden más?
¿Qué sucursales venden mejor?
¿En qué horas hay más clientes?
¿Qué días de la semana son más
flojos?
8. RapiServ
¿Quién puede darle esa información?
Mario sabe que Sistemas procesa los
tickets de las sucursales en los
procesos de stock de mercadería y
contabilidad
Por eso se dirige a Carlos, Encargado
de Sistemas
9. RapiServ
Carlos, el
Encargado de
Sistemas, recibe el
pedido y estima que
tendrá lista la
información en un
plazo de veinte días
a un mes
14. RapiServ
Este es el momento
en que recurren a
nosotros para que
los ayudemos
15. RapiServ
Antes de actuar analicemos la situación
¿Dónde está el problema?
Mario tiene razón en que los datos
están en la computadora
Y Carlos tiene razón en que no es fácil
darles la forma que Mario necesita
16. RapiServ
Ambos hacen uso de los mismos
datos, pero...
Mario necesita analizar la información
para saber qué ocurre y tomar
decisiones estratégicas
Carlos necesita llevar a cabo los
procesos que requiere la operatoria
diaria de la empresa
17. RapiServ
Hay una diferencia fundamental
A Carlos le basta con manejar datos
Mario necesita extraer información de
esos datos
18. Cadena de Valores
DatosDatos
• Sucursales
• Poductos
• Franjas Horarias
• Estacionamiento
• Servicio en auto
InformaciónInformación
• La sucursal X está en el
distrito Z de la zona W
• El producto P cuesta $Q
• La franja horaria 1
comprende las horas de la
mañana
ConocimientoConocimiento
• En la zona Capital hubo H
• pedidos del producto X
• En la franja horaria 1 se vende
menos que en la 2
DecisiónDecisión
• Hagan propaganda del producto
X en la zona Capital
• Estudien promociones para la
franja horaria 1
• Ofrezcan el servicio en auto en
la zona Buenos Aires
19. El proceso de toma de
decisiones
Se encuentran hechos destacados
Se explican en términos de negocios
Se toman las decisiones
correspondientes
20. Una Nueva Estructura
Si los datos están en la computadora
pero la forma no es la adecuada, la
solución es
CREAR UNA BASE DE DATOS CON
LA FORMA ADECUADA
21. Un Nuevo Tipo de BD
La base de datos con la estructura
adecuada es lo que se denomina
DATA WAREHOUSE
Es una base de datos separada de los
sistemas transaccionales e
independiente de ellos.
22. Data Warehouse
Un Data Warehouse es una Base de
Datos con una estructura
Orientada al negocio
Integrada
Variable en el tiempo
No Volátil
23. Orientada al negocio
Organiza y presenta los datos desde la
perspectiva de los conceptos que maneja la
empresa (fecha, franja horaria, producto,
sucursal, ventas).
Los datos tienen el nivel de detalle y la
estructura que necesitan los que toman
decisiones
24. Integrada
Se construye a partir de fuentes de datos
heterogéneas
Bases de datos relacionales, archivos
planos, hojas de cálculo, documentos
impresos
Se unifican denominaciones,
codificaciones, formatos
Limpieza
Integración
25. Variable en el Tiempo
El horizonte temporal del Data Warehouse
es más amplio que el de los sistemas
transaccionales
Vida útil de los datos
Datos históricos
La fecha es un dato fundamental
Marcación temporal
26. No Volátil
En el Data Warehouse los datos no se
modifican
El Data Warehouse se renueva
Los datos permanecen intactos entre
renovaciones
Sólo existen dos operaciones
Carga
Acceso
27. Data Warehouse
UN DATA WAREHOUSE CONTIENE
Información histórica
Para visualizar tendencias y efectuar
comparaciones
Información consolidada
Para acelerar la respuesta a las consultas
Las bases de datos más
voluminosas son Data
Warehouses
28. Procesos
Extracción, Transformación y Carga
Extracción
Se eligen qué datos se van a llevar al DWh desde
las diversas fuentes
Transformación
Los datos se depuran, completan y transforman
Carga
Los datos se ordenan, se consolidan, se calculan
los datos derivados, severifica la integridad y se
incorporan al DWh
Este es un proceso repetitivo
29. Procesos
Explotación de datos
Guardar y estructurar los datos en un
Data Warehouse es sólo parte de la
tarea
Necesitamos analizar los datos para la
toma de decisiones
30. Explotación de datos
Herramienta de redacción de informes
orientada al usuario
Empezamos por producir los mismos
informes que el profesional de negocios
estaba recibiendo hasta ahora
Pero ahora él puede armarlos en forma
interactiva
31. Informes
Para obtener los informes no es
necesario escribir ningún programa
Lo puede definir el propio profesional
de negocios
La herramienta que produce los
informes está preparada para que él la
utilice
32. Informes
El profesional de negocios decide
Qué criterios de selección va a usar
sobre la base de datos
Qué datos va a incluir en el informe
Cómo se van a ordenar los datos
Cómo se van a agrupar los datos
33. Informes
Con estas herramientas queda resuelto
el problema de la producción de
informes, pero Mario y su gente
encuentran que
LAS RESPUESTAS GENERAN
PREGUNTAS
34. Preguntas
¿Cómo se vende en cada sucursal por
franja horaria?
¿Qué productos se venden más en las
tardes?
¿Venden más las sucursales que
tienen servicio en el auto?
¿Y las que tienen estacionamiento?
35. Modelo de datos
Modelo de Entidad-Relación
Orientado a la implementación de los
procesos transaccionales
Tareas operativas
Modelo dimensional
Orientado a las características del negocio
(variables del negocio)
Tareas de análisis
37. Modelo dimensional
Cantidad de pedidos por fecha, producto
y sucursal
Producto
Sucursal
Fecha
Dimensiones: Producto, Sucursal,
Fecha
Estructura Jerárquica
Categoría Zona Año
Subcategoría Distrito Trimestre
Producto Sucursal Mes
Día
38. Cubo
Es una forma de presentar los datos al
usuario
No existe físicamente
El usuario puede trabajar con los datos
como si existiera
Es independiente de la forma en que
realmente se almacenan los datos
40. OLAP
Es el proceso de almacenar y
administrar datos sobre la base de las
variables del negocio (dimensiones),
para permitir a los profesionales de
negocios visualizarlos y analizarlos
para entender cuál es su significado
41. Preguntas
¿Cómo se vende en cada sucursal por
franja horaria?
¿ Qué productos se venden más en las
tardes?
¿Venden más las sucursales que
tienen servicio en el auto?
¿Y las que tienen estacionamiento?
42. Navegación
Cambio de dimensiones
Cambio de ejes
Cambio de forma de presentación
Cambio de medidas
Cambio de nivel de detalle
Drill down
Drill up
Conexión con otras tablas de hechos
Drill across
Conexión con tablas externas
Drill through/Drill Out
48. Tablero de Comando
Enfoque tradicional
Indicadores financieros
Ventas
Ganancias
Cobranza
Stock valorizado
El resto carece de importancia
49. Tablero de Comando
Enfoque tradicional
No tiene en cuenta aspectos tales
como
Relación con los clientes
Análisis de los procesos internos
Capacitación y crecimiento del personal
Descubrir esta falta demasiado tarde
puede traer graves consecuencias
50. Tablero de Comando Integral
(BSC)
Distintas perspectivas
Fijación de objetivos
Máximo (ej. gastos)
Mínimo (ej. ventas)
Establecimiento de metas y tolerancias
Tablero de Comando
55. Metadatos
Son datos que describen objetos del data warehouse
Estructura del Data Warehouse
Esquema, visiones, dimensiones, datos derivados, ubicación y
contenido de los data mart
Datos sobre los datos
Origen de los datos
Validez de los datos (activo, histórico, eliminado)
Información de control (estadísticas de uso, errores, información de
auditoría)
Algoritmos que se usan para la consolidación
Correspondencia entre datos operativos y los del data warehouse
Datos de Negocios
Definiciones de términos del negocio, dueños de los datos
56. Tres Alternativas
Data warehouse
Recoge información de toda la empresa
Data Mart
Sirve a un grupo específico de usuarios. Su alcance se reduce a un
área en particular (p.ej. Marketing)
Independiente: Se genera a través de un proceso de ETL
Dependiente : Se toma del Data Warehouse
Data warehouse virtual
Se forma a partir de distintos Data Marts
57. ¿Y ahora?
Mario sabe que con OLAP puede
contestar todas las preguntas que
puede formular, pero...
¿y las que no puede formular?
58. Preguntas
¿A qué clientes me conviene ofrecer
este nuevo producto?
¿Cuántos pedidos de pollo vamos a
recibir durante las vacaciones de
invierno?
¿La compra de Cordon Bleu influye en
la compra de papas fritas?
60. Data Mining
Es un proceso automático que permite
extraer esquemas interesantes y no
triviales de los datos y descubrir
relaciones entre variables
Estamos ahogados en datos, pero
sedientos de información
61. Selección y
Preprocesamiento
Data Mining
Interpretación y
Evaluación
Consolidación de
Datos
Conocimiento
p(x)=0.02
Warehouse
Datos Originales
Esquemas y
Modelos
Datos
Preparados
Datos
Consolidados
El Proceso de
Data Mining
62. Ejemplo
Veamos cómo un modelo de Data Mining
ayuda a Mario a contestar una de las
preguntas que se formulaba
¿La compra de Cordon Bleu influye en la
compra de papas fritas?
63. Ejemplo
Del análisis del contenido de los tickets
surge que
De un total de 500.000 tickets
Hay 60.000 que contienen Cordon Bleu
Hay 40.000 que contienen papas fritas
De esos tickets hay 30.000 que
contienen ambos productos
64. Ejemplo
En este caso:
¿Qué proporción de todos los tickets
tienen Cordon Bleu y papas fritas?
30.000/500.000
o sea el 6% de los tickets
66. Ejemplo
¿Qué proporción de los compradores de
Cordon Bleu compran además papas
fritas?
30.000/60.000
o sea que el 50% de los compradores de
Cordon Bleu piden papas fritas
67. Ejemplo
La conclusión es que el empuje de
Cordon Bleu sobre las papas fritas es
de 50/8 o sea 6,25
Esto quiere decir que la gente que
compra Cordon Bleu compra 6,25
veces más papas fritas que el promedio
de los clientes
68. Uso del Data Warehouse
Tres clases de aplicaciones del Data Warehouse
Procesamiento de Información
Consultas, análisis estadísticos sencillos, informes
Tablas, diagramas, gráficos
Procesamiento Analítico
Análisis multidimensional de datos
Operaciones OLAP: slice-dice, drilling, rotaciones
Data mining
Descubrimiento de esquemas ocultos
Modelos analíticos: predicción, asociación, segmentación
69. Potencial
de Soporte
a la Decisión
Alta Gerencia
Profesional de Negocios
Analista de Datos
Administrador
de
Datos
Decisiones
de Marketing
Presentación
Visualización
Data Mining
Descubrimiento de Información
Exploración de datos
Análisis Estadístico-Consultas-Informes
OLAP – Análisis Multidimensional
Data Warehouses / Data Marts
Fuentes de Datos
Papel, Archivos Planos,Planillas de Cálculo, BD, OLTP
Inteligencia de Negocios
José
Mario
Carlos
70. RapiServ
José, el Presidente,
obtiene la
información que
necesita en tiempo y
forma
71. RapiServ
Mario, Director de
Marketing, tiene a
su gente analizando
la información y no
imaginando qué
informes deberían
pedir
72. RapiServ
A Carlos, el
Encargado de
Sistemas, también
le mejoró la vida: ya
no le llegan pedidos
de marketing con
plazos imposibles
de cumplir
73. En Resumen
La información adecuada
En el plazo adecuado
Para la persona adecuada
MEJORES DECISIONES