1. División de Alta Tecnología
FUNDAMENTOS DE APLICACIONES
BUSINESS INTELLIGENCE
2. División de Alta Tecnología
Introducción al Business Intelligence
1.¿Qué es Business Intelligence?
2.Historia y Evolución de los conceptos de BI
3.Conceptos y Terminología BI: OLTP, OLAP, Data
Warehouse, Datamart, Metadata
3. División de Alta Tecnología
¿Qué es Business Intelligence?
Business Intelligence o Inteligencia de
Negocios, consiste en el proceso de
transformación de datos en información,
haciendo uso de técnicas de Extracción,
Transformación y Carga (ETL),
proporcionando información validada
para una adecuada toma de decisiones y
de manera oportuna.
4. División de Alta Tecnología
¿El valor de la Información?
“Transformación Ascendente”
DATOS
INFORMACION
INTELIGENCIA
CONOCIMIENTO
SABIDURIA
5. División de Alta Tecnología
¿El valor de la Información?
Asignación de valor: Ley de oferta y demanda?
Preguntas claves:
¿Qué influencia la compra y la demanda?
¿Qué productos me generan más ingresos?
¿En dónde hay oportunidades de negocio?
¿Cómo segmento mis clientes según su comportamiento comercial?
¿Qué es lo que mueve la calidad del producto y la demanda de los
clientes?
“Era de la Información”, la información tiene un valor
monetario.
6. División de Alta Tecnología
Las Organizaciones y sus Requerimientos de S.I.
Las empresas al querer contar con una mayor
automatización en sus procesos, implementan dentro de su
organización una gran infraestructura tecnológica.
Sistemas de Procesamiento de Datos (SPD)
Administración de Recursos Empresariales (ERP)
Sistemas de Información Ejecutiva (EIS)
Sistemas de Soporte a Decisiones (DSS)
Manejo de Relación con Clientes (CRM)
7. División de Alta Tecnología
¿ Qué información se necesita?
Antiguamente:
Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA
Actualmente:
Más personas toman decisiones
Deben tener información OPORTUNA Y DE CALIDAD
8. División de Alta Tecnología
Requerimientos Informativos
en la Piramide Organizacional
Analistas
Consumidores
de Información
Exploradores
de
Información
5-10% de los usuarios
15-25% de los usuarios
65-80% de los
usuarios
Nivel Estratégico
Nivel Táctico
Nivel Operacional
9. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Incas, Fenicios, persas, egipcios y otros pueblos usaban informaciones
obtenidas de la naturaleza en beneficio propio
Mareas
Periodos de Sequías
Lluvias
Posición de los astros
10. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Después de la conquista de América, se crea en España la "Casa del Oro“
Las nuevas tecnologías tales como, almacenamiento en tarjetas
perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación
(4GL), permitieron darle al usuario la facilidad de tener el control directo
de los sistemas y de la información.
11. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
En los 70’s se da un gran salto al aparecer :
• Los dispositivos de Acceso Directo
(DASD)
Acceso veloz a los datos y Búsquedas directas y No
lineales
• Administración de Bases de Datos
(DBMS)
permitía al desarrollador el acceso a la información, al
encargarse del almacenamiento e índices.
En los 90’s las grandes empresas contaban
con Centros de Información (CI).
Funcionaban como repositorio de datos,
Información poco disponible
Conceptos de Business Intelligence
12. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
El concepto de Data Warehouse nace entre los años 1992 y 1993 como
base del desarrollo de soluciones Business Intelligence. «repositorio»«repositorio»
En 1996 el concepto de Business Intelligence empezó a difundirse como
una evolución de los Executive Information Systems (EIS).
13. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
El término Business Intelligence se extendió hacia otras
herramientas como:
EIS (sistema de información ejecutiva)
DSS (sistema de soporte a las decisiones)
Balanced Scorecad (indicadores de gestión)
Dashboard (cuadros de mandos)
ER (reporteadores empresariales)
Data Marts, Data Mining, Herramientas OLAP
Resumen : Activar la capacidad de tomar decisiones, afinar estrategias de
relaciones con los clientes y satisfacer las necesidades del sector empresarial.
14. División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
Los sistemas de Planeamiento de Recursos Empresariales o Enterprise
Resource Planning (ERP), tienen como función principal dar soporte a la
parte operativa de las diferentes áreas de la organización, y se encuentra
muy ligada con la historia del Business Intelligence.
Actualmente los ERP se convierten en el principal origen de datos para
soluciones Business Intelligence
15. División de Alta Tecnología
ERP
El reto es unir elementos de las áreas y
proporcionarle a los usuarios una manera
universal de utilizar la información
almacenada en diferentes sistemas.
Utiliza la información a través de la
organización de forma más proactiva en
áreas claves.
16. División de Alta Tecnología
Conceptos y Terminología BI:
OLTP
OLAP
Data Warehouse
Datamart
Metadata
17. División de Alta Tecnología
On Line Transacction Processing (OLTP)
OLTP esta encargado de dar soporte a los procesos diarios de ingreso y
mantenimiento de datos en tiempo real.
Características
Diseño orientado a la transacción.
Volatilidad de los datos.
Proporciona soporte muy limitado a la toma de decisiones.
Ejemplos:
• Cobranzas.
• Sistema de control de asistencia.
• Control de almacén.
18. División de Alta Tecnología
On Line Analytical Processing (OLAP)
OnLine Analytical Processing (OLAP) es un proceso en el que
se usan herramientas netamente análiticas, que facilitan el
análisis de la información del negocio. Se halla organizada
en entidades y métricas, que permiten al usuario
flexibilidad en la ejecución de consultas complejas.
19. División de Alta Tecnología
OLAP
Los servicios OLAP proveen de múltiples niveles de análisis
entre los cuales podemos mencionar, además de tener la
capacidad de realizar consultas complejas:
•Realizar actividades intensivas de comparación de datos
•Análisis de tendencias
•Reportes
•Aislar un grupo de datos con características específicas
De forma amigable, rápida y confiable.
20. División de Alta Tecnología
OLAP
Características
Es consolidada. La data se agrupada desde todas las áres de la
organización y almacenada en un repositorio central y único.
Es consistente. Todos los usuarios deben obtener la misma versión
de los datos independientemente de donde provengan o cuando hallan
sido procesadas.
Es orientada al objetivo. Sólo debe contener información
importante que permita la toma de decisiones.
21. División de Alta Tecnología
OLAP
Características
Es histórica. Toda la información de la empresa es almacenada
como fotografías en el repositorio único de datos.
Es de solo lectura. El sistema OLAP es exclusivamente sólo para
consultas.
No es atómica. La data OLAP principalmente contiene data
sumirazada y resumida.
23. División de Alta Tecnología
OLAP. Un ejemplo
Ejemplo:
Una cadena de tiendas de alquiler de videos muestra el siguiente
cuadro mensual, con las cantidades de videos alquilados por cada
una de sus sucursales.
24. División de Alta Tecnología
OLAP. Un ejemplo
Sin embargo, la tienda de alquiler de videos también
desearía ver como se desarrollan las ventas en el tiempo.
25. División de Alta Tecnología
OLAP
Las mismas celdas de datos se visualizan mediante un cubo.
Tiempo
Tienda
Categoría
26. División de Alta Tecnología
OLAP
1. ¿Cuánto se alquila por categoría de video en cada tienda en un mes dado?
Resp.: Categoría de video por tienda en un mes dado
2. ¿Qué tiendas han mejorado sus alquileres de video a través del tiempo?
Resp. : Tienda por tiempo de una categoría de video dado.
27. División de Alta Tecnología
Modelos de Almacenamiento
OLAP Relacional (ROLAP)
OLAP Multidimensional (MOLAP)
OLAP Híbrido (HOLAP)
OLAP de Escritorio (DOLAP)
OLAP Local (LOLAP)
28. División de Alta Tecnología
ROLAP
OLAP Relacional (ROLAP) es un sistema en el cual los datos se
encuentran almacenados en una base de datos relacional.
Típicamente, los datos son detallados, evitando las agregaciones
y las tablas se encuentran normalizadas.
Los esquemas más comunes sobre los que se trabaja son estrella
o copo de nieve, aunque es posible trabajar sobre cualquier base
de datos relacional.
ROLAP es utilizada en DataMarts con grandes volúmenes de datos
como por ejemplo :
Las empresas de telecomunicaciones
Banca, entre otros.
29. División de Alta Tecnología
ROLAP
La arquitectura ROLAP está compuesta por un servidor de
base de datos Relacional y un motor OLAP en un servidor
dedicado.
Esta arquitectura está diseñada para almacenar gran
volumen de datos, debido a que su almacenamiento es
relacional.
30. División de Alta Tecnología
MOLAP
En un sistema OLAP multidimensional (MOLAP) los datos se
encuentran almacenados en una estructura multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la
información es usualmente calculado por adelantado. Estos valores
precalculados o agregaciones son la base de las ganancias de
desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de datos para
disminuir el espacio de almacenamiento en disco debido a los
valores precalculados.
MOLAP es utilizada en DataMarts con pequeños volúmenes de
datos como por ejemplo :
Medianas empresas
Áreas especificas de una organización
31. División de Alta Tecnología
La arquitectura MOLAP está compuesta por un motor OLAP en un
servidor dedicado.
Esta arquitectura está diseñada para almacenar poco volumen de
datos lo cual generará una limitación respecto al tamaño de BD.
Esta arquitectura permitir mejoras enormes en la performance
con respecto a los tiempos de consulta logrando un análisis más
fácil y rápido
Base de Datos
Relacional
Vista de
Usuario
Base de Datos
Multidimensional
AGREGACIONES
Y DATOS
Base de Datos
Relacional
Vista de
Usuario
Base de Datos
Multidimensional
AGREGACIONES
Y DATOS
MOLAP
32. División de Alta Tecnología
HOLAP
Un sistema OLAP Híbrido (HOLAP) mantiene los registros
detallados en la base de datos relacional, mientras que
los datos resumidos o agregados se almacenan en una
base de datos multidimensional separada.
Este método de almacenamiento es una combinación de
los dos anteriores e intenta rescatar lo mejor de cada
uno.
HOLAP es utilizada en DataMarts con grandes volúmenes
de datos como por ejemplo :
Banca
Retail
Seguros
Entre otros.
33. División de Alta Tecnología
La arquitectura HOLAP está compuesta por un servidor de
base de datos Relacional y un motor OLAP en un servidor
dedicado.
Esta arquitectura permite que el espacio físico, la performance
de las consultas y el procesamiento sea menor que MOLAP y
mayor que ROLAP.
Base de Datos
Relacional
Vista de
Usuario
Base de Datos
Multidimensional
DATOS AGREGACIONES
Base de Datos
Relacional
Vista de
Usuario
Base de Datos
Multidimensional
DATOS AGREGACIONES
HOLAP
34. División de Alta Tecnología
DOLAP y LOLAP
Las Desktop Online Analytical Processing (DOLAP) y
Local Online Analytical Processing (LOLAP) se almacena
en la estación de trabajo del cliente (que puede ser una
PC común).
Este tipo de cubos de información envían al servidor
relacional instrucciones SQL desde una estación de
trabajo y reciben los datos almacenándolos como micro
cubos los cuales son analizados de manera local.
Entre sus desventajas es que el cubo offline no puede ser
muy grande y al estar almacenado en la pc del cliente
pueden presentarse problemas de seguridad.
35. División de Alta Tecnología
ARQUITECTURAS OLAP
Los usuarios que requieren de un alto nivel de detalle necesitarán de
una arquitectura ROLAP
Los usuarios que requieren de datos agregados y sumarizados
necesitarán de una arquitectura MOLAP
Los analista que requieran ambos tipos de análisis necesitarán una
arquitectura HOLAP.
36. División de Alta Tecnología
OLTP vs OLAP
Difieren en arquitectura y uso.
Entre los numerosos puntos de diferencias se encuentran:
Los objetivos principales
La orientación de los datos
La integración
La historicidad
El acceso de datos y manipulación
Los patrones de uso
La granularidad de los datos
El perfil de los usuarios
La metodología de desarrollo, etc.
37. División de Alta Tecnología
OLTP vs OLAP
Objetivos principales de construcción
Los OLTP están orientados a dar soporte a las operaciones diarias del
negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del
negocio (consultas).
38. División de Alta Tecnología
OLTP vs OLAP
Alineación de datos
Los OLTP están orientados a aplicaciones o sistemas los cuales poseen
distintos tipos de datos y diferentes y estructurados para registrar las
trascancciones diarias del negocio.
Los sistemas OLAP están alineados por área o tema y están orientados
a la consulta del analista de negocio. Se orientan totalmente a las
consultas.
39. División de Alta Tecnología
OLTP vs. OLAP
OLTP
OLAP
Por ejemplo :
En las financieras existen numerosas aplicaciones de cuentas y colocaciones a
nivel operacional mientras que en un Data Warehouse la información estaría
organizada por cliente, funcionario, tipo de cuenta y tiempo.
En las comercializadoras existen aplicaciones sobre registro de ventas, registro
de compras, manejo de inventario o stock y presupuesto. En un Data Warehousing
hablaríamos de productos, sucursales, proveedores, tiempo y las diferentes
métricas propias de negocio (unidades vendidas, monto neto, etc)
40. División de Alta Tecnología
OLTP vs. OLAP
Integración de datos
En los OLTP, los datos se encuentran dispersos, son calificados como
datos base o datos operacionales. Estos datos son estructurados en
forma aislada uno de otros, pudiendo tener diferentes estructuras de
llaves y nombres.
En los ambientes OLAP, los datos deben estar integrados, consolidados
y orientados a un tema o área de análisis.
41. División de Alta Tecnología
OLTP vs. OLAP
Acceso y manipulación de los datos
Los sistemas operacionales realizan operaciones con los datos fila por
fila usando genaralmente sentencias inserts, updates y deletes.
Además requieren de rutinas de validación como son el commit y el
rollback, los bloqueos de registros, etc.
Los sistemas OLAP tienen una carga y acceso masivo de datos,
haciendo uso principalmente de sentencias select. Es por esta razón
que la estructura de la BD analítica es desnormalizada rompiendo los
esquemas clásicos operacionales para beneficiar el tiempo de consulta
y proceso.
42. División de Alta Tecnología
OLTP vs. OLAP
Granularidad de los datos
Los sistemas OLTP se encuentran los datos a nivel atómico
(transacción por transacción).
Los sistemas OLAP tienen adicionalmente de data detallada, datos
sumarizados y agregados.
44. División de Alta Tecnología
Data Warehouse
Ralph Kimball: “un data warehouse es una ‘copia’ de los
datos transaccionales específicamente estructurados para
consultas y análisis”.
45. División de Alta Tecnología
Data Warehousing
“A Warehouse is a place, Warehousing is a process”
[R.Hackathorn]
Existe una gran cantidad de procesos detrás de una arquitectura de Data
Warehouse de suma importancia para el mismo. Estos comprenden desde
procesos de extracción que estudian y seleccionan los datos fuente adecuados
para el Data Warehouse hasta procesos de consulta y análisis de datos que
despliegan la información de una forma fácil de interpretar y analizar.
A continuación pasaremos a explicar los procesos básicos de una Data
Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de Calidad,
Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad, Respaldo y
Recuperación.
46. División de Alta Tecnología
Extracción
El proceso de extracción consiste en estudiar y entender los datos fuente,
tomando aquellos que son de utilidad para el Data Warehouse.
Transformación
Una vez que los datos son extraídos, éstos se transforman. Este proceso incluye
corrección de errores, resolución de problemas de dominio, borrado de
campos que no son de interés, generación de claves, aumento de
información, etc.
Carga e Índices
Al terminar el proceso de transformación, se cargan los datos en el Data
Warehouse.
Chequeo de Calidad
Una vez ingresada la información al Data Warehouse, se realizan controles de
calidad para asegurar que la misma sea correcta.
Data Warehousing
47. División de Alta Tecnología
Consulta
El usuario final debe disponer de herramientas de consulta y procesamiento de
datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS,
Data Mining, etc.
Feedback
Muchas veces es aconsejable seguir el camino inverso de carga. Por ejemplo,
puede alimentarse los sistemas legales con información depurada del Data
Warehouse o almacenar en el mismo alguna consulta generada por el
usuario que sea de interés.
Auditoria
Los procesos de auditoría permiten conocer de donde proviene la información
así como también qué cálculos la generaron.
Data Warehousing
48. División de Alta Tecnología
Seguridad
Una vez construido el Data Warehouse, es de interés para la organización
que la información llegue a la mayor cantidad de usuarios pero, por otro
lado, se tiene sumo cuidado de protegerla contra posibles 'hackers',
'snoopers' o espías. El desarrollo de Internet a incrementado este dilema.
Respaldo y Recuperación
Se deben realizar actividades de backup y restore de la información, tanto la
almacenada en el Data Warehouse como la que circula desde los sistemas
fuente al Data Warehouse.
Data Warehousing
49. División de Alta Tecnología
Datamart
Un Datamart es un Data Warehouse mas
pequeño.Normalmente la información contenida en un
datamart es un subconjunto de un datawarehouse.
50. División de Alta Tecnología
Datamart
Características
Orientado a un departamento dentro de la organización
Puede ser implementado como una solución para problemas
inmediatos
No es necesario para construir un Data Warehouse.
Beneficios
Implementación rápida y sencilla
Menor costo de implementación
Cubre necesidades especificas del Negocio
Respuestas rápidas por el menor volumen de información
Asegura la consistencia de los datos
51. División de Alta Tecnología
Datamart
Desventajas
Inadvertidamente se puede usar datos no compatibles con otros
Datamarts que luego alarguen el tiempo de unificación
Si el Data Warehouse es construido primero, se requiere de hardware
adicional para soportar Datamarts individuales.
Datos descentralizados debido a que cada Datamart corresponde a
una base de datos individual por tema o por área.
52. División de Alta Tecnología
Metadata
Es un componente muy valioso para el Data Warehouse; los
datos provenientes de la metadata se sitúa en una
dimensión diferente al de otros datos del data warehouse,
debido a que su contenido no es tomado directamente
desde el ambiente operacional.
53. División de Alta Tecnología
La Metadata abarca todos los procesos de Data Warehousing y
contiene:
Nombres de campos y definiciones
Mapeo de los datos
Tablas
Índices
Cronogramas de extracción y carga
Criterios de selección
Cálculos de los datos derivados
Transformación de los datos
Metadata
54. División de Alta Tecnología
Existen 3 tipos de Metadatos:
• Metadata del Negocio: Contiene los modelos lógicos y las
reglas de negocio.
• Metadata Técnica: Contiene los nombres físicos de las tablas,
ubicación de almacenamiento, relaciones, llaves, etc.
• Metadata Operacional: Contiene la programación de cargas,
fechas de actualización de datos, seguridad.
Metadata
56. División de Alta Tecnología
1. ¿Qué beneficios puede brindarle a una empresa el Business Intelligence?
Habilidad de tomar las decisiones correctas en el momento
correcto
Por medio de las herramientas necesarias para poder
comparar y analizar tendencias
El tiempo invertido en la realización de presentaciones
ejecutivas se ve reducido de forma significativa
2. El término Business Intelligence fue adoptado:
a. Por los principales consultores europeos porque comprobaron que la historia
del Viejo Continente traía consigo este concepto en diversos episodios.
b. Para que los conceptos que surgieron con las siglas EIS, DSS y SIG puedan
abarcar cada vez más, dentro de un proceso natural de evolución de
tecnologías y metodologías.
a. Para sustituir la nomenclatura ofrecida a los proyectos de Data Warehouse y
Datamart cuando se los diseña por separado.
Preguntas
57. División de Alta Tecnología
3. Según la pirámide organizacional, cuáles son los 3 niveles de información que
se necesitan.
Nivel Estratégico
Nivel Táctico
Nivel Operacional
3. Nombre tres (3) diferencias entre OLTP vs OLAP.
La integración
La historicidad
La granularidad de los datos
3. La tecnología OLAP creció y se multiplicó originando las herramientas:
ROLAP
MOLAP
HOLAP
DOLAP y LOLAP
Preguntas
58. División de Alta Tecnología
3. Un vistazo a un cubo OLAP
Preguntas