SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
Mauricio Quintuña                              6to C Ingeniería de Sistemas




                                     Temario
1.   Definición.
2.   Objetivo
3.   Qué es un Data WareHouse?
4.   Importancia
5.   Procesos de un Data Warehouse

                                        1
Mauricio Quintuña                                                                    6to C Ingeniería de Sistemas


6.    Desarrollo gradual
7.    Beneficios de un Data WareHouse
8.    Cómo justificar la inversión en un DataWarehouse?
9.    Ventajas y desventajas del DataWarehouse?
10.   Tipos de usuarios de un DataWarehouse
11.   Las razones básicas de porque una organización implementa Data Warehouse:
12.   Los procesos básicos del Data WareHouse (ETL)
13.   Los elementos básicos de un Data WareHouse:
14.   El Data Mining y su relación con el Data Warehouse.
15.   Características clave del Data Warehouse
16.   Arquitectura del Data Warehouse
17.   ESTRUCTURA DEL DATA WAREHOUSE


                                        DataWareHouse
Definición
“El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e historiados,
organizados para el apoyo de un proceso de ayuda a la decisión.

Objetivo
El objetivo del DW se expresa en términos puramente de negocio como “mantener la fidelidad de la
clientela”

¿Que es un Data Warehouse?
Un Data Warehouse es un almacenamiento separado y homogéneo donde son cargados datos
transformados provenientes de diferentes bases de datos.

Importancia
    Un sistema de Data Warehouse permite transformar datos o información bruta en información
       con sentido y extremadamente útil.
    Uno de los valores más importantes de una organización es la información. Estos valores
       normalmente son guardados por la empresa de dos formas:
    Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y
       nuestro almacén de datos.

Procesos de un Data Warehouse

      a)   Extracción: obtención de información de las distintas fuentes tanto internas como externas.
      b)   Elaboración: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
      c)   Carga: organización y actualización de los datos y los metadatos en la base de datos.
      d)   Explotación: extracción y análisis de la información en los distintos niveles de agrupación.

Desde el punto de vista del usuario, el único proceso visible es la explotación del almacén de datos,
aunque el éxito del Data Warehouse radica en los tres procesos iniciales que alimentan la información del
mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacén.


Desarrollo gradual

      1) Una de las claves del éxito en la construcción de un Data Warehouse es el desarrollo de forma
         gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el
         almacén de datos a los demás usuarios.



                                                     2
Mauricio Quintuña                                                                      6to C Ingeniería de Sistemas


     2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un
        departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se
        puedan obtener y medir resultados a corto plazo.

Beneficios de un Data WareHouse

     a) Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose
        en información integrada y global del negocio.
     b) Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones
        ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha
        información.
     c) Proporciona la capacidad de aprender de los datos del pasado y de
        predecir situaciones futuras en diversos escenarios.
     d) Simplifica dentro de la empresa la implantación de sistemas de gestión
        integral de la relación con el cliente.
     e) Supone una optimización tecnológica y económica en entornos de
        Centro de Información, estadística o de generación de informes con
        retornos de la inversión espectaculares


¿Cómo justificar la inversión en un data warehouse?

- ¿Están las ventas de artículos deportivos sujetas a tendencias por temporada?
¿Qué artículos se ven afectados y cuándo?

- ¿Cuántos autos se vendieron el mes pasado? ¿Cómo se compara esta cantidad con el mismo mes en los
últimos cinco años?

- ¿Quiénes son los diez primeros vendedores o clientes en Latinoamérica? ¿Qué porcentaje del ingreso
generan?

- ¿Cuáles son los diez artículos de menor rentabilidad en el catálogo de ventas?


Ventajas - Data Warehouse

     a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que
        transaccionales.
     b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de
        respuesta mínimo a las consultas.
     c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos.
     d) La administración de la seguridad está centralizada para garantizar la necesidad de información
        dependiendo del perfil de los usuarios.

Desventajas:
   a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de
       procesamiento que puede requerir.
   b) Requiere de continua limpieza, transformación e integración de datos.
   c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que
       pretende una organización.
   d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos.

Tipos de usuarios de un DW:

     1) Turistas
                                                     3
Mauricio Quintuña                                                                     6to C Ingeniería de Sistemas


     2) Exploradores
     3) Labradores.

  Las razones básicas de porque una organización implementa Data Warehouse:

     a)    Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y
           discos que no son utilizados por sistemas de proceso de transacciones.

  b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que
  no son apropiados para los procesos de transacciones.

  c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los
  aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y
  reportes.

  d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y
  que no necesariamente requiere que se arregle el sistema de proceso de transacciones.

  e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de
  transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el
  propósito de hacer queries y reportes.

  Los procesos básicos del Data WareHouse (ETL):

     a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data
         Warehouse.
  b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay
  posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve,
  seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos,
  haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una
  dimensión.
  c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados.


  Los elementos básicos de un Data WareHouse:

     a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las
          transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.
     b) Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian
     transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para
     ser usados en el Data Warehouse.
     c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son
     organizados y almacenados para Queries directos por los usuarios finales, reportes y otras
     aplicaciones.
     d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa
     para los modelos de entidad – relación.
     e) Data Warehouse system.
     f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse,
     también un estilo dimensional especifico de búsquedas y presentación de información.
     g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional
     un estilo dimensional.
     h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases
     de datos que tienen un fuerte estilo dimensional.
     i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan
     y presentan la información objetivo para el soporte de las necesidades del negocio.
                                                     4
Mauricio Quintuña                                                                             6to C Ingeniería de Sistemas




     El Data Mining y su relación con el Data Warehouse.

     Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer
     conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las
     empresas.
     Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera
     permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios
     del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y
     registros de transacciones en línea.
     El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia.

     Cuatro características clave del Data Warehouse

     1)    Las evoluciones tecnológicas
     2)    La vinculación implícita con la estrategia de la empresa
     3)    Una lógica de mejora continua
     4)    Un nivel de madurez diferente según las empresas


     Arquitectura Data Warehouse

                                          Base de datos operacional / Nivel de base de datos externo
                                          Nivel de acceso a la información
                                          Nivel de acceso a los datos
                                          Nivel de directorio de datos (Metadata)
                                          Nivel de gestión de proceso
                                          Nivel de mensaje de la aplicación
                                          Nivel de data warehouse
                                          Nivel de organización de datos

     Estructura del data warehouse

           a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de
              almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle,
              consistente con los datos detallados actuales.

           b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés

           c)       Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde
                    un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse
                    casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para
                    construirlo son:

           d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data
              warehouse es el de los datos completamente resumidos. Estos datos son compactos y
              fácilmente accesibles.




                                                           5

Más contenido relacionado

La actualidad más candente

Data Flow 2
Data Flow 2Data Flow 2
Data Flow 2MISY
 
Características, componentes y arquitectura de los dbms.
Características, componentes y arquitectura de los dbms.Características, componentes y arquitectura de los dbms.
Características, componentes y arquitectura de los dbms.Julicamargo
 
Database Management System
Database Management SystemDatabase Management System
Database Management SystemTamur Iqbal
 
Diccionario de datos luis
Diccionario de datos luisDiccionario de datos luis
Diccionario de datos luisLuis Lizarraga
 
PRESENTACIÓN SQL
PRESENTACIÓN SQLPRESENTACIÓN SQL
PRESENTACIÓN SQLed0594
 
Fundamentos tecnologías web
Fundamentos tecnologías webFundamentos tecnologías web
Fundamentos tecnologías webDavid Hurtado
 
Resumen fundamentos de sistemas de bases de datos
Resumen fundamentos de sistemas de bases de datosResumen fundamentos de sistemas de bases de datos
Resumen fundamentos de sistemas de bases de datosaula40tics2finanzas
 
Importancia de la Calidad de los Sistemas de Informaciòn
 Importancia de la Calidad de los Sistemas de Informaciòn  Importancia de la Calidad de los Sistemas de Informaciòn
Importancia de la Calidad de los Sistemas de Informaciòn mariannys bermudez
 
Almacenamiento DAS (Direct Attached Storage)
Almacenamiento DAS (Direct Attached Storage)Almacenamiento DAS (Direct Attached Storage)
Almacenamiento DAS (Direct Attached Storage)Alex Avila
 
mongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y ComponentesmongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y Componentesomenar
 
proyecto sistema de informacion gerencial
proyecto sistema de informacion gerencialproyecto sistema de informacion gerencial
proyecto sistema de informacion gerencialdiego sanchez
 
Modulo sistemas de información
Modulo sistemas de informaciónModulo sistemas de información
Modulo sistemas de informaciónguestd12d42a9
 
Data flow diagrams (2)
Data flow diagrams (2)Data flow diagrams (2)
Data flow diagrams (2)Ujjwal 'Shanu'
 
Ventajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molapVentajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molapJuan Anaya
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de DatosJazmin Glez.
 
Visualización de datos con Google Data Studio
Visualización de datos con Google Data Studio Visualización de datos con Google Data Studio
Visualización de datos con Google Data Studio analisis-web.es
 
Sesión04 - Diccionario de datos (Oracle)
Sesión04 - Diccionario de datos (Oracle)Sesión04 - Diccionario de datos (Oracle)
Sesión04 - Diccionario de datos (Oracle)José Toro
 
Base de Datos - Modelo Entidad Relación
Base de Datos - Modelo Entidad RelaciónBase de Datos - Modelo Entidad Relación
Base de Datos - Modelo Entidad RelaciónAngela Inciarte
 

La actualidad más candente (20)

Data Flow 2
Data Flow 2Data Flow 2
Data Flow 2
 
Características, componentes y arquitectura de los dbms.
Características, componentes y arquitectura de los dbms.Características, componentes y arquitectura de los dbms.
Características, componentes y arquitectura de los dbms.
 
Database Management System
Database Management SystemDatabase Management System
Database Management System
 
Capacitacion neo4j
Capacitacion neo4jCapacitacion neo4j
Capacitacion neo4j
 
Diccionario de datos luis
Diccionario de datos luisDiccionario de datos luis
Diccionario de datos luis
 
PRESENTACIÓN SQL
PRESENTACIÓN SQLPRESENTACIÓN SQL
PRESENTACIÓN SQL
 
Diagramas de Secuencia.
Diagramas de Secuencia.Diagramas de Secuencia.
Diagramas de Secuencia.
 
Fundamentos tecnologías web
Fundamentos tecnologías webFundamentos tecnologías web
Fundamentos tecnologías web
 
Resumen fundamentos de sistemas de bases de datos
Resumen fundamentos de sistemas de bases de datosResumen fundamentos de sistemas de bases de datos
Resumen fundamentos de sistemas de bases de datos
 
Importancia de la Calidad de los Sistemas de Informaciòn
 Importancia de la Calidad de los Sistemas de Informaciòn  Importancia de la Calidad de los Sistemas de Informaciòn
Importancia de la Calidad de los Sistemas de Informaciòn
 
Almacenamiento DAS (Direct Attached Storage)
Almacenamiento DAS (Direct Attached Storage)Almacenamiento DAS (Direct Attached Storage)
Almacenamiento DAS (Direct Attached Storage)
 
mongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y ComponentesmongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y Componentes
 
proyecto sistema de informacion gerencial
proyecto sistema de informacion gerencialproyecto sistema de informacion gerencial
proyecto sistema de informacion gerencial
 
Modulo sistemas de información
Modulo sistemas de informaciónModulo sistemas de información
Modulo sistemas de información
 
Data flow diagrams (2)
Data flow diagrams (2)Data flow diagrams (2)
Data flow diagrams (2)
 
Ventajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molapVentajas y desventajas de los sistemas rolap y molap
Ventajas y desventajas de los sistemas rolap y molap
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de Datos
 
Visualización de datos con Google Data Studio
Visualización de datos con Google Data Studio Visualización de datos con Google Data Studio
Visualización de datos con Google Data Studio
 
Sesión04 - Diccionario de datos (Oracle)
Sesión04 - Diccionario de datos (Oracle)Sesión04 - Diccionario de datos (Oracle)
Sesión04 - Diccionario de datos (Oracle)
 
Base de Datos - Modelo Entidad Relación
Base de Datos - Modelo Entidad RelaciónBase de Datos - Modelo Entidad Relación
Base de Datos - Modelo Entidad Relación
 

Destacado

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. IntroduccionRicardo Mendoza
 
Data warehouse
Data warehouseData warehouse
Data warehousemalupahu
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosSebastian Rodriguez Robotham
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1nestor
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosMaría Isabel Bautista
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSINGKing Julian
 
Caracteristicas de las bases de datos
Caracteristicas de las bases de datosCaracteristicas de las bases de datos
Caracteristicas de las bases de datosNelson Rubio
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6Gustavo Araque
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouseJulio Pari
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegociosJulio Pari
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolapJulio Pari
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouseJulio Pari
 

Destacado (20)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de Negocios
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
 
Como crear un vocky
Como crear un vockyComo crear un vocky
Como crear un vocky
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 
Diseño de almacen de datos
Diseño de almacen de datosDiseño de almacen de datos
Diseño de almacen de datos
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
 
Diseño Dimensional
Diseño DimensionalDiseño Dimensional
Diseño Dimensional
 
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSING
 
Caracteristicas de las bases de datos
Caracteristicas de las bases de datosCaracteristicas de las bases de datos
Caracteristicas de las bases de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolap
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse
 

Similar a Que Es Un Datawarehouse

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Data warehouse
Data warehouseData warehouse
Data warehousemaggybe
 
La planificacion segun_data_ware_house
La planificacion segun_data_ware_houseLa planificacion segun_data_ware_house
La planificacion segun_data_ware_houseernestoicidec
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligenceIrene Lorza
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSEnestor
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Calzada Meza
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligenceMaryy Aqua
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosFiorella Urbina Vera
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 

Similar a Que Es Un Datawarehouse (20)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
La planificacion segun_data_ware_house
La planificacion segun_data_ware_houseLa planificacion segun_data_ware_house
La planificacion segun_data_ware_house
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
Data mart
Data martData mart
Data mart
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse 1
Datawarehouse   1Datawarehouse   1
Datawarehouse 1
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 

Último

IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfssuser50d1252
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfssuser50d1252
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxNataliaGonzalez619348
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadJonathanCovena1
 
Fichas de Matemática TERCERO DE SECUNDARIA.pdf
Fichas de Matemática TERCERO DE SECUNDARIA.pdfFichas de Matemática TERCERO DE SECUNDARIA.pdf
Fichas de Matemática TERCERO DE SECUNDARIA.pdfssuser50d1252
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORGonella
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdfRAMON EUSTAQUIO CARO BAYONA
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 

Último (20)

IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
DIA INTERNACIONAL DAS FLORESTAS .
DIA INTERNACIONAL DAS FLORESTAS         .DIA INTERNACIONAL DAS FLORESTAS         .
DIA INTERNACIONAL DAS FLORESTAS .
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la Sostenibilidad
 
Fichas de Matemática TERCERO DE SECUNDARIA.pdf
Fichas de Matemática TERCERO DE SECUNDARIA.pdfFichas de Matemática TERCERO DE SECUNDARIA.pdf
Fichas de Matemática TERCERO DE SECUNDARIA.pdf
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIOR
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 

Que Es Un Datawarehouse

  • 1. Mauricio Quintuña 6to C Ingeniería de Sistemas Temario 1. Definición. 2. Objetivo 3. Qué es un Data WareHouse? 4. Importancia 5. Procesos de un Data Warehouse 1
  • 2. Mauricio Quintuña 6to C Ingeniería de Sistemas 6. Desarrollo gradual 7. Beneficios de un Data WareHouse 8. Cómo justificar la inversión en un DataWarehouse? 9. Ventajas y desventajas del DataWarehouse? 10. Tipos de usuarios de un DataWarehouse 11. Las razones básicas de porque una organización implementa Data Warehouse: 12. Los procesos básicos del Data WareHouse (ETL) 13. Los elementos básicos de un Data WareHouse: 14. El Data Mining y su relación con el Data Warehouse. 15. Características clave del Data Warehouse 16. Arquitectura del Data Warehouse 17. ESTRUCTURA DEL DATA WAREHOUSE DataWareHouse Definición “El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión. Objetivo El objetivo del DW se expresa en términos puramente de negocio como “mantener la fidelidad de la clientela” ¿Que es un Data Warehouse? Un Data Warehouse es un almacenamiento separado y homogéneo donde son cargados datos transformados provenientes de diferentes bases de datos. Importancia  Un sistema de Data Warehouse permite transformar datos o información bruta en información con sentido y extremadamente útil.  Uno de los valores más importantes de una organización es la información. Estos valores normalmente son guardados por la empresa de dos formas:  Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y nuestro almacén de datos. Procesos de un Data Warehouse a) Extracción: obtención de información de las distintas fuentes tanto internas como externas. b) Elaboración: filtrado, limpieza, depuración, homogeneización y agrupación de la información. c) Carga: organización y actualización de los datos y los metadatos en la base de datos. d) Explotación: extracción y análisis de la información en los distintos niveles de agrupación. Desde el punto de vista del usuario, el único proceso visible es la explotación del almacén de datos, aunque el éxito del Data Warehouse radica en los tres procesos iniciales que alimentan la información del mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacén. Desarrollo gradual 1) Una de las claves del éxito en la construcción de un Data Warehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. 2
  • 3. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo. Beneficios de un Data WareHouse a) Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. b) Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información. c) Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. d) Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente. e) Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares ¿Cómo justificar la inversión en un data warehouse? - ¿Están las ventas de artículos deportivos sujetas a tendencias por temporada? ¿Qué artículos se ven afectados y cuándo? - ¿Cuántos autos se vendieron el mes pasado? ¿Cómo se compara esta cantidad con el mismo mes en los últimos cinco años? - ¿Quiénes son los diez primeros vendedores o clientes en Latinoamérica? ¿Qué porcentaje del ingreso generan? - ¿Cuáles son los diez artículos de menor rentabilidad en el catálogo de ventas? Ventajas - Data Warehouse a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que transaccionales. b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de respuesta mínimo a las consultas. c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos. d) La administración de la seguridad está centralizada para garantizar la necesidad de información dependiendo del perfil de los usuarios. Desventajas: a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. b) Requiere de continua limpieza, transformación e integración de datos. c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización. d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos. Tipos de usuarios de un DW: 1) Turistas 3
  • 4. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Exploradores 3) Labradores. Las razones básicas de porque una organización implementa Data Warehouse: a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones. b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones. c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y reportes. d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propósito de hacer queries y reportes. Los procesos básicos del Data WareHouse (ETL): a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data Warehouse. b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión. c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados. Los elementos básicos de un Data WareHouse: a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System. b) Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data Warehouse. c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son organizados y almacenados para Queries directos por los usuarios finales, reportes y otras aplicaciones. d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad – relación. e) Data Warehouse system. f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información. g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional. i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio. 4
  • 5. Mauricio Quintuña 6to C Ingeniería de Sistemas El Data Mining y su relación con el Data Warehouse. Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas. Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y registros de transacciones en línea. El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia. Cuatro características clave del Data Warehouse 1) Las evoluciones tecnológicas 2) La vinculación implícita con la estrategia de la empresa 3) Una lógica de mejora continua 4) Un nivel de madurez diferente según las empresas Arquitectura Data Warehouse  Base de datos operacional / Nivel de base de datos externo  Nivel de acceso a la información  Nivel de acceso a los datos  Nivel de directorio de datos (Metadata)  Nivel de gestión de proceso  Nivel de mensaje de la aplicación  Nivel de data warehouse  Nivel de organización de datos Estructura del data warehouse a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés c) Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son: d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles. 5