1
DataWareHouse
ETL et OLAP
Présenté par:
Karoui Mahmoud
06/04/2017
2
Rôle des interfaces (ETL)
3
 Sont capables d’accéder à des sources
multiples
o BD, fichiers, docs XML, ERP
 Contrôlent les données
 Effectuent la sélection
 Homogénéisent les données
o Identifiant client, produit
 Regroupent, agrègent, recodifient, trient
Processus Extract, Transform, Load (ETL)
4
o extraire les données de sources hétérogènes (extract)
o identifier les données des sources utiles
o déterminer les données qui ont changé
o consolider les données (transform)
o données redondantes, manquantes, incohérentes, etc.
o Découpage, fusion, conversion, agrégation, etc.
o Charger les données intégrées dans l’entrepôt (load)
o mode différé ou quasi temps réel.
5
extraction des données en mode différé
Extrait tout les changement survenus durant une période donnée
(ex : heure, jour,semaine,mois)
6
Extraction des données en mode temps réel
s’effectuent au moment ou les transaction surviennent
dans les systèmes sources
7
Chargement des données
• Faire les changements en lot dans une période
creuse (entrepôt de données non utilisé)
• considérer la bande passante requise pour le
chargement
• avoir un plan pour évaluer la qualité des
données chargées dans l’entrepôt
• commencer par charger les données des tables
de dimension
8
9
10
Cycle de vie d’un DWH
11
12
Merci pour votre attention

Présentation data warehouse etl et olap

  • 1.
    1 DataWareHouse ETL et OLAP Présentépar: Karoui Mahmoud 06/04/2017
  • 2.
  • 3.
    Rôle des interfaces(ETL) 3  Sont capables d’accéder à des sources multiples o BD, fichiers, docs XML, ERP  Contrôlent les données  Effectuent la sélection  Homogénéisent les données o Identifiant client, produit  Regroupent, agrègent, recodifient, trient
  • 4.
    Processus Extract, Transform,Load (ETL) 4 o extraire les données de sources hétérogènes (extract) o identifier les données des sources utiles o déterminer les données qui ont changé o consolider les données (transform) o données redondantes, manquantes, incohérentes, etc. o Découpage, fusion, conversion, agrégation, etc. o Charger les données intégrées dans l’entrepôt (load) o mode différé ou quasi temps réel.
  • 5.
    5 extraction des donnéesen mode différé Extrait tout les changement survenus durant une période donnée (ex : heure, jour,semaine,mois)
  • 6.
    6 Extraction des donnéesen mode temps réel s’effectuent au moment ou les transaction surviennent dans les systèmes sources
  • 7.
    7 Chargement des données •Faire les changements en lot dans une période creuse (entrepôt de données non utilisé) • considérer la bande passante requise pour le chargement • avoir un plan pour évaluer la qualité des données chargées dans l’entrepôt • commencer par charger les données des tables de dimension
  • 8.
  • 9.
  • 10.
  • 11.
    Cycle de vied’un DWH 11
  • 12.