Qu'est-ce qu'un ETL ?

1 265 vues

Publié le

Les entreprises d’aujourd’hui doivent de plus en plus composer avec l’infobésité.

C'est pourquoi elles ont besoin d’une façon efficace d’analyser leurs données afin de prendre de meilleures décisions d’affaires.

Les bases de données standard ne peuvent pas toujours répondre à ces questions parce que cela nécessite de croiser de multiples sources d’informations ensemble.

C’est ici que le processus ETL (Extract – Transform – Load) entre en jeu. L’ETL est un programme qui accède à de multiples sources de données disparates, en fait l’extraction, les manipule et les intègre dans un référentiel commun – l’entrepôt de données ou data warehouse.

0 commentaire
4 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 265
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
4
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Qu'est-ce qu'un ETL ?

  1. 1. Qu’est-ce qu’un ETL ? ...et comment ça peut m’être utile géomarketing + intelligence d’affaires
  2. 2. les données sont partout! • Le phénomène Big Data est bien réel! • Les données sont disparates: – Différents formats – Différentes sources – Sans uniformité / conformité – Structurées et non-structurées – …
  3. 3. les besoins sont bien réels! • Les entreprises doivent plus que jamais: – Analyser leurs données – Croiser différentes sources d’informations • L’objectif : prendre de meilleures décisions d’affaires
  4. 4. un ETL ? • Acronyme : Extract – Transform - Load • Programme qui accède à de multiples sources de données, en fait l’extraction, les manipule et les intègre dans un référentiel commun (data warehouse)
  5. 5. Extract • L’ETL peut travailler avec une multitude de – formats, structurés (bases de données standard), – semi-structuré (ex. courriels, logs) – non-structuré (ex. document Word).
  6. 6. Transform • Dans sa partie transformation, il permet de convertir les données et de procéder à une série d’opération • Exemple: éliminer les doublons, l’information superflue, les joindre à d’autres données, les agréger, etc.
  7. 7. Load • Ne se limite pas à insérer les informations dans l’entrepôt de données. • Cette étape permet également de faire une validation des règles d’insertion, de s’assurer de l’intégrité et la conformité des données, de détecter et de corriger les erreurs potentielles.
  8. 8. programmable • L’ETL peut être programmé pour accomplir ses tâches selon un horaire prédéfini (ex. à tous les jours) • Il procède à l’extraction et la manipulation des données et les stockent dans le data warehouse • Cela permet d’avoir des données toujours à jour!
  9. 9. et après? • Les informations qui sont stockées dans l’entrepôt de données peuvent ensuite être traitées et analysées directement ou via des plateformes d’intelligence d’affaires.
  10. 10. schéma Source : ATOL CD – Les ETL open source
  11. 11. des questions ? Inventis Mathieu Lahaye 819.380.8841 mathieu@inventis.ca inventis.ca blogue et groupe LinkedIn : geomarketing.ca

×