Qu’est-ce qu’un ETL ?
...et comment ça peut m’être utile
géomarketing + intelligence d’affaires
les données sont partout!
• Le phénomène Big Data est bien réel!
• Les données sont disparates:
– Différents formats
– Dif...
les besoins sont bien réels!
• Les entreprises doivent plus que jamais:
– Analyser leurs données
– Croiser différentes sou...
un ETL ?
• Acronyme : Extract – Transform - Load
• Programme qui accède à de multiples sources
de données, en fait l’extra...
Extract
• L’ETL peut travailler avec une multitude de
– formats, structurés (bases de données standard),
– semi-structuré ...
Transform
• Dans sa partie transformation, il permet de
convertir les données et de procéder à une
série d’opération
• Exe...
Load
• Ne se limite pas à insérer les
informations dans l’entrepôt de
données.
• Cette étape permet également de
faire une...
programmable
• L’ETL peut être programmé pour
accomplir ses tâches selon un
horaire prédéfini (ex. à tous les
jours)
• Il ...
et après?
• Les informations qui sont
stockées dans l’entrepôt de
données peuvent ensuite
être traitées et analysées
direc...
schéma
Source : ATOL CD – Les ETL open source
des questions ?
Inventis
Mathieu Lahaye
819.380.8841
mathieu@inventis.ca
inventis.ca
blogue et groupe LinkedIn : geomarket...
Prochain SlideShare
Chargement dans…5
×

Qu'est-ce qu'un ETL ?

1 058 vues

Publié le

Les entreprises d’aujourd’hui doivent de plus en plus composer avec l’infobésité.

C'est pourquoi elles ont besoin d’une façon efficace d’analyser leurs données afin de prendre de meilleures décisions d’affaires.

Les bases de données standard ne peuvent pas toujours répondre à ces questions parce que cela nécessite de croiser de multiples sources d’informations ensemble.

C’est ici que le processus ETL (Extract – Transform – Load) entre en jeu. L’ETL est un programme qui accède à de multiples sources de données disparates, en fait l’extraction, les manipule et les intègre dans un référentiel commun – l’entrepôt de données ou data warehouse.

0 commentaire
4 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 058
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
4
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Qu'est-ce qu'un ETL ?

  1. 1. Qu’est-ce qu’un ETL ? ...et comment ça peut m’être utile géomarketing + intelligence d’affaires
  2. 2. les données sont partout! • Le phénomène Big Data est bien réel! • Les données sont disparates: – Différents formats – Différentes sources – Sans uniformité / conformité – Structurées et non-structurées – …
  3. 3. les besoins sont bien réels! • Les entreprises doivent plus que jamais: – Analyser leurs données – Croiser différentes sources d’informations • L’objectif : prendre de meilleures décisions d’affaires
  4. 4. un ETL ? • Acronyme : Extract – Transform - Load • Programme qui accède à de multiples sources de données, en fait l’extraction, les manipule et les intègre dans un référentiel commun (data warehouse)
  5. 5. Extract • L’ETL peut travailler avec une multitude de – formats, structurés (bases de données standard), – semi-structuré (ex. courriels, logs) – non-structuré (ex. document Word).
  6. 6. Transform • Dans sa partie transformation, il permet de convertir les données et de procéder à une série d’opération • Exemple: éliminer les doublons, l’information superflue, les joindre à d’autres données, les agréger, etc.
  7. 7. Load • Ne se limite pas à insérer les informations dans l’entrepôt de données. • Cette étape permet également de faire une validation des règles d’insertion, de s’assurer de l’intégrité et la conformité des données, de détecter et de corriger les erreurs potentielles.
  8. 8. programmable • L’ETL peut être programmé pour accomplir ses tâches selon un horaire prédéfini (ex. à tous les jours) • Il procède à l’extraction et la manipulation des données et les stockent dans le data warehouse • Cela permet d’avoir des données toujours à jour!
  9. 9. et après? • Les informations qui sont stockées dans l’entrepôt de données peuvent ensuite être traitées et analysées directement ou via des plateformes d’intelligence d’affaires.
  10. 10. schéma Source : ATOL CD – Les ETL open source
  11. 11. des questions ? Inventis Mathieu Lahaye 819.380.8841 mathieu@inventis.ca inventis.ca blogue et groupe LinkedIn : geomarketing.ca

×