Slides diffusés pendant le webinaire animé par Victor Coustenoble de Trifacta et Marc Sallières et Malick Konate de Synaltic : "Préparez et visualisez vos Open Data avec Trifacta et Tableau"
Retrouvez la vidéo sur blog.synaltic.fr !
Le Comptoir OCTO x Dataiku x Snowflake - COMMENT CRÉER PLUS DE VALEUR ET DEVE...
Webinaire Synaltic x Trifacta 27/10/2016
1. Webinaire 27 octobre 2016
Préparez et visualisez vos
Open Data avec Trifacta et Tableau
Victor Coustenoble
Technical regional manager EMEA
vcoustenoble@trifacta.com
@vizanalytics
Malick Konate
Data Preparation Expert
mkonate@synaltic.fr
@MKonate_
4. Passionnés de data et d’open source
• Société de conseil et de services
spécialisée dans la mise en œuvre de
projets de Data Management
• Créée en 2004, Synaltic est la fusion des
sociétés Synotis et Altic
• Filiale en Suisse , à Lausanne
Fidélité
Expertise
2004
35
spécialistes
180
projets
Engagement
depuis 2012
5. Team dédiée Tableau
• Une équipe de data-analystes, spécialistes
Tableau
• Jonathan Trajkovic, Zen Master Tableau
2015/2016
8. La Data Preparation, pourquoi ?
• Datas de toutes formes et tailles dans les SI,
• Plus d’autonomie pour les data analystes et les data scientists.
53% des entreprises déclarent avoir déjà subi des
pertes en raison de la mauvaise qualité des données
Si une entreprise a des données de haute qualité, la
satisfaction des clients augmente de 57%.
TDWI - The Data Warehouse Institute
11. Trifacta
➔ Siège social à San Francisco, bureaux à Boston, Londres, Berlin et Paris
➔ Créé en 2012
➔ >100+ Employés
Focus
➔ 100% dédié au Data Wrangling et à la Préparation de Données
➔ Accélérer la création de valeur et l’utilisation métier du Big Data
➔ Préparation de données Visuelle, Interactive et en Self-Service
11
12. DATA WRANGLING
Qu’est-ce que le Data Wrangling (Préparation de Données) ?
12
QUESTION ANALYZE INSIGHT
DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH
Le Data Wrangling est le processus de préparation et de traitement de la donnée brute
depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un
processus analytique.
13. Créer une passerelle entre les données brutes et l’analyse
Discovering Structuring Cleaning Enriching Validating Publishing
ANALYSES & DECISIONNEL
Business System Data Machine Generated Data Third Party Data
IT LOB
de l’effort d’un
projet orienté
« données » réside
dans la
préparation des
données*
80%
PLATEFORME DE TRAITEMENT DES DONNEES
* New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
14. Allers-retours de demandes entre IT & Métiers
Comment je peux accéder aux
données brutes?
Qu’est-ce que tu veux analyser?
Je ne peux pas te le dire tant que je
n’ai pas vu les données, montres moi
les données en premier.
Je ne peux pas te donner accès aux
données brutes, tu dois me dire ce que tu
veux.
LOB IT
15. Discovering Structuring Cleaning Enriching Validating Publishing
Business System Data Machine Generated Data Third Party Data
LOB IT
Donner aux analystes métiers un accès aux données
brutes sous le contrôle de l’IT
ANALYSES, VISUALISATION, DECISIONNEL
PLATEFORME DE TRAITEMENT DES DONNEES
16. Les approches conventionnelles inhibent
l’autonomie des utilisateurs
Code manuel Techniques de Workflow et Mapping
(ETL)
18. Approche Trifacta : tout est basé sur l’Expérience Utilisateur
Intéragir Prédire
Visualiser
19. Cas d’utilisation métiers de Trifacta
Connaissance et
Vue 360 Client
Agrégation de
Données des
Essais Cliniques
Prévisions des
Ventes &
Stocks
Analyse et
Agrégation
Risques
Analyse Médias
Sociaux
Développement
Produit
19
20. PepsiCo | Des prévisions des ventes plus précise et plus rapidement
20
Opportunité:
Améliorer la prévision des ventes
• Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des
prévisions des ventes quasi-parfaites.
• Les analystes doivent constamment comparer les résultats des ventes par rapport aux
prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de
production.
Challenge:
Comment peut-on préparer les données plus efficacement et de manière plus précise?
• L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs.
• Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine
– avec un besoin de rationaliser le processus de préparation des données.
Solution:
Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation
• L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée
afin de préparer les données pour les prévisions dans Tableau Software.
• La durée du reporting a été réduite de 70% et le temps de création a été réduite
jusqu’à 90%.
• PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps
aux tendances du marché et des ventes.
Industry:
Consumer Packaged
Goods (CPG)
PepsiCo operates as a
food and beverage
company worldwide
24. 24
Constat : Plus de 80% du temps est passé à consolider, nettoyer et
transformer les données avant analyse.
Bénéfices de Trifacta + Tableau
• Accélérer l’accès aux données pour dégager plus rapidement les opportunités
métiers,
• Diminuer les risques métiers liés aux mauvaises données,
• Donner le pouvoir aux personnes avec la connaissance métier des données,
• Libérer l’innovation et optimiser l‘efficacité opérationnelle,
• Accélérer le ROI de projets Big Data,
• Réduire la pression des coûts et des recrutements (problèmes des compétences
Big Data dans l’entreprise).
Plus d’Efficacité, Plus d’Innovation
Conclusion