Webinaire 27 octobre 2016
Préparez et visualisez vos
Open Data avec Trifacta et Tableau
Victor Coustenoble
Technical regional manager EMEA
vcoustenoble@trifacta.com
@vizanalytics
Malick Konate
Data Preparation Expert
mkonate@synaltic.fr
@MKonate_
Agenda
• Synaltic
• Trifacta
• La Data Preparation
• Démo
« Préparer et Visualiser des Open Data »
Bonjour, nous sommes
Synaltic !
Passionnés de data et d’open source
• Société de conseil et de services
spécialisée dans la mise en œuvre de
projets de Data Management
• Créée en 2004, Synaltic est la fusion des
sociétés Synotis et Altic
• Filiale en Suisse , à Lausanne
Fidélité
Expertise
2004
35
spécialistes
180
projets
Engagement
depuis 2012
Team dédiée Tableau
• Une équipe de data-analystes, spécialistes
Tableau
• Jonathan Trajkovic, Zen Master Tableau
2015/2016
Observatoire des associations françaises Outil de simulation basé sur des data OpenFoodFact
Open Data
La Data
Preparation
La Data Preparation, pourquoi ?
• Datas de toutes formes et tailles dans les SI,
• Plus d’autonomie pour les data analystes et les data scientists.
53% des entreprises déclarent avoir déjà subi des
pertes en raison de la mauvaise qualité des données
Si une entreprise a des données de haute qualité, la
satisfaction des clients augmente de 57%.
TDWI - The Data Warehouse Institute
Plus d’informations :
Livre Blanc Synaltic
www.datapreparation.fr
Bonjour, nous sommes
Trifacta !
Trifacta
➔ Siège social à San Francisco, bureaux à Boston, Londres, Berlin et Paris
➔ Créé en 2012
➔ >100+ Employés
Focus
➔ 100% dédié au Data Wrangling et à la Préparation de Données
➔ Accélérer la création de valeur et l’utilisation métier du Big Data
➔ Préparation de données Visuelle, Interactive et en Self-Service
11
DATA WRANGLING
Qu’est-ce que le Data Wrangling (Préparation de Données) ?
12
QUESTION ANALYZE INSIGHT
DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH
Le Data Wrangling est le processus de préparation et de traitement de la donnée brute
depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un
processus analytique.
Créer une passerelle entre les données brutes et l’analyse
Discovering Structuring Cleaning Enriching Validating Publishing
ANALYSES & DECISIONNEL
Business System Data Machine Generated Data Third Party Data
IT LOB
de l’effort d’un
projet orienté
« données » réside
dans la
préparation des
données*
80%
PLATEFORME DE TRAITEMENT DES DONNEES
* New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
Allers-retours de demandes entre IT & Métiers
Comment je peux accéder aux
données brutes?
Qu’est-ce que tu veux analyser?
Je ne peux pas te le dire tant que je
n’ai pas vu les données, montres moi
les données en premier.
Je ne peux pas te donner accès aux
données brutes, tu dois me dire ce que tu
veux.
LOB IT
Discovering Structuring Cleaning Enriching Validating Publishing
Business System Data Machine Generated Data Third Party Data
LOB IT
Donner aux analystes métiers un accès aux données
brutes sous le contrôle de l’IT
ANALYSES, VISUALISATION, DECISIONNEL
PLATEFORME DE TRAITEMENT DES DONNEES
Les approches conventionnelles inhibent
l’autonomie des utilisateurs
Code manuel Techniques de Workflow et Mapping
(ETL)
... et il y a aussi Excel
Approche Trifacta : tout est basé sur l’Expérience Utilisateur
Intéragir Prédire
Visualiser
Cas d’utilisation métiers de Trifacta
Connaissance et
Vue 360 Client
Agrégation de
Données des
Essais Cliniques
Prévisions des
Ventes &
Stocks
Analyse et
Agrégation
Risques
Analyse Médias
Sociaux
Développement
Produit
19
PepsiCo | Des prévisions des ventes plus précise et plus rapidement
20
Opportunité:
Améliorer la prévision des ventes
• Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des
prévisions des ventes quasi-parfaites.
• Les analystes doivent constamment comparer les résultats des ventes par rapport aux
prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de
production.
Challenge:
Comment peut-on préparer les données plus efficacement et de manière plus précise?
• L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs.
• Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine
– avec un besoin de rationaliser le processus de préparation des données.
Solution:
Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation
• L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée
afin de préparer les données pour les prévisions dans Tableau Software.
• La durée du reporting a été réduite de 70% et le temps de création a été réduite
jusqu’à 90%.
• PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps
aux tendances du marché et des ventes.
Industry:
Consumer Packaged
Goods (CPG)
PepsiCo operates as a
food and beverage
company worldwide
Démonstration
➔ Open Food Facts répertorie les produits
alimentaires du monde entier.
➔ Contributeurs volontaires du monde
entier.
contact@openfoodfacts.org
Collecte Traitement Stockage
VISUALISATION
v
IT
LOB
Discovering Structuring Cleaning Enriching Validating Publishing
Démonstration
Open Data
Activités
Media Sociaux
Tweets
Chat
24
Constat : Plus de 80% du temps est passé à consolider, nettoyer et
transformer les données avant analyse.
Bénéfices de Trifacta + Tableau
• Accélérer l’accès aux données pour dégager plus rapidement les opportunités
métiers,
• Diminuer les risques métiers liés aux mauvaises données,
• Donner le pouvoir aux personnes avec la connaissance métier des données,
• Libérer l’innovation et optimiser l‘efficacité opérationnelle,
• Accélérer le ROI de projets Big Data,
• Réduire la pression des coûts et des recrutements (problèmes des compétences
Big Data dans l’entreprise).
Plus d’Efficacité, Plus d’Innovation
Conclusion
Questions?
Télécharger Trifacta Wrangler
http://trifacta.com/start-wrangling
Questions ?
Trifacta Préparation de Données Self-Service
Editions
26
➔ Basé sur Hadoop
➔ Initiatives Data Lake
➔ Volumes Illimités & Scalability
➔ Support Enterprise
➔ Souscription
➔ Desktop
➔ Petits volumes de données
➔ Support Communautaire
➔ Gratuit
www.trifacta.com/start-wrangling

Webinaire Synaltic x Trifacta 27/10/2016

  • 1.
    Webinaire 27 octobre2016 Préparez et visualisez vos Open Data avec Trifacta et Tableau Victor Coustenoble Technical regional manager EMEA vcoustenoble@trifacta.com @vizanalytics Malick Konate Data Preparation Expert mkonate@synaltic.fr @MKonate_
  • 2.
    Agenda • Synaltic • Trifacta •La Data Preparation • Démo « Préparer et Visualiser des Open Data »
  • 3.
  • 4.
    Passionnés de dataet d’open source • Société de conseil et de services spécialisée dans la mise en œuvre de projets de Data Management • Créée en 2004, Synaltic est la fusion des sociétés Synotis et Altic • Filiale en Suisse , à Lausanne Fidélité Expertise 2004 35 spécialistes 180 projets Engagement depuis 2012
  • 5.
    Team dédiée Tableau •Une équipe de data-analystes, spécialistes Tableau • Jonathan Trajkovic, Zen Master Tableau 2015/2016
  • 6.
    Observatoire des associationsfrançaises Outil de simulation basé sur des data OpenFoodFact Open Data
  • 7.
  • 8.
    La Data Preparation,pourquoi ? • Datas de toutes formes et tailles dans les SI, • Plus d’autonomie pour les data analystes et les data scientists. 53% des entreprises déclarent avoir déjà subi des pertes en raison de la mauvaise qualité des données Si une entreprise a des données de haute qualité, la satisfaction des clients augmente de 57%. TDWI - The Data Warehouse Institute
  • 9.
    Plus d’informations : LivreBlanc Synaltic www.datapreparation.fr
  • 10.
  • 11.
    Trifacta ➔ Siège socialà San Francisco, bureaux à Boston, Londres, Berlin et Paris ➔ Créé en 2012 ➔ >100+ Employés Focus ➔ 100% dédié au Data Wrangling et à la Préparation de Données ➔ Accélérer la création de valeur et l’utilisation métier du Big Data ➔ Préparation de données Visuelle, Interactive et en Self-Service 11
  • 12.
    DATA WRANGLING Qu’est-ce quele Data Wrangling (Préparation de Données) ? 12 QUESTION ANALYZE INSIGHT DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH Le Data Wrangling est le processus de préparation et de traitement de la donnée brute depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un processus analytique.
  • 13.
    Créer une passerelleentre les données brutes et l’analyse Discovering Structuring Cleaning Enriching Validating Publishing ANALYSES & DECISIONNEL Business System Data Machine Generated Data Third Party Data IT LOB de l’effort d’un projet orienté « données » réside dans la préparation des données* 80% PLATEFORME DE TRAITEMENT DES DONNEES * New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
  • 14.
    Allers-retours de demandesentre IT & Métiers Comment je peux accéder aux données brutes? Qu’est-ce que tu veux analyser? Je ne peux pas te le dire tant que je n’ai pas vu les données, montres moi les données en premier. Je ne peux pas te donner accès aux données brutes, tu dois me dire ce que tu veux. LOB IT
  • 15.
    Discovering Structuring CleaningEnriching Validating Publishing Business System Data Machine Generated Data Third Party Data LOB IT Donner aux analystes métiers un accès aux données brutes sous le contrôle de l’IT ANALYSES, VISUALISATION, DECISIONNEL PLATEFORME DE TRAITEMENT DES DONNEES
  • 16.
    Les approches conventionnellesinhibent l’autonomie des utilisateurs Code manuel Techniques de Workflow et Mapping (ETL)
  • 17.
    ... et ily a aussi Excel
  • 18.
    Approche Trifacta :tout est basé sur l’Expérience Utilisateur Intéragir Prédire Visualiser
  • 19.
    Cas d’utilisation métiersde Trifacta Connaissance et Vue 360 Client Agrégation de Données des Essais Cliniques Prévisions des Ventes & Stocks Analyse et Agrégation Risques Analyse Médias Sociaux Développement Produit 19
  • 20.
    PepsiCo | Desprévisions des ventes plus précise et plus rapidement 20 Opportunité: Améliorer la prévision des ventes • Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des prévisions des ventes quasi-parfaites. • Les analystes doivent constamment comparer les résultats des ventes par rapport aux prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de production. Challenge: Comment peut-on préparer les données plus efficacement et de manière plus précise? • L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs. • Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine – avec un besoin de rationaliser le processus de préparation des données. Solution: Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation • L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée afin de préparer les données pour les prévisions dans Tableau Software. • La durée du reporting a été réduite de 70% et le temps de création a été réduite jusqu’à 90%. • PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps aux tendances du marché et des ventes. Industry: Consumer Packaged Goods (CPG) PepsiCo operates as a food and beverage company worldwide
  • 21.
  • 22.
    ➔ Open FoodFacts répertorie les produits alimentaires du monde entier. ➔ Contributeurs volontaires du monde entier. contact@openfoodfacts.org
  • 23.
    Collecte Traitement Stockage VISUALISATION v IT LOB DiscoveringStructuring Cleaning Enriching Validating Publishing Démonstration Open Data Activités Media Sociaux Tweets Chat
  • 24.
    24 Constat : Plusde 80% du temps est passé à consolider, nettoyer et transformer les données avant analyse. Bénéfices de Trifacta + Tableau • Accélérer l’accès aux données pour dégager plus rapidement les opportunités métiers, • Diminuer les risques métiers liés aux mauvaises données, • Donner le pouvoir aux personnes avec la connaissance métier des données, • Libérer l’innovation et optimiser l‘efficacité opérationnelle, • Accélérer le ROI de projets Big Data, • Réduire la pression des coûts et des recrutements (problèmes des compétences Big Data dans l’entreprise). Plus d’Efficacité, Plus d’Innovation Conclusion
  • 25.
  • 26.
    Trifacta Préparation deDonnées Self-Service Editions 26 ➔ Basé sur Hadoop ➔ Initiatives Data Lake ➔ Volumes Illimités & Scalability ➔ Support Enterprise ➔ Souscription ➔ Desktop ➔ Petits volumes de données ➔ Support Communautaire ➔ Gratuit www.trifacta.com/start-wrangling