SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
Webinaire 27 octobre 2016
Préparez et visualisez vos
Open Data avec Trifacta et Tableau
Victor Coustenoble
Technical regional manager EMEA
vcoustenoble@trifacta.com
@vizanalytics
Malick Konate
Data Preparation Expert
mkonate@synaltic.fr
@MKonate_
Agenda
• Synaltic
• Trifacta
• La Data Preparation
• Démo
« Préparer et Visualiser des Open Data »
Bonjour, nous sommes
Synaltic !
Passionnés de data et d’open source
• Société de conseil et de services
spécialisée dans la mise en œuvre de
projets de Data Management
• Créée en 2004, Synaltic est la fusion des
sociétés Synotis et Altic
• Filiale en Suisse , à Lausanne
Fidélité
Expertise
2004
35
spécialistes
180
projets
Engagement
depuis 2012
Team dédiée Tableau
• Une équipe de data-analystes, spécialistes
Tableau
• Jonathan Trajkovic, Zen Master Tableau
2015/2016
Observatoire des associations françaises Outil de simulation basé sur des data OpenFoodFact
Open Data
La Data
Preparation
La Data Preparation, pourquoi ?
• Datas de toutes formes et tailles dans les SI,
• Plus d’autonomie pour les data analystes et les data scientists.
53% des entreprises déclarent avoir déjà subi des
pertes en raison de la mauvaise qualité des données
Si une entreprise a des données de haute qualité, la
satisfaction des clients augmente de 57%.
TDWI - The Data Warehouse Institute
Plus d’informations :
Livre Blanc Synaltic
www.datapreparation.fr
Bonjour, nous sommes
Trifacta !
Trifacta
➔ Siège social à San Francisco, bureaux à Boston, Londres, Berlin et Paris
➔ Créé en 2012
➔ >100+ Employés
Focus
➔ 100% dédié au Data Wrangling et à la Préparation de Données
➔ Accélérer la création de valeur et l’utilisation métier du Big Data
➔ Préparation de données Visuelle, Interactive et en Self-Service
11
DATA WRANGLING
Qu’est-ce que le Data Wrangling (Préparation de Données) ?
12
QUESTION ANALYZE INSIGHT
DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH
Le Data Wrangling est le processus de préparation et de traitement de la donnée brute
depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un
processus analytique.
Créer une passerelle entre les données brutes et l’analyse
Discovering Structuring Cleaning Enriching Validating Publishing
ANALYSES & DECISIONNEL
Business System Data Machine Generated Data Third Party Data
IT LOB
de l’effort d’un
projet orienté
« données » réside
dans la
préparation des
données*
80%
PLATEFORME DE TRAITEMENT DES DONNEES
* New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
Allers-retours de demandes entre IT & Métiers
Comment je peux accéder aux
données brutes?
Qu’est-ce que tu veux analyser?
Je ne peux pas te le dire tant que je
n’ai pas vu les données, montres moi
les données en premier.
Je ne peux pas te donner accès aux
données brutes, tu dois me dire ce que tu
veux.
LOB IT
Discovering Structuring Cleaning Enriching Validating Publishing
Business System Data Machine Generated Data Third Party Data
LOB IT
Donner aux analystes métiers un accès aux données
brutes sous le contrôle de l’IT
ANALYSES, VISUALISATION, DECISIONNEL
PLATEFORME DE TRAITEMENT DES DONNEES
Les approches conventionnelles inhibent
l’autonomie des utilisateurs
Code manuel Techniques de Workflow et Mapping
(ETL)
... et il y a aussi Excel
Approche Trifacta : tout est basé sur l’Expérience Utilisateur
Intéragir Prédire
Visualiser
Cas d’utilisation métiers de Trifacta
Connaissance et
Vue 360 Client
Agrégation de
Données des
Essais Cliniques
Prévisions des
Ventes &
Stocks
Analyse et
Agrégation
Risques
Analyse Médias
Sociaux
Développement
Produit
19
PepsiCo | Des prévisions des ventes plus précise et plus rapidement
20
Opportunité:
Améliorer la prévision des ventes
• Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des
prévisions des ventes quasi-parfaites.
• Les analystes doivent constamment comparer les résultats des ventes par rapport aux
prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de
production.
Challenge:
Comment peut-on préparer les données plus efficacement et de manière plus précise?
• L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs.
• Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine
– avec un besoin de rationaliser le processus de préparation des données.
Solution:
Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation
• L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée
afin de préparer les données pour les prévisions dans Tableau Software.
• La durée du reporting a été réduite de 70% et le temps de création a été réduite
jusqu’à 90%.
• PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps
aux tendances du marché et des ventes.
Industry:
Consumer Packaged
Goods (CPG)
PepsiCo operates as a
food and beverage
company worldwide
Démonstration
➔ Open Food Facts répertorie les produits
alimentaires du monde entier.
➔ Contributeurs volontaires du monde
entier.
contact@openfoodfacts.org
Collecte Traitement Stockage
VISUALISATION
v
IT
LOB
Discovering Structuring Cleaning Enriching Validating Publishing
Démonstration
Open Data
Activités
Media Sociaux
Tweets
Chat
24
Constat : Plus de 80% du temps est passé à consolider, nettoyer et
transformer les données avant analyse.
Bénéfices de Trifacta + Tableau
• Accélérer l’accès aux données pour dégager plus rapidement les opportunités
métiers,
• Diminuer les risques métiers liés aux mauvaises données,
• Donner le pouvoir aux personnes avec la connaissance métier des données,
• Libérer l’innovation et optimiser l‘efficacité opérationnelle,
• Accélérer le ROI de projets Big Data,
• Réduire la pression des coûts et des recrutements (problèmes des compétences
Big Data dans l’entreprise).
Plus d’Efficacité, Plus d’Innovation
Conclusion
Questions?
Télécharger Trifacta Wrangler
http://trifacta.com/start-wrangling
Questions ?
Trifacta Préparation de Données Self-Service
Editions
26
➔ Basé sur Hadoop
➔ Initiatives Data Lake
➔ Volumes Illimités & Scalability
➔ Support Enterprise
➔ Souscription
➔ Desktop
➔ Petits volumes de données
➔ Support Communautaire
➔ Gratuit
www.trifacta.com/start-wrangling

Contenu connexe

Tendances

RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
Denodo
 
Webinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by dataWebinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by data
Yassine, LASRI
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautésDigital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
Neo4j
 

Tendances (20)

Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
 
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
 
Préparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec TrifactaPréparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec Trifacta
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
[Smile] atelier spark - salon big data 13032018
[Smile]   atelier spark - salon big data 13032018[Smile]   atelier spark - salon big data 13032018
[Smile] atelier spark - salon big data 13032018
 
Talend - Collaboration IT et metiers autour de la donnee en libre-service - ...
Talend - Collaboration IT et metiers autour de la donnee en libre-service -  ...Talend - Collaboration IT et metiers autour de la donnee en libre-service -  ...
Talend - Collaboration IT et metiers autour de la donnee en libre-service - ...
 
Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
 
Présentation de Talend Data Preparation
Présentation de Talend Data PreparationPrésentation de Talend Data Preparation
Présentation de Talend Data Preparation
 
Webinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by dataWebinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by data
 
XebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data LabXebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data Lab
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
 
IBM Data lake
IBM Data lakeIBM Data lake
IBM Data lake
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017
 
lean development
lean developmentlean development
lean development
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautésDigital GraphTour Paris - Neo4j 4.0, les nouveautés
Digital GraphTour Paris - Neo4j 4.0, les nouveautés
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data Virtualization
 

Similaire à Webinaire Synaltic x Trifacta 27/10/2016

Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
IBM France Lab
 

Similaire à Webinaire Synaltic x Trifacta 27/10/2016 (20)

Bi et partage des données financières en libre -service
Bi et partage des données financières en libre -serviceBi et partage des données financières en libre -service
Bi et partage des données financières en libre -service
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
Comment choisir sa solution de tableaux de bord ?
Comment choisir sa solution de tableaux de bord ?Comment choisir sa solution de tableaux de bord ?
Comment choisir sa solution de tableaux de bord ?
 
Comment choisir sa solution de tableaux de bord ?
Comment choisir sa solution de tableaux de bord ?Comment choisir sa solution de tableaux de bord ?
Comment choisir sa solution de tableaux de bord ?
 
Les solutions Minitab pour développer vos produits selon les réglementations ...
Les solutions Minitab pour développer vos produits selon les réglementations ...Les solutions Minitab pour développer vos produits selon les réglementations ...
Les solutions Minitab pour développer vos produits selon les réglementations ...
 
Festival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tous
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usage
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
 
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
 
Tableau Drive, Une méthodologie innovante pour les déploiements en entreprise
Tableau Drive, Une méthodologie innovante pour les déploiements en entrepriseTableau Drive, Une méthodologie innovante pour les déploiements en entreprise
Tableau Drive, Une méthodologie innovante pour les déploiements en entreprise
 
Competitic simplifiez le pilotage de votre entreprise avec la business inte...
Competitic   simplifiez le pilotage de votre entreprise avec la business inte...Competitic   simplifiez le pilotage de votre entreprise avec la business inte...
Competitic simplifiez le pilotage de votre entreprise avec la business inte...
 
5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile5 bonnes raisons pour des projets analytiques en agile
5 bonnes raisons pour des projets analytiques en agile
 
Business intelligence QLIKVIEW
Business intelligence QLIKVIEWBusiness intelligence QLIKVIEW
Business intelligence QLIKVIEW
 
Nuit du Big Data, 10 Décembre 2014
Nuit du Big Data, 10 Décembre 2014Nuit du Big Data, 10 Décembre 2014
Nuit du Big Data, 10 Décembre 2014
 
Concrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab ConnectConcrétisez votre transformation digitale avec Minitab et Minitab Connect
Concrétisez votre transformation digitale avec Minitab et Minitab Connect
 
Décisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succèsDécisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succès
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Plaquette Analytic Suite Appliance Ingensi
Plaquette Analytic Suite Appliance IngensiPlaquette Analytic Suite Appliance Ingensi
Plaquette Analytic Suite Appliance Ingensi
 
Le Comptoir OCTO x Dataiku x Snowflake - COMMENT CRÉER PLUS DE VALEUR ET DEVE...
Le Comptoir OCTO x Dataiku x Snowflake - COMMENT CRÉER PLUS DE VALEUR ET DEVE...Le Comptoir OCTO x Dataiku x Snowflake - COMMENT CRÉER PLUS DE VALEUR ET DEVE...
Le Comptoir OCTO x Dataiku x Snowflake - COMMENT CRÉER PLUS DE VALEUR ET DEVE...
 

Webinaire Synaltic x Trifacta 27/10/2016

  • 1. Webinaire 27 octobre 2016 Préparez et visualisez vos Open Data avec Trifacta et Tableau Victor Coustenoble Technical regional manager EMEA vcoustenoble@trifacta.com @vizanalytics Malick Konate Data Preparation Expert mkonate@synaltic.fr @MKonate_
  • 2. Agenda • Synaltic • Trifacta • La Data Preparation • Démo « Préparer et Visualiser des Open Data »
  • 4. Passionnés de data et d’open source • Société de conseil et de services spécialisée dans la mise en œuvre de projets de Data Management • Créée en 2004, Synaltic est la fusion des sociétés Synotis et Altic • Filiale en Suisse , à Lausanne Fidélité Expertise 2004 35 spécialistes 180 projets Engagement depuis 2012
  • 5. Team dédiée Tableau • Une équipe de data-analystes, spécialistes Tableau • Jonathan Trajkovic, Zen Master Tableau 2015/2016
  • 6. Observatoire des associations françaises Outil de simulation basé sur des data OpenFoodFact Open Data
  • 8. La Data Preparation, pourquoi ? • Datas de toutes formes et tailles dans les SI, • Plus d’autonomie pour les data analystes et les data scientists. 53% des entreprises déclarent avoir déjà subi des pertes en raison de la mauvaise qualité des données Si une entreprise a des données de haute qualité, la satisfaction des clients augmente de 57%. TDWI - The Data Warehouse Institute
  • 9. Plus d’informations : Livre Blanc Synaltic www.datapreparation.fr
  • 11. Trifacta ➔ Siège social à San Francisco, bureaux à Boston, Londres, Berlin et Paris ➔ Créé en 2012 ➔ >100+ Employés Focus ➔ 100% dédié au Data Wrangling et à la Préparation de Données ➔ Accélérer la création de valeur et l’utilisation métier du Big Data ➔ Préparation de données Visuelle, Interactive et en Self-Service 11
  • 12. DATA WRANGLING Qu’est-ce que le Data Wrangling (Préparation de Données) ? 12 QUESTION ANALYZE INSIGHT DISCOVER STRUCTURE CLEANSE ENRICH VALIDATE PUBLISH Le Data Wrangling est le processus de préparation et de traitement de la donnée brute depuis n’importe quel format, afin de la rendre exploitable par l’utilisateur final dans un processus analytique.
  • 13. Créer une passerelle entre les données brutes et l’analyse Discovering Structuring Cleaning Enriching Validating Publishing ANALYSES & DECISIONNEL Business System Data Machine Generated Data Third Party Data IT LOB de l’effort d’un projet orienté « données » réside dans la préparation des données* 80% PLATEFORME DE TRAITEMENT DES DONNEES * New York Times – Août 2014 - For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights
  • 14. Allers-retours de demandes entre IT & Métiers Comment je peux accéder aux données brutes? Qu’est-ce que tu veux analyser? Je ne peux pas te le dire tant que je n’ai pas vu les données, montres moi les données en premier. Je ne peux pas te donner accès aux données brutes, tu dois me dire ce que tu veux. LOB IT
  • 15. Discovering Structuring Cleaning Enriching Validating Publishing Business System Data Machine Generated Data Third Party Data LOB IT Donner aux analystes métiers un accès aux données brutes sous le contrôle de l’IT ANALYSES, VISUALISATION, DECISIONNEL PLATEFORME DE TRAITEMENT DES DONNEES
  • 16. Les approches conventionnelles inhibent l’autonomie des utilisateurs Code manuel Techniques de Workflow et Mapping (ETL)
  • 17. ... et il y a aussi Excel
  • 18. Approche Trifacta : tout est basé sur l’Expérience Utilisateur Intéragir Prédire Visualiser
  • 19. Cas d’utilisation métiers de Trifacta Connaissance et Vue 360 Client Agrégation de Données des Essais Cliniques Prévisions des Ventes & Stocks Analyse et Agrégation Risques Analyse Médias Sociaux Développement Produit 19
  • 20. PepsiCo | Des prévisions des ventes plus précise et plus rapidement 20 Opportunité: Améliorer la prévision des ventes • Avec de très petites marges sur les ventes, le succès de PepsiCo repose sur des prévisions des ventes quasi-parfaites. • Les analystes doivent constamment comparer les résultats des ventes par rapport aux prévisions de leurs plus grands distributeurs afin de diriger les stocks et les plans de production. Challenge: Comment peut-on préparer les données plus efficacement et de manière plus précise? • L’utilisation de Excel et de Access était lente, laborieuse et source d’erreurs. • Chaque analyste devait manuellement créer et mettre à jour 4 à 5 rapports par semaine – avec un besoin de rationaliser le processus de préparation des données. Solution: Trifacta apporte à PepsiCo la préparation de données à l’échelle de leur organisation • L’équipe CPFR de PepsiCo utilise maintenant Trifacta comme une solution centralisée afin de préparer les données pour les prévisions dans Tableau Software. • La durée du reporting a été réduite de 70% et le temps de création a été réduite jusqu’à 90%. • PepsiCo est maintenant capable de répondre plus rapidement et sans perte de temps aux tendances du marché et des ventes. Industry: Consumer Packaged Goods (CPG) PepsiCo operates as a food and beverage company worldwide
  • 22. ➔ Open Food Facts répertorie les produits alimentaires du monde entier. ➔ Contributeurs volontaires du monde entier. contact@openfoodfacts.org
  • 23. Collecte Traitement Stockage VISUALISATION v IT LOB Discovering Structuring Cleaning Enriching Validating Publishing Démonstration Open Data Activités Media Sociaux Tweets Chat
  • 24. 24 Constat : Plus de 80% du temps est passé à consolider, nettoyer et transformer les données avant analyse. Bénéfices de Trifacta + Tableau • Accélérer l’accès aux données pour dégager plus rapidement les opportunités métiers, • Diminuer les risques métiers liés aux mauvaises données, • Donner le pouvoir aux personnes avec la connaissance métier des données, • Libérer l’innovation et optimiser l‘efficacité opérationnelle, • Accélérer le ROI de projets Big Data, • Réduire la pression des coûts et des recrutements (problèmes des compétences Big Data dans l’entreprise). Plus d’Efficacité, Plus d’Innovation Conclusion
  • 26. Trifacta Préparation de Données Self-Service Editions 26 ➔ Basé sur Hadoop ➔ Initiatives Data Lake ➔ Volumes Illimités & Scalability ➔ Support Enterprise ➔ Souscription ➔ Desktop ➔ Petits volumes de données ➔ Support Communautaire ➔ Gratuit www.trifacta.com/start-wrangling