SlideShare une entreprise Scribd logo
1  sur  17
Préparation de Données dans le Cloud
Webinaire 18/10/2018 Victor Coustenoble
Technical regional manager EMEA
vcoustenoble@trifacta.com
@vizanalytics
La problématique des
80% est reconnue par le
marché
DATA PLATFORMS
ANALYSE & CONSOMMATION DES DONNÉES
De la charge de travail dans
un projet d’analyse est de
préparer les données
*Wrangler: Interactive Visual Specification of Data Transformation Scripts – Heer, Hellerstein, Kandel, Paepke; Stanford University & University
California, Berkeley (2011)
80%
Avant les analyses la majorité du temps (50%-80%) est
passée sur de la préparation de données.
Besoin d’optimiser le processus de Préparation des Données
DATA PLATFORMS
ANALYSIS & CONSUMPTION
DATA PREPARATION
ACTIVITIES
Discover Structure Clea
n
Enric
h
Validate Publis
h
4
Ecosystème Cloud publiques
ADLS
Préparation de données dans les Cloud publiques
ADLS
Architecture Trifacta dans AWS
7
AWS cloud
Amazon EC2
Amazon S3
Trifacta
App Server
Other Data
Amazon S3
FileSpreadsheet
databaseapplication
Amazon
EMR
Amazon
Redshift
Amazon
Redshift
models
predictions
visualization
Trifacta
Photon Engine
Architecture Trifacta dans Microsoft Azure
Proprietary & Confidential9
“Google Cloud Dataprep is an intelligent data
service that allows users to visually explore, clean
and interactively prepare their data. We selected
Trifacta to help power this new service because it
was incredibly advanced, super intuitive for people
to use immediately, and had a cloud architecture that
integrated naturally with Google Cloud Platform.”
Brian Stevens, CTO Google Cloud
DATA SECURITY & ACCESS CONTROLS
TRANSPARENT DATA LINEAGE & DATA CATALOG INTEGRATION
BROAD & EXTENSIBLE CONNECTIVITY FRAMEWORK
On-Prem
Data
ADLS
Open Data
Fabric
Découvrir Structurer Nettoyer Enrichir Valider Publier
IT
LOB
Donner aux métiers un accès en self-service aux données brutes
sous le contrôle des équipes IT, dans des environnements multi-
Cloud, Hybrid ou On-premise.
Reporting / BI
Analystes métiers
Analyse prédictive /
Data Science
Processus d’entreprise /
Applications métiers
Trifacta SaaS gratuit
https://www.trifacta.com/start-wrangling/
Démonstrations
14
15
https://www.trifacta.com/gated-form/wrangler-edge-emea/
#1 Rankings from
Media & Analysts
#1 in Enterprise
Customers
#1 in Cloud
Platform Support
#1 in Modern Analytics, BI &
Machine Learning Support
Trifacta - Leader pour les solutions de Préparation de Données
Proprietary & Confidential16
Merci
Questions?
Initiez-vous à Trifacta Wrangler
https://www.trifacta.com/start-wrangling/
Victor Coustenoble
vcoustenoble@trifacta.com
@vizanalytics

Contenu connexe

Similaire à Préparation de Données dans le Cloud

Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationDenodo
 
CRIP HP Cloud Generation
CRIP HP Cloud GenerationCRIP HP Cloud Generation
CRIP HP Cloud GenerationPatrick Joubert
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jNeo4j
 
ASD2020-05b-MBSE-EricThomas.pdf
ASD2020-05b-MBSE-EricThomas.pdfASD2020-05b-MBSE-EricThomas.pdf
ASD2020-05b-MBSE-EricThomas.pdfxmumiao
 
[XamarinDay] Xamarin et le Cloud, better together !
[XamarinDay] Xamarin et le Cloud, better together ! [XamarinDay] Xamarin et le Cloud, better together !
[XamarinDay] Xamarin et le Cloud, better together ! Cellenza
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologyImad ALILAT
 
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Amazon Web Services
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems Excelerate Systems
 
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 La voie du succès avec les bases de données de graphes, la Graph Data Scie... La voie du succès avec les bases de données de graphes, la Graph Data Scie...
La voie du succès avec les bases de données de graphes, la Graph Data Scie...Neo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...Paris Open Source Summit
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessingPierre-Marie Brunet
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Big Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureBig Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureMicrosoft Technet France
 
Présentation de la rencontre du Groupe d'usagers FME_mars 2011
Présentation de la rencontre du Groupe d'usagers FME_mars 2011Présentation de la rencontre du Groupe d'usagers FME_mars 2011
Présentation de la rencontre du Groupe d'usagers FME_mars 2011Consortech
 

Similaire à Préparation de Données dans le Cloud (20)

Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Analytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data VirtualizationAnalytics & Machine Learning avec la Data Virtualization
Analytics & Machine Learning avec la Data Virtualization
 
CRIP HP Cloud Generation
CRIP HP Cloud GenerationCRIP HP Cloud Generation
CRIP HP Cloud Generation
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4j
 
ASD2020-05b-MBSE-EricThomas.pdf
ASD2020-05b-MBSE-EricThomas.pdfASD2020-05b-MBSE-EricThomas.pdf
ASD2020-05b-MBSE-EricThomas.pdf
 
cv_chaker_jouini_fr
cv_chaker_jouini_frcv_chaker_jouini_fr
cv_chaker_jouini_fr
 
[XamarinDay] Xamarin et le Cloud, better together !
[XamarinDay] Xamarin et le Cloud, better together ! [XamarinDay] Xamarin et le Cloud, better together !
[XamarinDay] Xamarin et le Cloud, better together !
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 La voie du succès avec les bases de données de graphes, la Graph Data Scie... La voie du succès avec les bases de données de graphes, la Graph Data Scie...
La voie du succès avec les bases de données de graphes, la Graph Data Scie...
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing
 
Pj hug 07_04_2016
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Big Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureBig Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… Azure
 
Présentation de la rencontre du Groupe d'usagers FME_mars 2011
Présentation de la rencontre du Groupe d'usagers FME_mars 2011Présentation de la rencontre du Groupe d'usagers FME_mars 2011
Présentation de la rencontre du Groupe d'usagers FME_mars 2011
 

Plus de Victor Coustenoble

Préparation de Données pour la Détection de Fraude
Préparation de Données pour la Détection de FraudePréparation de Données pour la Détection de Fraude
Préparation de Données pour la Détection de FraudeVictor Coustenoble
 
Préparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec TrifactaPréparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec TrifactaVictor Coustenoble
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - TrifactaVictor Coustenoble
 
DataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTDataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTVictor Coustenoble
 
BI, Reporting and Analytics on Apache Cassandra
BI, Reporting and Analytics on Apache CassandraBI, Reporting and Analytics on Apache Cassandra
BI, Reporting and Analytics on Apache CassandraVictor Coustenoble
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysVictor Coustenoble
 
Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Victor Coustenoble
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudVictor Coustenoble
 
Datastax Cassandra + Spark Streaming
Datastax Cassandra + Spark StreamingDatastax Cassandra + Spark Streaming
Datastax Cassandra + Spark StreamingVictor Coustenoble
 
DataStax Enterprise et Cas d'utilisation de Apache Cassandra
DataStax Enterprise et Cas d'utilisation de Apache CassandraDataStax Enterprise et Cas d'utilisation de Apache Cassandra
DataStax Enterprise et Cas d'utilisation de Apache CassandraVictor Coustenoble
 
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetup
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetupDataStax - Analytics on Apache Cassandra - Paris Tech Talks meetup
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetupVictor Coustenoble
 
Spark + Cassandra = Real Time Analytics on Operational Data
Spark + Cassandra = Real Time Analytics on Operational DataSpark + Cassandra = Real Time Analytics on Operational Data
Spark + Cassandra = Real Time Analytics on Operational DataVictor Coustenoble
 
Lightning fast analytics with Cassandra and Spark
Lightning fast analytics with Cassandra and SparkLightning fast analytics with Cassandra and Spark
Lightning fast analytics with Cassandra and SparkVictor Coustenoble
 

Plus de Victor Coustenoble (16)

Préparation de Données pour la Détection de Fraude
Préparation de Données pour la Détection de FraudePréparation de Données pour la Détection de Fraude
Préparation de Données pour la Détection de Fraude
 
Préparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec TrifactaPréparation de Données Hadoop avec Trifacta
Préparation de Données Hadoop avec Trifacta
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
 
DataStax Enterprise BBL
DataStax Enterprise BBLDataStax Enterprise BBL
DataStax Enterprise BBL
 
DataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTDataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoT
 
BI, Reporting and Analytics on Apache Cassandra
BI, Reporting and Analytics on Apache CassandraBI, Reporting and Analytics on Apache Cassandra
BI, Reporting and Analytics on Apache Cassandra
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft Techdays
 
Webinar Degetel DataStax
Webinar Degetel DataStaxWebinar Degetel DataStax
Webinar Degetel DataStax
 
Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?
 
Cassandra 2.2 & 3.0
Cassandra 2.2 & 3.0Cassandra 2.2 & 3.0
Cassandra 2.2 & 3.0
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le Cloud
 
Datastax Cassandra + Spark Streaming
Datastax Cassandra + Spark StreamingDatastax Cassandra + Spark Streaming
Datastax Cassandra + Spark Streaming
 
DataStax Enterprise et Cas d'utilisation de Apache Cassandra
DataStax Enterprise et Cas d'utilisation de Apache CassandraDataStax Enterprise et Cas d'utilisation de Apache Cassandra
DataStax Enterprise et Cas d'utilisation de Apache Cassandra
 
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetup
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetupDataStax - Analytics on Apache Cassandra - Paris Tech Talks meetup
DataStax - Analytics on Apache Cassandra - Paris Tech Talks meetup
 
Spark + Cassandra = Real Time Analytics on Operational Data
Spark + Cassandra = Real Time Analytics on Operational DataSpark + Cassandra = Real Time Analytics on Operational Data
Spark + Cassandra = Real Time Analytics on Operational Data
 
Lightning fast analytics with Cassandra and Spark
Lightning fast analytics with Cassandra and SparkLightning fast analytics with Cassandra and Spark
Lightning fast analytics with Cassandra and Spark
 

Dernier

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxbahija babzine
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 

Dernier (6)

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptx
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 

Préparation de Données dans le Cloud

  • 1. Préparation de Données dans le Cloud Webinaire 18/10/2018 Victor Coustenoble Technical regional manager EMEA vcoustenoble@trifacta.com @vizanalytics
  • 2. La problématique des 80% est reconnue par le marché DATA PLATFORMS ANALYSE & CONSOMMATION DES DONNÉES De la charge de travail dans un projet d’analyse est de préparer les données *Wrangler: Interactive Visual Specification of Data Transformation Scripts – Heer, Hellerstein, Kandel, Paepke; Stanford University & University California, Berkeley (2011) 80% Avant les analyses la majorité du temps (50%-80%) est passée sur de la préparation de données.
  • 3. Besoin d’optimiser le processus de Préparation des Données DATA PLATFORMS ANALYSIS & CONSUMPTION DATA PREPARATION ACTIVITIES Discover Structure Clea n Enric h Validate Publis h
  • 4. 4
  • 6. Préparation de données dans les Cloud publiques ADLS
  • 7. Architecture Trifacta dans AWS 7 AWS cloud Amazon EC2 Amazon S3 Trifacta App Server Other Data Amazon S3 FileSpreadsheet databaseapplication Amazon EMR Amazon Redshift Amazon Redshift models predictions visualization Trifacta Photon Engine
  • 8. Architecture Trifacta dans Microsoft Azure
  • 9. Proprietary & Confidential9 “Google Cloud Dataprep is an intelligent data service that allows users to visually explore, clean and interactively prepare their data. We selected Trifacta to help power this new service because it was incredibly advanced, super intuitive for people to use immediately, and had a cloud architecture that integrated naturally with Google Cloud Platform.” Brian Stevens, CTO Google Cloud
  • 10.
  • 11. DATA SECURITY & ACCESS CONTROLS TRANSPARENT DATA LINEAGE & DATA CATALOG INTEGRATION BROAD & EXTENSIBLE CONNECTIVITY FRAMEWORK On-Prem Data ADLS Open Data Fabric Découvrir Structurer Nettoyer Enrichir Valider Publier IT LOB Donner aux métiers un accès en self-service aux données brutes sous le contrôle des équipes IT, dans des environnements multi- Cloud, Hybrid ou On-premise. Reporting / BI Analystes métiers Analyse prédictive / Data Science Processus d’entreprise / Applications métiers
  • 14. 14
  • 16. #1 Rankings from Media & Analysts #1 in Enterprise Customers #1 in Cloud Platform Support #1 in Modern Analytics, BI & Machine Learning Support Trifacta - Leader pour les solutions de Préparation de Données Proprietary & Confidential16
  • 17. Merci Questions? Initiez-vous à Trifacta Wrangler https://www.trifacta.com/start-wrangling/ Victor Coustenoble vcoustenoble@trifacta.com @vizanalytics