Préparation de Données dans le Cloud
Webinaire 18/10/2018 Victor Coustenoble
Technical regional manager EMEA
vcoustenoble@trifacta.com
@vizanalytics
La problématique des
80% est reconnue par le
marché
DATA PLATFORMS
ANALYSE & CONSOMMATION DES DONNÉES
De la charge de travail dans
un projet d’analyse est de
préparer les données
*Wrangler: Interactive Visual Specification of Data Transformation Scripts – Heer, Hellerstein, Kandel, Paepke; Stanford University & University
California, Berkeley (2011)
80%
Avant les analyses la majorité du temps (50%-80%) est
passée sur de la préparation de données.
Besoin d’optimiser le processus de Préparation des Données
DATA PLATFORMS
ANALYSIS & CONSUMPTION
DATA PREPARATION
ACTIVITIES
Discover Structure Clea
n
Enric
h
Validate Publis
h
4
Ecosystème Cloud publiques
ADLS
Préparation de données dans les Cloud publiques
ADLS
Architecture Trifacta dans AWS
7
AWS cloud
Amazon EC2
Amazon S3
Trifacta
App Server
Other Data
Amazon S3
FileSpreadsheet
databaseapplication
Amazon
EMR
Amazon
Redshift
Amazon
Redshift
models
predictions
visualization
Trifacta
Photon Engine
Architecture Trifacta dans Microsoft Azure
Proprietary & Confidential9
“Google Cloud Dataprep is an intelligent data
service that allows users to visually explore, clean
and interactively prepare their data. We selected
Trifacta to help power this new service because it
was incredibly advanced, super intuitive for people
to use immediately, and had a cloud architecture that
integrated naturally with Google Cloud Platform.”
Brian Stevens, CTO Google Cloud
DATA SECURITY & ACCESS CONTROLS
TRANSPARENT DATA LINEAGE & DATA CATALOG INTEGRATION
BROAD & EXTENSIBLE CONNECTIVITY FRAMEWORK
On-Prem
Data
ADLS
Open Data
Fabric
Découvrir Structurer Nettoyer Enrichir Valider Publier
IT
LOB
Donner aux métiers un accès en self-service aux données brutes
sous le contrôle des équipes IT, dans des environnements multi-
Cloud, Hybrid ou On-premise.
Reporting / BI
Analystes métiers
Analyse prédictive /
Data Science
Processus d’entreprise /
Applications métiers
Trifacta SaaS gratuit
https://www.trifacta.com/start-wrangling/
Démonstrations
14
15
https://www.trifacta.com/gated-form/wrangler-edge-emea/
#1 Rankings from
Media & Analysts
#1 in Enterprise
Customers
#1 in Cloud
Platform Support
#1 in Modern Analytics, BI &
Machine Learning Support
Trifacta - Leader pour les solutions de Préparation de Données
Proprietary & Confidential16
Merci
Questions?
Initiez-vous à Trifacta Wrangler
https://www.trifacta.com/start-wrangling/
Victor Coustenoble
vcoustenoble@trifacta.com
@vizanalytics

Préparation de Données dans le Cloud

  • 1.
    Préparation de Donnéesdans le Cloud Webinaire 18/10/2018 Victor Coustenoble Technical regional manager EMEA vcoustenoble@trifacta.com @vizanalytics
  • 2.
    La problématique des 80%est reconnue par le marché DATA PLATFORMS ANALYSE & CONSOMMATION DES DONNÉES De la charge de travail dans un projet d’analyse est de préparer les données *Wrangler: Interactive Visual Specification of Data Transformation Scripts – Heer, Hellerstein, Kandel, Paepke; Stanford University & University California, Berkeley (2011) 80% Avant les analyses la majorité du temps (50%-80%) est passée sur de la préparation de données.
  • 3.
    Besoin d’optimiser leprocessus de Préparation des Données DATA PLATFORMS ANALYSIS & CONSUMPTION DATA PREPARATION ACTIVITIES Discover Structure Clea n Enric h Validate Publis h
  • 4.
  • 5.
  • 6.
    Préparation de donnéesdans les Cloud publiques ADLS
  • 7.
    Architecture Trifacta dansAWS 7 AWS cloud Amazon EC2 Amazon S3 Trifacta App Server Other Data Amazon S3 FileSpreadsheet databaseapplication Amazon EMR Amazon Redshift Amazon Redshift models predictions visualization Trifacta Photon Engine
  • 8.
  • 9.
    Proprietary & Confidential9 “GoogleCloud Dataprep is an intelligent data service that allows users to visually explore, clean and interactively prepare their data. We selected Trifacta to help power this new service because it was incredibly advanced, super intuitive for people to use immediately, and had a cloud architecture that integrated naturally with Google Cloud Platform.” Brian Stevens, CTO Google Cloud
  • 11.
    DATA SECURITY &ACCESS CONTROLS TRANSPARENT DATA LINEAGE & DATA CATALOG INTEGRATION BROAD & EXTENSIBLE CONNECTIVITY FRAMEWORK On-Prem Data ADLS Open Data Fabric Découvrir Structurer Nettoyer Enrichir Valider Publier IT LOB Donner aux métiers un accès en self-service aux données brutes sous le contrôle des équipes IT, dans des environnements multi- Cloud, Hybrid ou On-premise. Reporting / BI Analystes métiers Analyse prédictive / Data Science Processus d’entreprise / Applications métiers
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
    #1 Rankings from Media& Analysts #1 in Enterprise Customers #1 in Cloud Platform Support #1 in Modern Analytics, BI & Machine Learning Support Trifacta - Leader pour les solutions de Préparation de Données Proprietary & Confidential16
  • 17.
    Merci Questions? Initiez-vous à TrifactaWrangler https://www.trifacta.com/start-wrangling/ Victor Coustenoble vcoustenoble@trifacta.com @vizanalytics