SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
© 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc.
Du temps réel au data warehouse :
capturez et analysez en temps réel vos
données
Julien Lépine, Solutions Architect, Amazon
Adrien Schmidt, CEO, Squid Solutions
13 Mai 2014@aws_actus / #awssummit
Big Data: des données en augmentation perpétuelle
Go To
Po
95% des 1,2 zettaoctets des
données dans l’univers digital
sont non structurées
70% de ces données ont été
générées par des utilisateurs
La croissance des données non
structurées est explosive, avec
des croissances annuelles
(CAGR) de 62% entre 2008 et
2012. Source: IDC
Zo
Eo
Un écosystème Big Data
Amazon Redshift
Amazon EMR
Amazon EC2
Analyser
Amazon Glacier
Amazon S3
Amazon DynamoDB
Stocker
AWS Direct Connect
Collecter
Amazon Kinesis
Stockage illimité ; faible coût
Stockage d’objets ; disponibilité
Élastique et sécurisé
Durable: 99,999999999%
Amazon S3
Clusters Hadoop
Plateforme managée
Simple d’utilisation
Intégré à Amazon S3, DynamoDB
Amazon
Elastic
MapReduce
Service de métrologie AWS
Cas d’usage
• X * 10M d’enregistrements/sec
• X * 100K sources
• X To par heure
Contraintes
• Besoin de plus d’élasticité
• Envie d’alertes en temps-réel
• Coûteux à opérer
• Stockage éventuellement
consistent
Notre transition « Big Data »
Ancien besoin
• Accepter des volumes très importants de données et les traiter par lots
horaires ou quotidiens
Nouveau besoin
• Prendre des décisions plus rapidement, même en temps-réel
• Redimensionner le système complet à l’échelle, de manière élastique
• Rendre facile le fait de « garder tout »
• Permettre à plusieurs applications de traiter les données en parallèle
Scenarios Capture-Transformation-Chargement
accéléré
Métrique continue / KPI Extraction Analyse réactive sur les données
Types de données Infrastructure IT, Logs Applicatifs, Média Sociaux, Données Financières, Clics Web, Capteurs, Geolocalisation
Logiciels /
technologie
Serveurs IT, Traitement Logs applications Tableaux de bord opérationnels IT Intelligence opérationnelle sur
capteurs
Marketing / Publicité
en ligne
Agrégation de données marketing Advertising metrics like coverage, yield,
conversion
Analytique sur engagement client avec
les publicités, optimisation des bids
Finance Collecte de données des marchés
financiers
Métriques de données financières Analyse et détection de fraudes, suivi
de VAR audit d’ordres sur les marchés
E-Commerce /
Plateformes en ligne
Agrégation de données sur l’engagement
en ligne des clients
Métriques d’engagement client, CTR,
pages vues, …
Moteurs de recommandation, analyse
de comportement
Scénarios clients sur plusieurs industries
Traitement temps-réel
Élastique; forte volumétrie
Simple d’utilisation
Intégré dans l’écosystème
Amazon
Kinesis
Architecture Amazon Kinesis
Amazon Web Services
AZ AZ AZ
Durable, highly consistent storage replicates data
across three data centers (availability zones)
Aggregate and
archive to S3
Millions of
sources producing
100s of terabytes
per hour
Front
End
Authentication
Authorization
Ordered stream
of events supports
multiple readers
Real-time
dashboards
and alarms
Machine learning
algorithms or
sliding window
analytics
Aggregate analysis
in Hadoop or a
data warehouse
Inexpensive: $0.028 per million puts
Plateforme pour l’intégration et le traitement continu
Le bon outil pour le bon cas d’usage
Intégration temps-réel
• Passe à l’échelle
• Durable
• Élastique
• Lecture / relecture
Traitement continu
• Équilibrage de charge sur les flux d’entrée
• Tolérance de panne, Checkpoint / Replay
• Élastique
• Plusieurs applications traitent en parallèle
Permet le transfert de données vers des points de stockage / traitement
Service managé
Latence faible de bout-en-bout
Traitement en continu et en temps-réel
Écrire dans Kinesis
Une interface simple « Put »
• Les producteurs utilisent un appel PUT pour stocker
des données dans un Stream
• PutRecord {Data, PartitionKey, StreamName}
• Une clé de partitionnement est fournie par le
producteur afin de cibler un Shard
• Kinesis utilise un algorithme de hash pour
déterminer dans quel Shard stocker les données
• Un numéro unique de séquence est retourné au
producteur une fois les données stockées
Exemple Javascript
Accélérer le développement d’applications de
traitement Kinesis avec le Kinesis Client Library
o Bibliothèque Java ouverte, sources sur GitHub
o Concevez et déployez des applications sur Amazon EC2
o KCL sert d’intermédiaire de traitement:
 Démarre un « Worker » pour chaque Shard
 Simplifie la lecture via une abstraction des Shards
 Augmente / Diminue le nombre de Workers en
fonction du nombre de Shards
 Gère les Checkpoints et la reprise sur erreur
o Gère la répartition de charge avec les Auto Scaling Groups
Connecter Kinesis avec Amazon DynamoDB, S3, Redshift
ou votre système avec Kinesis Connector Library
Amazon S3
Amazon
DynamoDB
Amazon Redshift
Amazon
Kinesis
ITransformer
• Transforme un
enregistrement
Kinesis en une
donnée utile
IFilter
• Exclue les
enregistrements non
pertinents
IBuffer
• Regroupe les
enregistrements
ensemble pour
faciliter le traitement
par lot
IEmitter
• Enregistre les lots
d’enregistrements
vers un système de
stockage
D’autres options de lecture de Streams Kinesis
APIs, Storm
o Utiliser les APIs « Get* » pour lire les données brutes depuis les flux Kinesis
• GetRecords {Limit, ShardIterator}
• GetShardIterator {ShardId, ShardIteratorType, StartingSequenceNumber, StreamName}
o Intégrer Kinesis avec des Topologies Storm
• Bootstraps (Zookeeper) attache les Shards aux Spouts
• Lecture de données depuis les Streams Kinesis
• Émet des « tuples » et gère le Checkpoints (Zookeeper)
Envoyer et lire des données avec Kinesis
HTTP Post
AWS SDK
LOG4J
Flume
Fluentd
Get* APIs
Kinesis Client
Library
+
Connector Library
Apache
Storm
Amazon Elastic
MapReduce
Envoyer Lire
Utiliser EMR pour lire et traiter des flux Kinesis
Traitement
Source
• Analyste
• Développeur
Mon site
Kinesis
Log4J
Appender
Envoi vers
Kinesis
EMR – AMI 3.0.5
Hive
Pig
Cascading
MapReduce
Lit depuis
Exemple Hive
Tarif Kinesis
Simple, paiement à l’usage, pas d’engagement
Type d’usage Prix
Shard par Heure $0,015
1,000,000 transactions PUT $0,028
• Le niveau de performance est défini en nombre de Shards, choisi par le client
• Chaque Shard fournit 1 Mo/s en écriture, and 2 Mo/s en lecture
• Bande passante entrante gratuite
• Les applications de lecture Kinesis sur EC2 sont facturées au tarif EC2
HDFS
Plateformes
d’analyse
Gestion de
données
Amazon
RedShift
Amazon EMR
Amazon
RDS
Amazon S3 Amazon
DynamoDB
Amazon
Kinesis
Sources
SourcesSources de
données
AWS Data Pipeline
À l’échelle du Pétaoctet
Massivement parallèle
Data warehouse relationnel
Totalement managé
Amazon
Redshift
beaucoup plus rapide
beaucoup moins cher
vraiment beaucoup plus simple
Maîtriser Amazon Redshift
Adrien Schmidt
CEO, Squid Solutions
A propos de Squid Solutions
• 10 ans d’expérience
• 4 profils tech différents
• 14 DWH en gestion
• 20To données en ligne
• 2 plateformes big data
• 8 semaines par POC
• Toute la chaine data
A propos de ProQuest
• Distribution de
contenus numériques
• 90,000 sources
• 6B pages de contenus
• 20M d’articles
• 450K Ebooks
• 100 pays
A propos d’Amazon Redshift
Principes clé
• MPP / Shared Nothing
• Horizontal scalability
• Data Distribution
• Parallel Import
Disponible à la demande
• 4 configurations de base
• Extensible (up/down)
• Stop and go
10 GigE
(HPC)
Ingestion
Backup
Restore
JDBC/ODBC
Le choix de Redshift
• Les fonctions et
performances d’une
base SQL MPP mature
– Performances pour des
requêtes interactives
– SQL avancé pour l’analyse
– Un moteur en en
développement actif
• Le modèle de coût et
la flexibilité des
solutions Hadoop
– Volumétrie adapté
Go/To/Po
– Engagement longue durée
divise les coûts par 3
Répondre aux attentes clients spécifiques
Données
agrégées
Faible
latence
End user
reports &
analysis
Données
granulaires
Forte
latence
Intégrité
des
données,
analyses
avancées
Des couches de données bottom-up
Raw Data Layer
Reporting Layer
Global KPI Layer
Business intelligence à
travers les départements
Rapports standard
“COUNTER-compliant”
Analyse fine de l’usage
Une infrastructure robuste sur AWS
ProQuest
Big Data Analytics
Secure
Available
Flexible
Scalable
© 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc.
13 Mai 2014
Merci !
Du temps réel au data warehouse :
capturez et analysez en temps réel vos
données
Julien Lépine, Solutions Architect, Amazon
Adrien Schmidt, CEO, Squid Solutions
@aws_actus / #awssummit

Contenu connexe

Tendances

AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...Amazon Web Services
 
Track 3 - Atelier 1 - Optimisation des coûts avec AWS
Track 3 - Atelier 1 - Optimisation des coûts avec AWSTrack 3 - Atelier 1 - Optimisation des coûts avec AWS
Track 3 - Atelier 1 - Optimisation des coûts avec AWSAmazon Web Services
 
AWS Paris Summit 2014 - T1 - Services de bases de données
AWS Paris Summit 2014 - T1 - Services de bases de donnéesAWS Paris Summit 2014 - T1 - Services de bases de données
AWS Paris Summit 2014 - T1 - Services de bases de donnéesAmazon Web Services
 
Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Amazon Web Services
 
Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Amazon Web Services
 
AWS Enterprise Day | Paris - Morning Session
AWS Enterprise Day | Paris - Morning SessionAWS Enterprise Day | Paris - Morning Session
AWS Enterprise Day | Paris - Morning SessionAmazon Web Services
 
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2Amazon Web Services
 
Deep Dive AWS CloudTrail
Deep Dive AWS CloudTrailDeep Dive AWS CloudTrail
Deep Dive AWS CloudTrailJulien SIMON
 
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par Edifixio
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par EdifixioTrack 1 - Atelier 3 - Implémentation de cloud d'entreprise par Edifixio
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par EdifixioAmazon Web Services
 
Présentation des services AWS
Présentation des services AWSPrésentation des services AWS
Présentation des services AWSJulien SIMON
 
Gibtalk aws
Gibtalk awsGibtalk aws
Gibtalk awsmeliphen
 
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...Nathalie Richomme
 
Track 2 - Atelier 2 - Introduction à redshift
Track 2 - Atelier 2 - Introduction à redshiftTrack 2 - Atelier 2 - Introduction à redshift
Track 2 - Atelier 2 - Introduction à redshiftAmazon Web Services
 
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAmazon Web Services
 
Construire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarConstruire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarAmazon Web Services
 
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...Amazon Web Services
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Amazon Web Services
 
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAmazon Web Services
 
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...Amazon Web Services
 
Présentation evénement AWS - 13 oct 2015
Présentation evénement AWS  - 13 oct 2015 Présentation evénement AWS  - 13 oct 2015
Présentation evénement AWS - 13 oct 2015 ABC Systemes
 

Tendances (20)

AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
 
Track 3 - Atelier 1 - Optimisation des coûts avec AWS
Track 3 - Atelier 1 - Optimisation des coûts avec AWSTrack 3 - Atelier 1 - Optimisation des coûts avec AWS
Track 3 - Atelier 1 - Optimisation des coûts avec AWS
 
AWS Paris Summit 2014 - T1 - Services de bases de données
AWS Paris Summit 2014 - T1 - Services de bases de donnéesAWS Paris Summit 2014 - T1 - Services de bases de données
AWS Paris Summit 2014 - T1 - Services de bases de données
 
Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?
 
Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test
 
AWS Enterprise Day | Paris - Morning Session
AWS Enterprise Day | Paris - Morning SessionAWS Enterprise Day | Paris - Morning Session
AWS Enterprise Day | Paris - Morning Session
 
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2
Track 1 - Atelier 1 - Votre première semaine avec Amazon EC2
 
Deep Dive AWS CloudTrail
Deep Dive AWS CloudTrailDeep Dive AWS CloudTrail
Deep Dive AWS CloudTrail
 
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par Edifixio
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par EdifixioTrack 1 - Atelier 3 - Implémentation de cloud d'entreprise par Edifixio
Track 1 - Atelier 3 - Implémentation de cloud d'entreprise par Edifixio
 
Présentation des services AWS
Présentation des services AWSPrésentation des services AWS
Présentation des services AWS
 
Gibtalk aws
Gibtalk awsGibtalk aws
Gibtalk aws
 
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
 
Track 2 - Atelier 2 - Introduction à redshift
Track 2 - Atelier 2 - Introduction à redshiftTrack 2 - Atelier 2 - Introduction à redshift
Track 2 - Atelier 2 - Introduction à redshift
 
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
 
Construire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarConstruire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book Webinar
 
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...
Track 1 - Atelier 2 - Distribution complète d’un site avec le cdn Amazon Clo...
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
 
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
 
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...
AWS Paris Summit 2014 - T4 - Etre partenaire AWS : Construisez votre business...
 
Présentation evénement AWS - 13 oct 2015
Présentation evénement AWS  - 13 oct 2015 Présentation evénement AWS  - 13 oct 2015
Présentation evénement AWS - 13 oct 2015
 

En vedette

Aberdeen Oil & Gas Event - Enterprise Cloud Adoption Patterns
Aberdeen Oil & Gas Event - Enterprise Cloud Adoption PatternsAberdeen Oil & Gas Event - Enterprise Cloud Adoption Patterns
Aberdeen Oil & Gas Event - Enterprise Cloud Adoption PatternsAmazon Web Services
 
EP Info Data Mgement 3-4 Feb 2015
EP Info  Data Mgement 3-4 Feb 2015EP Info  Data Mgement 3-4 Feb 2015
EP Info Data Mgement 3-4 Feb 2015Andy Moore
 
Aberdeen Oil & Gas Event - AWS Partner Eurotech
Aberdeen Oil & Gas Event - AWS Partner EurotechAberdeen Oil & Gas Event - AWS Partner Eurotech
Aberdeen Oil & Gas Event - AWS Partner EurotechAmazon Web Services
 
Encoding & streaming sur le cloud AWS
Encoding & streaming sur le cloud AWSEncoding & streaming sur le cloud AWS
Encoding & streaming sur le cloud AWSAmazon Web Services
 
Cloud adoption patterns
Cloud adoption patternsCloud adoption patterns
Cloud adoption patternsKyle Brown
 
Improving MySQL performance with Hadoop
Improving MySQL performance with HadoopImproving MySQL performance with Hadoop
Improving MySQL performance with HadoopSagar Jauhari
 
AWS Elemental Services for Video Processing and Delivery
AWS Elemental Services for Video Processing and DeliveryAWS Elemental Services for Video Processing and Delivery
AWS Elemental Services for Video Processing and DeliveryAmazon Web Services
 
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...Amazon Web Services
 
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision
 
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...Amazon Web Services
 
Présentation edifixio aws
Présentation edifixio   awsPrésentation edifixio   aws
Présentation edifixio awsArielleMeffre
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
Introduction to Amazon Web Services
Introduction to Amazon Web ServicesIntroduction to Amazon Web Services
Introduction to Amazon Web ServicesAmazon Web Services
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing
 

En vedette (17)

Aberdeen Oil & Gas Event - Enterprise Cloud Adoption Patterns
Aberdeen Oil & Gas Event - Enterprise Cloud Adoption PatternsAberdeen Oil & Gas Event - Enterprise Cloud Adoption Patterns
Aberdeen Oil & Gas Event - Enterprise Cloud Adoption Patterns
 
EP Info Data Mgement 3-4 Feb 2015
EP Info  Data Mgement 3-4 Feb 2015EP Info  Data Mgement 3-4 Feb 2015
EP Info Data Mgement 3-4 Feb 2015
 
Aberdeen Oil & Gas Event - AWS Partner Eurotech
Aberdeen Oil & Gas Event - AWS Partner EurotechAberdeen Oil & Gas Event - AWS Partner Eurotech
Aberdeen Oil & Gas Event - AWS Partner Eurotech
 
Encoding & streaming sur le cloud AWS
Encoding & streaming sur le cloud AWSEncoding & streaming sur le cloud AWS
Encoding & streaming sur le cloud AWS
 
Cloud adoption patterns
Cloud adoption patternsCloud adoption patterns
Cloud adoption patterns
 
Improving MySQL performance with Hadoop
Improving MySQL performance with HadoopImproving MySQL performance with Hadoop
Improving MySQL performance with Hadoop
 
Débuter sur le cloud AWS
Débuter sur le cloud AWSDébuter sur le cloud AWS
Débuter sur le cloud AWS
 
AWS Elemental Services for Video Processing and Delivery
AWS Elemental Services for Video Processing and DeliveryAWS Elemental Services for Video Processing and Delivery
AWS Elemental Services for Video Processing and Delivery
 
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...
ACCELERATING OTT DELIVERY AND MODERNIZING MEDIA LOGISTICS WITH CLOUD BASED VI...
 
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
 
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...
Introduction to Media Processing, Delivery and Storage in the Cloud - AWS Jun...
 
Présentation edifixio aws
Présentation edifixio   awsPrésentation edifixio   aws
Présentation edifixio aws
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Introduction to Amazon Web Services
Introduction to Amazon Web ServicesIntroduction to Amazon Web Services
Introduction to Amazon Web Services
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
BigData selon IBM
BigData selon IBM BigData selon IBM
BigData selon IBM
 

Similaire à AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et analysez en temps réel vos données

Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataMicrosoft
 
De la stratégie à la réalité : de meilleures décisions avec les données
De la stratégie à la réalité : de meilleures décisions avec les donnéesDe la stratégie à la réalité : de meilleures décisions avec les données
De la stratégie à la réalité : de meilleures décisions avec les donnéesAmazon Web Services
 
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelAmazon Web Services
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSJean-Michel Franco
 
Serverless low cost analytics by Adways y Audric Guigon
Serverless low cost analytics by Adways y Audric GuigonServerless low cost analytics by Adways y Audric Guigon
Serverless low cost analytics by Adways y Audric GuigonThe Incredible Automation Day
 
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWS
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWSAWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWS
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWSAmazon Web Services
 
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Amazon Web Services
 
Les clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceLes clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceFrederic Desprez
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceParis Open Source Summit
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...Micropole Group
 
Je passe au cloud computing Que faire de l'existant
Je passe au cloud computing Que faire de l'existantJe passe au cloud computing Que faire de l'existant
Je passe au cloud computing Que faire de l'existantJean-François Caenen
 
Exadays cloud – Enjeux et Transformation du SI
Exadays   cloud – Enjeux et Transformation du SIExadays   cloud – Enjeux et Transformation du SI
Exadays cloud – Enjeux et Transformation du SISamir Arezki ☁
 
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Jean-Michel Franco
 
Stockage Cloud : il y en aura pour tout le monde
Stockage Cloud : il y en aura pour tout le mondeStockage Cloud : il y en aura pour tout le monde
Stockage Cloud : il y en aura pour tout le mondeMicrosoft Technet France
 
What's new in MongoDB 3.6
What's new in MongoDB 3.6What's new in MongoDB 3.6
What's new in MongoDB 3.6MongoDB
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM France Lab
 
Denodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data ScienceAshraf Grioute
 
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]IBM France PME-ETI
 

Similaire à AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et analysez en temps réel vos données (20)

Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
 
De la stratégie à la réalité : de meilleures décisions avec les données
De la stratégie à la réalité : de meilleures décisions avec les donnéesDe la stratégie à la réalité : de meilleures décisions avec les données
De la stratégie à la réalité : de meilleures décisions avec les données
 
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
 
Serverless low cost analytics by Adways y Audric Guigon
Serverless low cost analytics by Adways y Audric GuigonServerless low cost analytics by Adways y Audric Guigon
Serverless low cost analytics by Adways y Audric Guigon
 
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWS
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWSAWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWS
AWS Paris Summit 2014 - T2 - Optimisation du coût total de possession avec AWS
 
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
Transforming Enterprise IT - French Version - Transformation Day Montreal 2018
 
Les clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceLes clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie science
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysance
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
 
Je passe au cloud computing Que faire de l'existant
Je passe au cloud computing Que faire de l'existantJe passe au cloud computing Que faire de l'existant
Je passe au cloud computing Que faire de l'existant
 
Exadays cloud – Enjeux et Transformation du SI
Exadays   cloud – Enjeux et Transformation du SIExadays   cloud – Enjeux et Transformation du SI
Exadays cloud – Enjeux et Transformation du SI
 
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
 
Stockage Cloud : il y en aura pour tout le monde
Stockage Cloud : il y en aura pour tout le mondeStockage Cloud : il y en aura pour tout le monde
Stockage Cloud : il y en aura pour tout le monde
 
What's new in MongoDB 3.6
What's new in MongoDB 3.6What's new in MongoDB 3.6
What's new in MongoDB 3.6
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
 
Denodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie APIDenodo, pilier central de votre stratégie API
Denodo, pilier central de votre stratégie API
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data Science
 
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]
Stockage et Cloud [#CloudAccelerate 13/06/2014 @ IBM CC Paris]
 

Plus de Amazon Web Services

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Amazon Web Services
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Amazon Web Services
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateAmazon Web Services
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSAmazon Web Services
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Amazon Web Services
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Amazon Web Services
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...Amazon Web Services
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsAmazon Web Services
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareAmazon Web Services
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSAmazon Web Services
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAmazon Web Services
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareAmazon Web Services
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWSAmazon Web Services
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckAmazon Web Services
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without serversAmazon Web Services
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...Amazon Web Services
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceAmazon Web Services
 

Plus de Amazon Web Services (20)

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS Fargate
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWS
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot
 
Open banking as a service
Open banking as a serviceOpen banking as a service
Open banking as a service
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
 
Computer Vision con AWS
Computer Vision con AWSComputer Vision con AWS
Computer Vision con AWS
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatare
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e web
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWS
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch Deck
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without servers
 
Fundraising Essentials
Fundraising EssentialsFundraising Essentials
Fundraising Essentials
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container Service
 

AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et analysez en temps réel vos données

  • 1. © 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc. Du temps réel au data warehouse : capturez et analysez en temps réel vos données Julien Lépine, Solutions Architect, Amazon Adrien Schmidt, CEO, Squid Solutions 13 Mai 2014@aws_actus / #awssummit
  • 2. Big Data: des données en augmentation perpétuelle Go To Po 95% des 1,2 zettaoctets des données dans l’univers digital sont non structurées 70% de ces données ont été générées par des utilisateurs La croissance des données non structurées est explosive, avec des croissances annuelles (CAGR) de 62% entre 2008 et 2012. Source: IDC Zo Eo
  • 3. Un écosystème Big Data Amazon Redshift Amazon EMR Amazon EC2 Analyser Amazon Glacier Amazon S3 Amazon DynamoDB Stocker AWS Direct Connect Collecter Amazon Kinesis
  • 4. Stockage illimité ; faible coût Stockage d’objets ; disponibilité Élastique et sécurisé Durable: 99,999999999% Amazon S3
  • 5. Clusters Hadoop Plateforme managée Simple d’utilisation Intégré à Amazon S3, DynamoDB Amazon Elastic MapReduce
  • 6. Service de métrologie AWS Cas d’usage • X * 10M d’enregistrements/sec • X * 100K sources • X To par heure Contraintes • Besoin de plus d’élasticité • Envie d’alertes en temps-réel • Coûteux à opérer • Stockage éventuellement consistent
  • 7. Notre transition « Big Data » Ancien besoin • Accepter des volumes très importants de données et les traiter par lots horaires ou quotidiens Nouveau besoin • Prendre des décisions plus rapidement, même en temps-réel • Redimensionner le système complet à l’échelle, de manière élastique • Rendre facile le fait de « garder tout » • Permettre à plusieurs applications de traiter les données en parallèle
  • 8. Scenarios Capture-Transformation-Chargement accéléré Métrique continue / KPI Extraction Analyse réactive sur les données Types de données Infrastructure IT, Logs Applicatifs, Média Sociaux, Données Financières, Clics Web, Capteurs, Geolocalisation Logiciels / technologie Serveurs IT, Traitement Logs applications Tableaux de bord opérationnels IT Intelligence opérationnelle sur capteurs Marketing / Publicité en ligne Agrégation de données marketing Advertising metrics like coverage, yield, conversion Analytique sur engagement client avec les publicités, optimisation des bids Finance Collecte de données des marchés financiers Métriques de données financières Analyse et détection de fraudes, suivi de VAR audit d’ordres sur les marchés E-Commerce / Plateformes en ligne Agrégation de données sur l’engagement en ligne des clients Métriques d’engagement client, CTR, pages vues, … Moteurs de recommandation, analyse de comportement Scénarios clients sur plusieurs industries
  • 9. Traitement temps-réel Élastique; forte volumétrie Simple d’utilisation Intégré dans l’écosystème Amazon Kinesis
  • 10. Architecture Amazon Kinesis Amazon Web Services AZ AZ AZ Durable, highly consistent storage replicates data across three data centers (availability zones) Aggregate and archive to S3 Millions of sources producing 100s of terabytes per hour Front End Authentication Authorization Ordered stream of events supports multiple readers Real-time dashboards and alarms Machine learning algorithms or sliding window analytics Aggregate analysis in Hadoop or a data warehouse Inexpensive: $0.028 per million puts
  • 11. Plateforme pour l’intégration et le traitement continu Le bon outil pour le bon cas d’usage Intégration temps-réel • Passe à l’échelle • Durable • Élastique • Lecture / relecture Traitement continu • Équilibrage de charge sur les flux d’entrée • Tolérance de panne, Checkpoint / Replay • Élastique • Plusieurs applications traitent en parallèle Permet le transfert de données vers des points de stockage / traitement Service managé Latence faible de bout-en-bout Traitement en continu et en temps-réel
  • 12. Écrire dans Kinesis Une interface simple « Put » • Les producteurs utilisent un appel PUT pour stocker des données dans un Stream • PutRecord {Data, PartitionKey, StreamName} • Une clé de partitionnement est fournie par le producteur afin de cibler un Shard • Kinesis utilise un algorithme de hash pour déterminer dans quel Shard stocker les données • Un numéro unique de séquence est retourné au producteur une fois les données stockées
  • 14.
  • 15. Accélérer le développement d’applications de traitement Kinesis avec le Kinesis Client Library o Bibliothèque Java ouverte, sources sur GitHub o Concevez et déployez des applications sur Amazon EC2 o KCL sert d’intermédiaire de traitement:  Démarre un « Worker » pour chaque Shard  Simplifie la lecture via une abstraction des Shards  Augmente / Diminue le nombre de Workers en fonction du nombre de Shards  Gère les Checkpoints et la reprise sur erreur o Gère la répartition de charge avec les Auto Scaling Groups
  • 16. Connecter Kinesis avec Amazon DynamoDB, S3, Redshift ou votre système avec Kinesis Connector Library Amazon S3 Amazon DynamoDB Amazon Redshift Amazon Kinesis ITransformer • Transforme un enregistrement Kinesis en une donnée utile IFilter • Exclue les enregistrements non pertinents IBuffer • Regroupe les enregistrements ensemble pour faciliter le traitement par lot IEmitter • Enregistre les lots d’enregistrements vers un système de stockage
  • 17. D’autres options de lecture de Streams Kinesis APIs, Storm o Utiliser les APIs « Get* » pour lire les données brutes depuis les flux Kinesis • GetRecords {Limit, ShardIterator} • GetShardIterator {ShardId, ShardIteratorType, StartingSequenceNumber, StreamName} o Intégrer Kinesis avec des Topologies Storm • Bootstraps (Zookeeper) attache les Shards aux Spouts • Lecture de données depuis les Streams Kinesis • Émet des « tuples » et gère le Checkpoints (Zookeeper)
  • 18. Envoyer et lire des données avec Kinesis HTTP Post AWS SDK LOG4J Flume Fluentd Get* APIs Kinesis Client Library + Connector Library Apache Storm Amazon Elastic MapReduce Envoyer Lire
  • 19. Utiliser EMR pour lire et traiter des flux Kinesis Traitement Source • Analyste • Développeur Mon site Kinesis Log4J Appender Envoi vers Kinesis EMR – AMI 3.0.5 Hive Pig Cascading MapReduce Lit depuis
  • 21. Tarif Kinesis Simple, paiement à l’usage, pas d’engagement Type d’usage Prix Shard par Heure $0,015 1,000,000 transactions PUT $0,028 • Le niveau de performance est défini en nombre de Shards, choisi par le client • Chaque Shard fournit 1 Mo/s en écriture, and 2 Mo/s en lecture • Bande passante entrante gratuite • Les applications de lecture Kinesis sur EC2 sont facturées au tarif EC2
  • 22. HDFS Plateformes d’analyse Gestion de données Amazon RedShift Amazon EMR Amazon RDS Amazon S3 Amazon DynamoDB Amazon Kinesis Sources SourcesSources de données AWS Data Pipeline
  • 23. À l’échelle du Pétaoctet Massivement parallèle Data warehouse relationnel Totalement managé Amazon Redshift beaucoup plus rapide beaucoup moins cher vraiment beaucoup plus simple
  • 24. Maîtriser Amazon Redshift Adrien Schmidt CEO, Squid Solutions
  • 25. A propos de Squid Solutions • 10 ans d’expérience • 4 profils tech différents • 14 DWH en gestion • 20To données en ligne • 2 plateformes big data • 8 semaines par POC • Toute la chaine data
  • 26. A propos de ProQuest • Distribution de contenus numériques • 90,000 sources • 6B pages de contenus • 20M d’articles • 450K Ebooks • 100 pays
  • 27. A propos d’Amazon Redshift Principes clé • MPP / Shared Nothing • Horizontal scalability • Data Distribution • Parallel Import Disponible à la demande • 4 configurations de base • Extensible (up/down) • Stop and go 10 GigE (HPC) Ingestion Backup Restore JDBC/ODBC
  • 28. Le choix de Redshift • Les fonctions et performances d’une base SQL MPP mature – Performances pour des requêtes interactives – SQL avancé pour l’analyse – Un moteur en en développement actif • Le modèle de coût et la flexibilité des solutions Hadoop – Volumétrie adapté Go/To/Po – Engagement longue durée divise les coûts par 3
  • 29. Répondre aux attentes clients spécifiques Données agrégées Faible latence End user reports & analysis Données granulaires Forte latence Intégrité des données, analyses avancées
  • 30. Des couches de données bottom-up Raw Data Layer Reporting Layer Global KPI Layer Business intelligence à travers les départements Rapports standard “COUNTER-compliant” Analyse fine de l’usage
  • 31.
  • 32.
  • 33. Une infrastructure robuste sur AWS ProQuest Big Data Analytics Secure Available Flexible Scalable
  • 34. © 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole or in part without the express consent of Amazon.com, Inc. 13 Mai 2014 Merci ! Du temps réel au data warehouse : capturez et analysez en temps réel vos données Julien Lépine, Solutions Architect, Amazon Adrien Schmidt, CEO, Squid Solutions @aws_actus / #awssummit