SlideShare une entreprise Scribd logo
© Copyright 2015 – Keyrus 1
© Copyright 2015 – Keyrus 2© Copyright 2015 – Keyrus 2
CLOUD BI  GOOGLE & AMAZON
Focus Bigquery & Redshift
Olivier Breton – Responsable Innovation
&
Pierre Coste – Leader Technique BI & Search & Cloud
© Copyright 2015 – Keyrus 3
CLOUD : UNE OFFRE DE SERVICE
A LA DEMANDE
© Copyright 2015 – Keyrus 4
LES DONNÉES DANS LE CLOUD
• Données secrètes : ne doivent pas être dans le cloud
• Données confidentielles : Ne mettent pas en péril la société
• Données normales : Peu de valeur pour la société
Cloud Souverain ?
stockage US / EU ?
© Copyright 2015 – Keyrus 5
PRÉSENTATION AMAZON REDSHIFT
© Copyright 2015 – Keyrus 6
PRÉSENTATION BIGQUERY
• Un modèle qui ne peut pas être reproduit en local, une requête
peut engendrer l’utilisation de 10 000 cœurs
• Pas d’installation, pas d’administration, pas d’index
• Scalable : répondra aussi vite peu importe le nombre d’utilisateurs
et la données
• Temps réel – Stream data
table
dataset
PROJET
LES COMPOSANTS
∕ UTF-8 & ISO-8859-1
∕ Support du SQL standard et étendu
par Bigquery
∕ Modèles normalisés & dénormalisés
∕ Streaming
∕ Chargements parallélisés
∕ Interface graphique de gestion
© Copyright 2015 – Keyrus 7
PRÉSENTATION BIGQUERY
• Stockage en colonne VS stockage en ligne
• Full scan de la table à chaque requête
• Mise en cache de chaque requête
Les colonnes
∕ Strings
∕ integers
∕ booleans
∕ floats
∕ timestamps,
∕ Nested
∕ records
© Copyright 2015 – Keyrus 8
PRÉSENTATION BIGQUERY
• Chargement des données
• Par Fichier en CSV ou en JSON
• Streaming pour chargement en temps réel (via API)
Les données
∕ Une table alimentée est immuable
∕ Pas de modification au niveau ligne
∕ Pas d’update, pas de delete
© Copyright 2015 – Keyrus 9
PRÉSENTATION BIGQUERY
• Décorateur pour diminuer les coûts
• @time : le snapshot
• TABLE_DATE_RANGE(prefix, timestamp1, timestamp2)
• TABLE_QUERY(dateset, expr) 'table_id CONTAINS "oo" AND
length(table_id) >= 4')
Les cout
∕ Stockage : $0.020 per GB, per
month
∕ Requête : $5 per TB (1er TB gratuit)
∕ Chargement / Copie / Export gratuit
Les cout
∕ 750 heures gratuites pendant 2 Mois
∕ 0,25$/heure/node au moins cher
pour 2 cpu / 15gb Ram /
© Copyright 2015 – Keyrus 10
CONNEXION
• Une interface pour gérer Bigquery
• Connexion via l’utilitaire BQ
• Connexion avec des API
Connexion API
∕ Java, Python, JavaScript, Ruby,
PHP, …
∕ Google Apps Script
∕ Connexion OAuth2
Connexions
∕ Connexion ODBC / JDBC
∕ API class
© Copyright 2015 – Keyrus 11
BIGQUERY VS REDSHIFT
Requête sur 1 milliard de ligne
• A1 : Sans rien faire
• A2 : Avec un index trié
• A3 : Tri + données distribuées
Requête sur 5 milliards de ligne
• Sans rien faire
• La même requête quelques temps plus tard
© Copyright 2015 – Keyrus 12
Un cout du stockagé divisé par deux !
Chaque table non modifié depuis plus de 90 jours verra son prix de stockage divisé par
deux, soit 1 centime par GB.
• Réduction automatique
• Le cout du requétage est le même
• Pas d'impact sur les perfs
• Une modification sur la table remet à 0 le compteur
UPDATE GCPNEXT 2016
© Copyright 2015 – Keyrus 13
Capacitor Storage Engine
Google a amélioré sa façon de stocker et requéter les donnés sur sons sytème et
principalement une meilleure gestion des données compréssés. Pour faire simple, Google est
maintenant capable de filter directement sur des données compréssées sans étapes de
décompression.
UPDATE GCPNEXT 2016
MaintenantAvant
© Copyright 2015 – Keyrus 14
Optimisation de l'import
Google a revu son système d'import de données et annonce des temps d'insertion diminué par
5. A investiguer entre autre sur le format Avro
https://cloud.google.com/blog/big-data/2016/03/improve-bigquery-ingestion-times-10x-by-
using-avro-source-format
Partitionnement automatique
En version Alpha, Google BigQuery va proposer un partitionnement automatique au sein d'une
seule table physique, qui pourrait avoir pour intérêt d'éviter de faire uen table par jour et se
rapprocherait du partitionnement standard dans les bases de données classiques.
Toutes les infos ici en Anglais : https://cloud.google.com/blog/big-data/2016/03/google-
bigquery-cuts-historical-data-storage-cost-in-half-and-accelerates-many-queries-by-10x
UPDATE GCPNEXT 2016

Contenu connexe

Tendances

GUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the Web
GUSS
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides Keynote
Microsoft
 
Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Microsoft Décideurs IT
 
BBL - Monitoring - kyriba
BBL - Monitoring - kyribaBBL - Monitoring - kyriba
BBL - Monitoring - kyriba
Olivier BAZOUD
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseurs
Patrick Bury
 
Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...
Vincent Lepot
 
Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016
Guillaume Nocent
 
Aws vs azure
Aws vs azureAws vs azure
Aws vs azure
Manfred Dardenne
 
Résilience avec Hystrix dans Liferay
Résilience avec Hystrix dans  LiferayRésilience avec Hystrix dans  Liferay
Résilience avec Hystrix dans Liferay
Quang Tu LE
 
Cloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiquesCloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiques
Microsoft
 
Google Compute Engine
Google Compute EngineGoogle Compute Engine
Google Compute Engine
Jean-Baptiste Claramonte
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
Microsoft Décideurs IT
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud Databases
OVHcloud
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Modern Data Stack France
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
Khanh Maudoux
 
MapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifiéMapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifié
Mathieu Dumoulin
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
Khanh Maudoux
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.it
hibnico
 

Tendances (18)

GUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the Web
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides Keynote
 
Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?
 
BBL - Monitoring - kyriba
BBL - Monitoring - kyribaBBL - Monitoring - kyriba
BBL - Monitoring - kyriba
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseurs
 
Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...
 
Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016
 
Aws vs azure
Aws vs azureAws vs azure
Aws vs azure
 
Résilience avec Hystrix dans Liferay
Résilience avec Hystrix dans  LiferayRésilience avec Hystrix dans  Liferay
Résilience avec Hystrix dans Liferay
 
Cloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiquesCloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiques
 
Google Compute Engine
Google Compute EngineGoogle Compute Engine
Google Compute Engine
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud Databases
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
MapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifiéMapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifié
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.it
 

En vedette

Théories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la MotivationThéories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la Motivation
Chiraz Chebbi
 
Earth day
Earth dayEarth day
Amber Edwards resume 2016
Amber Edwards resume 2016Amber Edwards resume 2016
Amber Edwards resume 2016
Amber Edwards
 
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
Anton Chuvakin
 
гістарычныя сядзібы
гістарычныя сядзібы   гістарычныя сядзібы
гістарычныя сядзібы
olia-1989128
 
Jusino-CNU-academic-trans
Jusino-CNU-academic-transJusino-CNU-academic-trans
Jusino-CNU-academic-trans
Angelica Jusino
 
Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)
Carlos Pérez-Aradros
 
How to Migrate your Startup to AWS
How to Migrate your Startup to AWSHow to Migrate your Startup to AWS
How to Migrate your Startup to AWS
Amazon Web Services
 
Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !
Romain Vignes
 
Keyrus US Information
Keyrus US InformationKeyrus US Information
Keyrus US Information
Devon Ziegenfuss
 
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Jean-Michel Franco
 
PCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่นPCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่น
Supaporn Kornkhonburi
 
La Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketingLa Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketing
Jean-Michel Franco
 
Cyber terrorisme in Nederland
Cyber terrorisme in NederlandCyber terrorisme in Nederland
Cyber terrorisme in Nederland
Sijmen Ruwhof
 
Formation mobile-cross-platform
Formation mobile-cross-platformFormation mobile-cross-platform
Formation mobile-cross-platform
Atelier IHM Polytech Nice Sophia
 
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data ScienceDans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Aurélie Vache
 
Airbnb Pitch Deck
Airbnb Pitch DeckAirbnb Pitch Deck
Airbnb Pitch Deck
Tech in Asia ID
 
BuzzFeed Pitch Deck
BuzzFeed Pitch DeckBuzzFeed Pitch Deck
BuzzFeed Pitch Deck
Tech in Asia ID
 

En vedette (18)

Théories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la MotivationThéories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la Motivation
 
Earth day
Earth dayEarth day
Earth day
 
Amber Edwards resume 2016
Amber Edwards resume 2016Amber Edwards resume 2016
Amber Edwards resume 2016
 
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
 
гістарычныя сядзібы
гістарычныя сядзібы   гістарычныя сядзібы
гістарычныя сядзібы
 
Jusino-CNU-academic-trans
Jusino-CNU-academic-transJusino-CNU-academic-trans
Jusino-CNU-academic-trans
 
Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)
 
How to Migrate your Startup to AWS
How to Migrate your Startup to AWSHow to Migrate your Startup to AWS
How to Migrate your Startup to AWS
 
Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !
 
Keyrus US Information
Keyrus US InformationKeyrus US Information
Keyrus US Information
 
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
 
PCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่นPCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่น
 
La Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketingLa Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketing
 
Cyber terrorisme in Nederland
Cyber terrorisme in NederlandCyber terrorisme in Nederland
Cyber terrorisme in Nederland
 
Formation mobile-cross-platform
Formation mobile-cross-platformFormation mobile-cross-platform
Formation mobile-cross-platform
 
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data ScienceDans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
 
Airbnb Pitch Deck
Airbnb Pitch DeckAirbnb Pitch Deck
Airbnb Pitch Deck
 
BuzzFeed Pitch Deck
BuzzFeed Pitch DeckBuzzFeed Pitch Deck
BuzzFeed Pitch Deck
 

Similaire à Présentation BigQuery et comparatif avec RedShift

Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google Cloud
Pierre Coste
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Amazon Web Services
 
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Microsoft Technet France
 
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
marcomeasyteam
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshopsparow2010
 
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Aurélie Vache
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Switzerland
 
Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques
Microsoft Technet France
 
Windows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiquesWindows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiques
MCKLMT
 
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiquesTechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
MCKLMT
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL Server
Microsoft
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1
Microsoft
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Carles Sistare
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
David Caramelo
 
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
ABC Systemes
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019
Jean-Baptiste Claramonte
 
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Microsoft
 
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandOpen XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandPublicis Sapient Engineering
 
Datit207 scénarios hybrides entre sql server et windows azure
Datit207   scénarios hybrides entre sql server et windows azureDatit207   scénarios hybrides entre sql server et windows azure
Datit207 scénarios hybrides entre sql server et windows azureChristophe Laporte
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Cellenza
 

Similaire à Présentation BigQuery et comparatif avec RedShift (20)

Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google Cloud
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
 
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
 
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshop
 
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
 
Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques
 
Windows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiquesWindows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiques
 
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiquesTechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL Server
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
 
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019
 
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
 
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandOpen XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
 
Datit207 scénarios hybrides entre sql server et windows azure
Datit207   scénarios hybrides entre sql server et windows azureDatit207   scénarios hybrides entre sql server et windows azure
Datit207 scénarios hybrides entre sql server et windows azure
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1
 

Dernier

Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Laurent Speyser
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
Université de Franche-Comté
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
OCTO Technology
 
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO Technology
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
OCTO Technology
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
UNITECBordeaux
 

Dernier (6)

Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
 
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'universitéDe l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
De l'IA comme plagiat à la rédaction d'une « charte IA » à l'université
 
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...
 
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO TALKS : 4 Tech Trends du Software Engineering.pdf
OCTO TALKS : 4 Tech Trends du Software Engineering.pdf
 
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...
 
Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024Le support de présentation des Signaux 2024
Le support de présentation des Signaux 2024
 

Présentation BigQuery et comparatif avec RedShift

  • 1. © Copyright 2015 – Keyrus 1
  • 2. © Copyright 2015 – Keyrus 2© Copyright 2015 – Keyrus 2 CLOUD BI GOOGLE & AMAZON Focus Bigquery & Redshift Olivier Breton – Responsable Innovation & Pierre Coste – Leader Technique BI & Search & Cloud
  • 3. © Copyright 2015 – Keyrus 3 CLOUD : UNE OFFRE DE SERVICE A LA DEMANDE
  • 4. © Copyright 2015 – Keyrus 4 LES DONNÉES DANS LE CLOUD • Données secrètes : ne doivent pas être dans le cloud • Données confidentielles : Ne mettent pas en péril la société • Données normales : Peu de valeur pour la société Cloud Souverain ? stockage US / EU ?
  • 5. © Copyright 2015 – Keyrus 5 PRÉSENTATION AMAZON REDSHIFT
  • 6. © Copyright 2015 – Keyrus 6 PRÉSENTATION BIGQUERY • Un modèle qui ne peut pas être reproduit en local, une requête peut engendrer l’utilisation de 10 000 cœurs • Pas d’installation, pas d’administration, pas d’index • Scalable : répondra aussi vite peu importe le nombre d’utilisateurs et la données • Temps réel – Stream data table dataset PROJET LES COMPOSANTS ∕ UTF-8 & ISO-8859-1 ∕ Support du SQL standard et étendu par Bigquery ∕ Modèles normalisés & dénormalisés ∕ Streaming ∕ Chargements parallélisés ∕ Interface graphique de gestion
  • 7. © Copyright 2015 – Keyrus 7 PRÉSENTATION BIGQUERY • Stockage en colonne VS stockage en ligne • Full scan de la table à chaque requête • Mise en cache de chaque requête Les colonnes ∕ Strings ∕ integers ∕ booleans ∕ floats ∕ timestamps, ∕ Nested ∕ records
  • 8. © Copyright 2015 – Keyrus 8 PRÉSENTATION BIGQUERY • Chargement des données • Par Fichier en CSV ou en JSON • Streaming pour chargement en temps réel (via API) Les données ∕ Une table alimentée est immuable ∕ Pas de modification au niveau ligne ∕ Pas d’update, pas de delete
  • 9. © Copyright 2015 – Keyrus 9 PRÉSENTATION BIGQUERY • Décorateur pour diminuer les coûts • @time : le snapshot • TABLE_DATE_RANGE(prefix, timestamp1, timestamp2) • TABLE_QUERY(dateset, expr) 'table_id CONTAINS "oo" AND length(table_id) >= 4') Les cout ∕ Stockage : $0.020 per GB, per month ∕ Requête : $5 per TB (1er TB gratuit) ∕ Chargement / Copie / Export gratuit Les cout ∕ 750 heures gratuites pendant 2 Mois ∕ 0,25$/heure/node au moins cher pour 2 cpu / 15gb Ram /
  • 10. © Copyright 2015 – Keyrus 10 CONNEXION • Une interface pour gérer Bigquery • Connexion via l’utilitaire BQ • Connexion avec des API Connexion API ∕ Java, Python, JavaScript, Ruby, PHP, … ∕ Google Apps Script ∕ Connexion OAuth2 Connexions ∕ Connexion ODBC / JDBC ∕ API class
  • 11. © Copyright 2015 – Keyrus 11 BIGQUERY VS REDSHIFT Requête sur 1 milliard de ligne • A1 : Sans rien faire • A2 : Avec un index trié • A3 : Tri + données distribuées Requête sur 5 milliards de ligne • Sans rien faire • La même requête quelques temps plus tard
  • 12. © Copyright 2015 – Keyrus 12 Un cout du stockagé divisé par deux ! Chaque table non modifié depuis plus de 90 jours verra son prix de stockage divisé par deux, soit 1 centime par GB. • Réduction automatique • Le cout du requétage est le même • Pas d'impact sur les perfs • Une modification sur la table remet à 0 le compteur UPDATE GCPNEXT 2016
  • 13. © Copyright 2015 – Keyrus 13 Capacitor Storage Engine Google a amélioré sa façon de stocker et requéter les donnés sur sons sytème et principalement une meilleure gestion des données compréssés. Pour faire simple, Google est maintenant capable de filter directement sur des données compréssées sans étapes de décompression. UPDATE GCPNEXT 2016 MaintenantAvant
  • 14. © Copyright 2015 – Keyrus 14 Optimisation de l'import Google a revu son système d'import de données et annonce des temps d'insertion diminué par 5. A investiguer entre autre sur le format Avro https://cloud.google.com/blog/big-data/2016/03/improve-bigquery-ingestion-times-10x-by- using-avro-source-format Partitionnement automatique En version Alpha, Google BigQuery va proposer un partitionnement automatique au sein d'une seule table physique, qui pourrait avoir pour intérêt d'éviter de faire uen table par jour et se rapprocherait du partitionnement standard dans les bases de données classiques. Toutes les infos ici en Anglais : https://cloud.google.com/blog/big-data/2016/03/google- bigquery-cuts-historical-data-storage-cost-in-half-and-accelerates-many-queries-by-10x UPDATE GCPNEXT 2016