SlideShare une entreprise Scribd logo
1  sur  14
© Copyright 2015 – Keyrus 1
© Copyright 2015 – Keyrus 2© Copyright 2015 – Keyrus 2
CLOUD BI  GOOGLE & AMAZON
Focus Bigquery & Redshift
Olivier Breton – Responsable Innovation
&
Pierre Coste – Leader Technique BI & Search & Cloud
© Copyright 2015 – Keyrus 3
CLOUD : UNE OFFRE DE SERVICE
A LA DEMANDE
© Copyright 2015 – Keyrus 4
LES DONNÉES DANS LE CLOUD
• Données secrètes : ne doivent pas être dans le cloud
• Données confidentielles : Ne mettent pas en péril la société
• Données normales : Peu de valeur pour la société
Cloud Souverain ?
stockage US / EU ?
© Copyright 2015 – Keyrus 5
PRÉSENTATION AMAZON REDSHIFT
© Copyright 2015 – Keyrus 6
PRÉSENTATION BIGQUERY
• Un modèle qui ne peut pas être reproduit en local, une requête
peut engendrer l’utilisation de 10 000 cœurs
• Pas d’installation, pas d’administration, pas d’index
• Scalable : répondra aussi vite peu importe le nombre d’utilisateurs
et la données
• Temps réel – Stream data
table
dataset
PROJET
LES COMPOSANTS
∕ UTF-8 & ISO-8859-1
∕ Support du SQL standard et étendu
par Bigquery
∕ Modèles normalisés & dénormalisés
∕ Streaming
∕ Chargements parallélisés
∕ Interface graphique de gestion
© Copyright 2015 – Keyrus 7
PRÉSENTATION BIGQUERY
• Stockage en colonne VS stockage en ligne
• Full scan de la table à chaque requête
• Mise en cache de chaque requête
Les colonnes
∕ Strings
∕ integers
∕ booleans
∕ floats
∕ timestamps,
∕ Nested
∕ records
© Copyright 2015 – Keyrus 8
PRÉSENTATION BIGQUERY
• Chargement des données
• Par Fichier en CSV ou en JSON
• Streaming pour chargement en temps réel (via API)
Les données
∕ Une table alimentée est immuable
∕ Pas de modification au niveau ligne
∕ Pas d’update, pas de delete
© Copyright 2015 – Keyrus 9
PRÉSENTATION BIGQUERY
• Décorateur pour diminuer les coûts
• @time : le snapshot
• TABLE_DATE_RANGE(prefix, timestamp1, timestamp2)
• TABLE_QUERY(dateset, expr) 'table_id CONTAINS "oo" AND
length(table_id) >= 4')
Les cout
∕ Stockage : $0.020 per GB, per
month
∕ Requête : $5 per TB (1er TB gratuit)
∕ Chargement / Copie / Export gratuit
Les cout
∕ 750 heures gratuites pendant 2 Mois
∕ 0,25$/heure/node au moins cher
pour 2 cpu / 15gb Ram /
© Copyright 2015 – Keyrus 10
CONNEXION
• Une interface pour gérer Bigquery
• Connexion via l’utilitaire BQ
• Connexion avec des API
Connexion API
∕ Java, Python, JavaScript, Ruby,
PHP, …
∕ Google Apps Script
∕ Connexion OAuth2
Connexions
∕ Connexion ODBC / JDBC
∕ API class
© Copyright 2015 – Keyrus 11
BIGQUERY VS REDSHIFT
Requête sur 1 milliard de ligne
• A1 : Sans rien faire
• A2 : Avec un index trié
• A3 : Tri + données distribuées
Requête sur 5 milliards de ligne
• Sans rien faire
• La même requête quelques temps plus tard
© Copyright 2015 – Keyrus 12
Un cout du stockagé divisé par deux !
Chaque table non modifié depuis plus de 90 jours verra son prix de stockage divisé par
deux, soit 1 centime par GB.
• Réduction automatique
• Le cout du requétage est le même
• Pas d'impact sur les perfs
• Une modification sur la table remet à 0 le compteur
UPDATE GCPNEXT 2016
© Copyright 2015 – Keyrus 13
Capacitor Storage Engine
Google a amélioré sa façon de stocker et requéter les donnés sur sons sytème et
principalement une meilleure gestion des données compréssés. Pour faire simple, Google est
maintenant capable de filter directement sur des données compréssées sans étapes de
décompression.
UPDATE GCPNEXT 2016
MaintenantAvant
© Copyright 2015 – Keyrus 14
Optimisation de l'import
Google a revu son système d'import de données et annonce des temps d'insertion diminué par
5. A investiguer entre autre sur le format Avro
https://cloud.google.com/blog/big-data/2016/03/improve-bigquery-ingestion-times-10x-by-
using-avro-source-format
Partitionnement automatique
En version Alpha, Google BigQuery va proposer un partitionnement automatique au sein d'une
seule table physique, qui pourrait avoir pour intérêt d'éviter de faire uen table par jour et se
rapprocherait du partitionnement standard dans les bases de données classiques.
Toutes les infos ici en Anglais : https://cloud.google.com/blog/big-data/2016/03/google-
bigquery-cuts-historical-data-storage-cost-in-half-and-accelerates-many-queries-by-10x
UPDATE GCPNEXT 2016

Contenu connexe

Tendances

GUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteMicrosoft
 
Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Microsoft Décideurs IT
 
BBL - Monitoring - kyriba
BBL - Monitoring - kyribaBBL - Monitoring - kyriba
BBL - Monitoring - kyribaOlivier BAZOUD
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseursPatrick Bury
 
Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...Vincent Lepot
 
Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016Guillaume Nocent
 
Résilience avec Hystrix dans Liferay
Résilience avec Hystrix dans  LiferayRésilience avec Hystrix dans  Liferay
Résilience avec Hystrix dans LiferayQuang Tu LE
 
Cloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiquesCloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiquesMicrosoft
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzureMicrosoft Décideurs IT
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesOVHcloud
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Modern Data Stack France
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystèmeKhanh Maudoux
 
MapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifiéMapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifiéMathieu Dumoulin
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.ithibnico
 

Tendances (18)

GUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the Web
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides Keynote
 
Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?Comment calculer le coût de Windows Azure ?
Comment calculer le coût de Windows Azure ?
 
BBL - Monitoring - kyriba
BBL - Monitoring - kyribaBBL - Monitoring - kyriba
BBL - Monitoring - kyriba
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseurs
 
Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...Comment l’architecture événementielle révolutionne la communication dans le S...
Comment l’architecture événementielle révolutionne la communication dans le S...
 
Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016Présentation JSS2015 - Le Query Store de SQL Server 2016
Présentation JSS2015 - Le Query Store de SQL Server 2016
 
Aws vs azure
Aws vs azureAws vs azure
Aws vs azure
 
Résilience avec Hystrix dans Liferay
Résilience avec Hystrix dans  LiferayRésilience avec Hystrix dans  Liferay
Résilience avec Hystrix dans Liferay
 
Cloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiquesCloud Azure – Services de données et bonnes pratiques
Cloud Azure – Services de données et bonnes pratiques
 
Google Compute Engine
Google Compute EngineGoogle Compute Engine
Google Compute Engine
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud Databases
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
MapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifiéMapReduce: Traitement de données distribué à grande échelle simplifié
MapReduce: Traitement de données distribué à grande échelle simplifié
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.it
 

En vedette

Théories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la MotivationThéories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la MotivationChiraz Chebbi
 
Amber Edwards resume 2016
Amber Edwards resume 2016Amber Edwards resume 2016
Amber Edwards resume 2016Amber Edwards
 
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...Anton Chuvakin
 
гістарычныя сядзібы
гістарычныя сядзібы   гістарычныя сядзібы
гістарычныя сядзібы olia-1989128
 
Jusino-CNU-academic-trans
Jusino-CNU-academic-transJusino-CNU-academic-trans
Jusino-CNU-academic-transAngelica Jusino
 
Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)Carlos Pérez-Aradros
 
How to Migrate your Startup to AWS
How to Migrate your Startup to AWSHow to Migrate your Startup to AWS
How to Migrate your Startup to AWSAmazon Web Services
 
Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !Romain Vignes
 
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone Jean-Michel Franco
 
PCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่นPCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่นSupaporn Kornkhonburi
 
La Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketingLa Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketingJean-Michel Franco
 
Cyber terrorisme in Nederland
Cyber terrorisme in NederlandCyber terrorisme in Nederland
Cyber terrorisme in NederlandSijmen Ruwhof
 
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data ScienceDans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data ScienceAurélie Vache
 

En vedette (18)

Théories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la MotivationThéories de la Personnalité, de la Perception et de la Motivation
Théories de la Personnalité, de la Perception et de la Motivation
 
Earth day
Earth dayEarth day
Earth day
 
Amber Edwards resume 2016
Amber Edwards resume 2016Amber Edwards resume 2016
Amber Edwards resume 2016
 
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
IANS Navigating the Data Stream without Boiling the Ocean: Case Studies in Ef...
 
гістарычныя сядзібы
гістарычныя сядзібы   гістарычныя сядзібы
гістарычныя сядзібы
 
Jusino-CNU-academic-trans
Jusino-CNU-academic-transJusino-CNU-academic-trans
Jusino-CNU-academic-trans
 
Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)Zentyal Customization (templates, hooks, LDAP)
Zentyal Customization (templates, hooks, LDAP)
 
How to Migrate your Startup to AWS
How to Migrate your Startup to AWSHow to Migrate your Startup to AWS
How to Migrate your Startup to AWS
 
Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !Mix-IT 2016 - Sans motivation pas d'action !
Mix-IT 2016 - Sans motivation pas d'action !
 
Keyrus US Information
Keyrus US InformationKeyrus US Information
Keyrus US Information
 
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone Talend Summer 16 launch présentation: Open Data Preparation for Everyone
Talend Summer 16 launch présentation: Open Data Preparation for Everyone
 
PCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่นPCM IS สมุนไพรดับกลิ่น
PCM IS สมุนไพรดับกลิ่น
 
La Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketingLa Préparation de Données au self-service de votre marketing
La Préparation de Données au self-service de votre marketing
 
Cyber terrorisme in Nederland
Cyber terrorisme in NederlandCyber terrorisme in Nederland
Cyber terrorisme in Nederland
 
Formation mobile-cross-platform
Formation mobile-cross-platformFormation mobile-cross-platform
Formation mobile-cross-platform
 
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data ScienceDans les coulisses de Google BigQuery - Meetup Toulouse Data Science
Dans les coulisses de Google BigQuery - Meetup Toulouse Data Science
 
Airbnb Pitch Deck
Airbnb Pitch DeckAirbnb Pitch Deck
Airbnb Pitch Deck
 
BuzzFeed Pitch Deck
BuzzFeed Pitch DeckBuzzFeed Pitch Deck
BuzzFeed Pitch Deck
 

Similaire à Présentation BigQuery et comparatif avec RedShift

Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google CloudPierre Coste
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Amazon Web Services
 
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple Microsoft Technet France
 
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015marcomeasyteam
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshopsparow2010
 
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016Aurélie Vache
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Switzerland
 
Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques Microsoft Technet France
 
Windows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiquesWindows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiquesMCKLMT
 
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiquesTechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiquesMCKLMT
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerMicrosoft
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Microsoft
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesCarles Sistare
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...David Caramelo
 
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...ABC Systemes
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Jean-Baptiste Claramonte
 
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàMicrosoft
 
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandOpen XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandPublicis Sapient Engineering
 
Datit207 scénarios hybrides entre sql server et windows azure
Datit207   scénarios hybrides entre sql server et windows azureDatit207   scénarios hybrides entre sql server et windows azure
Datit207 scénarios hybrides entre sql server et windows azureChristophe Laporte
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Cellenza
 

Similaire à Présentation BigQuery et comparatif avec RedShift (20)

Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google Cloud
 
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec ...
 
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
Stockage sur site et dans le Cloud: témoignage d'implémentation StorSimple
 
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
#OOW15LeOff Breakfast EASYTEAM 28 octobre 2015
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshop
 
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
Dans les coulisses de Google BigQuery - DevFest Toulouse 2016
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
 
Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques Cloud Azure -- Services de données et bonnes pratiques
Cloud Azure -- Services de données et bonnes pratiques
 
Windows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiquesWindows Azure : Services de données et bonnes pratiques
Windows Azure : Services de données et bonnes pratiques
 
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiquesTechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
TechDays 2014 : Cloud Azure – Services de données et bonnes pratiques
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL Server
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
 
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...Stockage dans le cloud hybride  microsoft azure stor simple  presentation cus...
Stockage dans le cloud hybride microsoft azure stor simple presentation cus...
 
Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019Construire un data lake managé - GDG Paris - Juin 2019
Construire un data lake managé - GDG Paris - Juin 2019
 
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
 
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric BriandOpen XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
Open XKE - Google Compute Engine par Jean-Baptiste Claramonte et Eric Briand
 
Datit207 scénarios hybrides entre sql server et windows azure
Datit207   scénarios hybrides entre sql server et windows azureDatit207   scénarios hybrides entre sql server et windows azure
Datit207 scénarios hybrides entre sql server et windows azure
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1
 

Présentation BigQuery et comparatif avec RedShift

  • 1. © Copyright 2015 – Keyrus 1
  • 2. © Copyright 2015 – Keyrus 2© Copyright 2015 – Keyrus 2 CLOUD BI GOOGLE & AMAZON Focus Bigquery & Redshift Olivier Breton – Responsable Innovation & Pierre Coste – Leader Technique BI & Search & Cloud
  • 3. © Copyright 2015 – Keyrus 3 CLOUD : UNE OFFRE DE SERVICE A LA DEMANDE
  • 4. © Copyright 2015 – Keyrus 4 LES DONNÉES DANS LE CLOUD • Données secrètes : ne doivent pas être dans le cloud • Données confidentielles : Ne mettent pas en péril la société • Données normales : Peu de valeur pour la société Cloud Souverain ? stockage US / EU ?
  • 5. © Copyright 2015 – Keyrus 5 PRÉSENTATION AMAZON REDSHIFT
  • 6. © Copyright 2015 – Keyrus 6 PRÉSENTATION BIGQUERY • Un modèle qui ne peut pas être reproduit en local, une requête peut engendrer l’utilisation de 10 000 cœurs • Pas d’installation, pas d’administration, pas d’index • Scalable : répondra aussi vite peu importe le nombre d’utilisateurs et la données • Temps réel – Stream data table dataset PROJET LES COMPOSANTS ∕ UTF-8 & ISO-8859-1 ∕ Support du SQL standard et étendu par Bigquery ∕ Modèles normalisés & dénormalisés ∕ Streaming ∕ Chargements parallélisés ∕ Interface graphique de gestion
  • 7. © Copyright 2015 – Keyrus 7 PRÉSENTATION BIGQUERY • Stockage en colonne VS stockage en ligne • Full scan de la table à chaque requête • Mise en cache de chaque requête Les colonnes ∕ Strings ∕ integers ∕ booleans ∕ floats ∕ timestamps, ∕ Nested ∕ records
  • 8. © Copyright 2015 – Keyrus 8 PRÉSENTATION BIGQUERY • Chargement des données • Par Fichier en CSV ou en JSON • Streaming pour chargement en temps réel (via API) Les données ∕ Une table alimentée est immuable ∕ Pas de modification au niveau ligne ∕ Pas d’update, pas de delete
  • 9. © Copyright 2015 – Keyrus 9 PRÉSENTATION BIGQUERY • Décorateur pour diminuer les coûts • @time : le snapshot • TABLE_DATE_RANGE(prefix, timestamp1, timestamp2) • TABLE_QUERY(dateset, expr) 'table_id CONTAINS "oo" AND length(table_id) >= 4') Les cout ∕ Stockage : $0.020 per GB, per month ∕ Requête : $5 per TB (1er TB gratuit) ∕ Chargement / Copie / Export gratuit Les cout ∕ 750 heures gratuites pendant 2 Mois ∕ 0,25$/heure/node au moins cher pour 2 cpu / 15gb Ram /
  • 10. © Copyright 2015 – Keyrus 10 CONNEXION • Une interface pour gérer Bigquery • Connexion via l’utilitaire BQ • Connexion avec des API Connexion API ∕ Java, Python, JavaScript, Ruby, PHP, … ∕ Google Apps Script ∕ Connexion OAuth2 Connexions ∕ Connexion ODBC / JDBC ∕ API class
  • 11. © Copyright 2015 – Keyrus 11 BIGQUERY VS REDSHIFT Requête sur 1 milliard de ligne • A1 : Sans rien faire • A2 : Avec un index trié • A3 : Tri + données distribuées Requête sur 5 milliards de ligne • Sans rien faire • La même requête quelques temps plus tard
  • 12. © Copyright 2015 – Keyrus 12 Un cout du stockagé divisé par deux ! Chaque table non modifié depuis plus de 90 jours verra son prix de stockage divisé par deux, soit 1 centime par GB. • Réduction automatique • Le cout du requétage est le même • Pas d'impact sur les perfs • Une modification sur la table remet à 0 le compteur UPDATE GCPNEXT 2016
  • 13. © Copyright 2015 – Keyrus 13 Capacitor Storage Engine Google a amélioré sa façon de stocker et requéter les donnés sur sons sytème et principalement une meilleure gestion des données compréssés. Pour faire simple, Google est maintenant capable de filter directement sur des données compréssées sans étapes de décompression. UPDATE GCPNEXT 2016 MaintenantAvant
  • 14. © Copyright 2015 – Keyrus 14 Optimisation de l'import Google a revu son système d'import de données et annonce des temps d'insertion diminué par 5. A investiguer entre autre sur le format Avro https://cloud.google.com/blog/big-data/2016/03/improve-bigquery-ingestion-times-10x-by- using-avro-source-format Partitionnement automatique En version Alpha, Google BigQuery va proposer un partitionnement automatique au sein d'une seule table physique, qui pourrait avoir pour intérêt d'éviter de faire uen table par jour et se rapprocherait du partitionnement standard dans les bases de données classiques. Toutes les infos ici en Anglais : https://cloud.google.com/blog/big-data/2016/03/google- bigquery-cuts-historical-data-storage-cost-in-half-and-accelerates-many-queries-by-10x UPDATE GCPNEXT 2016