Les Clouds: Buzzword ou révolution technologiqueFrédéric Desprez, Adrian MuresanLIP ENS Lyon/INRIA Grenoble Rhône-AlpesEPI GRAAL/Avalon06/06/2010
Hype !
AgendaIntroduction
Cloud Computing: modes d’utilisation et exemples
Programmer les Clouds
Sécurité et pannes
Performances
Problèmes de recherche
Conclusionintroduction
IntroductionIl est moins coûteux de louer de la capacité de calcul et de stockage que de monter un centre de calcul
La transparence d’utilisation des grandes plates-formes distribuées est primordiale
Pouvoir gérer ces ressources de manière dynamique et élastique!
Un long historique du calcul distribué à plus ou moins grande échelle
Des supercalculateurs et grappes aux Clouds en passant par les grilles
Des besoins applicatifs de plus en plus importants et variés
Explosion du nombre et du volume de données
Utility computing
“Wewillprobablysee the spread of computer utilities, which, likepresentelectric and telephone utilities, will service individual homes and offices across the country”Professeur John McCarthy, 1961 !!!IntroductionLes grilles font-elles déjà parties du “passé” ?Des plates-formes de recherche et de production disponiblesDes technologies logicielles (relativement) maturesGrand nombred’applicationsportéesAttractivité des Clouds côtérecherche et industrieIl est moins coûteux de louer ou d’acheter de l’électricité que de construire, gérer et maintenir une station de production! Systèmes distribués !
Les grillesQu’est-cequ’une grille ?« A fully distributed, dynamically reconfigurable, scalable and autonomous infrastructure to provide location independent, pervasive, reliable, secure and efficient access to a coordinated set of services encapsulating and virtualizing resources (computing power, storage, instruments, data, etc.) in order to generate knowledge ... » d’après le CoreGRIDNoE
Qu’est-ce que le Cloud Computing ?Un paradigme de calculdistribuéémergeantdanslequel les données et les services sontdisponiblesdans des data centers extensibles et peuventêtreaccédés de manièretransparentedepuis des appareils (ordinateurs, téléphones, grappes, …) connectés par Internet5ème génération d’architectures 1970: Mainframes,
 1980: Client-serveurs,
 1990: Web, grilles,
 2000: SOA,
 2010: Clouds	Credit: IBM Corp.Cloud Computing
Cloud ComputingNé de
La profusion de ressources (data centers)
Une technologie de virtualisation mature et des communications à haut débit
Quelques caractéristiques
Libre service à la demande
Le consommateur récupère des ressources de calcul et de stockage à la demande (machines virtuelles)
Accès réseau
Ressources, briques logicielles et applications disponibles à travers le réseau pour des clients de tailles différentes
Mise en commun de ressources
Data centers fournissant les ressources (machines, stockage, mémoire, BP réseau) pour différents clients en mode partagé. Diminution des tâches de maintenance.
« Elasticité » réactive et rapide
Croissance ou décroissance dynamique du nombre de ressources en fonction de la demande et des besoins. Extensibilité !
Service mesuré et facturation à l’usage
Reporting de l’utilisation des ressources
Résilience
Continuité du serviceGoogle cluster 1997
Google Data centers 36 data centers contenant plus d’un million de serveurs
 40 serveurs/rackhttp://opencompute.org/
The Million-Server Data Centerhttp://spectrum.ieee.org/tech-talk/semiconductors/devices/what-will-the-data-center-of-the-future-look-like
Constat : CoûtInvestissement*Source :http://media.amazonwebservices.com/AWS_Cloud_Best_Practices.pdf14
Une vue à 10000 piedsSLAsServices webVirtualisation
Grilles vs CloudsUne vision partagée
simplifier l’accès aux ressources distantes de la manière la plus transparente possible
Technologie différente
Grappes et batchs vs datacenters et virtualisation
Gestion de ressources
Statique vs dynamique
Modèle de programmation
MPI/GridRPC vs MapReduce/scripts/workflows
Modèle de sécurité
Certificats vs Web + SSL
Des domaines applicatifs différents (pour l’instant!)
HPC/HTC vs BusinessGridComputingCloudComputingSalesforces.comGrid‘5000InfrastructureIaaSCloudComputingAmazon EC2/S3Eucalyptus IaaSOpen SourceNimbus IaaSOpen SourceOpenNebulaIaaSOpen SourceFP7 ReservoirSun Open CloudMicrosoftAzureIBM Blue CloudHP FlexibleComputingServicesFutureGridLe calculcomme un service : un historique1998199920032006200820092007200520112010Crédits: T. Priol, INRIA
Modes d’utilisation
Cloud Computing: modes d’utilisationInfrastructure as a Service (IaaS)
Le matériel est fourni sous forme de machines virtuelles sur lesquelles on installe son image disque
Amazon EC2, Rackspace, GoGRID, Orange, …
Platform as a Service (PaaS)
On peut développer ses propres applications en utilisant les services fournis
Google Apps, Windows Azure, Amazon S3, IBM CloudBurst et Websphere, …
Software as a Service (SaaS)
Des applications entières sont disponibles à distance
Gmail, Googledocs, Facebook, Orange, IBM LotusLive, …Infrastructure as a ServiceAvoir accès à la demande à un grand nombre de ressources virtualiséesDynamicité, élasticitéPaiement à la consommationConcept de virtualisationLe système d’exploitation n’est plus central et est un logiciel comme un autre !Le concept de machines virtuelles consiste à recevoir des instances de systèmes. Les ressources physiques sont partagées par plusieurs machines virtuellesExemplesAmazon EC2, RightScale, GoGrid, Orange Open Cloud, …
VirtualisationMachines virtuelles s’exécutant sur un nœud de calculVM0VM1VM2N0Proposé par IBM dans les années 60“Virtual Machines have finallyarrived. Dismissed for a number of years as merelyacademiccuriosities, they are nowseen as cost-effective techniques for organizing computer systemsresources to provideextraordinary system flexibility and support for certain unique applications”.Goldberg, Survey of Virtual Machine Research, 1974Nœud de calculCrédits: T. Priol, INRIA
VirtualisationApacheweb serversimulationPropriétés IsolementVM2VM1?MachinevirtuelleMachinevirtuelleCrédits: T. Priol, INRIA
VirtualisationVM0N0Noeud de calculPropriétés Isolement
 PortabilitéMachinevirtuelleMachinevirtuelleVM0N1Noeud de calculCrédits: T. Priol, INRIA
VirtualisationPropriétésIsolement
Portabilité
 Suspend/restart (et migration ?)MachinevirtuelleVM0Crédits: T. Priol, INRIA
TechnoAppAppAppAppAppAppSESESESystèmed’exploitationHyperviseurMatérielMatérielPile virtualiséePile traditionnelle
Architecture logicielleIaaSNIST DRAFT Cloud Computing Synopsis and Recommendations
Amazon Web Services : ContexteSite marchand amazon.com (1995)Trafic fluctuantDisponibilitéAnalyse de donnéesGestion de stockLarge catalogueInternational : latence (réplication géographique) => CDN2006La référence IaaS => PaaS
On ne paye que ce qu’on utilise
Plus de 20 produits
Datacenters sur 5 régions géographiques
Des nouveautés régulièrement
Références : Dropbox, Slideshare, Netflix, Zinga …Credits: Fabien Bousquet, Kalistic
AWS : géo localisation: 5 régionsDe 2 à 4 zones de disponibilité dans chaque régionCredits: Fabien Bousquet, Kalistic
AWS : Vue générale*Source : http://media.amazonwebservices.com/AWS_Cloud_Best_Practices.pdfCredits: Fabien Bousquet, Kalistic
AWS : Mise en placeInscription internetCarte bancaireInstantanéConsole Web pour démarrerPas d’attente de mise en placePas de coût d’installationSystème ouvert / automatisable :OutilSDKAPICredits: Fabien Bousquet, Kalistic
Amazon Elastic Compute CloudA set of APIs and business models which give developer-level access to Amazon’s infrastructure and content:Search As A ServiceAlexa Web Information ServiceAlexa Top SitesAlexa Site ThumbnailAlexa Web Search PlatformData As A ServiceAmazon E-Commerce ServiceAmazon Historical PricingInfrastructure As A ServiceAmazon Simple Queue ServiceAmazon Simple Storage ServiceAmazon Elastic Compute CloudOther toolsBD : 		RDS, SimpleDBMessaging : 	SNS, SQS, SESStockage : 	EBS, AWS Import/ExportCDN : 	CloudFront »« Calcul » : 	MapReduceDéploiement/Gestion : Beanstalk, CloudFormationSurveillance : 	CloudWatchRéseaux : 	Route 53, VPCPeople As A ServiceAmazon Mechanical TrunkCredits: Jeff Barr, Amazon
AutresoutilsAmazon Relational Database Service (Amazon RDS)
provides an easy way to setup, operate and scale a relational database in the cloud. You can launch a DB Instance and get access to a full-featured MySQL database and not worry about common database administration tasks like backups, patch management etc.
Amazon Simple Queue Service (Amazon SQS)
a reliable, highly scalable, hosted distributed queue for storing messages as they travel between computers and application components.
Amazon Simple Notifications Service (Amazon SNS)
provides a simple way to notify applications or people from the cloud by creating Topics and using a publish-subscribe protocol.
Amazon Elastic MapReduce
provides a hosted Hadoop framework running on the web-scale infrastructure of Amazon Elastic Compute Cloud (Amazon EC2) and Amazon Simple Storage Service (Amazon S3) and allows you to create customized JobFlows. JobFlow is a sequence of MapReduce steps.Autresoutils, contAmazon Virtual Private Cloud (Amazon VPC)
allows you to extend your corporate network into a private cloud contained within AWS. Amazon VPC uses IPSec tunnel mode that enables you to create a secure connection between a gateway in your data center and a gateway in AWS.
Amazon Route
a highly scalable DNS service that allows you manage your DNS records by creating a HostedZone for every domain you would like to manage.
AWS Identity and Access Management (IAM)
enable you to create multiple Users with unique security credentials and manage the permissions for each of these Users within your AWS Account. IAM is natively integrated into AWS Services. No service APIs have changed to support IAM, and exiting applications and tools built on top of the AWS service APIs will continue to work when using IAM.Amazon Web ServicesElastic ComputeCloud (EC2)CalculerSimple Storage Service (S3)Simple QueueService (SQS)StockerEchangerCredits: Jeff Barr, Amazon
Amazon Elastic Compute CloudProvides on-demand processing power
Virtual machine images (Amazon Machine Image, AMI)From $.10 per server hour Virtual Compute Cloud
 Elastic Capacity
 1.7 GHz x86
 1.7 GB RAM
 160 GB Disk
 250 MB/Second Network
 Network Security ModelTime or Traffic-based Scaling, Load testing, Simulation and Analysis, Rendering, Software as a Service Platform, Hosting$.10 - $.18 per GB data transfer
Amazon EC2 ConceptsAmazon Machine Image (AMI)Bootable root diskPre-defined or user-builtCatalog of user-built AMIsOS: Fedora, Centos, Gentoo, Debian, Ubuntu, Windows ServerApp Stack: LAMP, mpiBLAST, HadoopLimited to 10 GBInstanceRunning copy of an AMILaunch in less than 2 minutesStart/stop programmaticallyNetwork Security ModelExplicit access controlSecurity groupsInter-service bandwidth is free
Types d’instanceshttp://aws.amazon.com/fr/ec2/instance-types/High-Memory Extra Large Instance17.1 Go de Mémoire6.5 EC2 ComputeUnits (2 virtualcores avec chacun 3.25 EC2 ComputeUnits)420 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ModéréeHigh-Memory Double Extra Large Instance34.2 Go de Mémoire13 EC2 ComputeUnits (4 virtualcores avec chacun 3.25 EC2 ComputeUnits)850 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeHigh-Memory Quadruple Extra Large Instance68.4 Go de Mémoire26 EC2 ComputeUnits (8 virtualcores avec chacun 3.25 EC2 ComputeUnits)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeApplications à grand trafic, notamment les bases de données et les applications de mise en mémoire cachePetites Instances – défaut1.7 Go de Mémoire1 EC2 Compute Unit (1 virtualcore avec 1 EC2 Compute Unit)160 Go de stockage d’instancePlateforme 32-bitPerformance I/O: ModéréeLarge Instance7.5 Go de Mémoire 4 EC2 ComputeUnits (2 virtualcores avec chacun 2 EC2 ComputeUnits)850 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeExtra Large Instance15 Go de Mémoire8 EC2 ComputeUnits (4 virtualcores avec chacun 2 EC2 ComputeUnits)1,690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: Elevée
Types d’instances, suite http://aws.amazon.com/fr/ec2/instance-types/Quadruple Extra Large Instance Grappe de Calcul23 Go de Mémoire33.5 EC2 ComputeUnits (2 x Intel Xeon X5570, quad-core architecture “Nehalem”)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: Très Elevée (10 Gigabit Ethernet)Nom API: cc1.4xlargeLes instances cette famille fournissent proportionnellement plus de ressources CPU avec une performance réseau améliorée et sont adaptées aux applications Calculs Haute Performance (HPC) et aux autres applications nécessitant un lien réseau.High-CPU Medium Instance1.7 Go de Mémoire5 EC2 ComputeUnits (2 virtualcores avec chacun 2.5 EC2 ComputeUnits)350 Go de stockage d’instancePlateforme 32-bitPerformance I/O: ModéréeNom API: c1.mediumHigh-CPU Extra Large Instance7 Go de Mémoire20 EC2 ComputeUnits (8 virtualcores avec chacun 2.5 EC2 ComputeUnits)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeNom API: c1.xlarge
Amazon Simple Queue ServiceEfficient, reliable load distribution layerPay by the message Scalable Queuing
 Elastic Capacity
 Reliable, Simple, SecureInter-process messaging, data buffering, architecture component $.10 per 1000 messages$.10 - $.18 per GB data transfer
EC2: StockageInstance storeCopie de l’AMI / disque de bootLimité à 10 GBInstance EC2MountDisque lié à l’instance sans coût additionnelNombre et taille variable en fonction du type d’instanceEphemeraldiskEBSNon lié au cycle de vie de l’instanceNombre et taille libresS3Copie d’un EBS à un instant TStocké sur S3SNAPSHOT Accès via APIDonnées non persistantes => Données perdues si machine arrêtée (« terminate ») ou machine plantéeDonnées persistantes => Données non liées au cycle de vie de l’instanceCredits: Fabien Bousquet, Kalistic
Amazon Simple Storage Service$.01 for 1000 to 10000 requestsVirtually infinite storage capacityProvides permanence layer when EC2 nodes are not running Object-Based Storage
 1 B – 5 GB / object
 Fast, Reliable, Scalable
 Redundant, Dispersed
 99.99% Availability Goal
 Private or Public
 Per-object URLs & ACLs
 BitTorrent Support$.15 per GB per monthstorage$.10 - $.18 per GB data transfer
Amazon S3 ConceptsObjectsOpaque data to be stored (1 byte … 5 Gigabytes)Authentication and access controlsBucketsObject container – any number of objects100 buckets per account / buckets are “owned”KeysUnique object identifier within bucketUp to 1024 bytes longFlat object storage modelStandards-Based InterfacesREST and  SOAPURL-Addressability – every object has a URLCredits: Jeff Barr, Amazon
Amazon S3 Concepts, contStockage. 3 actions :EcrireLireSupprimerBuckets : Dossiers / fichiersContrôle de version et droit d’accèsAccès via APIPlusieurs régions géographiques => Latence, disponibilitéCredits: Fabien Bousquet, Kalistic
VuegénéraleS3EC2RegionbucketZoneInstance EC2EBSAPIMountS3Security GroupStart withDo snapshotSNAPSHOTAPIAMIAMIWebCredits: Fabien Bousquet, Kalistic
Combiençàcoûte ?Palier gratuitDans le cadre du palier d’utilisation gratuite d’AWS, les nouveaux clients AWS peuvent démarrer avec Amazon EC2 gratuitement. À l’inscription, les nouveaux clients AWS reçoivent les services EC2 suivants chaque mois pendant un an : 750 heures d’EC2 exécutant l’utilisation d’instance Linux/Unix Micro
750 heures d’ElasticLoadBalancing plus 15 GO de traitement de données
10 GO de stockage Amazon Elastic Block Storage (EBS) plus 1 million d’E/S, 1 GO de stockage de copies instantanée, 10 000 copies instantanées de demandes GET et 1000 copies instantanées de demandes Put
15 GO de bande passante entrante et 15 GO de bande passante sortante groupés parmi tous les services AWS Combiençàcoûte, suite Instances à la demande
Combiençàcoûte, instances réservéesPaiement fixe à l’année et réduction tarif horaire.
Combiençàcoûte, instances spotPermettent de faire une offre pour acheter de la capacité Amazon EC2 non utilisée.
Facturées au prix spot défini par Amazon EC2, qui fluctue de manière périodique en fonction de l’offre et de la demande pour la capacité d’instance spot.
Pour utiliser les instances spot, on fait une demande en spécifiant
le type d’instance, la région souhaitée,
le nombre d’instances qu’on veut exécuter
le prix maximum qu’on est disposé à payer par heure d’instance.

Les Clouds: Buzzword ou révolution technologique

  • 1.
    Les Clouds: Buzzwordou révolution technologiqueFrédéric Desprez, Adrian MuresanLIP ENS Lyon/INRIA Grenoble Rhône-AlpesEPI GRAAL/Avalon06/06/2010
  • 2.
  • 3.
  • 4.
    Cloud Computing: modesd’utilisation et exemples
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
    IntroductionIl est moinscoûteux de louer de la capacité de calcul et de stockage que de monter un centre de calcul
  • 11.
    La transparence d’utilisationdes grandes plates-formes distribuées est primordiale
  • 12.
    Pouvoir gérer cesressources de manière dynamique et élastique!
  • 13.
    Un long historiquedu calcul distribué à plus ou moins grande échelle
  • 14.
    Des supercalculateurs etgrappes aux Clouds en passant par les grilles
  • 15.
    Des besoins applicatifsde plus en plus importants et variés
  • 16.
    Explosion du nombreet du volume de données
  • 17.
  • 18.
    “Wewillprobablysee the spreadof computer utilities, which, likepresentelectric and telephone utilities, will service individual homes and offices across the country”Professeur John McCarthy, 1961 !!!IntroductionLes grilles font-elles déjà parties du “passé” ?Des plates-formes de recherche et de production disponiblesDes technologies logicielles (relativement) maturesGrand nombred’applicationsportéesAttractivité des Clouds côtérecherche et industrieIl est moins coûteux de louer ou d’acheter de l’électricité que de construire, gérer et maintenir une station de production! Systèmes distribués !
  • 19.
    Les grillesQu’est-cequ’une grille?« A fully distributed, dynamically reconfigurable, scalable and autonomous infrastructure to provide location independent, pervasive, reliable, secure and efficient access to a coordinated set of services encapsulating and virtualizing resources (computing power, storage, instruments, data, etc.) in order to generate knowledge ... » d’après le CoreGRIDNoE
  • 20.
    Qu’est-ce que leCloud Computing ?Un paradigme de calculdistribuéémergeantdanslequel les données et les services sontdisponiblesdans des data centers extensibles et peuventêtreaccédés de manièretransparentedepuis des appareils (ordinateurs, téléphones, grappes, …) connectés par Internet5ème génération d’architectures 1970: Mainframes,
  • 21.
  • 22.
    1990: Web,grilles,
  • 23.
  • 24.
    2010: Clouds Credit:IBM Corp.Cloud Computing
  • 25.
  • 26.
    La profusion deressources (data centers)
  • 27.
    Une technologie devirtualisation mature et des communications à haut débit
  • 28.
  • 29.
  • 30.
    Le consommateur récupèredes ressources de calcul et de stockage à la demande (machines virtuelles)
  • 31.
  • 32.
    Ressources, briques logicielleset applications disponibles à travers le réseau pour des clients de tailles différentes
  • 33.
    Mise en communde ressources
  • 34.
    Data centers fournissantles ressources (machines, stockage, mémoire, BP réseau) pour différents clients en mode partagé. Diminution des tâches de maintenance.
  • 35.
  • 36.
    Croissance ou décroissancedynamique du nombre de ressources en fonction de la demande et des besoins. Extensibilité !
  • 37.
    Service mesuré etfacturation à l’usage
  • 38.
  • 39.
  • 40.
  • 41.
    Google Data centers36 data centers contenant plus d’un million de serveurs
  • 42.
  • 43.
    The Million-Server DataCenterhttp://spectrum.ieee.org/tech-talk/semiconductors/devices/what-will-the-data-center-of-the-future-look-like
  • 44.
    Constat : CoûtInvestissement*Source:http://media.amazonwebservices.com/AWS_Cloud_Best_Practices.pdf14
  • 45.
    Une vue à10000 piedsSLAsServices webVirtualisation
  • 46.
    Grilles vs CloudsUnevision partagée
  • 47.
    simplifier l’accès auxressources distantes de la manière la plus transparente possible
  • 48.
  • 49.
    Grappes et batchsvs datacenters et virtualisation
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
    Des domaines applicatifsdifférents (pour l’instant!)
  • 57.
    HPC/HTC vs BusinessGridComputingCloudComputingSalesforces.comGrid‘5000InfrastructureIaaSCloudComputingAmazonEC2/S3Eucalyptus IaaSOpen SourceNimbus IaaSOpen SourceOpenNebulaIaaSOpen SourceFP7 ReservoirSun Open CloudMicrosoftAzureIBM Blue CloudHP FlexibleComputingServicesFutureGridLe calculcomme un service : un historique1998199920032006200820092007200520112010Crédits: T. Priol, INRIA
  • 58.
  • 59.
    Cloud Computing: modesd’utilisationInfrastructure as a Service (IaaS)
  • 60.
    Le matériel estfourni sous forme de machines virtuelles sur lesquelles on installe son image disque
  • 61.
    Amazon EC2, Rackspace,GoGRID, Orange, …
  • 62.
    Platform as aService (PaaS)
  • 63.
    On peut développerses propres applications en utilisant les services fournis
  • 64.
    Google Apps, WindowsAzure, Amazon S3, IBM CloudBurst et Websphere, …
  • 65.
    Software as aService (SaaS)
  • 66.
    Des applications entièressont disponibles à distance
  • 67.
    Gmail, Googledocs, Facebook,Orange, IBM LotusLive, …Infrastructure as a ServiceAvoir accès à la demande à un grand nombre de ressources virtualiséesDynamicité, élasticitéPaiement à la consommationConcept de virtualisationLe système d’exploitation n’est plus central et est un logiciel comme un autre !Le concept de machines virtuelles consiste à recevoir des instances de systèmes. Les ressources physiques sont partagées par plusieurs machines virtuellesExemplesAmazon EC2, RightScale, GoGrid, Orange Open Cloud, …
  • 68.
    VirtualisationMachines virtuelles s’exécutantsur un nœud de calculVM0VM1VM2N0Proposé par IBM dans les années 60“Virtual Machines have finallyarrived. Dismissed for a number of years as merelyacademiccuriosities, they are nowseen as cost-effective techniques for organizing computer systemsresources to provideextraordinary system flexibility and support for certain unique applications”.Goldberg, Survey of Virtual Machine Research, 1974Nœud de calculCrédits: T. Priol, INRIA
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
    Suspend/restart (etmigration ?)MachinevirtuelleVM0Crédits: T. Priol, INRIA
  • 75.
  • 76.
    Architecture logicielleIaaSNIST DRAFTCloud Computing Synopsis and Recommendations
  • 77.
    Amazon Web Services: ContexteSite marchand amazon.com (1995)Trafic fluctuantDisponibilitéAnalyse de donnéesGestion de stockLarge catalogueInternational : latence (réplication géographique) => CDN2006La référence IaaS => PaaS
  • 78.
    On ne payeque ce qu’on utilise
  • 79.
    Plus de 20produits
  • 80.
    Datacenters sur 5régions géographiques
  • 81.
  • 82.
    Références : Dropbox,Slideshare, Netflix, Zinga …Credits: Fabien Bousquet, Kalistic
  • 83.
    AWS : géolocalisation: 5 régionsDe 2 à 4 zones de disponibilité dans chaque régionCredits: Fabien Bousquet, Kalistic
  • 84.
    AWS : Vuegénérale*Source : http://media.amazonwebservices.com/AWS_Cloud_Best_Practices.pdfCredits: Fabien Bousquet, Kalistic
  • 85.
    AWS : Miseen placeInscription internetCarte bancaireInstantanéConsole Web pour démarrerPas d’attente de mise en placePas de coût d’installationSystème ouvert / automatisable :OutilSDKAPICredits: Fabien Bousquet, Kalistic
  • 86.
    Amazon Elastic ComputeCloudA set of APIs and business models which give developer-level access to Amazon’s infrastructure and content:Search As A ServiceAlexa Web Information ServiceAlexa Top SitesAlexa Site ThumbnailAlexa Web Search PlatformData As A ServiceAmazon E-Commerce ServiceAmazon Historical PricingInfrastructure As A ServiceAmazon Simple Queue ServiceAmazon Simple Storage ServiceAmazon Elastic Compute CloudOther toolsBD : RDS, SimpleDBMessaging : SNS, SQS, SESStockage : EBS, AWS Import/ExportCDN : CloudFront »« Calcul » : MapReduceDéploiement/Gestion : Beanstalk, CloudFormationSurveillance : CloudWatchRéseaux : Route 53, VPCPeople As A ServiceAmazon Mechanical TrunkCredits: Jeff Barr, Amazon
  • 87.
  • 88.
    provides an easyway to setup, operate and scale a relational database in the cloud. You can launch a DB Instance and get access to a full-featured MySQL database and not worry about common database administration tasks like backups, patch management etc.
  • 89.
    Amazon Simple QueueService (Amazon SQS)
  • 90.
    a reliable, highlyscalable, hosted distributed queue for storing messages as they travel between computers and application components.
  • 91.
    Amazon Simple NotificationsService (Amazon SNS)
  • 92.
    provides a simpleway to notify applications or people from the cloud by creating Topics and using a publish-subscribe protocol.
  • 93.
  • 94.
    provides a hostedHadoop framework running on the web-scale infrastructure of Amazon Elastic Compute Cloud (Amazon EC2) and Amazon Simple Storage Service (Amazon S3) and allows you to create customized JobFlows. JobFlow is a sequence of MapReduce steps.Autresoutils, contAmazon Virtual Private Cloud (Amazon VPC)
  • 95.
    allows you toextend your corporate network into a private cloud contained within AWS. Amazon VPC uses IPSec tunnel mode that enables you to create a secure connection between a gateway in your data center and a gateway in AWS.
  • 96.
  • 97.
    a highly scalableDNS service that allows you manage your DNS records by creating a HostedZone for every domain you would like to manage.
  • 98.
    AWS Identity andAccess Management (IAM)
  • 99.
    enable you tocreate multiple Users with unique security credentials and manage the permissions for each of these Users within your AWS Account. IAM is natively integrated into AWS Services. No service APIs have changed to support IAM, and exiting applications and tools built on top of the AWS service APIs will continue to work when using IAM.Amazon Web ServicesElastic ComputeCloud (EC2)CalculerSimple Storage Service (S3)Simple QueueService (SQS)StockerEchangerCredits: Jeff Barr, Amazon
  • 100.
    Amazon Elastic ComputeCloudProvides on-demand processing power
  • 101.
    Virtual machine images(Amazon Machine Image, AMI)From $.10 per server hour Virtual Compute Cloud
  • 102.
  • 103.
  • 104.
  • 105.
  • 106.
  • 107.
    Network SecurityModelTime or Traffic-based Scaling, Load testing, Simulation and Analysis, Rendering, Software as a Service Platform, Hosting$.10 - $.18 per GB data transfer
  • 108.
    Amazon EC2 ConceptsAmazonMachine Image (AMI)Bootable root diskPre-defined or user-builtCatalog of user-built AMIsOS: Fedora, Centos, Gentoo, Debian, Ubuntu, Windows ServerApp Stack: LAMP, mpiBLAST, HadoopLimited to 10 GBInstanceRunning copy of an AMILaunch in less than 2 minutesStart/stop programmaticallyNetwork Security ModelExplicit access controlSecurity groupsInter-service bandwidth is free
  • 109.
    Types d’instanceshttp://aws.amazon.com/fr/ec2/instance-types/High-Memory ExtraLarge Instance17.1 Go de Mémoire6.5 EC2 ComputeUnits (2 virtualcores avec chacun 3.25 EC2 ComputeUnits)420 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ModéréeHigh-Memory Double Extra Large Instance34.2 Go de Mémoire13 EC2 ComputeUnits (4 virtualcores avec chacun 3.25 EC2 ComputeUnits)850 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeHigh-Memory Quadruple Extra Large Instance68.4 Go de Mémoire26 EC2 ComputeUnits (8 virtualcores avec chacun 3.25 EC2 ComputeUnits)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeApplications à grand trafic, notamment les bases de données et les applications de mise en mémoire cachePetites Instances – défaut1.7 Go de Mémoire1 EC2 Compute Unit (1 virtualcore avec 1 EC2 Compute Unit)160 Go de stockage d’instancePlateforme 32-bitPerformance I/O: ModéréeLarge Instance7.5 Go de Mémoire 4 EC2 ComputeUnits (2 virtualcores avec chacun 2 EC2 ComputeUnits)850 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeExtra Large Instance15 Go de Mémoire8 EC2 ComputeUnits (4 virtualcores avec chacun 2 EC2 ComputeUnits)1,690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: Elevée
  • 110.
    Types d’instances, suitehttp://aws.amazon.com/fr/ec2/instance-types/Quadruple Extra Large Instance Grappe de Calcul23 Go de Mémoire33.5 EC2 ComputeUnits (2 x Intel Xeon X5570, quad-core architecture “Nehalem”)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: Très Elevée (10 Gigabit Ethernet)Nom API: cc1.4xlargeLes instances cette famille fournissent proportionnellement plus de ressources CPU avec une performance réseau améliorée et sont adaptées aux applications Calculs Haute Performance (HPC) et aux autres applications nécessitant un lien réseau.High-CPU Medium Instance1.7 Go de Mémoire5 EC2 ComputeUnits (2 virtualcores avec chacun 2.5 EC2 ComputeUnits)350 Go de stockage d’instancePlateforme 32-bitPerformance I/O: ModéréeNom API: c1.mediumHigh-CPU Extra Large Instance7 Go de Mémoire20 EC2 ComputeUnits (8 virtualcores avec chacun 2.5 EC2 ComputeUnits)1690 Go de stockage d’instancePlateforme 64-bitPerformance I/O: ElevéeNom API: c1.xlarge
  • 111.
    Amazon Simple QueueServiceEfficient, reliable load distribution layerPay by the message Scalable Queuing
  • 112.
  • 113.
    Reliable, Simple,SecureInter-process messaging, data buffering, architecture component $.10 per 1000 messages$.10 - $.18 per GB data transfer
  • 114.
    EC2: StockageInstance storeCopiede l’AMI / disque de bootLimité à 10 GBInstance EC2MountDisque lié à l’instance sans coût additionnelNombre et taille variable en fonction du type d’instanceEphemeraldiskEBSNon lié au cycle de vie de l’instanceNombre et taille libresS3Copie d’un EBS à un instant TStocké sur S3SNAPSHOT Accès via APIDonnées non persistantes => Données perdues si machine arrêtée (« terminate ») ou machine plantéeDonnées persistantes => Données non liées au cycle de vie de l’instanceCredits: Fabien Bousquet, Kalistic
  • 115.
    Amazon Simple StorageService$.01 for 1000 to 10000 requestsVirtually infinite storage capacityProvides permanence layer when EC2 nodes are not running Object-Based Storage
  • 116.
    1 B– 5 GB / object
  • 117.
  • 118.
  • 119.
  • 120.
  • 121.
  • 122.
    BitTorrent Support$.15per GB per monthstorage$.10 - $.18 per GB data transfer
  • 123.
    Amazon S3 ConceptsObjectsOpaquedata to be stored (1 byte … 5 Gigabytes)Authentication and access controlsBucketsObject container – any number of objects100 buckets per account / buckets are “owned”KeysUnique object identifier within bucketUp to 1024 bytes longFlat object storage modelStandards-Based InterfacesREST and SOAPURL-Addressability – every object has a URLCredits: Jeff Barr, Amazon
  • 124.
    Amazon S3 Concepts,contStockage. 3 actions :EcrireLireSupprimerBuckets : Dossiers / fichiersContrôle de version et droit d’accèsAccès via APIPlusieurs régions géographiques => Latence, disponibilitéCredits: Fabien Bousquet, Kalistic
  • 125.
    VuegénéraleS3EC2RegionbucketZoneInstance EC2EBSAPIMountS3Security GroupStartwithDo snapshotSNAPSHOTAPIAMIAMIWebCredits: Fabien Bousquet, Kalistic
  • 126.
    Combiençàcoûte ?Palier gratuitDansle cadre du palier d’utilisation gratuite d’AWS, les nouveaux clients AWS peuvent démarrer avec Amazon EC2 gratuitement. À l’inscription, les nouveaux clients AWS reçoivent les services EC2 suivants chaque mois pendant un an : 750 heures d’EC2 exécutant l’utilisation d’instance Linux/Unix Micro
  • 127.
    750 heures d’ElasticLoadBalancingplus 15 GO de traitement de données
  • 128.
    10 GO destockage Amazon Elastic Block Storage (EBS) plus 1 million d’E/S, 1 GO de stockage de copies instantanée, 10 000 copies instantanées de demandes GET et 1000 copies instantanées de demandes Put
  • 129.
    15 GO debande passante entrante et 15 GO de bande passante sortante groupés parmi tous les services AWS Combiençàcoûte, suite Instances à la demande
  • 130.
    Combiençàcoûte, instances réservéesPaiementfixe à l’année et réduction tarif horaire.
  • 131.
    Combiençàcoûte, instances spotPermettentde faire une offre pour acheter de la capacité Amazon EC2 non utilisée.
  • 132.
    Facturées au prixspot défini par Amazon EC2, qui fluctue de manière périodique en fonction de l’offre et de la demande pour la capacité d’instance spot.
  • 133.
    Pour utiliser lesinstances spot, on fait une demande en spécifiant
  • 134.
    le type d’instance,la région souhaitée,
  • 135.
    le nombre d’instancesqu’on veut exécuter
  • 136.
    le prix maximumqu’on est disposé à payer par heure d’instance.

Notes de l'éditeur

  • #57  - does not support OCCI yet
  • #58 Kate’s notes:A picture of the architecture – things to emphasize is that it is highly configurable and easy to extend – e.g. last summer we got a community contribution of the backfil/spot scheduler.I typically just discuss workspace layers and then say that Cumulus is organized in a similar way. From top, by layer:Interfaces – right now three types supported we’d love to support OCCIAnd it would be easy to do because we have this workspace API layer that makes it easy to “add on” other interfacesThe RM layer – default is the workspace scheduler (we implemented it), spot pricing adds spot pricing functionality, workspace pilot enables workspace service to work with a batch scheduler such as SGE or Torque. But you can configure workspace service with any of these schedulers – or write your own. Workspace Control Protocol allows any scheduler to interact with workspace control program that carries out its commands on the “worker nodes”The workspace control program is itself configurable – you can have different virtualization flavors, different ways of distributing images to nodes, networking options, etc. – there are many plugins
  • #60  - supported Hypervisors: Xen, KVM, VMware
  • #70  - the 2008 releas was a beta - supported JVM languages: Groovy, JRuby, Scala, Clojure, Jython and PHP - the Datastore is non-relational and uses an SQL-like syntax called GQL
  • #72  - AppScale (2010) - developed and is maintained by the RACELab at UC Santa Barbara
  • #89 90
  • #90  - large oscillations in the last quarter of the year probably due to increasing number of customers of the platform
  • #94 Still difficult to conduct a conclusive comparison experiment => have to make some form of compromise.For IaaS clouds: the smallest VM type was used.
  • #95  - seving a small static file
  • #96  - serving a larger static file - across severla months
  • #97  - compute 1.000.000 operations - Salesforce is limited in the number of operations and did only 100.000 operations and that’s why it’s so good
  • #98  - the test is searching for a string in a storage system - the spike is caused by switching from sequential tests to parallel tests which affected all IaaS providers, except for Rackspace - PaaS clouds did well because they have optimized shared storage models for large data sets
  • #113  - works with oriented graphs - written in C++, has a C++ API
  • #114  - vertexes are identical entities, the code that they execute behaves differently because of the value that they hold (each vertex can be a state machine) - written in C++, has a C++ API
  • #115 In each superstep - a vertex runs a compute() function - a vertex can access all the messages it was sent from the previous step - a vertex can send messages to its neighbours (will be reveived in the next superstep)The global sync step - transfers messages from the previous superstep to the recipientsDeactivation - a vertex explicitly deactivates itself when it has no more work to do - it can be reactivated externally - vertexes that become inactive are not run in the next superstep - computation finishes when all the vertexes are inactive and there are no messages in transitCombiners can be used to combine messages that are sent to the same vertex.Aggregators can be used for global process statistics.
  • #116  - top-right is the binary tree which is about 50x times larger as a number of vertexes - bottom left is the random graph with mean out degree 127.1 for each vertex (approx 127 billion edges in the largest case)