SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
—
SRE - Mythes et Réalités
12/10/2023
— Sommaire
Le SRE
01
SRE - Mythes et Réalités
00
02 Mythes vs Réalités
03 En pratique
— C’est qui le gars à gauche ?
Henri Gomez
Cloud Advisor chez Wescale
Engineering Manager
➔ En charge de l’équipe SRE Applicative
puis Observabilité
Head Of SRE
➔ Solution BigData en mode Editeur &
SaaS (DAAS)
IT Operations Manager
➔ Création de l’offre SaaS SonarCloud
chez un éditeur
— C’est qui le gars à droite ?
Jean-Pascal Thiery
Cloud Native Dev chez Wescale
Gardien du MCO
➔ Basculer sereinement d’une base
de données à une autre
Tech lead Observabilité
➔ Mise en place du socle
d’Observabilité unifié
Tech lead developer
➔ Création d’une solution de
backoffice du sol au plafond
Le SRE
01
— Définition
Le SRE
01
E
S R E
Reliability
Disponibilité
Utilisateurs
Services
Résilience
Fiabilité
Sécurité
Sith
Site
Engineering
Ingéniérie
Ordre Méthode
— SRE selon le SRE Book
Le SRE
01
Les SRE Google sont des ingénieurs logiciels
SRE is what happens when you ask a
software engineer to design an
operations team
50–60% are Google Software Engineers,
The other 40–50% are candidates are
very close
— SRE selon le SRE Book
Le SRE
01
50% du temps en développement
(Création de valeurs)
Automation systématique
Eviter la croissance des équipes IT avec la
croissance de l’infra
Maintenir la vélocité de changement sans
impact sur les SLO
— SRE selon le SRE Book
Le SRE
01
Il y a 4 ‘Golden Signals’ à suivre
Erreur
Latence
Tra c Saturation
— Missions historiques
Le SRE
01
➔ SRE is the new Ops dans un cadre qui s’étend à l’application
➔ La priorité, les services doivent être Up & Running
➔ Détection des problèmes avant qu’ils ne deviennent des incidents
➔ A la manoeuvre sur les Post Mortem
➔ Coûts d’exploitation
— Nouvelles missions
Définition du SRE
01
Du conseil, beaucoup de conseil
Sur l’outillage
Pool de connections
Analyse de plan d'exécutions SQL
Sur les pratiques de Run
Qu’est-ce que l’observabilité
La bonne et la mauvaise log
Sur l’architecture
Clusterisation et Redondance
Stratégies et solution de cache
— Nouvelles missions
Définition du SRE
01
On mesure, beaucoup, pour aujourd’hui et demain
Performances Capacity Planning Projection Futur FinOps
Mythes vs Réalités
02
— SRE par et pour Google
Mythes vs Réalités
01
➔ La définition Google d’un SRE répond aux problématiques Google
➔ Une boite de Techs, qui font des produits Techs pour des Techs
➔ Les contraintes d’une entreprise majeure globale
➔ Des moyens sans commune mesure, tant techniques et qu’humains
➔ Une approche Software Engineering systématique (même pour les SRE/Ops)
TO BE OR NOT TO BE
— SRE, le super héro du Run
Mythes vs Réalités
01
➔ Les solutions embarquent toujours plus de technologies
◆ Hyperviseurs, VM, Containers, SQL, NoSQL, Messaging, multiples langages, …
➔ Les stacks techniques sont de plus en plus complexes
◆ Redondance, systèmes de sécurité, multi-zones
➔ Il est compliqué d’être expert sur l’ensemble du scope
➔ Un SRE n’est pas un multi expert, mais un profil avec une large culture
— SRE, le détecteur de Bug
Mythes vs Réalités
01
➔ Étant omniscient, un SRE peut voir les Bugs
➔ You build it, you run it
➔ Les SLI et la taux d’erreurs sont les seuls vrai moyens de détecter les bugs
pour un SRE
○ Budget d’erreur
○ C’est souvent trop tard
➔ La qualité des livrables est toujours de la responsabilité de l’équipe de
dev
— SRE, le bouclier ultime
Mythes vs Réalités
01
➔ La sécurité est l’affaire de tous
➔ La résilience du site passe par son intégrité
➔ Le pentesting et la cybersécurité sont des domaines de l’informatique à
part entière
— Un dev qui est un ops qui fait du dev ?
Mythes vs Réalités
01
➔ Ne pas penser qu’un SRE est un expert dans tous les domaines
◆ SRE is the new FullStackDevSecFinDataOups
➔ Développeur, un profil à temps plein
➔ Un SRE peut avoir une forte culture développement
◆ Pour aider les Dev à analyser les problèmes jusqu’au code
◆ Il n’a pas vocation à remplacer les Dev
— SRE != DevOps
Mythes vs Réalités
01
S R E DevOps
Operations
Monitoring
Capacity Planning
Gestion d’incidents
CI/CD
Automatisation
Config Management
Infra As Code
UNE CONFUSION COURANTE
— SRE != CI/CD
Mythes vs Réalités
01
➔ Les SRE consomment de la CI/CD tout comme les autres acteurs
➔ Gardez en tête le “You build it, you run it !”
◆ Responsabiliser les équipes de réalisation sur le run
● CI/CD
● Observabilité
● Sécurité
En pratique
03
— Les pré-requis
En pratique
03
➔ Une automation déjà présente pour développer et déployer en confiance
◆ Un SRE peut être un Dev d’infras, il aura aussi besoin d’une usine logicielle
➔ Un environnement de Run automatisable
◆ Les solutions d’Infra As Code doivent être utilisables
➔ Un monitoring
◆ Existant et qui sera amendé et amélioré
◆ A créer, dans une optique d’observabilité large
— Les attentes
En pratique
03
➔ Des environnements sous contrôle
◆ Pour être prédictible et reproductible, les opérations manuelles sont à proscrire
➔ Être embarqué jour 1 sur des projets de changement de périmètres
◆ Nouveau project
◆ Nouvelle technologie
◆ Nouveau partenaire
➔ Connaître les SLA principaux
◆ Pour en déduire les premiers SLI et SLO
➔ Être écouté comme force de proposition
◆ Pour renforcer la résilience
◆ Pour collecter les mesures qui alimenteront l’observabilité
— L’Equipe SRE
En pratique
03
➔ Privilégier de petites équipes
◆ Avec des scopes clairs
◆ Des frontières de responsabilité précises
◆ Connues de tous
➔ Avoir assez de seniors pour faire monter en compétences les juniors
◆ 1 senior pour 2 juniors max
➔ Derniers formés deviennent tuteurs
◆ Facilite l’onboarding des nouveaux, valide la compréhension des primo formés
— Les Hard Skills
En pratique
03
➔ Sur la stack technique
◆ Hosting
◆ Data (SQL/NoSQL)
◆ Services Managés
◆ Services SaaS
➔ Sur les applicatifs
◆ Langages
◆ Frameworks
◆ En connaître pour pouvoir analyser une stack trace
— Les Soft Skills
En pratique
03
➔ Savoir écouter
➔ Être un bon communiquant
➔ Ne pas avoir peur d’aller vers les autres
➔ Etre force de proposition
➔ Une bonne capacité à convaincre
➔ Savoir embarquer le plus grand nombre
➔ Savoir apprendre
— Partage et pédagogie
En pratique
03
➔ Expliquer les problématique d'exploitabilité d’une plateforme
➔ Vis ma vie
➔ Embarquer dans la gestion de crise
◆ Résolution plus rapide et plus précises
◆ Co conception des remédiations
◆ Rédaction de post-mortem
➔ Expliquer les grands concepts
◆ Qualité de service
◆ SLA, SLI, SLO
— De monitoring à Observabilité
En pratique
03
➔ Les infrastructures
➔ Les middlewares
➔ Les applications
➔ Les services
➔ Les partenaires
➔ Pour s’assurer de la conformité avec les SLA
➔ … tous les SLA✌
— L’approche Accelerate
En pratique
03
➔ Délivrer de la valeur plus rapidement
◆ Change Lead Time
◆ Deployment Frequency
➔ Sans sacrifier la qualité de service
◆ Mean Time To Recovery
◆ Change Failure Rate
https://en.wikipedia.org/wiki/Accelerate_(book)
POUR PARTIR SUR DES BASES SIMPLES ET SOLIDES
Conclusion
—
Conclusion
➔ SRE because Hope is not a strategy
➔ HTTP 417 - Super Hero Expectation Failed
➔ Il est capital d’embarquer tous les acteurs
➔ L’observabilité est une des clés de la réussite
Questions

Contenu connexe

Similaire à SRE - Mythes et Réalités - Volcamp 2023.pdf

Meeting Nuvollo - La passerelle-I.D.E (french)
Meeting Nuvollo - La passerelle-I.D.E (french)Meeting Nuvollo - La passerelle-I.D.E (french)
Meeting Nuvollo - La passerelle-I.D.E (french)Nuvollo
 
Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo
 
Usi 2013 - NoSql les defis à relever
Usi 2013 -  NoSql les defis à releverUsi 2013 -  NoSql les defis à relever
Usi 2013 - NoSql les defis à releverDjamel Zouaoui
 
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs XebiaLabs
 
NDepend 5 en action par son créateur
NDepend 5 en action par son créateurNDepend 5 en action par son créateur
NDepend 5 en action par son créateurMicrosoft
 
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...SpikeeLabs
 
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutions
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutionsSnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutions
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutionsRaphaël Semeteys
 
La sécurité applicative par le design
La sécurité applicative par le designLa sécurité applicative par le design
La sécurité applicative par le designChristophe Villeneuve
 
Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011agnes_crepet
 
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS Formation
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS FormationSéminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS Formation
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS FormationORSYS
 
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...OCTO Technology
 
Présentation Eranea à Open Source Now 2012
Présentation Eranea à Open Source Now 2012Présentation Eranea à Open Source Now 2012
Présentation Eranea à Open Source Now 2012Didier Durand
 
Ingénieur d'applications informatiques
Ingénieur d'applications informatiquesIngénieur d'applications informatiques
Ingénieur d'applications informatiquesSimstream
 
dev et admin sys : une cohabitation simplifiée
dev et admin sys : une cohabitation simplifiéedev et admin sys : une cohabitation simplifiée
dev et admin sys : une cohabitation simplifiéeNicolas Silberman
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs Microsoft
 

Similaire à SRE - Mythes et Réalités - Volcamp 2023.pdf (20)

Meeting Nuvollo - La passerelle-I.D.E (french)
Meeting Nuvollo - La passerelle-I.D.E (french)Meeting Nuvollo - La passerelle-I.D.E (french)
Meeting Nuvollo - La passerelle-I.D.E (french)
 
Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)Nuvollo and La passerelle-I.D.E (french)
Nuvollo and La passerelle-I.D.E (french)
 
Usi 2013 - NoSql les defis à relever
Usi 2013 -  NoSql les defis à releverUsi 2013 -  NoSql les defis à relever
Usi 2013 - NoSql les defis à relever
 
Dev opsday case study
Dev opsday   case studyDev opsday   case study
Dev opsday case study
 
Mon Stockage a la Cloud Attitude
Mon Stockage a la Cloud Attitude Mon Stockage a la Cloud Attitude
Mon Stockage a la Cloud Attitude
 
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
 
No code low code
No code low codeNo code low code
No code low code
 
NDepend 5 en action par son créateur
NDepend 5 en action par son créateurNDepend 5 en action par son créateur
NDepend 5 en action par son créateur
 
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...
Industrialisation du processus de livraison et pratiques DevOps avec Kubernet...
 
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutions
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutionsSnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutions
SnowcampIO 2023 - 1 plateforme à concevoir + 2 architectes = 3 solutions
 
Job dating it metz 05 nov 2015
Job dating it metz 05 nov 2015Job dating it metz 05 nov 2015
Job dating it metz 05 nov 2015
 
La sécurité applicative par le design
La sécurité applicative par le designLa sécurité applicative par le design
La sécurité applicative par le design
 
Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011Introduction a l_agilite_iut_lyon_1_decembre2011
Introduction a l_agilite_iut_lyon_1_decembre2011
 
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS Formation
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS FormationSéminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS Formation
Séminaire CLOUD COMPUTING, SYNTHÈSE - ORSYS Formation
 
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...
La Duck Conf 2018 : "Au secours : le Marketing a choisi Salesforce - SaaS ou ...
 
Présentation Eranea à Open Source Now 2012
Présentation Eranea à Open Source Now 2012Présentation Eranea à Open Source Now 2012
Présentation Eranea à Open Source Now 2012
 
Ingénieur d'applications informatiques
Ingénieur d'applications informatiquesIngénieur d'applications informatiques
Ingénieur d'applications informatiques
 
Bref
BrefBref
Bref
 
dev et admin sys : une cohabitation simplifiée
dev et admin sys : une cohabitation simplifiéedev et admin sys : une cohabitation simplifiée
dev et admin sys : une cohabitation simplifiée
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 

Plus de Henri Gomez

20200225 bbl-docker-packaging-natif
20200225 bbl-docker-packaging-natif20200225 bbl-docker-packaging-natif
20200225 bbl-docker-packaging-natifHenri Gomez
 
Je s'appelle Glowroot - LyonJUG Oct 2018
Je s'appelle Glowroot - LyonJUG Oct 2018Je s'appelle Glowroot - LyonJUG Oct 2018
Je s'appelle Glowroot - LyonJUG Oct 2018Henri Gomez
 
Glowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienGlowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienHenri Gomez
 
Glowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienGlowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienHenri Gomez
 
From ci to cd - LavaJug 2012
From ci to cd  - LavaJug 2012From ci to cd  - LavaJug 2012
From ci to cd - LavaJug 2012Henri Gomez
 
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012Henri Gomez
 
20120110 paris jug-packaging-natif
20120110 paris jug-packaging-natif20120110 paris jug-packaging-natif
20120110 paris jug-packaging-natifHenri Gomez
 
20111220 lyon jug-packaging-natif
20111220 lyon jug-packaging-natif20111220 lyon jug-packaging-natif
20111220 lyon jug-packaging-natifHenri Gomez
 
20111220 lyon jug-devops-culture
20111220 lyon jug-devops-culture20111220 lyon jug-devops-culture
20111220 lyon jug-devops-cultureHenri Gomez
 
20111205 breizh jug-devops
20111205 breizh jug-devops20111205 breizh jug-devops
20111205 breizh jug-devopsHenri Gomez
 
20111205 breizh jug-packaging-natif
20111205 breizh jug-packaging-natif20111205 breizh jug-packaging-natif
20111205 breizh jug-packaging-natifHenri Gomez
 
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011Henri Gomez
 
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011Henri Gomez
 
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011Henri Gomez
 
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011DevOps - Retour d'expérience - MarsJug du 29 Juin 2011
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011Henri Gomez
 

Plus de Henri Gomez (16)

20200225 bbl-docker-packaging-natif
20200225 bbl-docker-packaging-natif20200225 bbl-docker-packaging-natif
20200225 bbl-docker-packaging-natif
 
Je s'appelle Glowroot - LyonJUG Oct 2018
Je s'appelle Glowroot - LyonJUG Oct 2018Je s'appelle Glowroot - LyonJUG Oct 2018
Je s'appelle Glowroot - LyonJUG Oct 2018
 
Glowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienGlowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bien
 
Glowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bienGlowroot, le petit APM qui vous veut du bien
Glowroot, le petit APM qui vous veut du bien
 
From ci to cd - LavaJug 2012
From ci to cd  - LavaJug 2012From ci to cd  - LavaJug 2012
From ci to cd - LavaJug 2012
 
From ci to cd
From ci to cdFrom ci to cd
From ci to cd
 
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012
Using Jenkins as Native Packages Factory - Jenkins User Conference Paris 2012
 
20120110 paris jug-packaging-natif
20120110 paris jug-packaging-natif20120110 paris jug-packaging-natif
20120110 paris jug-packaging-natif
 
20111220 lyon jug-packaging-natif
20111220 lyon jug-packaging-natif20111220 lyon jug-packaging-natif
20111220 lyon jug-packaging-natif
 
20111220 lyon jug-devops-culture
20111220 lyon jug-devops-culture20111220 lyon jug-devops-culture
20111220 lyon jug-devops-culture
 
20111205 breizh jug-devops
20111205 breizh jug-devops20111205 breizh jug-devops
20111205 breizh jug-devops
 
20111205 breizh jug-packaging-natif
20111205 breizh jug-packaging-natif20111205 breizh jug-packaging-natif
20111205 breizh jug-packaging-natif
 
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011
DevOps - Retour d’expérience - RivieraDev du 20 Octobre 2011
 
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011
DevOps - Retour d’expérience - AlpesJug du 20 Septembre 2011
 
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011
DevOps - Retour d'expérience - GenevaJug du 30 Aout 2011
 
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011DevOps - Retour d'expérience - MarsJug du 29 Juin 2011
DevOps - Retour d'expérience - MarsJug du 29 Juin 2011
 

SRE - Mythes et Réalités - Volcamp 2023.pdf

  • 1. — SRE - Mythes et Réalités 12/10/2023
  • 2. — Sommaire Le SRE 01 SRE - Mythes et Réalités 00 02 Mythes vs Réalités 03 En pratique
  • 3. — C’est qui le gars à gauche ? Henri Gomez Cloud Advisor chez Wescale Engineering Manager ➔ En charge de l’équipe SRE Applicative puis Observabilité Head Of SRE ➔ Solution BigData en mode Editeur & SaaS (DAAS) IT Operations Manager ➔ Création de l’offre SaaS SonarCloud chez un éditeur
  • 4. — C’est qui le gars à droite ? Jean-Pascal Thiery Cloud Native Dev chez Wescale Gardien du MCO ➔ Basculer sereinement d’une base de données à une autre Tech lead Observabilité ➔ Mise en place du socle d’Observabilité unifié Tech lead developer ➔ Création d’une solution de backoffice du sol au plafond
  • 6. — Définition Le SRE 01 E S R E Reliability Disponibilité Utilisateurs Services Résilience Fiabilité Sécurité Sith Site Engineering Ingéniérie Ordre Méthode
  • 7. — SRE selon le SRE Book Le SRE 01 Les SRE Google sont des ingénieurs logiciels SRE is what happens when you ask a software engineer to design an operations team 50–60% are Google Software Engineers, The other 40–50% are candidates are very close
  • 8. — SRE selon le SRE Book Le SRE 01 50% du temps en développement (Création de valeurs) Automation systématique Eviter la croissance des équipes IT avec la croissance de l’infra Maintenir la vélocité de changement sans impact sur les SLO
  • 9. — SRE selon le SRE Book Le SRE 01 Il y a 4 ‘Golden Signals’ à suivre Erreur Latence Tra c Saturation
  • 10. — Missions historiques Le SRE 01 ➔ SRE is the new Ops dans un cadre qui s’étend à l’application ➔ La priorité, les services doivent être Up & Running ➔ Détection des problèmes avant qu’ils ne deviennent des incidents ➔ A la manoeuvre sur les Post Mortem ➔ Coûts d’exploitation
  • 11. — Nouvelles missions Définition du SRE 01 Du conseil, beaucoup de conseil Sur l’outillage Pool de connections Analyse de plan d'exécutions SQL Sur les pratiques de Run Qu’est-ce que l’observabilité La bonne et la mauvaise log Sur l’architecture Clusterisation et Redondance Stratégies et solution de cache
  • 12. — Nouvelles missions Définition du SRE 01 On mesure, beaucoup, pour aujourd’hui et demain Performances Capacity Planning Projection Futur FinOps
  • 14. — SRE par et pour Google Mythes vs Réalités 01 ➔ La définition Google d’un SRE répond aux problématiques Google ➔ Une boite de Techs, qui font des produits Techs pour des Techs ➔ Les contraintes d’une entreprise majeure globale ➔ Des moyens sans commune mesure, tant techniques et qu’humains ➔ Une approche Software Engineering systématique (même pour les SRE/Ops) TO BE OR NOT TO BE
  • 15. — SRE, le super héro du Run Mythes vs Réalités 01 ➔ Les solutions embarquent toujours plus de technologies ◆ Hyperviseurs, VM, Containers, SQL, NoSQL, Messaging, multiples langages, … ➔ Les stacks techniques sont de plus en plus complexes ◆ Redondance, systèmes de sécurité, multi-zones ➔ Il est compliqué d’être expert sur l’ensemble du scope ➔ Un SRE n’est pas un multi expert, mais un profil avec une large culture
  • 16. — SRE, le détecteur de Bug Mythes vs Réalités 01 ➔ Étant omniscient, un SRE peut voir les Bugs ➔ You build it, you run it ➔ Les SLI et la taux d’erreurs sont les seuls vrai moyens de détecter les bugs pour un SRE ○ Budget d’erreur ○ C’est souvent trop tard ➔ La qualité des livrables est toujours de la responsabilité de l’équipe de dev
  • 17. — SRE, le bouclier ultime Mythes vs Réalités 01 ➔ La sécurité est l’affaire de tous ➔ La résilience du site passe par son intégrité ➔ Le pentesting et la cybersécurité sont des domaines de l’informatique à part entière
  • 18. — Un dev qui est un ops qui fait du dev ? Mythes vs Réalités 01 ➔ Ne pas penser qu’un SRE est un expert dans tous les domaines ◆ SRE is the new FullStackDevSecFinDataOups ➔ Développeur, un profil à temps plein ➔ Un SRE peut avoir une forte culture développement ◆ Pour aider les Dev à analyser les problèmes jusqu’au code ◆ Il n’a pas vocation à remplacer les Dev
  • 19. — SRE != DevOps Mythes vs Réalités 01 S R E DevOps Operations Monitoring Capacity Planning Gestion d’incidents CI/CD Automatisation Config Management Infra As Code UNE CONFUSION COURANTE
  • 20. — SRE != CI/CD Mythes vs Réalités 01 ➔ Les SRE consomment de la CI/CD tout comme les autres acteurs ➔ Gardez en tête le “You build it, you run it !” ◆ Responsabiliser les équipes de réalisation sur le run ● CI/CD ● Observabilité ● Sécurité
  • 22. — Les pré-requis En pratique 03 ➔ Une automation déjà présente pour développer et déployer en confiance ◆ Un SRE peut être un Dev d’infras, il aura aussi besoin d’une usine logicielle ➔ Un environnement de Run automatisable ◆ Les solutions d’Infra As Code doivent être utilisables ➔ Un monitoring ◆ Existant et qui sera amendé et amélioré ◆ A créer, dans une optique d’observabilité large
  • 23. — Les attentes En pratique 03 ➔ Des environnements sous contrôle ◆ Pour être prédictible et reproductible, les opérations manuelles sont à proscrire ➔ Être embarqué jour 1 sur des projets de changement de périmètres ◆ Nouveau project ◆ Nouvelle technologie ◆ Nouveau partenaire ➔ Connaître les SLA principaux ◆ Pour en déduire les premiers SLI et SLO ➔ Être écouté comme force de proposition ◆ Pour renforcer la résilience ◆ Pour collecter les mesures qui alimenteront l’observabilité
  • 24. — L’Equipe SRE En pratique 03 ➔ Privilégier de petites équipes ◆ Avec des scopes clairs ◆ Des frontières de responsabilité précises ◆ Connues de tous ➔ Avoir assez de seniors pour faire monter en compétences les juniors ◆ 1 senior pour 2 juniors max ➔ Derniers formés deviennent tuteurs ◆ Facilite l’onboarding des nouveaux, valide la compréhension des primo formés
  • 25. — Les Hard Skills En pratique 03 ➔ Sur la stack technique ◆ Hosting ◆ Data (SQL/NoSQL) ◆ Services Managés ◆ Services SaaS ➔ Sur les applicatifs ◆ Langages ◆ Frameworks ◆ En connaître pour pouvoir analyser une stack trace
  • 26. — Les Soft Skills En pratique 03 ➔ Savoir écouter ➔ Être un bon communiquant ➔ Ne pas avoir peur d’aller vers les autres ➔ Etre force de proposition ➔ Une bonne capacité à convaincre ➔ Savoir embarquer le plus grand nombre ➔ Savoir apprendre
  • 27. — Partage et pédagogie En pratique 03 ➔ Expliquer les problématique d'exploitabilité d’une plateforme ➔ Vis ma vie ➔ Embarquer dans la gestion de crise ◆ Résolution plus rapide et plus précises ◆ Co conception des remédiations ◆ Rédaction de post-mortem ➔ Expliquer les grands concepts ◆ Qualité de service ◆ SLA, SLI, SLO
  • 28. — De monitoring à Observabilité En pratique 03 ➔ Les infrastructures ➔ Les middlewares ➔ Les applications ➔ Les services ➔ Les partenaires ➔ Pour s’assurer de la conformité avec les SLA ➔ … tous les SLA✌
  • 29. — L’approche Accelerate En pratique 03 ➔ Délivrer de la valeur plus rapidement ◆ Change Lead Time ◆ Deployment Frequency ➔ Sans sacrifier la qualité de service ◆ Mean Time To Recovery ◆ Change Failure Rate https://en.wikipedia.org/wiki/Accelerate_(book) POUR PARTIR SUR DES BASES SIMPLES ET SOLIDES
  • 31. — Conclusion ➔ SRE because Hope is not a strategy ➔ HTTP 417 - Super Hero Expectation Failed ➔ Il est capital d’embarquer tous les acteurs ➔ L’observabilité est une des clés de la réussite