Publicité
Publicité

Contenu connexe

Publicité

Plus de devops REX(20)

Publicité

devops REX 2018 - Game Days chez Datadog : Échouer pour mieux réussir

  1. Échouer pour réussir
 Game Days 
 Léo Cavaillé
 SRE Lead @leoc892
  2. Chaos (engineering)
  3. Chaos (engineering) Tester la réponse d'un système face à des perturbations dans des conditions réelles
  4. Chaos (engineering) Tester la réponse d'un système face à des perturbations dans des conditions réelles
  5. "Game day"
  6. Préparation d'un scénario de chaos pour un service 1 "Game day"
  7. Préparation d'un scénario de chaos pour un service 1 2 Exécution du scénario "Game day"
  8. Préparation d'un scénario de chaos pour un service 1 2 3 Exécution du scénario "Action items" "Game day"
  9. Préparation d'un scénario de chaos pour un service 1 2 3 Exécution du scénario "Action items" "Game day" SRE(s) + Dev(s)
  10. Où commencer?
  11. Choix des scénarii
  12. Il y a plus de 10000 requêtes en parallèle ce qui active un mécanisme pour rediriger du trafic vers d'autres instances en reconfigurant les clients par un service dynamique de métadonnées. Choix des scénarii
  13. Il y a plus de 10000 requêtes en parallèle ce qui active un mécanisme pour rediriger du trafic vers d'autres instances en reconfigurant les clients par un service dynamique de métadonnées. Cloud instance Hors Service chez l'hébergeur Choix des scénarii
  14. Préparation
  15. Préparation
  16. Préparation
  17. Préparation
  18. Préparation
  19. Préparation
  20. Préparation
  21. Préparation
  22. Exemple
  23. Exemple
  24. Exemple
  25. Test Staging Production Choix de l'environnement
  26. Test Ce que les devs veulent Staging Production Choix de l'environnement
  27. Test Ce que les devs veulent Staging Le compromis Production Choix de l'environnement
  28. Test Ce que les devs veulent Staging Le compromis Production Ce qu'il faudrait faire Choix de l'environnement
  29. Simplicité
  30. Créer une dynamique
  31. Cadence
  32. Réduire la barrière d'entrée Simple à organiser/réaliser: ~ 2h30 pour un game day ~ 2 personnes (1 dev, 1 SRE) Cadence
  33. Réduire la barrière d'entrée Simple à organiser/réaliser: ~ 2h30 pour un game day ~ 2 personnes (1 dev, 1 SRE) Varier ● Services ● Équipes ● Niveaux Cadence
  34. Niveaux De 0 à 5
  35. Niveaux De 0 à 5 Idées pour augmenter la difficulté des game days. Permet aussi de classer vos services.
  36. Niveaux De 0 à 5 Idées pour augmenter la difficulté des game days. Permet aussi de classer vos services. Donner aux équipes l'envie de passer au niveau suivant.
  37. 84 game days en 2018 Cadence
  38. Documentation
  39. Automatiser
  40. Automatiser
  41. Automatiser
  42. Culture
  43. Célébrer
  44. Célébrer Les échecs
  45. Célébrer Les échecs Les succès
  46. You build it You run it You own it
  47. Connaissance opérationnelle MonitoringDocumentationExpérience
  48. Outil utilisable sans l'aide des SREs
  49. Outil utilisable sans l'aide des SREs
  50. Outil utilisable sans l'aide des SREs
  51. – ~10 SREs vs. 300 développeurs
 – Renforcer la confiance d'une équipe dans ses livrables Outil utilisable sans l'aide des SREs
  52. Hope is not a strategy
  53. Merci (we're hiring)
Publicité