Reprise sur incident - RMLL 2011

1 743 vues

Publié le

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.

L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.

Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

Publié dans : Technologie, Business
0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 743
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
20
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Pas besoin d'argumenter : un dépôt de code est indispensable à partir d'un seul développeur
  • Reprise sur incident - RMLL 2011

    1. 1. Reprise sur incident RMLL 2011
    2. 2. Qui suis-je ?» Jean-Marc Fontaine» Consultant pour Alter Way Consulting» Président de lAFUP» Formateur / Professeur vacataire à luniversité de Saint Quentin» Co-auteur du livre blanc « Industrialisation PHP »» Auteur du blog Industrialisation-PHP.com
    3. 3. Cela va arriver !
    4. 4. Diminuer la gravité» Durée dindisponibilité» Perte de données» Rupture de la confidentialité22/07/11 ALTER WAY - Reprise sur incident
    5. 5. Minimiser limpact» En terme dimage» Financier22/07/11 ALTER WAY - Reprise sur incident
    6. 6. Se préparer22/07/11
    7. 7. Avoir un plan» Se préparer pour être efficace le jour J» Equipe spécialisée» Implication des fournisseurs22/07/11 ALTER WAY - Reprise sur incident
    8. 8. Mesures de mitigation» Machines virtuelles configurées» Réplication de la base de données» Désactivation de certaines fonctionnalités» Version statique22/07/11 ALTER WAY - Reprise sur incident
    9. 9. Sauvegardes» Sauvegarder tout» Sauvegarder régulièrement» Garder un historique intelligent22/07/11 ALTER WAY - Reprise sur incident
    10. 10. Journalisation (1/2)» Système» Application» Déploiements» Opérations de maintenance22/07/11 ALTER WAY - Reprise sur incident
    11. 11. Journalisation (2/2)» Privilégier les formats plats – Manipulation aisée – Signature – Compressibles – Gestion des droits aisées – Rotation22/07/11 ALTER WAY - Reprise sur incident
    12. 12. Communiquer en interne» Certains pics de fréquentations sont anticipables : – Période de lannée – Publicité – Promotion – Communication dans les médias22/07/11 ALTER WAY - Reprise sur incident
    13. 13. Déploiement automatisé» Rapide» Pas sujet à la pression» Outils : – Ant – Capistrano – Phing22/07/11 ALTER WAY - Reprise sur incident
    14. 14. Tester les procédures» Régulièrement» Avec précaution22/07/11 ALTER WAY - Reprise sur incident
    15. 15. Détecter22/07/11
    16. 16. Supervision» Ressources – Nagios – Centreon – Zabbix» Journaux» Application» Disponibilité – Pingdom – NetVigie22/07/11 ALTER WAY - Reprise sur incident
    17. 17. Facilitez le contact» Personne / service à contacter identifiés» Moyens de contact disponibles facilement» Réactivité aux contacts entrants22/07/11 ALTER WAY - Reprise sur incident
    18. 18. Communiquer22/07/11
    19. 19. Communication» Isoler léquipe dintervention» Escalader en interne si nécessaire» Communication externe : – Régulière – Aussi transparente que possible – Page détat22/07/11 ALTER WAY - Reprise sur incident
    20. 20. Analyser22/07/11
    21. 21. Identification de la cause» Interne – Panne matérielle – Instabilité logicielle – Bogue applicatif – Erreur humaine» Externe – Attaque – Panne matérielle – Pic de fréquentation22/07/11 ALTER WAY - Reprise sur incident
    22. 22. Portée» Quels sont les éléments touchés ?» Le service est-il réduit ou coupé ?22/07/11 ALTER WAY - Reprise sur incident
    23. 23. Impact» Problème de sécurité ?» Perte de données ?» Atteinte à limage ?22/07/11 ALTER WAY - Reprise sur incident
    24. 24. Corriger22/07/11
    25. 25. Correction» Activer les mesures de mitigation si nécessaire» Appliquer les mesures correctives» Déployer lapplication si nécessaire» En dernier recours tout couper22/07/11 ALTER WAY - Reprise sur incident
    26. 26. Apprendre22/07/11
    27. 27. Capitaliser» Méthode des 5 pourquoi» Intégrer le résultat aux procédures de test22/07/11 ALTER WAY - Reprise sur incident
    28. 28. Récapitulatif» Se préparer» Communiquer» Analyser» Corriger» Apprendre22/07/11 ALTER WAY - Reprise sur incident
    29. 29. Merci !» Email : jm@jmfontaine.net» Twitter : jmfontaine» Blog : www.jmfontaine.net» Autre blog : www.industrialisation-php.net22/07/11 ALTER WAY - Reprise sur incident
    30. 30. Crédits photos» http://www.flickr.com/photos/r000pert/136999467/» http://www.flickr.com/photos/illetirres/2214018398/» http://www.flickr.com/photos/larimdame/2575986601/» http://www.flickr.com/photos/techne/107093245/» http://www.flickr.com/photos/p-doodle/466500483/» http://www.flickr.com/photos/dennissylvesterhurd/141183312/22/07/11 ALTER WAY - Reprise sur incident

    ×