Reprise sur incident     RMLL 2011
Qui suis-je ?»   Jean-Marc Fontaine»   Consultant pour Alter Way Consulting»   Président de lAFUP»   Formateur / Professeu...
Cela va arriver !
Diminuer la gravité»   Durée dindisponibilité»   Perte de données»   Rupture de la confidentialité22/07/11                ...
Minimiser limpact»    En terme dimage»    Financier22/07/11                ALTER WAY - Reprise sur incident
Se préparer22/07/11
Avoir un plan»    Se préparer pour être efficace le jour J»    Equipe spécialisée»    Implication des fournisseurs22/07/11...
Mesures de mitigation»    Machines virtuelles configurées»    Réplication de la base de données»    Désactivation de certa...
Sauvegardes»    Sauvegarder tout»    Sauvegarder régulièrement»    Garder un historique intelligent22/07/11               ...
Journalisation (1/2)»   Système»   Application»   Déploiements»   Opérations de maintenance22/07/11                  ALTER...
Journalisation (2/2)»   Privilégier les formats plats      –    Manipulation aisée      –    Signature      –    Compressi...
Communiquer en interne»    Certains pics de fréquentations sont anticipables :       –   Période de lannée       –   Publi...
Déploiement automatisé»    Rapide»    Pas sujet à la pression»    Outils :       – Ant       – Capistrano       – Phing22/...
Tester les procédures»    Régulièrement»    Avec précaution22/07/11               ALTER WAY - Reprise sur incident
Détecter22/07/11
Supervision»    Ressources       – Nagios       – Centreon       – Zabbix»    Journaux»    Application»    Disponibilité  ...
Facilitez le contact»    Personne / service à contacter identifiés»    Moyens de contact disponibles facilement»    Réacti...
Communiquer22/07/11
Communication»    Isoler léquipe dintervention»    Escalader en interne si nécessaire»    Communication externe :       – ...
Analyser22/07/11
Identification de la cause»    Interne       –   Panne matérielle       –   Instabilité logicielle       –   Bogue applica...
Portée»    Quels sont les éléments touchés ?»    Le service est-il réduit ou coupé ?22/07/11                      ALTER WA...
Impact»    Problème de sécurité ?»    Perte de données ?»    Atteinte à limage ?22/07/11                      ALTER WAY - ...
Corriger22/07/11
Correction»    Activer les mesures de mitigation si nécessaire»    Appliquer les mesures correctives»    Déployer lapplica...
Apprendre22/07/11
Capitaliser»    Méthode des 5 pourquoi»    Intégrer le résultat aux procédures de test22/07/11                     ALTER W...
Récapitulatif»    Se préparer»    Communiquer»    Analyser»    Corriger»    Apprendre22/07/11           ALTER WAY - Repris...
Merci !»    Email : jm@jmfontaine.net»    Twitter : jmfontaine»    Blog : www.jmfontaine.net»    Autre blog : www.industri...
Crédits photos»    http://www.flickr.com/photos/r000pert/136999467/»    http://www.flickr.com/photos/illetirres/2214018398...
Prochain SlideShare
Chargement dans…5
×

Reprise sur incident , par Jean Marc Fontaine

864 vues

Publié le

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.

L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.

Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
864
Sur SlideShare
0
Issues des intégrations
0
Intégrations
10
Actions
Partages
0
Téléchargements
11
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Reprise sur incident , par Jean Marc Fontaine

  1. 1. Reprise sur incident RMLL 2011
  2. 2. Qui suis-je ?» Jean-Marc Fontaine» Consultant pour Alter Way Consulting» Président de lAFUP» Formateur / Professeur vacataire à luniversité de Saint Quentin» Co-auteur du livre blanc « Industrialisation PHP »» Auteur du blog Industrialisation-PHP.com
  3. 3. Cela va arriver !
  4. 4. Diminuer la gravité» Durée dindisponibilité» Perte de données» Rupture de la confidentialité22/07/11 ALTER WAY - Reprise sur incident
  5. 5. Minimiser limpact» En terme dimage» Financier22/07/11 ALTER WAY - Reprise sur incident
  6. 6. Se préparer22/07/11
  7. 7. Avoir un plan» Se préparer pour être efficace le jour J» Equipe spécialisée» Implication des fournisseurs22/07/11 ALTER WAY - Reprise sur incident
  8. 8. Mesures de mitigation» Machines virtuelles configurées» Réplication de la base de données» Désactivation de certaines fonctionnalités» Version statique22/07/11 ALTER WAY - Reprise sur incident
  9. 9. Sauvegardes» Sauvegarder tout» Sauvegarder régulièrement» Garder un historique intelligent22/07/11 ALTER WAY - Reprise sur incident
  10. 10. Journalisation (1/2)» Système» Application» Déploiements» Opérations de maintenance22/07/11 ALTER WAY - Reprise sur incident
  11. 11. Journalisation (2/2)» Privilégier les formats plats – Manipulation aisée – Signature – Compressibles – Gestion des droits aisées – Rotation22/07/11 ALTER WAY - Reprise sur incident
  12. 12. Communiquer en interne» Certains pics de fréquentations sont anticipables : – Période de lannée – Publicité – Promotion – Communication dans les médias22/07/11 ALTER WAY - Reprise sur incident
  13. 13. Déploiement automatisé» Rapide» Pas sujet à la pression» Outils : – Ant – Capistrano – Phing22/07/11 ALTER WAY - Reprise sur incident
  14. 14. Tester les procédures» Régulièrement» Avec précaution22/07/11 ALTER WAY - Reprise sur incident
  15. 15. Détecter22/07/11
  16. 16. Supervision» Ressources – Nagios – Centreon – Zabbix» Journaux» Application» Disponibilité – Pingdom – NetVigie22/07/11 ALTER WAY - Reprise sur incident
  17. 17. Facilitez le contact» Personne / service à contacter identifiés» Moyens de contact disponibles facilement» Réactivité aux contacts entrants22/07/11 ALTER WAY - Reprise sur incident
  18. 18. Communiquer22/07/11
  19. 19. Communication» Isoler léquipe dintervention» Escalader en interne si nécessaire» Communication externe : – Régulière – Aussi transparente que possible – Page détat22/07/11 ALTER WAY - Reprise sur incident
  20. 20. Analyser22/07/11
  21. 21. Identification de la cause» Interne – Panne matérielle – Instabilité logicielle – Bogue applicatif – Erreur humaine» Externe – Attaque – Panne matérielle – Pic de fréquentation22/07/11 ALTER WAY - Reprise sur incident
  22. 22. Portée» Quels sont les éléments touchés ?» Le service est-il réduit ou coupé ?22/07/11 ALTER WAY - Reprise sur incident
  23. 23. Impact» Problème de sécurité ?» Perte de données ?» Atteinte à limage ?22/07/11 ALTER WAY - Reprise sur incident
  24. 24. Corriger22/07/11
  25. 25. Correction» Activer les mesures de mitigation si nécessaire» Appliquer les mesures correctives» Déployer lapplication si nécessaire» En dernier recours tout couper22/07/11 ALTER WAY - Reprise sur incident
  26. 26. Apprendre22/07/11
  27. 27. Capitaliser» Méthode des 5 pourquoi» Intégrer le résultat aux procédures de test22/07/11 ALTER WAY - Reprise sur incident
  28. 28. Récapitulatif» Se préparer» Communiquer» Analyser» Corriger» Apprendre22/07/11 ALTER WAY - Reprise sur incident
  29. 29. Merci !» Email : jm@jmfontaine.net» Twitter : jmfontaine» Blog : www.jmfontaine.net» Autre blog : www.industrialisation-php.net22/07/11 ALTER WAY - Reprise sur incident
  30. 30. Crédits photos» http://www.flickr.com/photos/r000pert/136999467/» http://www.flickr.com/photos/illetirres/2214018398/» http://www.flickr.com/photos/larimdame/2575986601/» http://www.flickr.com/photos/techne/107093245/» http://www.flickr.com/photos/p-doodle/466500483/» http://www.flickr.com/photos/dennissylvesterhurd/141183312/22/07/11 ALTER WAY - Reprise sur incident

×