Atelier 18 Janvier2007 - Paris
Gestion des Incidents et
Gestion des Problèmes
2ème
Partie
Thierry CHAMFRAULT / Philippe LEMONNIER
Bouygues Telecom
2.
Bienvenue ...
• Lethème :
La Gestion des Incidents et la Gestion des Problèmes
• Le principe :
Appréhender les bénéfices d’ITIL, mais sans être une séance de formation
Échanger et s’enrichir mutuellement de nos expériences réussies ou en
cours, de nos difficultés.
Confronter la théorie à des situations vécues, des contextes particuliers.
3.
Notre objectif
Que chacunreparte avec au moins
une idée, un élément, une action
applicable dans son contexte
4.
L’agenda
• Retour d’expérience(plénière – 50 minutes)
Un peu de théorie
La gestion de problèmes chez Bouygues Télécom
• Expérimenter (par groupe – 1h15 heure )
Travail en groupes (3 ateliers)
(Désignation d’un « porte-parole » par groupe)
• Restituer et synthétiser (plénière – 45 minutes)
Restitution des groupes par chaque « porte-parole » (10
minutes par groupe)
Synthèse par les experts ITIL et questions-réponses (15
minutes)
• Échanges informels (Cocktail )
5.
L’équipe
L’équipe d’animation del’atelier est la suivante:
• Président : Thierry Chamfrault, Philippe Lemonnier
• Experts ITIL : Thierry Chamfrault, Vincent Douhairie
• Animateurs : Dario Tarantelli, Olivier Maupate, Marc Lallemand
• Coordinateurs : Sylvie Roche, Louisa Brunet, Marc Lallemand
6.
L’agenda
• Retour d’Expérience
Un peu de théorie
La gestion de problèmes chez Bouygues Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
7.
De l’opération àla
Planification
Centre de service
Gestion des
Incidents
Gestion des
Problèmes
Gestion des
configurations
Gestion des
Changements
Gestion des Mises
en Production
OPERATION
PLANIFICATION
Centre de service
Gestion des
Incidents
Gestion des
Problèmes
Gestion des
configurations
Gestion des
Changements
Gestion des Mises
en Production
OPERATION
PLANIFICATION
Le cycle de nos futurs ateliers
8.
Un problème
Savoir vivreavec un problème est une
preuve de maturité collective
« Il y a moins de difficultés à résoudre un problème qu’à le
poser ! »
Joseph de Maistre
9.
Une définition
La causeinconnue d’un incident
(phénomène ou comportement) significatif ou de
plusieurs incidents présentant les mêmes
symptômes.
Mais ne pas connaître ou trouver la cause ne remet nullement en
cause la compétence d’un groupe
10.
Un état d’esprit!
Mémoiredes évènements = efficacité
TRACABILITE
(court et moyen terme)
Lorsqu’un problème a une solution, il ne sert à rien de s’inquiéter,
et lorsqu’il n’en a pas s’inquiéter ne sert à rien!
Proverbe Arabe
11.
Symptômes
répétitifs
Incidents 1
Incidents x
Incidents2
1
Significatif pour le
business
Incidents 1
2
Selon planning
périodique
Rapports
de revues
générés
3
Selon planning de
mise en prod
Nouveau produit
ou TMA
4
PROBLEME
Conditions de déclaration
La nécessité demaîtriser les
changements
Incidents hors
changements
20%
Incidents liés à
des
changements
80%
14.
Un Problème
• Description Ticket de problème
• Priorité f(Impact , Urgence)
Impact dépend du volume et de son effet sur l’organisation
(exemple plus de 100 personnes inactives)
Urgence Criticité du problème par rapport à l’activité de
l’utilisateur (exemple : critique, forte, faible)
15.
Figure 9
Des méthodes,….
• Diagramme Cause / effet :
Ishikawa
• Mémoire de l’entreprise :
Kepner et Tregoe
• Analyses Proactives :
Analyse des tendances
(Taux CPU, réclamations
clients,…)
16.
LEGENDE :
MATERIEL
MANAGEMENT
MILIEU
OPERATIONNEL
S
METHODE
LES
ORGANIGRAMME
S DEA ET B
SONT INCONNUS
IL N’Y A PAS
D’ORGANIGRAMME
DISPONIBLE
LES SITES
SONT
ELOIGNES
LES
RESPONSABLE
S NE SONT PAS
SUR LA MEME
LONGUEUR
D’ONDES
TOUT LE MONDE
FAIT TOUT ET
RIEN A LA FOIS
LES ROLES NE
SONT PAS
DEFINIS
IL N’Y A PAS DE
CONTRAT DE SERVICE
LES OBJECTIFS DE A
ET B SONT INCONNUS
POURQUOI LE
FONCTIONNEMENT
ENTRE
L’ORGANISATION
A ET
L’ORGANISATIONB
N’EST PAS CLAIR ?
IL N ’Y A PAS DE
DOCUMENTS SUR
L’ORGANISATION
LES
ORGANIGRAMMES
NE SONT PAS
DIFFUSES
LA REORGANISATION
N’A PAS ETE DECLINEE
PERSONNE N’A
INTERET A LE
CLARIFIER
3 points
2 points
1 point
IL N’Y A PAS EU
DE
PRESENTATION
DES EQUIPES
PERSONNE N’A
D’INTERET A
CLARIFIER LE
FONCTIONNEMENT
IL N ’Y A PAS
DE PROCESS
COMMUNS
IL N ’Y A PAS
DE GESTION
DE SERVICE
MANQUE DE
PROCEDURE
S ECRITES
IL N ’Y A PAS DE
CONTRÔLE DU
TRAVAIL DE A et
B
LES OBJECTIFS DU
SERVICE A CHANGENT
TOUS LES JOURS
6
3
1
9
5
3
1
2
Figure 9
Des méthodes, ….
Incident no.1
est
Up-time
"Down -time"
Tempsde
Réponse
Temps de Réparation
Temps de
Restauration
Restauration
Détection Solution
Correction /
Contournement
N° x
Incident
no.2
Temps de
Détection
Problème
résolu
"Down -time"
"Down -time"
Temps de
diagnostic
Temps de traitement
Temps de
restauration
Restauration
Déclaration
problème
Erreur connue Solution
Correction
/Contournement
Incidents
N° 2
problème
no.2
Temps de
détection ou
d’observation
Temps moyen entre 2 problèmes
N° 1
Vue technique du problème
Temps de
post
observation
Figure 4
Mise sous
surveillance
Cycle de vie du problème
19.
L’écosystème
Gestion
des
incidents
et des
demandes GESTION
des
PROBLEMES
etdes erreurs connues
Gestion des
changements
Demande de
changement (RFC)
Déclaration
d’un problème
Communication
(avancement et clôture)
Avancement
et clôture du
changement Reporting
de l’activité
Incident
ou
demande
Sous-traitant
SLA-OLA
Incidents
Problèmes et erreurs connues
Configurations
CMDB
Avancement et clôture du problème
Gestion de la
disponibilité
Gestion de la
capacité
20.
Objectif du processusde
gestion des problèmes
Rechercher la cause première des
incidents, apporter des solutions pour
prévenir de nouveaux incidents et ainsi
minimiser l’impact négatif sur le
business
L’épilepsie – Porosité de la chambre à air
21.
Mais
Trouver la caused’un ou plusieurs
incidents ne garantie en rien notre
capacité à trouver une solution pour les
résoudre
Exemple : Dégénérescence de la rétine ……
dans certains cas, n’est il pas mieux de ne pas savoir!!!
22.
Objectif du processusde
gestion des Problèmes
Restaurer ne veut pas dire connaître la
cause!
Un « on/off » prévaut bien souvent à de longues explications et est
souvent très efficace
23.
Chaos
Réactif
Proactif
Service
Valeur
Plusieurs Help Desk,Découverte des problèmes, …..
Centre de services, Gestion des incidents, gestion des configurations
Gestion des problèmes, Gestion des changements, Gestion de la disponibilité
Gestion de la capacité, Gestion des niveaux de service (SLA, OLA/UC)
Rapprochement Services et indicateurs Business
Court terme Moyen terme Long terme
ITIL – Chaîne de Maturité
24.
Identification et
enregistrement du
problème
Classification
du
problème
Investigationet
diagnostic du problème
Demande de
changement, résolution
et clôture du problème
Communication,
suivi, surveillance,
des problèmes
Événement
Incidents récurrents
Corrélation d’incidents
Communication
Management, fournisseur,
acteur métier
Utilisateur, client, infrastructure,
fournisseur, application, ….
Incidents,
problèmes,
et erreurs connues
CMDB
Changements
CMDB
Configurations
CMDB
Services et
niveaux de service
CMDB
Les bonnes pratiques
25.
Les relations
Déclaration
incident
Incident
routinier?
Correspond à
uneerreur
connue?
Evaluer l’incident et suivre la
procédure habituelle
O
N
O
Informer le client sur la
solution de contournement
Incrémenter le nb d’incidents
de l’enregistrement de l’erreur
connue identifiée
Reporter l’identifiant de
l’erreur connue dans le ticket
d’incident
Enrichir le ticket d’incident
des informations de
classement
Extraire de la base des
erreurs connues la solution
de résolution ou de
contournement
Correspond à
un problème
connu?
N
N
Support
nécessaire?
Affecter le problème à une
équipe
Enregistrer le problème dans
la base de données des
problèmes
Déclarer un nouveau
problème
Incrémenter le nb d’incidents
de l’enregistrement du
problème identifié
Reporter l’identifiant du
problème dans le ticket
d’incident
Enrichir le ticket d’incident
des informations de
classement
Extraire de la base des
problèmes la solution de
résolution ou de
contournement
Support
nécessaire?
O
O O
Appliquer la solution Appliquer la solution
Traiter problème
N
N
Erreurs
connues
CMDB
Problèmes
CMDB
26.
ACT-PB1
Contrôler les
problèmes
Tickets
d’Incidents
Déclaration d’unproblème
Solution de contournement (FIX, patch, …)
ACT-PB2
Contrôler les
erreurs
Cause
identifiée
Informations sur le traitement des erreurs
(Clôture, état, avancement)
ACT-PB3
Gérer
proactivement
les problèmes
Demande de changement pour
résolution (RFC)
Demande de changement pour résolution (RFC)
Déclaration d’une erreur
Déclaration
d’un problème
Solution de contournement (FIX, patch, …)
Informations sur les actions engagées
Compte-rendu
de revue
Sous-traitants
Déclaration d’une erreur
en développement ou
maintenance
CMDB
CMDB
CMDB
CMDB
CMDB
CMDB
Reporting
sur les problèmes
ACT-PB4
Communiquer,
suivre, piloter
et affecter les
problèmes
SLA-OLA
SLA-OLA
SLA-OLA
SLA-OLA
Avancement et clôture du problème
Avancement et clôture du changement
Une synthèse
27.
Pilotage du processus
•Gestionnaire(s) des problèmes
• Indicateurs clés de performance
Améliorer la qualité des services – Indicateur : Taux de
répétition des incidents et problèmes en baisse
Minimiser l’impact des problèmes - Indicateur :
Diminution du temps moyen de diagnostic des problèmes
Réduire le coût des problèmes - Indicateur : Réduction du
taux d’impact des problèmes sur les utilisateurs
28.
L’agenda
• Retour d’Expérience
Unpeu de théorie
La gestion de problèmes chez Bouygues
Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
29.
Contexte
Direction des OpérationsRéseau
Les Services :
Voix : utilisateur = client Bouygues Telecom
Communications de/vers Bouygues Telecom,
Communications de/vers Orange & SFR,
Communications de/vers les téléphones fixes,
…
Réseau IP : utilisateur = Productions Bouygues Telecom (Réseau, SI &
bureautique)
Communications IP entre tous les serveurs,
Communications de/vers Internet,
Communications cryptées de/vers les partenaires de Bouygues Telecom
…
« Services » : utilisateur = client Bouygues Telecom
Vocaux : Boîtes et portails vocales,
Kiosques multi-opérateurs : SMS+, Gallery, …
SMS : Bouygues Telecom, échanges de/vers Orange & SFR, …
MultiMédia Mobile : Surf i-mode™, surf Wap, Mail i-mode™,MMS,Vidéo
Internet : Esp@ce Client, www.bouyguestelecom.fr, …
Entreprise : Localisation, Raccordement SMS, …
Gestion des campagnes Marketing : média VMS, média mail i-mode™
InterConnexion : SMS, MMS.
30.
Direction des opérationsréseau
Alimentation de la base des problèmes
Base
des
incidents
Relation Clients
Client interne
Management
Déclaration d’un problème
Poids des incidents, fonction du
business et du potentiel de business
et de l’impact image pour l’entreprise,
Suivi quotidien
des niveaux de services
Risque sur l’engagement
du contrat de services
Aucun critère
défini
31.
Traitement d’un problème
Déclarationdu problème
Resp. : Problem Manager
Enregistrement du problème
Resp. : Responsable du problème
Traitement du problème
Resp. : Responsable du problème
Validation correction problème
Resp. : Responsable du problème
Clôture du problème
Resp. : Problem Manager
Etats du
problème
Référence et responsable du problème Ouvert
Changement : correction implémentée Traité,
Non Corrigé
Informations de traitement du problème :
- Criticité,
- Priorité,
- Plan d’actions + « acteurs problème »
- Critères de clôture du problème
Enregistré
Demande de clôture
Enregistré,
Maîtrisé,
Contourné,
Corrigé
Maîtrisé
Contourné,
Suspendu
Clos
32.
Suivi des problèmes
Revuemensuelle
Participants : Membre du Comité de direction de la direction des
opérations réseau + Problem manager
Objectifs
− Etat d’avancement sur l’ensemble des problèmes,
− Focus sur un problème spécifique,
− Gestion des priorités,
− Remontée des alertes, demande d’escalade,
− Clôture des problèmes.
33.
L’agenda
• Découvrir
Unpeu de théorie
La gestion de problèmes chez Bouygues
Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
34.
Expérimenter
• Déroulement dechaque atelier :
Tour de table
Désignation d’un « porte-parole »
Échanges et débats
« Visite » de l’expert
Préparation de la restitution
• Les règles du jeu :
L’animateur ...
Le porte parole ...
L’expert « volant » ...
Vous ...
35.
Groupe 1
La gestionde Problème doit-elle
être préventive ou réactive ?
Animateur : Dario Tarantelli
Lieu : Salle 1
Les livrables :
Axes prioritaires à mettre en
place
36.
Groupe 2
Commentmesurer l’efficacité du
processus ( KPI ) ?
Animateur : Marc Lallemand
Lieu : Salle 2
Les livrables :
Indicateurs Clés de Performances
Retour sur investissement
37.
Groupe 3
Quellessont les responsabilités du Problem Manager ?
Animateur : Olivier Maupaté
Lieu : Salle 3
Livrables :
Rôle et responsabilités
Positionnement dans l’organisation
Groupe 1
La gestionde Problème doit-elle
être préventive ou réactive ?
Animateur : Dario Tarantelli
Lieu : Salle 1
Les livrables :
Axes prioritaires à mettre en
place
42.
Définitions
Le sujet concernel’identification des problèmes
Identification réactive Identification proactive
Il y a eu 1 ou plusieurs
incidents
Il n’y a pas eu d’incident
Il y a incident potentiel
43.
Comment ?
Identification réactiveIdentification proactive
•Analyse des incidents
•Escalades sur incidents
•Bilan post-incidents
•Analyse des capacités
•Mesure des niveaux de
services
•Evènements « anormaux »
sans perturbation
•Insatisfactions clients
•Analyse des SPOF
•Analyse des changements
(risques sur architecture)
44.
Facteurs-clés de succès
Identificationréactive Identification proactive
•Gestion des incidents
•Gestion du timing et des
priorités
•Outillage complémentaire
•Gestion des compétences et des connaissances
Ressources affectées
Arbre de connaissances (référentiel pour SD)
45.
Réactif ou proactif?
Ca dépend…
Commencer par le réactif pour libérer les
ressources et la pression, qui pourront être
consacrées ensuite au proactif (80/20 au
démarrage).
Commencer le proactif pour éviter d’être
submergé par la gestion réactive ou parce
que l’on sent une fragilité.
46.
Questions à l’expert?
Peut-on créer un ticket problème :
• pour traiter un « SPOF » humain ?
• pour traiter un dysfonctionnement d’un
processus ?
• Réponse : Non, Non
Groupe 2
Commentmesurer l’efficacité du
processus ( KPI ) ?
Animateur : Marc Lallemand
Lieu : Salle 2
Les livrables :
Indicateurs Clés de Performances
Retour sur investissement
Efficacité (Résultats).
Opérations
• Nombred’Incidents non contournés.
• Nombre d’incidents sur erreur connue.
• Evolution de la charge de support niveau 2.
• Temps passé pour résoudre les incidents
• Le turnover du personnel (Incident – Plaintes).
Groupe 3
Quellessont les responsabilités du Problem Manager ?
Animateur : Olivier Maupaté
Lieu : Salle 3
Livrables :
Rôle et responsabilités
Positionnement dans l’organisation
55.
Rôle et positionnement
•Son rôle :
Recentrer l’objectif de tous sur la résolution
des problèmes
• Son positionnement :
Indépendance opérationnelle
Être crédible vis-à-vis de la gestion de
processus (capable de fédérer les
compétences)
56.
Responsabilité
• Analyse desproblèmes
• Définir les priorités
• Identifier les compétences
nécessaires à sa gestion et faire
mobiliser les ressources
Atelier 18 Janvier2007 - Paris
Conclusions
L’intégration des
processus au sein de
l’entreprise
59.
Le niveau dematurité des entreprises et
des administrations françaises
N = 170
Source : IDC/Osiatis 2004
55% 54% 19% 53% 43% 10%
31% 30% 58% 42% 37% 85%
9% 11% 18%
5% 12% 5%
1% 4% 2% 1% 8%
5% 1% 3% 1%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
60.
Quelques Constats
• Leniveau global de maturité des entreprises et des
administrations françaises est faible
• La gestion des incidents est le processus pour lequel
les entreprises sont le plus avancé
• La gestion des configurations semble être le
processus dans lequel les entreprises investissent le
plus
• Les entreprises sont fortement sensibilisées dans la
gestion des niveaux de service
61.
54% 44% 22%48% 45% 9%
25% 44% 52% 48% 27% 78%
8% 7% 17%
5%
23% 13%
4% 4% 5%
13% 4%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
54% 44% 22% 48% 45% 9%
25% 44% 52% 48% 27% 78%
8% 7% 17%
5%
23% 13%
4% 4% 5%
13% 4%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
Le secteur des services est bien avancé
dans la gestion des processus ITIL
N = 170
Source : IDC/Osiatis 2004
62.
Quelques principes àretenir
• Les Problèmes sont la propriété du centre de service
• Informer un client, est une marque de reconnaissance
qui bien souvent fait de lui un allié
• Un problème se ferme avec l’accord du client
• Un processus de gestion des Problèmes est efficace si
20% des problèmes qui impactent 80 % du business
sont traités
63.
MERCI DE VOTREATTENTION
Email: tchamfra@bouyguestelecom.fr
Email: PLEMONNI@bouyguestelecom.fr