Atelier 18 Janvier 2007 - Paris
Gestion des Incidents et
Gestion des Problèmes
2ème
Partie
Thierry CHAMFRAULT / Philippe LEMONNIER
Bouygues Telecom
Bienvenue ...
• Le thème :
 La Gestion des Incidents et la Gestion des Problèmes
• Le principe :
 Appréhender les bénéfices d’ITIL, mais sans être une séance de formation
 Échanger et s’enrichir mutuellement de nos expériences réussies ou en
cours, de nos difficultés.
 Confronter la théorie à des situations vécues, des contextes particuliers.
Notre objectif
Que chacun reparte avec au moins
une idée, un élément, une action
applicable dans son contexte
L’agenda
• Retour d’expérience (plénière – 50 minutes)
 Un peu de théorie
 La gestion de problèmes chez Bouygues Télécom
• Expérimenter (par groupe – 1h15 heure )
 Travail en groupes (3 ateliers)
(Désignation d’un « porte-parole » par groupe)
• Restituer et synthétiser (plénière – 45 minutes)
 Restitution des groupes par chaque « porte-parole » (10
minutes par groupe)
 Synthèse par les experts ITIL et questions-réponses (15
minutes)
• Échanges informels (Cocktail )
L’équipe
L’équipe d’animation de l’atelier est la suivante:
• Président : Thierry Chamfrault, Philippe Lemonnier
• Experts ITIL : Thierry Chamfrault, Vincent Douhairie
• Animateurs : Dario Tarantelli, Olivier Maupate, Marc Lallemand
• Coordinateurs : Sylvie Roche, Louisa Brunet, Marc Lallemand
L’agenda
• Retour d’Expérience
 Un peu de théorie
 La gestion de problèmes chez Bouygues Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
De l’opération à la
Planification
Centre de service
Gestion des
Incidents
Gestion des
Problèmes
Gestion des
configurations
Gestion des
Changements
Gestion des Mises
en Production
OPERATION
PLANIFICATION
Centre de service
Gestion des
Incidents
Gestion des
Problèmes
Gestion des
configurations
Gestion des
Changements
Gestion des Mises
en Production
OPERATION
PLANIFICATION
Le cycle de nos futurs ateliers
Un problème
Savoir vivre avec un problème est une
preuve de maturité collective
« Il y a moins de difficultés à résoudre un problème qu’à le
poser ! »
Joseph de Maistre
Une définition
La cause inconnue d’un incident
(phénomène ou comportement) significatif ou de
plusieurs incidents présentant les mêmes
symptômes.
Mais ne pas connaître ou trouver la cause ne remet nullement en
cause la compétence d’un groupe
Un état d’esprit!
Mémoire des évènements = efficacité
TRACABILITE
(court et moyen terme)
Lorsqu’un problème a une solution, il ne sert à rien de s’inquiéter,
et lorsqu’il n’en a pas s’inquiéter ne sert à rien!
Proverbe Arabe
Symptômes
répétitifs
Incidents 1
Incidents x
Incidents 2
1
Significatif pour le
business
Incidents 1
2
Selon planning
périodique
Rapports
de revues
générés
3
Selon planning de
mise en prod
Nouveau produit
ou TMA
4
PROBLEME
Conditions de déclaration
Appels
Incidents
Problèmes
Erreurs Connues
Changements
Gestion des problèmes
RESOLUTION
« Un Problème est à l’asynchrone, ce que l’incident est au
synchrone »
La nécessité de maîtriser les
changements
Incidents hors
changements
20%
Incidents liés à
des
changements
80%
Un Problème
• Description  Ticket de problème
• Priorité  f(Impact , Urgence)
 Impact dépend du volume et de son effet sur l’organisation
(exemple plus de 100 personnes inactives)
 Urgence Criticité du problème par rapport à l’activité de
l’utilisateur (exemple : critique, forte, faible)
Figure 9
Des méthodes, ….
• Diagramme Cause / effet :
 Ishikawa
• Mémoire de l’entreprise :
 Kepner et Tregoe
• Analyses Proactives :
 Analyse des tendances
(Taux CPU, réclamations
clients,…)
LEGENDE :
MATERIEL
MANAGEMENT
MILIEU
OPERATIONNEL
S
METHODE
LES
ORGANIGRAMME
S DE A ET B
SONT INCONNUS
IL N’Y A PAS
D’ORGANIGRAMME
DISPONIBLE
LES SITES
SONT
ELOIGNES
LES
RESPONSABLE
S NE SONT PAS
SUR LA MEME
LONGUEUR
D’ONDES
TOUT LE MONDE
FAIT TOUT ET
RIEN A LA FOIS
LES ROLES NE
SONT PAS
DEFINIS
IL N’Y A PAS DE
CONTRAT DE SERVICE
LES OBJECTIFS DE A
ET B SONT INCONNUS
POURQUOI LE
FONCTIONNEMENT
ENTRE
L’ORGANISATION
A ET
L’ORGANISATIONB
N’EST PAS CLAIR ?
IL N ’Y A PAS DE
DOCUMENTS SUR
L’ORGANISATION
LES
ORGANIGRAMMES
NE SONT PAS
DIFFUSES
LA REORGANISATION
N’A PAS ETE DECLINEE
PERSONNE N’A
INTERET A LE
CLARIFIER
3 points
2 points
1 point
IL N’Y A PAS EU
DE
PRESENTATION
DES EQUIPES
PERSONNE N’A
D’INTERET A
CLARIFIER LE
FONCTIONNEMENT
IL N ’Y A PAS
DE PROCESS
COMMUNS
IL N ’Y A PAS
DE GESTION
DE SERVICE
MANQUE DE
PROCEDURE
S ECRITES
IL N ’Y A PAS DE
CONTRÔLE DU
TRAVAIL DE A et
B
LES OBJECTIFS DU
SERVICE A CHANGENT
TOUS LES JOURS
6
3
1
9
5
3
1
2
Figure 9
Des méthodes, ….
Catégories Pb
Humaine
Matériel
Logiciel
Personne
Procédure
Réseau
Poste de travail
Serveur
Application métier
Système d’exploitation
Logiciel bureautique
Figure 8 Une Classification
Incident no.1
est
Up-time
"Down -time"
Temps de
Réponse
Temps de Réparation
Temps de
Restauration
Restauration
Détection Solution
Correction /
Contournement
     
N° x
Incident
no.2
Temps de
Détection
Problème
résolu
"Down -time"
"Down -time"
Temps de
diagnostic
Temps de traitement
Temps de
restauration
Restauration
Déclaration
problème
Erreur connue Solution
Correction
/Contournement
     
Incidents
N° 2
problème
no.2
Temps de
détection ou
d’observation
Temps moyen entre 2 problèmes
N° 1
Vue technique du problème
Temps de
post
observation

Figure 4
Mise sous
surveillance
Cycle de vie du problème
L’écosystème
Gestion
des
incidents
et des
demandes GESTION
des
PROBLEMES
et des erreurs connues
Gestion des
changements
Demande de
changement (RFC)
Déclaration
d’un problème
Communication
(avancement et clôture)
Avancement
et clôture du
changement Reporting
de l’activité
Incident
ou
demande
Sous-traitant
SLA-OLA
Incidents
Problèmes et erreurs connues
Configurations
CMDB
Avancement et clôture du problème
Gestion de la
disponibilité
Gestion de la
capacité
Objectif du processus de
gestion des problèmes
Rechercher la cause première des
incidents, apporter des solutions pour
prévenir de nouveaux incidents et ainsi
minimiser l’impact négatif sur le
business
L’épilepsie – Porosité de la chambre à air
Mais
Trouver la cause d’un ou plusieurs
incidents ne garantie en rien notre
capacité à trouver une solution pour les
résoudre
Exemple : Dégénérescence de la rétine ……
dans certains cas, n’est il pas mieux de ne pas savoir!!!
Objectif du processus de
gestion des Problèmes
Restaurer ne veut pas dire connaître la
cause!
Un « on/off » prévaut bien souvent à de longues explications et est
souvent très efficace
Chaos
Réactif
Proactif
Service
Valeur
Plusieurs Help Desk, Découverte des problèmes, …..
Centre de services, Gestion des incidents, gestion des configurations
Gestion des problèmes, Gestion des changements, Gestion de la disponibilité
Gestion de la capacité, Gestion des niveaux de service (SLA, OLA/UC)
Rapprochement Services et indicateurs Business
Court terme Moyen terme Long terme
ITIL – Chaîne de Maturité
Identification et
enregistrement du
problème
Classification
du
problème
Investigation et
diagnostic du problème
Demande de
changement, résolution
et clôture du problème
Communication,
suivi, surveillance,
des problèmes
Événement
 Incidents récurrents
 Corrélation d’incidents
Communication
Management, fournisseur,
acteur métier
Utilisateur, client, infrastructure,
fournisseur, application, ….
Incidents,
problèmes,
et erreurs connues
CMDB
Changements
CMDB
Configurations
CMDB
Services et
niveaux de service
CMDB
Les bonnes pratiques
Les relations
Déclaration
incident
Incident
routinier?
Correspond à
une erreur
connue?
Evaluer l’incident et suivre la
procédure habituelle
O
N
O
Informer le client sur la
solution de contournement
Incrémenter le nb d’incidents
de l’enregistrement de l’erreur
connue identifiée
Reporter l’identifiant de
l’erreur connue dans le ticket
d’incident
Enrichir le ticket d’incident
des informations de
classement
Extraire de la base des
erreurs connues la solution
de résolution ou de
contournement
Correspond à
un problème
connu?
N
N
Support
nécessaire?
Affecter le problème à une
équipe
Enregistrer le problème dans
la base de données des
problèmes
Déclarer un nouveau
problème
Incrémenter le nb d’incidents
de l’enregistrement du
problème identifié
Reporter l’identifiant du
problème dans le ticket
d’incident
Enrichir le ticket d’incident
des informations de
classement
Extraire de la base des
problèmes la solution de
résolution ou de
contournement
Support
nécessaire?
O
O O
Appliquer la solution Appliquer la solution
Traiter problème
N
N
Erreurs
connues
CMDB
Problèmes
CMDB
ACT-PB1
Contrôler les
problèmes
Tickets
d’Incidents
Déclaration d’un problème
Solution de contournement (FIX, patch, …)
ACT-PB2
Contrôler les
erreurs
Cause
identifiée
Informations sur le traitement des erreurs
(Clôture, état, avancement)
ACT-PB3
Gérer
proactivement
les problèmes
Demande de changement pour
résolution (RFC)
Demande de changement pour résolution (RFC)
Déclaration d’une erreur
Déclaration
d’un problème
Solution de contournement (FIX, patch, …)
Informations sur les actions engagées
Compte-rendu
de revue
Sous-traitants
Déclaration d’une erreur
en développement ou
maintenance
CMDB
CMDB
CMDB
CMDB
CMDB
CMDB
Reporting
sur les problèmes
ACT-PB4
Communiquer,
suivre, piloter
et affecter les
problèmes
SLA-OLA
SLA-OLA
SLA-OLA
SLA-OLA
Avancement et clôture du problème
Avancement et clôture du changement
Une synthèse
Pilotage du processus
• Gestionnaire(s) des problèmes
• Indicateurs clés de performance
 Améliorer la qualité des services – Indicateur : Taux de
répétition des incidents et problèmes en baisse
 Minimiser l’impact des problèmes - Indicateur :
Diminution du temps moyen de diagnostic des problèmes
 Réduire le coût des problèmes - Indicateur : Réduction du
taux d’impact des problèmes sur les utilisateurs
L’agenda
• Retour d’Expérience
Un peu de théorie
La gestion de problèmes chez Bouygues
Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
Contexte
Direction des Opérations Réseau
Les Services :
 Voix : utilisateur = client Bouygues Telecom
 Communications de/vers Bouygues Telecom,
 Communications de/vers Orange & SFR,
 Communications de/vers les téléphones fixes,
 …
 Réseau IP : utilisateur = Productions Bouygues Telecom (Réseau, SI &
bureautique)
 Communications IP entre tous les serveurs,
 Communications de/vers Internet,
 Communications cryptées de/vers les partenaires de Bouygues Telecom
 …
 « Services » : utilisateur = client Bouygues Telecom
 Vocaux : Boîtes et portails vocales,
 Kiosques multi-opérateurs : SMS+, Gallery, …
 SMS : Bouygues Telecom, échanges de/vers Orange & SFR, …
 MultiMédia Mobile : Surf i-mode™, surf Wap, Mail i-mode™,MMS,Vidéo
 Internet : Esp@ce Client, www.bouyguestelecom.fr, …
 Entreprise : Localisation, Raccordement SMS, …
 Gestion des campagnes Marketing : média VMS, média mail i-mode™
 InterConnexion : SMS, MMS.
Direction des opérations réseau
Alimentation de la base des problèmes
Base
des
incidents
Relation Clients
Client interne
Management
Déclaration d’un problème
Poids des incidents, fonction du
business et du potentiel de business
et de l’impact image pour l’entreprise,
Suivi quotidien
des niveaux de services
Risque sur l’engagement
du contrat de services
Aucun critère
défini
Traitement d’un problème
Déclaration du problème
Resp. : Problem Manager
Enregistrement du problème
Resp. : Responsable du problème
Traitement du problème
Resp. : Responsable du problème
Validation correction problème
Resp. : Responsable du problème
Clôture du problème
Resp. : Problem Manager
Etats du
problème
Référence et responsable du problème Ouvert
Changement : correction implémentée Traité,
Non Corrigé
Informations de traitement du problème :
- Criticité,
- Priorité,
- Plan d’actions + « acteurs problème »
- Critères de clôture du problème
Enregistré
Demande de clôture
Enregistré,
Maîtrisé,
Contourné,
Corrigé
Maîtrisé
Contourné,
Suspendu
Clos
Suivi des problèmes
Revue mensuelle
Participants : Membre du Comité de direction de la direction des
opérations réseau + Problem manager
Objectifs
− Etat d’avancement sur l’ensemble des problèmes,
− Focus sur un problème spécifique,
− Gestion des priorités,
− Remontée des alertes, demande d’escalade,
− Clôture des problèmes.
L’agenda
• Découvrir
 Un peu de théorie
 La gestion de problèmes chez Bouygues
Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
Expérimenter
• Déroulement de chaque atelier :
 Tour de table
 Désignation d’un « porte-parole »
 Échanges et débats
 « Visite » de l’expert
 Préparation de la restitution
• Les règles du jeu :
 L’animateur ...
 Le porte parole ...
 L’expert « volant » ...
 Vous ...
Groupe 1
La gestion de Problème doit-elle
être préventive ou réactive ?
 Animateur : Dario Tarantelli
Lieu : Salle 1
Les livrables :
Axes prioritaires à mettre en
place
Groupe 2
 Comment mesurer l’efficacité du
processus ( KPI ) ?
Animateur : Marc Lallemand
Lieu : Salle 2
Les livrables :
 Indicateurs Clés de Performances
 Retour sur investissement
Groupe 3
 Quelles sont les responsabilités du Problem Manager ?
Animateur : Olivier Maupaté
Lieu : Salle 3
Livrables :
 Rôle et responsabilités
 Positionnement dans l’organisation
Rendez-vous dans vos groupes
A tout à l’heure !
L’agenda
• Découvrir
 Un peu de théorie
 La gestion de problèmes chez Bouygues
Télécom
• Expérimenter
• Pause
• Restituer et synthétiser
• Échanges informels
Restitution Groupe 1
Groupe 1
La gestion de Problème doit-elle
être préventive ou réactive ?
 Animateur : Dario Tarantelli
Lieu : Salle 1
Les livrables :
Axes prioritaires à mettre en
place
Définitions
Le sujet concerne l’identification des problèmes
Identification réactive Identification proactive
Il y a eu 1 ou plusieurs
incidents
Il n’y a pas eu d’incident
Il y a incident potentiel
Comment ?
Identification réactive Identification proactive
•Analyse des incidents
•Escalades sur incidents
•Bilan post-incidents
•Analyse des capacités
•Mesure des niveaux de
services
•Evènements « anormaux »
sans perturbation
•Insatisfactions clients
•Analyse des SPOF
•Analyse des changements
(risques sur architecture)
Facteurs-clés de succès
Identification réactive Identification proactive
•Gestion des incidents
•Gestion du timing et des
priorités
•Outillage complémentaire
•Gestion des compétences et des connaissances
Ressources affectées
Arbre de connaissances (référentiel pour SD)
Réactif ou proactif ?
Ca dépend…
Commencer par le réactif pour libérer les
ressources et la pression, qui pourront être
consacrées ensuite au proactif (80/20 au
démarrage).
Commencer le proactif pour éviter d’être
submergé par la gestion réactive ou parce
que l’on sent une fragilité.
Questions à l’expert ?
Peut-on créer un ticket problème :
• pour traiter un « SPOF » humain ?
• pour traiter un dysfonctionnement d’un
processus ?
• Réponse : Non, Non
Restitution Groupe 2
Groupe 2
 Comment mesurer l’efficacité du
processus ( KPI ) ?
Animateur : Marc Lallemand
Lieu : Salle 2
Les livrables :
 Indicateurs Clés de Performances
 Retour sur investissement
Efficacité (Résultats).
Satisfaction Client
• Prix de la crise (Non institutionnalisée).
• Nombre de plaintes.
• Impact sur les Niveaux de services
Efficacité (Résultats).
Opérations
• Nombre d’Incidents non contournés.
• Nombre d’incidents sur erreur connue.
• Evolution de la charge de support niveau 2.
• Temps passé pour résoudre les incidents
• Le turnover du personnel (Incident – Plaintes).
Efficience (Processus)
• Temps moyen passé
• Durée d’ouverture du problème.
Retour sur investissement
• Voir quels indicateurs à mettre en place pour
justifier la mise en place d’un problem
management.
Restitution Groupe 3
Groupe 3
 Quelles sont les responsabilités du Problem Manager ?
Animateur : Olivier Maupaté
Lieu : Salle 3
Livrables :
 Rôle et responsabilités
 Positionnement dans l’organisation
Rôle et positionnement
• Son rôle :
 Recentrer l’objectif de tous sur la résolution
des problèmes
• Son positionnement :
 Indépendance opérationnelle
 Être crédible vis-à-vis de la gestion de
processus (capable de fédérer les
compétences)
Responsabilité
• Analyse des problèmes
• Définir les priorités
• Identifier les compétences
nécessaires à sa gestion et faire
mobiliser les ressources
Synthèse de l’expert
Atelier 18 Janvier 2007 - Paris
Conclusions
L’intégration des
processus au sein de
l’entreprise
Le niveau de maturité des entreprises et
des administrations françaises
N = 170
Source : IDC/Osiatis 2004
55% 54% 19% 53% 43% 10%
31% 30% 58% 42% 37% 85%
9% 11% 18%
5% 12% 5%
1% 4% 2% 1% 8%
5% 1% 3% 1%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
Quelques Constats
• Le niveau global de maturité des entreprises et des
administrations françaises est faible
• La gestion des incidents est le processus pour lequel
les entreprises sont le plus avancé
• La gestion des configurations semble être le
processus dans lequel les entreprises investissent le
plus
• Les entreprises sont fortement sensibilisées dans la
gestion des niveaux de service
54% 44% 22% 48% 45% 9%
25% 44% 52% 48% 27% 78%
8% 7% 17%
5%
23% 13%
4% 4% 5%
13% 4%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
54% 44% 22% 48% 45% 9%
25% 44% 52% 48% 27% 78%
8% 7% 17%
5%
23% 13%
4% 4% 5%
13% 4%
Optimisation
Maîtrisé
Défini
Reproductible
Initial
Niveau
de
maturité
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Gestion des
incidents
Gestion des
problèmes
Gestion des
configura-
tions
Gestion des
change-
ments
Gestion des
mises en
production
Gestion des
niveaux de
service
Pourcentage des entreprises par
processus
Le secteur des services est bien avancé
dans la gestion des processus ITIL
N = 170
Source : IDC/Osiatis 2004
Quelques principes à retenir
• Les Problèmes sont la propriété du centre de service
• Informer un client, est une marque de reconnaissance
qui bien souvent fait de lui un allié
• Un problème se ferme avec l’accord du client
• Un processus de gestion des Problèmes est efficace si
20% des problèmes qui impactent 80 % du business
sont traités
MERCI DE VOTRE ATTENTION
 Email: tchamfra@bouyguestelecom.fr
 Email: PLEMONNI@bouyguestelecom.fr

Atelier gestion des problèmes 180107.ppt

  • 1.
    Atelier 18 Janvier2007 - Paris Gestion des Incidents et Gestion des Problèmes 2ème Partie Thierry CHAMFRAULT / Philippe LEMONNIER Bouygues Telecom
  • 2.
    Bienvenue ... • Lethème :  La Gestion des Incidents et la Gestion des Problèmes • Le principe :  Appréhender les bénéfices d’ITIL, mais sans être une séance de formation  Échanger et s’enrichir mutuellement de nos expériences réussies ou en cours, de nos difficultés.  Confronter la théorie à des situations vécues, des contextes particuliers.
  • 3.
    Notre objectif Que chacunreparte avec au moins une idée, un élément, une action applicable dans son contexte
  • 4.
    L’agenda • Retour d’expérience(plénière – 50 minutes)  Un peu de théorie  La gestion de problèmes chez Bouygues Télécom • Expérimenter (par groupe – 1h15 heure )  Travail en groupes (3 ateliers) (Désignation d’un « porte-parole » par groupe) • Restituer et synthétiser (plénière – 45 minutes)  Restitution des groupes par chaque « porte-parole » (10 minutes par groupe)  Synthèse par les experts ITIL et questions-réponses (15 minutes) • Échanges informels (Cocktail )
  • 5.
    L’équipe L’équipe d’animation del’atelier est la suivante: • Président : Thierry Chamfrault, Philippe Lemonnier • Experts ITIL : Thierry Chamfrault, Vincent Douhairie • Animateurs : Dario Tarantelli, Olivier Maupate, Marc Lallemand • Coordinateurs : Sylvie Roche, Louisa Brunet, Marc Lallemand
  • 6.
    L’agenda • Retour d’Expérience Un peu de théorie  La gestion de problèmes chez Bouygues Télécom • Expérimenter • Pause • Restituer et synthétiser • Échanges informels
  • 7.
    De l’opération àla Planification Centre de service Gestion des Incidents Gestion des Problèmes Gestion des configurations Gestion des Changements Gestion des Mises en Production OPERATION PLANIFICATION Centre de service Gestion des Incidents Gestion des Problèmes Gestion des configurations Gestion des Changements Gestion des Mises en Production OPERATION PLANIFICATION Le cycle de nos futurs ateliers
  • 8.
    Un problème Savoir vivreavec un problème est une preuve de maturité collective « Il y a moins de difficultés à résoudre un problème qu’à le poser ! » Joseph de Maistre
  • 9.
    Une définition La causeinconnue d’un incident (phénomène ou comportement) significatif ou de plusieurs incidents présentant les mêmes symptômes. Mais ne pas connaître ou trouver la cause ne remet nullement en cause la compétence d’un groupe
  • 10.
    Un état d’esprit! Mémoiredes évènements = efficacité TRACABILITE (court et moyen terme) Lorsqu’un problème a une solution, il ne sert à rien de s’inquiéter, et lorsqu’il n’en a pas s’inquiéter ne sert à rien! Proverbe Arabe
  • 11.
    Symptômes répétitifs Incidents 1 Incidents x Incidents2 1 Significatif pour le business Incidents 1 2 Selon planning périodique Rapports de revues générés 3 Selon planning de mise en prod Nouveau produit ou TMA 4 PROBLEME Conditions de déclaration
  • 12.
    Appels Incidents Problèmes Erreurs Connues Changements Gestion desproblèmes RESOLUTION « Un Problème est à l’asynchrone, ce que l’incident est au synchrone »
  • 13.
    La nécessité demaîtriser les changements Incidents hors changements 20% Incidents liés à des changements 80%
  • 14.
    Un Problème • Description Ticket de problème • Priorité  f(Impact , Urgence)  Impact dépend du volume et de son effet sur l’organisation (exemple plus de 100 personnes inactives)  Urgence Criticité du problème par rapport à l’activité de l’utilisateur (exemple : critique, forte, faible)
  • 15.
    Figure 9 Des méthodes,…. • Diagramme Cause / effet :  Ishikawa • Mémoire de l’entreprise :  Kepner et Tregoe • Analyses Proactives :  Analyse des tendances (Taux CPU, réclamations clients,…)
  • 16.
    LEGENDE : MATERIEL MANAGEMENT MILIEU OPERATIONNEL S METHODE LES ORGANIGRAMME S DEA ET B SONT INCONNUS IL N’Y A PAS D’ORGANIGRAMME DISPONIBLE LES SITES SONT ELOIGNES LES RESPONSABLE S NE SONT PAS SUR LA MEME LONGUEUR D’ONDES TOUT LE MONDE FAIT TOUT ET RIEN A LA FOIS LES ROLES NE SONT PAS DEFINIS IL N’Y A PAS DE CONTRAT DE SERVICE LES OBJECTIFS DE A ET B SONT INCONNUS POURQUOI LE FONCTIONNEMENT ENTRE L’ORGANISATION A ET L’ORGANISATIONB N’EST PAS CLAIR ? IL N ’Y A PAS DE DOCUMENTS SUR L’ORGANISATION LES ORGANIGRAMMES NE SONT PAS DIFFUSES LA REORGANISATION N’A PAS ETE DECLINEE PERSONNE N’A INTERET A LE CLARIFIER 3 points 2 points 1 point IL N’Y A PAS EU DE PRESENTATION DES EQUIPES PERSONNE N’A D’INTERET A CLARIFIER LE FONCTIONNEMENT IL N ’Y A PAS DE PROCESS COMMUNS IL N ’Y A PAS DE GESTION DE SERVICE MANQUE DE PROCEDURE S ECRITES IL N ’Y A PAS DE CONTRÔLE DU TRAVAIL DE A et B LES OBJECTIFS DU SERVICE A CHANGENT TOUS LES JOURS 6 3 1 9 5 3 1 2 Figure 9 Des méthodes, ….
  • 17.
    Catégories Pb Humaine Matériel Logiciel Personne Procédure Réseau Poste detravail Serveur Application métier Système d’exploitation Logiciel bureautique Figure 8 Une Classification
  • 18.
    Incident no.1 est Up-time "Down -time" Tempsde Réponse Temps de Réparation Temps de Restauration Restauration Détection Solution Correction / Contournement       N° x Incident no.2 Temps de Détection Problème résolu "Down -time" "Down -time" Temps de diagnostic Temps de traitement Temps de restauration Restauration Déclaration problème Erreur connue Solution Correction /Contournement       Incidents N° 2 problème no.2 Temps de détection ou d’observation Temps moyen entre 2 problèmes N° 1 Vue technique du problème Temps de post observation  Figure 4 Mise sous surveillance Cycle de vie du problème
  • 19.
    L’écosystème Gestion des incidents et des demandes GESTION des PROBLEMES etdes erreurs connues Gestion des changements Demande de changement (RFC) Déclaration d’un problème Communication (avancement et clôture) Avancement et clôture du changement Reporting de l’activité Incident ou demande Sous-traitant SLA-OLA Incidents Problèmes et erreurs connues Configurations CMDB Avancement et clôture du problème Gestion de la disponibilité Gestion de la capacité
  • 20.
    Objectif du processusde gestion des problèmes Rechercher la cause première des incidents, apporter des solutions pour prévenir de nouveaux incidents et ainsi minimiser l’impact négatif sur le business L’épilepsie – Porosité de la chambre à air
  • 21.
    Mais Trouver la caused’un ou plusieurs incidents ne garantie en rien notre capacité à trouver une solution pour les résoudre Exemple : Dégénérescence de la rétine …… dans certains cas, n’est il pas mieux de ne pas savoir!!!
  • 22.
    Objectif du processusde gestion des Problèmes Restaurer ne veut pas dire connaître la cause! Un « on/off » prévaut bien souvent à de longues explications et est souvent très efficace
  • 23.
    Chaos Réactif Proactif Service Valeur Plusieurs Help Desk,Découverte des problèmes, ….. Centre de services, Gestion des incidents, gestion des configurations Gestion des problèmes, Gestion des changements, Gestion de la disponibilité Gestion de la capacité, Gestion des niveaux de service (SLA, OLA/UC) Rapprochement Services et indicateurs Business Court terme Moyen terme Long terme ITIL – Chaîne de Maturité
  • 24.
    Identification et enregistrement du problème Classification du problème Investigationet diagnostic du problème Demande de changement, résolution et clôture du problème Communication, suivi, surveillance, des problèmes Événement  Incidents récurrents  Corrélation d’incidents Communication Management, fournisseur, acteur métier Utilisateur, client, infrastructure, fournisseur, application, …. Incidents, problèmes, et erreurs connues CMDB Changements CMDB Configurations CMDB Services et niveaux de service CMDB Les bonnes pratiques
  • 25.
    Les relations Déclaration incident Incident routinier? Correspond à uneerreur connue? Evaluer l’incident et suivre la procédure habituelle O N O Informer le client sur la solution de contournement Incrémenter le nb d’incidents de l’enregistrement de l’erreur connue identifiée Reporter l’identifiant de l’erreur connue dans le ticket d’incident Enrichir le ticket d’incident des informations de classement Extraire de la base des erreurs connues la solution de résolution ou de contournement Correspond à un problème connu? N N Support nécessaire? Affecter le problème à une équipe Enregistrer le problème dans la base de données des problèmes Déclarer un nouveau problème Incrémenter le nb d’incidents de l’enregistrement du problème identifié Reporter l’identifiant du problème dans le ticket d’incident Enrichir le ticket d’incident des informations de classement Extraire de la base des problèmes la solution de résolution ou de contournement Support nécessaire? O O O Appliquer la solution Appliquer la solution Traiter problème N N Erreurs connues CMDB Problèmes CMDB
  • 26.
    ACT-PB1 Contrôler les problèmes Tickets d’Incidents Déclaration d’unproblème Solution de contournement (FIX, patch, …) ACT-PB2 Contrôler les erreurs Cause identifiée Informations sur le traitement des erreurs (Clôture, état, avancement) ACT-PB3 Gérer proactivement les problèmes Demande de changement pour résolution (RFC) Demande de changement pour résolution (RFC) Déclaration d’une erreur Déclaration d’un problème Solution de contournement (FIX, patch, …) Informations sur les actions engagées Compte-rendu de revue Sous-traitants Déclaration d’une erreur en développement ou maintenance CMDB CMDB CMDB CMDB CMDB CMDB Reporting sur les problèmes ACT-PB4 Communiquer, suivre, piloter et affecter les problèmes SLA-OLA SLA-OLA SLA-OLA SLA-OLA Avancement et clôture du problème Avancement et clôture du changement Une synthèse
  • 27.
    Pilotage du processus •Gestionnaire(s) des problèmes • Indicateurs clés de performance  Améliorer la qualité des services – Indicateur : Taux de répétition des incidents et problèmes en baisse  Minimiser l’impact des problèmes - Indicateur : Diminution du temps moyen de diagnostic des problèmes  Réduire le coût des problèmes - Indicateur : Réduction du taux d’impact des problèmes sur les utilisateurs
  • 28.
    L’agenda • Retour d’Expérience Unpeu de théorie La gestion de problèmes chez Bouygues Télécom • Expérimenter • Pause • Restituer et synthétiser • Échanges informels
  • 29.
    Contexte Direction des OpérationsRéseau Les Services :  Voix : utilisateur = client Bouygues Telecom  Communications de/vers Bouygues Telecom,  Communications de/vers Orange & SFR,  Communications de/vers les téléphones fixes,  …  Réseau IP : utilisateur = Productions Bouygues Telecom (Réseau, SI & bureautique)  Communications IP entre tous les serveurs,  Communications de/vers Internet,  Communications cryptées de/vers les partenaires de Bouygues Telecom  …  « Services » : utilisateur = client Bouygues Telecom  Vocaux : Boîtes et portails vocales,  Kiosques multi-opérateurs : SMS+, Gallery, …  SMS : Bouygues Telecom, échanges de/vers Orange & SFR, …  MultiMédia Mobile : Surf i-mode™, surf Wap, Mail i-mode™,MMS,Vidéo  Internet : Esp@ce Client, www.bouyguestelecom.fr, …  Entreprise : Localisation, Raccordement SMS, …  Gestion des campagnes Marketing : média VMS, média mail i-mode™  InterConnexion : SMS, MMS.
  • 30.
    Direction des opérationsréseau Alimentation de la base des problèmes Base des incidents Relation Clients Client interne Management Déclaration d’un problème Poids des incidents, fonction du business et du potentiel de business et de l’impact image pour l’entreprise, Suivi quotidien des niveaux de services Risque sur l’engagement du contrat de services Aucun critère défini
  • 31.
    Traitement d’un problème Déclarationdu problème Resp. : Problem Manager Enregistrement du problème Resp. : Responsable du problème Traitement du problème Resp. : Responsable du problème Validation correction problème Resp. : Responsable du problème Clôture du problème Resp. : Problem Manager Etats du problème Référence et responsable du problème Ouvert Changement : correction implémentée Traité, Non Corrigé Informations de traitement du problème : - Criticité, - Priorité, - Plan d’actions + « acteurs problème » - Critères de clôture du problème Enregistré Demande de clôture Enregistré, Maîtrisé, Contourné, Corrigé Maîtrisé Contourné, Suspendu Clos
  • 32.
    Suivi des problèmes Revuemensuelle Participants : Membre du Comité de direction de la direction des opérations réseau + Problem manager Objectifs − Etat d’avancement sur l’ensemble des problèmes, − Focus sur un problème spécifique, − Gestion des priorités, − Remontée des alertes, demande d’escalade, − Clôture des problèmes.
  • 33.
    L’agenda • Découvrir  Unpeu de théorie  La gestion de problèmes chez Bouygues Télécom • Expérimenter • Pause • Restituer et synthétiser • Échanges informels
  • 34.
    Expérimenter • Déroulement dechaque atelier :  Tour de table  Désignation d’un « porte-parole »  Échanges et débats  « Visite » de l’expert  Préparation de la restitution • Les règles du jeu :  L’animateur ...  Le porte parole ...  L’expert « volant » ...  Vous ...
  • 35.
    Groupe 1 La gestionde Problème doit-elle être préventive ou réactive ?  Animateur : Dario Tarantelli Lieu : Salle 1 Les livrables : Axes prioritaires à mettre en place
  • 36.
    Groupe 2  Commentmesurer l’efficacité du processus ( KPI ) ? Animateur : Marc Lallemand Lieu : Salle 2 Les livrables :  Indicateurs Clés de Performances  Retour sur investissement
  • 37.
    Groupe 3  Quellessont les responsabilités du Problem Manager ? Animateur : Olivier Maupaté Lieu : Salle 3 Livrables :  Rôle et responsabilités  Positionnement dans l’organisation
  • 38.
    Rendez-vous dans vosgroupes A tout à l’heure !
  • 39.
    L’agenda • Découvrir  Unpeu de théorie  La gestion de problèmes chez Bouygues Télécom • Expérimenter • Pause • Restituer et synthétiser • Échanges informels
  • 40.
  • 41.
    Groupe 1 La gestionde Problème doit-elle être préventive ou réactive ?  Animateur : Dario Tarantelli Lieu : Salle 1 Les livrables : Axes prioritaires à mettre en place
  • 42.
    Définitions Le sujet concernel’identification des problèmes Identification réactive Identification proactive Il y a eu 1 ou plusieurs incidents Il n’y a pas eu d’incident Il y a incident potentiel
  • 43.
    Comment ? Identification réactiveIdentification proactive •Analyse des incidents •Escalades sur incidents •Bilan post-incidents •Analyse des capacités •Mesure des niveaux de services •Evènements « anormaux » sans perturbation •Insatisfactions clients •Analyse des SPOF •Analyse des changements (risques sur architecture)
  • 44.
    Facteurs-clés de succès Identificationréactive Identification proactive •Gestion des incidents •Gestion du timing et des priorités •Outillage complémentaire •Gestion des compétences et des connaissances Ressources affectées Arbre de connaissances (référentiel pour SD)
  • 45.
    Réactif ou proactif? Ca dépend… Commencer par le réactif pour libérer les ressources et la pression, qui pourront être consacrées ensuite au proactif (80/20 au démarrage). Commencer le proactif pour éviter d’être submergé par la gestion réactive ou parce que l’on sent une fragilité.
  • 46.
    Questions à l’expert? Peut-on créer un ticket problème : • pour traiter un « SPOF » humain ? • pour traiter un dysfonctionnement d’un processus ? • Réponse : Non, Non
  • 47.
  • 48.
    Groupe 2  Commentmesurer l’efficacité du processus ( KPI ) ? Animateur : Marc Lallemand Lieu : Salle 2 Les livrables :  Indicateurs Clés de Performances  Retour sur investissement
  • 49.
    Efficacité (Résultats). Satisfaction Client •Prix de la crise (Non institutionnalisée). • Nombre de plaintes. • Impact sur les Niveaux de services
  • 50.
    Efficacité (Résultats). Opérations • Nombred’Incidents non contournés. • Nombre d’incidents sur erreur connue. • Evolution de la charge de support niveau 2. • Temps passé pour résoudre les incidents • Le turnover du personnel (Incident – Plaintes).
  • 51.
    Efficience (Processus) • Tempsmoyen passé • Durée d’ouverture du problème.
  • 52.
    Retour sur investissement •Voir quels indicateurs à mettre en place pour justifier la mise en place d’un problem management.
  • 53.
  • 54.
    Groupe 3  Quellessont les responsabilités du Problem Manager ? Animateur : Olivier Maupaté Lieu : Salle 3 Livrables :  Rôle et responsabilités  Positionnement dans l’organisation
  • 55.
    Rôle et positionnement •Son rôle :  Recentrer l’objectif de tous sur la résolution des problèmes • Son positionnement :  Indépendance opérationnelle  Être crédible vis-à-vis de la gestion de processus (capable de fédérer les compétences)
  • 56.
    Responsabilité • Analyse desproblèmes • Définir les priorités • Identifier les compétences nécessaires à sa gestion et faire mobiliser les ressources
  • 57.
  • 58.
    Atelier 18 Janvier2007 - Paris Conclusions L’intégration des processus au sein de l’entreprise
  • 59.
    Le niveau dematurité des entreprises et des administrations françaises N = 170 Source : IDC/Osiatis 2004 55% 54% 19% 53% 43% 10% 31% 30% 58% 42% 37% 85% 9% 11% 18% 5% 12% 5% 1% 4% 2% 1% 8% 5% 1% 3% 1% Optimisation Maîtrisé Défini Reproductible Initial Niveau de maturité Gestion des incidents Gestion des problèmes Gestion des configura- tions Gestion des change- ments Gestion des mises en production Gestion des niveaux de service Gestion des incidents Gestion des problèmes Gestion des configura- tions Gestion des change- ments Gestion des mises en production Gestion des niveaux de service Pourcentage des entreprises par processus
  • 60.
    Quelques Constats • Leniveau global de maturité des entreprises et des administrations françaises est faible • La gestion des incidents est le processus pour lequel les entreprises sont le plus avancé • La gestion des configurations semble être le processus dans lequel les entreprises investissent le plus • Les entreprises sont fortement sensibilisées dans la gestion des niveaux de service
  • 61.
    54% 44% 22%48% 45% 9% 25% 44% 52% 48% 27% 78% 8% 7% 17% 5% 23% 13% 4% 4% 5% 13% 4% Optimisation Maîtrisé Défini Reproductible Initial Niveau de maturité Gestion des incidents Gestion des problèmes Gestion des configura- tions Gestion des change- ments Gestion des mises en production Gestion des niveaux de service Pourcentage des entreprises par processus 54% 44% 22% 48% 45% 9% 25% 44% 52% 48% 27% 78% 8% 7% 17% 5% 23% 13% 4% 4% 5% 13% 4% Optimisation Maîtrisé Défini Reproductible Initial Niveau de maturité Gestion des incidents Gestion des problèmes Gestion des configura- tions Gestion des change- ments Gestion des mises en production Gestion des niveaux de service Gestion des incidents Gestion des problèmes Gestion des configura- tions Gestion des change- ments Gestion des mises en production Gestion des niveaux de service Pourcentage des entreprises par processus Le secteur des services est bien avancé dans la gestion des processus ITIL N = 170 Source : IDC/Osiatis 2004
  • 62.
    Quelques principes àretenir • Les Problèmes sont la propriété du centre de service • Informer un client, est une marque de reconnaissance qui bien souvent fait de lui un allié • Un problème se ferme avec l’accord du client • Un processus de gestion des Problèmes est efficace si 20% des problèmes qui impactent 80 % du business sont traités
  • 63.
    MERCI DE VOTREATTENTION  Email: tchamfra@bouyguestelecom.fr  Email: PLEMONNI@bouyguestelecom.fr