No d’ordre : 4380 ANNÉE 2011
THÈSE / UNIVERSITÉ DE RENNES 1
sous le sceau de l’Université Européenne de Bretagne
COTUTELLE / UNIVERSIDAD SIMÓN BOLÍVAR
pour les grades de
DOCTEUR DE L’UNIVERSITÉ DE RENNES 1
Mention : Traitement du signal et télécommunications
Ecole doctorale MATISSE
et
DOCTOR EN INGENIERÍA
DE LA UNIVERSIDAD SIMÓN BOLÍVAR
Decanato de Estudios de Postgrado
présentée par
Miguel ALTUVE
préparées à l’unité de recherche LTSI - INSERM U642
Laboratoire de Traitement du Signal et de l’Image
UFR Structure et Propriétés de la Matière
Grupo de Bioingeniería y Biofísica Aplicada
Decanato de Investigación y Desarrollo
Détection multivariée
des épisodes
d’apnée-bradycardie
chez le prématuré
par modèles
semi-Markovien cachés
Thèse soutenue à Rennes
le 8 juillet 2011
devant le jury composé de :
Jean-Marc BOUCHER
Pr, Telecom Bretagne / rapporteur
Jocelyne FAYN
Ingénieur de Recherche INSERM, HDR, Lyon/
rapporteur
Pablo LAGUNA
Pr, Université de Saragosse / examinateur
Patrick PLADYS
Pr, Université de Rennes 1 / examinateur
Gianfranco PASSARIELLO
Pr, Université Simon Bolivar / examinateur
Guy CARRAULT
Pr, Université de Rennes 1 / co-directeur de thèse
Alfredo HERNÁNDEZ
CR INSERM, HDR, Université de Rennes 1 /
co-directeur de thèse
À ma femme Rosana
On me l’a raconté et je l’ai oublié.
Je l’ai vu et je l’ai compris.
Je l’ai fait et je l’ai appris.
Confucius
Remerciements
D’abord je tiens à remercier Dieu pour l’intelligence qu’il m’a accordée pour réaliser
cette thèse.
Je remercie ma femme Rosana pour avoir cru en moi, sa présence et sa patience ont
été très précieuses durant cette longue aventure. Pour toutes ces raisons et plus encore,
je lui dédie affectueusement cette thèse. Je remercie aussi ma famille, tout spécialement
mes parents, frère et sœurs, pour leur amour et leur soutien inconditionnel à tout moment,
même dans la distance. Je remercie également parents, frère et sœur de ma femme pour
leur soutien.
Je tiens à exprimer ma gratitude à mes directeurs de thèse, Messieurs Guy CARRAULT
et Alfredo HERNÁNDEZ, pour tous leurs conseils scientifiques et leur sens critique tout
au long de cette thèse, ainsi que pour les remarques constructives qu’ils ont su me donner
lors de la rédaction de ce manuscrit et des articles scientifiques. Je compte sur vous pour la
continuation de la colaboration GBBA-LTSI pour les années à venir.
Un grand merci aux distingués membres du jury pour leurs commentaires constructifs
et suggestions apportées à mes travaux de recherche.
Je tiens à exprimer mes remerciements aux Professeurs Lotfi SENHADJI, directeur
du LTSI et Jean-Louis COATRIEUX, directeur de recherche INSERM et initiateur de la
collaboration GBBA-LTSI, de m’avoir accueilli chaleureusement au sein de leur laboratoire.
Je remercie aussi le personnel administratif du LTSI, plus particulièrement Mesdames
Patricia BERNABE, Soizic CHARPENTIER et Muriel DIOP, de m’avoir aidé à résoudre
de nombreux problèmes administratifs.
Je remercie les membres de l’équipe SEPIA du LTSI dont j’ai fait partie, pour les
discussions au sujet de nombreux domaines en traitement du signal, et plus particulièrement
les médecins de l’équipe, Messieurs Alain BEUCHÉE et Patrick PLADYS, dont les expertises
dans le domaine pédiatrique étaient remarquables. Ils ont su m’apporter beaucoup d’idées
pour résoudre les problèmes rencontrés et j’ai beaucoup apprécié leur avis sur les sujets
cliniques.
i
ii
Je reconnais de plus le soutien continu des doctorants, stagiaires et postdoctorants du
LTSI au long de mes années de recherche. Je suis particulièrement reconnaissant envers
Monsieur Jérôme DUMONT pour les discussions scientifiques au cours de ce travail qui,
par ailleurs, représente une continuité des idées proposées dans sa thèse. J’ai pu également
compter sur le soutien technique de Monsieur Julien FLEUREAU pour le temps qu’il a
su me consacrer durant ma première année de thèse, en particulier en ce qui concerne la
programmation. Je remercie énormément Monsieur David OJEDA pour m’avoir aidé en
Linux, LATEX, à résoudre rapidement des problèmes en programation et fait découvrir d’autres
logiciels qui m’ont facilité le travail au cours de ma thèse. Je lui suis très reconnaissant aussi
pour son amitié et pour les activités sportives et sociales réalisées ensemble. Je remercie Malo
GAUBERT, Nicolas CLADEL, Guillaume CAZOULAT, Marie-Paule GARCIA, Krzysztof
JURCZUK, Bertrand SAUDREAU, Solenna BLANCHARD, Paul FROGERAIS, Antoine
DEFONTAINE, Romain BILLOIS, Faten MINA, Clément HUNEAU, Lionil GIORGIS,
Yuan WANG et Chufeng YANG, collègues du LTSI sur qui j’ai souvent pu compter pour
discuter de différents sujets de recherche, mais aussi pour l’ambiance agréable au sein du
laboratoire.
En outre, je reconnais l’aide de mes collègues du GBBA. Je suis particulièrement
reconnaissant envers le Professeur Gianfranco PASSARIELLO, cofondateur du GBBA et de
la colaboration GBBA-LTSI, pour ses conseils très appreciés à tout moment et qui m’ont
servi pour élargir mes horizons académiques et réussir dans plusieurs aspects de ma vie, tant
étudiant que professionnel. Je remercie Monsieur Julio CRUZ, codirecteur vénézuélien de
cette thèse qui représente une continuité de la sienne. Je le remercie énormément pour ses
encouragements et ses idées apportées à mes travaux. Je remercie également le Professeur
Sara WONG, directrice de mes travaux de recherche de master à la USB, coordinatrice
du Doctorado en Ingeniería de l’USB, directrice du GBBA et responsable vénézuélienne
du programme ECOS-NORD LTSI-GBBA, pour sa joie de vivre et sa confiance pendant
mes recherches et qui pendant son année sabbatique au LTSI m’a soutenu et encouragé à
continuer mes recherches et à réaliser des activités sportives. Merci au Professeur Fernando
MORA, cofondateur du GBBA et de la collaboration GBBA-LTSI, pour son intérêt pour
mes sujets de recherche et ceux du GBBA, à Alexandra La CRUZ, membre très important
du GBBA, pour son aide pendant les premiers années à Rennes et au LTSI, à Ana Marian
CHINEA qui pendant son séjour à Rennes a contribué à enrichir mes recherches sur la
fusion de données et à Erika SEVERYN pour son aide désintéressée quant aux démarches
administratives que je n’ai pas pu réaliser à l’USB. Je remercie également Guillermo
VILLEGAS, Noel CASTRO, Mary DIAZ, Pedro MARCHENA et Yuber DELGADO, pour
leur incroyable enthousiasme et leur amitié.
Je tiens aussi à remercier les membres d’autres groupes de recherche de l’USB, tels
que le GBRP et le GRETA et spécialement les Professeurs Ninoska VILORIA, Carlos
GONZALEZ, Kleydis SUAREZ, Mónica HUERTA et Roger CLOTET, pour leurs conseils,
iii
leur soutien ainsi que pour leur amitié.
Les personnes de mon département de Technologie Industrielle méritent également un
remerciement pour leur appui et leur autorisation pour réaliser cet important projet, plus
particulièrement les membres du conseil du département et les secrétaires. Je pense aussi à
Monsieur Ubaldo PADILLA qui m’a aidé à formaliser mes inscriptions à l’USB et à Madame
Carolina RUMBOS qui m’a aidé à réaliser des démarches à l’USB et pour son amitié très
précieuse.
Pendant mes années à Rennes, j’ai pu compter sur l’amitié sincère et l’aide de nom-
breuses personnes que j’ai rencontrées. Je pense particulièrement aux vénézuéliens Antonio
BRAVO, Anabel CHATELLIER, Angel ESCALONA, Juan MANTILLA, Miguel CASTRO,
Alexandra ALCEDO, Juan Andrés BALZAN, Juan Guillermo BALZAN, Argi MIRO,
Mikael TORRES, Jeanlouis COLONNE, Gerardo DOMINGUEZ et Miguel VERA, mais
aussi à Xavier NAVARRO, Joana MESQUITA, Michel LORRIAUX, Julián BETANCUR,
Zulma SANDOVAL, Stephanie ORTEGA, Éloïse BILLOIS, Juan OSPINA et Marian LEE.
Avec vous j’ai passé de très bons moments et j’espère vous revoir très bientôt.
La rédaction de cette thèse ainsi que la présentation n’auraient été possibles sans la
participation de mes directeurs de thèse ainsi des collègues Guylaine LE-JAN, Adrian CO-
LOMBET, Joachim BEHAR, Raphael MARCZAK et Céline LECAVELIER des ETANGS-
LEVALLOIS, pour avoir relu des parties de ce travail. Leurs commentaires et corrections
sur les versions antérieures de ce livre de thèse ont été très judicieux.
Sur le plan sportif, je remercie l’équipe de football du LTSI, mes entraineurs de natation
Alain DEBOUCHE et Raphaël LE CAM, et Régis CHATELLIER pour les nombreuses
courses à pieds en entrainement ou en compétition.
Je tiens à remercier le Decanato de Estudios de Postgrado et la Dirección de Relaciones
Internacionales de la Universidad Simón Bolívar, spécialement Mesdames Carmen CALEYA
et Daniela TRULLAS, ainsi que l’école MATISSE de l’université de Rennes 1 d’avoir permis
la réalisation de cette thèse en co-tutelle.
Enfin, je tiens à remercier le programme Apoyo Institucional para Estudios de Postgrado
de la Dirección de Desarrollo Profesoral de la Universidad Simón Bolivar, plus particuliè-
rement Mesdames Mariela CURIEL et Ana Rivas, la convention de coopération entre la
Fundación Gran Mariscal de Ayacucho (Fundayacucho) et l’Ambassade de France au Vene-
zuela, spécialement Mesdames Julia MONTOYA, Michelle ELLNER et Judith SANTANA,
Messieurs Stéphane FREYCHET, Jean-Marc LAFORET et Jesús Arnaldo PÉREZ, le LTSI
et Madamme Karine ELIE du CROUS de Rennes. Grâce à leur soutien financier, ce travail
de thèse ainsi que mon séjour en France ont été possibles.
À vous tous, merci beaucoup !
Table des matières
Introduction 1
1 Présentation du contexte clinique 7
1.1 Le nouveau-né prématuré . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Les apnées-bradycardies du nouveau-né prématuré . . . . . . . . . . . . . . 10
1.3 Les systèmes de monitoring automatisés . . . . . . . . . . . . . . . . . . . . 12
1.3.1 L’équipement dans l’USIN . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2 Délais dans le cycle de surveillance . . . . . . . . . . . . . . . . . . . 14
1.4 Généralités du système cardiovasculaire . . . . . . . . . . . . . . . . . . . . 15
1.4.1 Le cœur et l’activité électrique cardiaque . . . . . . . . . . . . . . . . 15
1.4.2 Le système spécialisé d’excitation-conduction du cœur . . . . . . . . 18
1.5 L’électrocardiogramme du nouveau-né prématuré . . . . . . . . . . . . . . . 19
1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Position du problème et démarche proposée 29
2.1 Travaux antérieurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.1 Détection de bradycardies . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.2 Système multi-agents de monitoring appliqué aux soins néonatals . . 35
2.1.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Méthodologie proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.1 Base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2 Extraction de caractéristiques . . . . . . . . . . . . . . . . . . . . . . 38
2.2.3 Prise de décision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.3 Méthodologie d’évaluation des performances de détection . . . . . . . . . . . 40
2.3.1 Courbe COR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 Analyse multi-variée de l’ECG pour la détection et la caractérisation de
l’apnée-bradycardie des nouveaux-nés prématurés 47
3.1 Segmentation des ondes : position du problème et bibliographie . . . . . . . 48
3.1.1 Algorithme basé sur la dérivée filtrée . . . . . . . . . . . . . . . . . . 48
3.1.2 Algorithme basé sur le filtrage adaptatif . . . . . . . . . . . . . . . . 49
v
vi Table des matières
3.1.3 Algorithme basé sur la modélisation physiologique . . . . . . . . . . 49
3.1.4 Algorithme basé sur le réalignement temporel . . . . . . . . . . . . . 49
3.1.5 Algorithme basé sur la modélisation Markovienne . . . . . . . . . . . 50
3.1.6 Algorithme basé sur la transformée en ondelettes . . . . . . . . . . . 50
3.2 Détection et segmentation automatique du QRS . . . . . . . . . . . . . . . . 51
3.2.1 Pré-traitement de l’ECG . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2.2 Détection des battements . . . . . . . . . . . . . . . . . . . . . . . . 52
3.2.3 Extraction des battements . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2.4 Segmentation des battements par ondelettes . . . . . . . . . . . . . . 55
3.3 Optimisation de la chaîne de segmentation d’ECG . . . . . . . . . . . . . . 58
3.3.1 Méthode proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2 Optimisation des paramètres . . . . . . . . . . . . . . . . . . . . . . 62
3.4 Résultats de détection et de segmentation . . . . . . . . . . . . . . . . . . . 64
3.4.1 Performances du détecteur des battements . . . . . . . . . . . . . . . 64
3.4.2 Performances de la méthode de segmentation des QRS . . . . . . . . 65
3.5 Analyse du QRS pour la caractérisation de l’apnée-bradycardie . . . . . . . 67
3.5.1 Principe et objectif de l’étude . . . . . . . . . . . . . . . . . . . . . . 67
3.5.2 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4 Modélisation de la dynamique de séries temporelles multivariées 81
4.1 Position du problème et état de l’art . . . . . . . . . . . . . . . . . . . . . . 82
4.1.1 Positionnement du problème . . . . . . . . . . . . . . . . . . . . . . 82
4.1.2 Fouille de données temporelles multivariées . . . . . . . . . . . . . . 83
4.1.3 Caractérisation des dynamiques de séries temporelles . . . . . . . . . 86
4.2 Les modèles de Markov et semi-Markov cachés . . . . . . . . . . . . . . . . 88
4.2.1 Architecture des modèles . . . . . . . . . . . . . . . . . . . . . . . . 90
4.2.2 Estimation des paramètres des modèles . . . . . . . . . . . . . . . . 93
4.3 Rappel de la méthode proposée par DUMONT J. . . . . . . . . . . . . . . . 94
4.3.1 Les distributions des durées et d’observation . . . . . . . . . . . . . . 94
4.3.2 Méthodologie utilisée pour l’estimation des paramètres des MSMC . 95
4.3.3 Estimation du nombre d’états . . . . . . . . . . . . . . . . . . . . . . 97
4.3.4 Évaluation d’une séquence observée . . . . . . . . . . . . . . . . . . . 98
4.3.5 Un exemple de modélisation d’observations bivariées par MSMC . . 99
4.3.6 Classification/détection par MMC et par MSMC . . . . . . . . . . . 100
4.3.7 Synthèse sur les MSMC . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.4 Contributions de ce travail de thèse . . . . . . . . . . . . . . . . . . . . . . . 104
4.4.1 Évaluation du temps de retard à la détection (TRD) . . . . . . . . . 105
4.4.2 Exploration de l’hétérogénéité des modèles . . . . . . . . . . . . . . . 105
4.4.3 Adaptation au traitement en ligne . . . . . . . . . . . . . . . . . . . 105
Table des matières vii
4.4.4 Optimisation de la distribution d’états dans la gamme dynamique
des séries observées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4.5 Exploitation des retards physiologiques dans les séries observées . . . 108
4.4.6 Synthèse de la fouille de données appliquées dans cette thèse . . . . 110
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5 Application des MSMC sur des signaux simulés et réels 119
5.1 Évaluation de la faisabilité des MSMC sur signal simulé . . . . . . . . . . . 120
5.1.1 Le modèle de FitzHugh-Nagumo pour la génération des séries synthé-
tiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.1.2 Étude comparative de classification par MMC et MSMC . . . . . . . 124
5.1.3 Étude de la performance de classification en fonction du nombre d’états126
5.1.4 Étude de la performance de classification intégrant les améliorations
proposées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.1.5 Détection en ligne d’évènements d’intérêt . . . . . . . . . . . . . . . 129
5.2 Évaluation des MSMC sur signaux réels . . . . . . . . . . . . . . . . . . . . 138
5.2.1 Méthode proposée pour l’annotation des instants de début de brady-
cardie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.2.2 Classification des séries temporelles : « présence » ou « absence »
d’apnée-bradycardie . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.2.3 Détection en ligne d’épisodes d’apnée-bradycardie . . . . . . . . . . . 147
5.2.4 Fusion des détecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Conclusions et perspectives 159
A Liste des travaux liés à ce travail 167
B La transformée en ondelettes pour la segmentation des battements 169
C Les algorithmes évolutionnaires 173
C.1 Représentation (définition des individus) . . . . . . . . . . . . . . . . . . . . 174
C.2 Fonction d’évaluation (fonction de coût) . . . . . . . . . . . . . . . . . . . . 174
C.3 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
C.4 Mécanisme de sélection des parents . . . . . . . . . . . . . . . . . . . . . . . 175
C.5 Opérateurs de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
C.5.1 Mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
C.5.2 Recombinaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
C.6 Mécanisme de sélection des survivants . . . . . . . . . . . . . . . . . . . . . 176
D L’algorithme de Viterbi 179
D.1 L’algorithme de Viterbi étendu aux MSMC . . . . . . . . . . . . . . . . . . 180
viii Table des matières
E Optimisation des paramètres τ, ∆QU et ∆QNU, sur signaux réels 183
E.1 Détermination de τ optimal . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
E.1.1 Optimisation de τ pour RR . . . . . . . . . . . . . . . . . . . . . . . 183
E.1.2 Optimisation de τ pour Ramp . . . . . . . . . . . . . . . . . . . . . . 183
E.1.3 Optimisation de τ pour QRSd . . . . . . . . . . . . . . . . . . . . . . 184
E.2 Détermination de ∆QU optimal . . . . . . . . . . . . . . . . . . . . . . . . . 185
E.2.1 Optimisation de ∆QU pour RR . . . . . . . . . . . . . . . . . . . . . 185
E.2.2 Optimisation de ∆QU pour Ramp . . . . . . . . . . . . . . . . . . . . 185
E.2.3 Optimisation de ∆QU pour QRSd . . . . . . . . . . . . . . . . . . . . 186
E.2.4 Optimisation de ∆QU pour RR . . . . . . . . . . . . . . . . . . . . . 186
E.2.5 Optimisation de ∆QU pour RR&Ramp . . . . . . . . . . . . . . . . . 186
E.2.6 Optimisation de ∆QU pour RR&QRSd . . . . . . . . . . . . . . . . . 187
E.3 Détermination de ∆QNU optimal . . . . . . . . . . . . . . . . . . . . . . . . 187
E.3.1 Optimisation de δQNU pour RR . . . . . . . . . . . . . . . . . . . . . 187
E.3.2 Optimisation de δQNU pour Ramp et QRSd . . . . . . . . . . . . . . 188
E.3.3 Optimisation de δQNU pour RR . . . . . . . . . . . . . . . . . . . . . 188
E.3.4 Optimisation de δQNU pour Ramp et QRSd . . . . . . . . . . . . . 188
E.3.5 Optimisation de δQNU pour RR&Ramp . . . . . . . . . . . . . . . . 189
E.3.6 Optimisation de δQNU pour RR&QRSd . . . . . . . . . . . . . . . . 189
Table des figures
1.1 Image d’un prématuré. On peut y voir certains dispositifs de mesure (Reportés
sur la figure). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 Système de monitoring utilisé dans l’USIN de Rennes. . . . . . . . . . . . . 13
1.3 Cycle de surveillance d’un prématuré dans une USIN . . . . . . . . . . . . . 14
1.4 Structure anatomique du cœur. Image d’après [Guyton and Hall, 1956]. . . 16
1.5 Potentiel d’action des cellules cardiaques ventriculaires. . . . . . . . . . . . . 17
1.6 Système spécialisé de conduction du cœur. Image d’après [Guyton and Hall,
1956]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.7 Ondes, intervalles et segments dans l’ECG. . . . . . . . . . . . . . . . . . . 20
1.8 Exemples des ECG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1 Utilisation d’un seuil d’amplitude fixe pour détecter les bradycardies à partir
des séries RR. Dans cet exemple, la détection se fait lorsque RR(k) ≥ 600
ms, où k est l’indice temporel. . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Utilisation d’un seuil d’amplitude et durée fixes pour détecter les bradycardies
à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque
RR(k) ≥ 600 ms pendant 4 secondes, où k est l’indice temporel. . . . . . . . 32
2.3 Utilisation d’un seuil relatif pour détecter les bradycardies à partir des séries
RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 1, 33RRbase
pendant 4 s, où k est l’indice temporel et RRbase est la valeur moyenne de
la série RR calculée dans une fenêtre glissante de 20 secondes qui précède
l’intervalle RR actuel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Dispositifs utilisés dans le système INTEM. . . . . . . . . . . . . . . . . . . 36
2.5 Étapes du processus de détection des apnées-bradycardies proposées dans
cette thèse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.6 Étape d’extraction des caractéristiques de la démarche proposée. . . . . . . 39
2.7 Étape de prise de décision de la démarche proposée. . . . . . . . . . . . . . 40
2.8 Méthodologie d’évaluation des performances de détection. La fenêtre wV P
est centrée dans l’échantillon de détection analysé. . . . . . . . . . . . . . . 42
2.9 Exemples de courbes COR. Le cercle représente le point de détection parfaite,
les étoiles représentent une détection avec une TFP = 0, 05 (5 %) et les
carrés correspondent à la distance la plus courte au point (0,1). . . . . . . . 43
3.1 Étapes de la segmentation du signal ECG . . . . . . . . . . . . . . . . . . . 51
3.2 Représentation en bloc du processus de détection des battements. . . . . . . 53
ix
x Table des figures
3.3 Banc de filtres de la décomposition en ondelettes (sans décimation). G(z) et
H(z) sont respectivement les filtres passe-haute et passe-bas. Wk
2 x[n] sont
les sorties des filtres aux échelles 2k (k = 1, 2, . . . , 5) pour le battement x[n]. 56
3.4 Indicateurs à repérer pour l’algorithme de segmentation. . . . . . . . . . . . 58
3.5 Le problème d’optimisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6 Optimisation par application des AE de manière séquentielle. . . . . . . . . 60
3.7 Méthodologie d’optimisation des paramètres des méthodes. Les annotations
et les détections dépendent de la méthode à optimiser. La méthode est le
détecteur des battements dans un premier essai et la segmentation du QRS
après. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.8 Construction des différentes bases de données utilisées pour effectuer les
processus d’adaptation et la phase d’évaluation. . . . . . . . . . . . . . . . . 63
3.9 Amplitude de l’onde R (Ramp) et durée du complexe QRS (QRSd) pour un
battement synthétique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.10 De haut en bas respectivement, intervalles d’analyses de séries temporelles
RR, QRSd et Ramp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.11 Boîtes à moustaches de la moyenne des séries par intervalle et de la différence
de la moyenne des séries entre l’intervalle T1 et les autres intervalles, pour
les séries temporelles : (a) RR, (b) Ramp et (c) QRSd. . . . . . . . . . . . . 72
3.12 Segment typique présentant de petites différences entre l’intervalle T1 et les
autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les
intervalles, alors que dans (d), les lignes verticales en pointillé représentent
la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff). 73
3.13 Segment typique présentant de différences significatives entre l’intervalle T1
et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent
les intervalles, alors que dans (d), les lignes verticales en pointillé représentent
la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff). 74
4.1 Exemples des séries temporelles extraites de l’ECG sur trois instants différents.
Dans (a), (b) et (c) on observe les séries RR, RAMP et QRSd respectivement
dans une période de repos. Dans (d) la série RR pressente un ralentissement
du cœur qui produit des variations dans les séries RAMP (e) et QRSd (f).
Dans (g), (h) et (i) on observe les séries RR, RAMP et QRSd respectivement
en présence d’un épisode d’apnée-bradycardie dont le cercle correspond à la
détection effectuée par la méthode classique (RR ≥ 600 ms pendant 4 s) et
le losange représente le début de la bradycardie. . . . . . . . . . . . . . . . . 84
4.2 Étapes du processus de fouille de données et leur correspondance dans cette
thèse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.3 Structure de base d’un modèle de Markov caché. . . . . . . . . . . . . . . . 88
4.4 Structure de base d’un modèle de semi-Markov caché. . . . . . . . . . . . . 89
4.5 Principe de fonctionnement d’un modèle Markovien caché. . . . . . . . . . . 92
4.6 Principe de fonctionnement d’un modèle semi-Markovien caché. . . . . . . . 92
4.7 Procédure utilisée pour l’apprentissage des MSMC à partir d’une base de
données, d’après DUMONT [Dumont, 2008]. . . . . . . . . . . . . . . . . . . 97
Table des figures xi
4.8 Modélisation des séries bivariées issues d’un attracteur de Rössler par des
MSMC. On observe dans (a) la projection dans le plan x&y d’un MSMC
avec 14 états, dans (b) la projection dans le plan x&z d’un MSMC avec 10
états et dans (c) la projection dans le plan y&z d’un MSMC avec 12 états. . 99
4.9 Comparaison des MSMC chargés de modéliser des séries bivariées : Projection
dans le plan x&z dans (a) pour les séries originaux, dans (b) pour 1000x&z
et dans (c) pour (1000 + x)&z. . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.10 Méthodologie de classification utilisée en utilisant les MSMC. . . . . . . . . 102
4.11 Processus de détection en ligne d’apnée-bradycardie proposé dans cette thèse.107
4.12 Quantificateur (a) uniforme et (b) non uniforme. . . . . . . . . . . . . . . . 108
5.1 Exemple de séries temporelles issues du MFN pour différentes valeurs du
paramètre a : (a) dynamique dans le plan bivariée v&r, (b) dynamique de
la variable v et (c) dynamique de la variable r. On distingue bien les deux
classes de séries temporelles générées. . . . . . . . . . . . . . . . . . . . . . . 122
5.2 Dynamiques des classes appartenant à la variable r à 5 dB. . . . . . . . . . 123
5.3 Exemple d’une réalisation de la variable r, générée avec a1 = 0, 58. . . . . . 124
5.4 TEG (%) en fonction du nombre d’états des MSMC pour la classification de
trois classes issues de la variable r à 5 dB. . . . . . . . . . . . . . . . . . . . 127
5.5 Spectre des séries temporelles v et r. . . . . . . . . . . . . . . . . . . . . . . 130
5.6 Étapes du processus d’optimisation des paramètres. paramètre correspond
aux valeurs de ∆QU, ∆QNU et τ et méthode correspond à quantification
uniforme, quantification non uniforme et prise en compte de la version
retardée des séquences, respectivement. . . . . . . . . . . . . . . . . . . . . . 131
5.7 Dans (a), séries temporelles v générées avec a1 et a2 et dans (b), agrandisse-
ment de (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.8 Dans (a), courbes des log-vraisemblances Lk, k = {1, 2, 3}, des séries tempo-
relles de la figure 5.7 et dans (b), agrandissement de (a). . . . . . . . . . . . 132
5.9 Différence des log-vraisemblances présentées dans la figure 5.8. . . . . . . . . 133
5.10 Séries mono-source bivariée v, générées avec a1 et avec a2, pour un RSB = 5 dB
et une valeur de τ = 3, 75 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.11 Meilleures performances de détection de la perturbation produite avec a1,
en utilisant MSMC. Dans (a) courbes COR et dans (b) courbes TRD en
fonction de TFP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.12 Approximation de la série temporelle RR (représentée par des cercles) pendant
un épisode de bradycardie, par une fonction sigmoïde (courbe rouge continue).
La courbe noire pointillée correspond à la dérivée de la fonction sigmoïde et
la ligne verticale correspond à l’annotation du début de bradycardie. . . . . 140
5.13 Exemples des séries RR que ne doivent pas être incluses dans le sous-ensemble
LSC1. Dans (a) la FC présente un ralentissement avant le début de la
bradycardie et dans (b) l’intervalle RR ne dépasse pas le seuil de 500 ms que
plus de 20 s après l’annotation. . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.14 Exemple d’une série RR avec un épisode de bradycardie. Les différents blocs
segmentés et leur classe sont indiqués. . . . . . . . . . . . . . . . . . . . . . 141
xii Table des figures
5.15 Procédure pour la détermination de la taille de la séquence d’observation
sur les signaux RR. RR correspond à la moyenne des 233 blocs de séries RR
avec les épisodes d’apnée-bradycardies. . . . . . . . . . . . . . . . . . . . . . 142
5.16 Moyenne (ligne continue) et moyenne ± écart-type (lignes pointillées) de
7 premières secondes des séries RR en bradycardie. Dans (a) on observe
la variation d’amplitude du premier échantillon tandis que dans (b), cette
variation est réduite en supprimant aux séries la moyenne déterminée sur les
5 secondes qui précédent le début de la bradycardie. . . . . . . . . . . . . . 143
5.17 Boîte à moustache du premier échantillon des série RR en bradycardie : (a)
RR non centrées et (b) RR centrées. . . . . . . . . . . . . . . . . . . . . . . 143
5.18 (a) Série RR avec deux épisodes de bradycardie, (b) log-vraisemblance des
modèles : L1 (ligne segmentée) et L2 (ligne continue) et (c) différence entre les
log-vraisemblance : L1 −L2. Dans (a) et (c) les lignes verticales correspondent
aux annotations de début et fin de l’épisode de bradycardie. . . . . . . . . . 149
5.19 Performance de détection de l’apnée-bradycardie par MSMC, sans prendre
en compte les modifications proposées. Dans (a) courbes COR et dans (b)
courbes TRD moyen en fonction de TFP. Le caractère « x » représente le
point correspondant à la DCDP. . . . . . . . . . . . . . . . . . . . . . . . . 150
5.20 Performance de détection de l’apnée-bradycardie par MSMC. Dans (a)
courbes COR et dans (b) courbes TRD moyen en fonction de TFP. Le
caractère « x » représente le point correspondant à la DCDP. . . . . . . . . 152
5.21 Courbe COR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.22 Performance de détection lors de la fusion des variables RRQNU, RRQNU et
RR&QRSdQU. Dans (a) courbes COR et dans (b) courbes TRD moyen en
fonction de TFP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
B.1 Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour les
échelles 1 à 5 pour une fréquence d’échantillonnage de 250 Hz. . . . . . . . 170
B.2 Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour une
fréquence d’échantillonnage de (a) 500 Hz et (b) 1000 Hz. . . . . . . . . . . 171
C.1 Principe de fonctionnement d’un algorithme évolutionnaire. . . . . . . . . . 174
Liste des tableaux
1.1 Valeurs normales de l’ECG pédiatrique par âge. . . . . . . . . . . . . . . . . 23
3.1 Paramètres de la méthode de détection des battements à optimiser. . . . . . 54
3.2 Paramètres de la méthode de segmentation des QRS à optimiser. . . . . . . 58
3.3 Valeurs des paramètres de la méthode de détection des battements avant
(pour les adultes) et après (pour les nouveaux-nés prématurés) le processus
d’optimisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.4 Performances du détecteur des battements avant et après le processus d’opti-
misation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres
réglés pour l’ECG du prématuré. . . . . . . . . . . . . . . . . . . . . . . . . 65
3.5 Valeurs optimales des paramètres de la méthode de segmentation des QRS. 66
3.6 Exemple des fenêtres de recherche et des seuils utilisés dans la méthode de
segmentation des QRS. Les paramètres de notre approche ont été déterminés
en utilisant les paramètres optimaux (Tableau 3.5) pour un intervalle RR
typique de 400 ms. Les autres approches correspondent aux paramètres
utilisés par [Dumont et al., 2010] et [Smrdel and Jager, 2004]. . . . . . . . . 66
3.7 Performances de la segmentation des QRS, avant et après le processus
d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après :
paramètres réglés pour l’ECG du prématuré. . . . . . . . . . . . . . . . . . . 67
3.8 wµ et wσ des séries temporelles RR, Ramp et QRSd, pour tous les intervalles
analysés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.9 µDA et σDA entre l’intervalle T1 et les autres intervalles, pour les séries
temporelles RR, Ramp et QRSd. . . . . . . . . . . . . . . . . . . . . . . . . 71
3.10 tests d’hypothèse de Mann–Whitney U pour la moyenne des séries RR, Ramp
et QRSd. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.1 Résumé des principaux paramètres et caractéristiques des MMC et MSMC. 92
4.2 Tableau de contingence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.1 Estimation du nombre d’états par MSMC pour différentes valeurs de RSB,
pour modéliser la dynamique de la variable r. . . . . . . . . . . . . . . . . . 125
5.2 Tableau de contingence en utilisant les MSMC pour classer trois dynamiques
observées dans la variable r à 5 dB. Chaque élément du tableau représente
la somme des éléments correspondants sur les 10 répétitions. . . . . . . . . . 125
xiii
xiv Liste des tableaux
5.3 Comparaison des performances de classification entre les MMC et les MSMC
pour la classifications des séquences d’observations issues de la variable r à 5
dB et pour 10 réalisations des étapes apprentissage/test. . . . . . . . . . . . 126
5.4 Estimation du nombre d’états par MSMC pour modéliser la dynamique des
différents versions de la variable r avec un RSB = 5 dB. . . . . . . . . . . . 129
5.5 TEG pour classer trois dynamiques différents des variables r à 5 dB en
utilisant des MSMC sur 10 réalisations. . . . . . . . . . . . . . . . . . . . . . 129
5.6 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de v. . . . . . . . . . . . . . . . . . . . . . . . 133
5.7 Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . . . . . . . . 134
5.8 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQU. . . . . . . . . . . . . . . . . . . . . . 134
5.9 Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . . . . . . . 134
5.10 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQNU. . . . . . . . . . . . . . . . . . . . . . 135
5.11 Estimation du nombre d’états par MSMC pour modéliser la dynamique de v
pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.12 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de v. . . . . . . . . . . . . . . . . . . . . . . . 136
5.13 Estimation du nombre d’états par MSMC pour modéliser la dynamique de v
pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.14 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQU. . . . . . . . . . . . . . . . . . . . . . 136
5.15 Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . . . . . . . 137
5.16 Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQNU. . . . . . . . . . . . . . . . . . . . . 137
5.17 Meilleures performances de détection de la perturbation produite avec a1,
en utilisant des MSMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.18 Valeurs optimales des paramètres ∆QU et δQNU. . . . . . . . . . . . . . . . . 144
5.19 Estimation du nombre d’états par MSMC pour modéliser les classes 1 et 2. 145
5.20 Performances de classification par MSMC en utilisant les signaux réels. . . . 146
5.21 Performance de détection de l’apnée-bradycardie par MSMC, sans prendre
en compte les modifications proposées. . . . . . . . . . . . . . . . . . . . . . 150
5.22 Huit meilleures approches de détection de bradycardies par MSMC, en termes
de performance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.23 Performance de détection des méthodes classique dans leur point opérationnel.151
5.24 Performance de détection lors de la fusion des variables RR, Ramp et QRSd. 154
5.25 Performance de détection lors de la fusion décentralisée des variables RRQNU,
RRQNU et RR&QRSdQU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
B.1 Bande passante à 3 dB pour chaque échelle du filtre équivalente Qk(ejω) . . 170
Liste des tableaux xv
E.1 Nombre d’états par MSMC et performance de détection en utilisant la
variable RR pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . 184
E.2 Nombre d’états par MSMC et performance de détection en utilisant la
variable Ramp pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . 184
E.3 Nombre d’états par MSMC et performance de détection en utilisant la
variable QRSd pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . 184
E.4 Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . . 185
E.5 Nombre d’états par MSMC et performance de détection en utilisant la
variable RampQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . 185
E.6 Nombre d’états par MSMC et performance de détection en utilisant la
variable QRSdQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . 186
E.7 Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . 186
E.8 Performance de détection en utilisant la variable RR&RampQU. . . . . . . . 187
E.9 Performance de détection en utilisant la variable RR&QRSdQU. . . . . . . . 187
E.10 Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . 188
E.11 Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . 188
E.12 Performance de détection en utilisant la variable RR&RampQNU. . . . . . . 189
E.13 Performance de détection en utilisant la variable RR&QRSdQNU. . . . . . . 189
Table des algorithmes
1 Pseudo-code de la méthode de détection des battements. . . . . . . . . . . . 54
2 Pseudo-code de la méthode de segmentation des QRS. . . . . . . . . . . . . 59
3 Pseudo-code pour déterminer ∆QU optimal. . . . . . . . . . . . . . . . . . . 108
4 Pseudo-code de la méthode de quantification non uniforme proposée. . . . . 108
5 Pseudo-code pour déterminer ∆QNU optimal. . . . . . . . . . . . . . . . . . 109
xvii
Liste des symboles
δ Constante pour la détermination du seuil adaptatif, au chapitre 3
δα,k Seuil pour détecter l’événement α (α ∈ {k})
γ Paramètres du détecteur à optimiser par courbes COR au chapitre 2
γQRSpost Seuil utilisé pour trouver des pentes importantes de l’onde S (équation 3.7)
γQRSpre Seuil utilisé pour trouver des pentes significatives de l’onde Q (équation 3.6)
λMMC Ensemble des paramètres du MMC
λMSMC Ensemble des paramètres du MSMC
R Ensemble des nombres réels
Z Ensemble des entiers naturels
v Matrice d’observation de la variable v intégrant la version originale de la
séquence observée à l’instant t et la version retardée de la séquence observée à
l’instant t − τ
L Fonction de vraisemblance (équation 4.9)
N Loi normale gaussienne
U Loi uniforme continue
µDA Moyenne de la différence absolue (équation 3.17)
µDJ Moyenne du jitter de détection (équation 3.11)
µd
i Moyenne des gaussiennes pour représenter les temps de passage de l’état i
µνk
i Moyenne des gaussiennes pour représenter la distribution d’observation de
l’état i
πi Probabilité de l’état initial
δQNU Seuil pour déterminer ∆QNU
∆QU Pas de quantification uniforme
σDA Écart-type de la différence absolue (équation 3.18)
σDJ Écart-type du jitter de détection (équation 3.12)
Σνk
i Matrice de covariance des centres des gaussiennes multivariées pour représenter
la distribution d’observation de l’état i
xix
xx Liste des symboles
τ Délai
µνk
i Vecteur des centres des gaussiennes multivariées pour représenter la distribution
d’observation de l’état i
∆QNU Pas de quantification non uniforme
ξQRSoff Seuil utilisé pour la recherche de QRSoff (équation 3.9)
ξQRSon Seuil utilisé pour la recherche de QRSon (équation 3.8)
a Paramètre du MFN
a1 a1 ∈ a ∼ U(0,58, 0,62)
a2 a2 ∈ a ∼ U(0,78, 0,82)
aij Élément de la matrice de transition
Ann Annotation
bi Probabilité d’observation de l’état i
CF1 Fonction de coût pour AE1
CF2 Fonction de coût pour AE2
d Durée d’une état de la chaîne de Markov
Det Détection
fcHigh Fréquence de coupure du filtre passe-haut
fcLow Fréquence de coupure du filtre passe-bas
G(z) Filtre de détail
H(z) Filtre d’approximation
HISTO Taille du tampon circulaire
I Valeur du courant d’excitation externe au MFN
K Nombre d’évènements différents à détecter
L Taille de la fenêtre pour déterminer la moyenne dans la procédure de détection
en ligne
M Nombre d’états des modèles
nfirst Première pente significative
nlast Dernière pente significative
NP Nombre de pics pour déterminer sa valeur moyenne
O Ensemble d’observations
O1:T Séquence d’observation
pi Probabilité de durée de l’état i
Perr Probabilité d’erreur de détection (équation 3.10)
r Variable de récupération (variable lente) du MFN
T Taille de la séquence d’observation multivariée, au chapitre 5
Liste des symboles xxi
TIso Taille de la fenêtre où la forme d’onde est la plus plate pour déterminer ISOp
TMWI Taille de la fenêtre glissante de l’intégrateur
TPQ Taille de la fenêtre de recherche temporelle pour le ISOp
THR Seuil adaptatif utilisé dans l’algorithme de détection des battements
Ti Intervalle i pour analyser les séries du chapitre 3
TPeak Taille de la fenêtre pour détecter la crête maximale QRS
TQlim Taille de la fenêtre temporelle utilisée pour trouver l’onde Q
TR1 Taille de la fenêtre temporelle utilisée pour la recherche des ondes R avant le
PF
TR2 Taille de la fenêtre temporelle utilisée pour la recherche des ondes R après le
PF
TRefr Période de suppression réfractaire
TRRlim Temps limite pour réinitialiser la détection des QRS
TSlim Taille de la fenêtre temporelle utilisée pour rechercher les ondes S
v Potentiel de membrane (variable rapide) du MFN
wµ Moyenne pondérée (équation 3.15)
wσ Écart-type pondéré (équation 3.16)
Wn
2 Échelle n de la transformation en ondelettes
wV P Taille de la fenêtre pour déterminer les VP
σd
i
2
Variance des gaussiennes pour représenter les temps de passage de l’état i
σνk
i
2
Variance des gaussiennes pour représenter la distribution d’observation de
l’état i
vQNU Variable v quantifiée non uniformément
vQU Variable v quantifiée uniformément
RR Matrice d’observation de la variable RR intégrant la version originale de la
séquence observée à l’instant t et la version retardée de la séquence observée à
l’instant t − τ
c.f. Confer (se reporter à)
i.e. id est (c’est-à-dire)
A-V Auriculo-ventriculaire
ACP Analyse en composante principale
AE Algorithmes évolutionnaires
AE1 AE pour optimiser les paramètres du détecteur des battements
AE2 AE pour optimiser les paramètres de la méthode de segmentation des QRS
BIC Critère d’information bayésien
bpm Battements par minute
xxii Liste des symboles
COR Caractéristiques opérationnelles du récepteur
CPAP Continuous Positive Airway Pressure
DB1 Sous-ensembles de données pour adapter la méthode de détection de battements
DB1L Premier ensemble d’apprentissage utilisée pour AE1
DB1T Premier ensemble de test
DB2 Sous-ensembles de données pour adapter la méthode de segmentation de
battements
DB2L Deuxième ensemble d’apprentissage utilisée pour AE2
DB2T Deuxième ensemble de test
DCDP Distance la plus courte à la détection parfaite
DTW Dynamic Time Warping
ECG Électrocardiogramme
EEG Électroencéphalogramme
EM Espérance-maximisation
FC Fréquence cardiaque
FCbase Fréquence cardiaque de base
FN Nombre de Faux Négatifs
FP Nombre de Faux Positifs
GBBA Groupe de Bioingénierie et Biophysique Appliquée
HF High Frequency
INTEM Système de monitoring intelligent développe au LTSI
IRM Imagerie par résonance magnétique
ISOp Position du niveau iso-électrique
KISS Knowledge-based Interactive Signal monitoring System
LF Low Frequency
LSCk Sous-ensemble pour la classification de données réels, k = {1, 2}
LSMFNk Sous-ensemble de données synthétiques k = {1, 2, 3}
LTSI Laboratoire de Traitement du Signal et de l’Image
MFN Modèle de FitzHugh-Nagumo (équation 5.1)
MMC Modèle Markovien caché
MSMC Modèle semi-Markovien caché
MV Maximum de vraisemblance
PA Potentiel d’action
Pd Probabilité de détection
Liste des symboles xxiii
PF Point fiducial
Pfa Probabilité de fausse alarme
PRA Période réfractaire absolue
PRR Période réfractaire relative
PTCA Angioplastie coronaire transluminale percutanée
QRS Durée du complexe QRS
QRSdQNU Quantification non uniforme de la variable QRSd
QRSdQU Quantification uniforme de la variable QRSd
QRSoff Fin du complexe QRS
QRSon Début du complexe QRS
Ramp Amplitude de l’onde R
RampQNU Quantification non uniforme de la variable Ramp
RampQU Quantification uniforme de la variable Ramp
RNA Réseaux neuronaux artificiels
RR Durée du cycle cardiaque
RRbase Durée du cycle cardiaque de base
RRQNU Quantification non uniforme de la variable RR
RRQU Quantification uniforme de la variable RR
RSB Rapport signal sur bruit
SA Semaines d’aménorrhée
SEN Sensibilité
SEPIA Surveillance, Explication et Prévention des Ischémies et des Arythmies car-
diaques
SNA Système nerveux autonome
SPC Spécificité
SpO2 Saturation d’oxygène
TECk Taux d’erreur par classe k (équation 4.27)
TEG Taux d’erreur global (équation 4.26)
TFP Taux de faux positif
TRD Temps de retard à la détection
TVP Taux de vrai positif
USIC Unités de Soins Intensifs Coronarien
USIN Unités de soins intensifs néonatals
VFC Variabilité de la fréquence cardiaque
VN Nombre de Vrais Négatifs
VP Nombre de Vrais Positifs
VPP Valeur prédictive positive
Introduction
Ce travail de thèse a été élaboré dans le cadre d’une co-tutelle entre deux laboratoires :
– Le Groupe de Bioingénierie et Biophysique Appliquée (GBBA) de l’Université Simón
Bolívar. Les activités de recherche de ce laboratoire sont centrées sur l’instrumentation
biomédicale, le traitement des signaux biomédicaux, la visualisation et le traitement
d’images médicales.
– Le Laboratoire de Traitement du Signal et de l’Image (LTSI) de l’Université de Rennes
1, composé de quatre équipes. L’équipe SEPIA (Surveillance Explication et Prévention
des Ischémies et des Arythmies) est celle qui a encadré cette thèse. L’activité de cette
équipe est basée sur une approche multidisciplinaire qui combine le traitement du
signal, la physiologie et la modélisation intégrative appliquée à l’étude du système
cardiovasculaire.
Le monitoring des signaux physiologiques est le centre de la coopération entre ces deux
laboratoires et a été abordé dans le cadre du projet KISS (Knowledge-based Interactive Signal
monitoring System) [Siregar et al., 1989], où des problèmes d’acquisition et de traitement des
signaux [Passariello, 1991; Hernández et al., 1999], de caractérisation d’arythmies [Schleich,
1993; Thoraval, 1995], d’extraction et de représentation de connaissances profondes [Siregar
et al., 1995; Hernández, 2000], d’architecture des systèmes liés au concept de monitoring
intelligent dans les Unités de Soins Intensifs Coronarien (USIC) [Mora, 1991; Mabo et al.,
1991], et plus récemment d’analyse de la dynamique des séries temporelles par fouille de
données [Dumont, 2008] ont aussi été traités.
Ce travail représente le prolongement de ces contributions. Son objectif principal est
de prédire la survenue des apnée-bradycardies chez le nouveau-né prématuré en utilisant
une méthodologie cherchant à exploiter la dynamique des séries temporelles multivariées,
extraites de l’électrocardiogramme.
La naissance prématurée de l’enfant arrive avant 37 semaines de gestation. Cette
problématique est en augmentation constante dans la plupart des pays [Martin et al., 2009;
Zeitlin, 2009]. Elle peut entraîner de nombreuses complications aux enfants en raison des
dysfonctionnements des organes, qui ne sont pas complètement développés et aptes pour la
vie extra-utérine. L’un des problèmes le plus fréquent est l’épisode d’apnée-bradycardie,
1
2 Introduction
dont la répétition influence de manière négative le développement de l’enfant [Pichler et al.,
2003; Urlesberger et al., 1999; Janvier et al., 2004]. Par conséquent, les enfants prématurés
sont surveillés en continu par un système de monitoring installé dans les unités des soins
intensifs néonatals (USIN). Ce système permet de déterminer l’évolution de l’état de santé
de l’enfant et, depuis sa mise en marche, la qualité, l’espérance de vie et le pronostic de vie
des prématurés ont été considérablement améliorés et la mortalité a été réduite.
En effet, les avancées technologiques en électronique, informatique et télécommunications
ont conduit à l’élaboration de systèmes multivoies de monitoring néonatal de plus en plus
performants. La plupart sont constitués de modules d’acquisition des données et d’une
station centrale pour visualiser les signaux acquis en temps réel. Des alarmes sont produites
lorsqu’une situation à risque est détectée, comme par exemple, une apnée-bradycardie. L’un
des principaux signaux exploités dans ces systèmes est l’électrocardiogramme (ECG). L’ECG
est un outil diagnostique qui mesure et enregistre l’activité électrique du cœur. Il reste
aujourd’hui comme la technique la plus largement utilisée pour l’exploration de l’activité
électrique cardiaque, puisqu’il s’agit d’une technique non invasive, simple, économique et
sûre.
Même si l’analyse de l’ECG a évolué au fil des années et que le développement des
méthodes de traitement des signaux électrocardiographiques a amélioré la caractérisation
et le diagnostic des maladies cardiovasculaires, l’ensemble des informations fournies par
l’ECG ne sont pas encore totalement exploitées dans les processus de décision, notamment
en monitoring en USIN. Deux points particuliers sont à nos yeux sous exploités dans les
stations de monitoring néonatal : i) l’exploration multivariée des ondes et intervalles de
l’ECG, afin de détecter précocement les épisodes d’apnée-bradycardie et ii) les méthodes
d’analyse restent des méthodes de détection et sont très peu anticipatives (prédiction de
l’évènement).
Dans ce travail, une nouvelle méthodologie pour répondre aux deux problématiques
précédentes est proposée. Elle est basée sur l’exploitation de la dynamique des séries
temporelles multivariées extraites de l’ECG. Cette dynamique est analysée par l’usage des
modèles semi-Markovien cachés (MSMC). Les MSMC sont des modèles stochastiques à
nombre d’états M fini et dont l’émission d’observations (bi) de l’état i et la durée (pi)
de l’état i sont représentées par une densité de probabilité. Un MSMC est similaire à un
modèle de Markov caché (MMC) classique, mais la principale différence est que le processus
non observé est semi-Markovien, dans le sens où un changement dans un état futur dépend
à la fois de l’état caché actuel et du temps passé sur cet état.
Les MMC et MSMC ont été appliqués dans le domaine du traitement du signal pendant
plus de deux décennies, en particulier dans le contexte de la reconnaissance automatique
de la parole. Toutefois, ils constituent également des outils souples, flexibles et robustes
pour le traitement des séries temporelles univariées et multivariées, y compris dans les cas
Introduction 3
d’observations discrètes ou continues. L’intérêt pour la théorie et les applications de ces
modèles est en pleine expansion à d’autres domaines, par exemple : différents types de
reconnaissance (visages, parole, geste, écriture, signature), bioinformatique (analyse des
séquences biologiques, analyse de l’ECG, classification de l’électroencéphalogramme), envi-
ronnement (direction du vent, précipitations, tremblements de terre) et finances (rentabilité
journalière).
Le principal intérêt d’utiliser les MSMC dans le traitement de signaux biomédicaux est
basé sur le fait que : i) ils peuvent représenter l’évolution temporelle d’une variable grâce
au paramètre pi, ii) ils ne nécessitent pas de connaissances a priori sur les données à traiter
et iii) le nombre d’états M est le seul hyper-paramètre à régler.
Cette thèse est organisée comme suit :
– Le premier chapitre détaille les concepts physiologiques du nouveau-né prématuré et ses
complications, en particulier l’apnée-bradycardie. Le fondement d’électrocardiographie
et l’ECG du nouveau-né prématuré y sont détaillés.
– Le deuxième chapitre passe en revue les travaux qui ont déjà été proposés dans ce
domaine. Les faiblesses y sont relevées. Ce chapitre se clôture par la présentation de
la méthodologie proposée pour détecter les épisodes d’apnée-bradycardie.
– Le troisième chapitre montre comment l’analyse multivariée de l’ECG est exploitée, afin
de caractériser les épisodes d’apnée-bradycardie chez les prématurés. Pour l’extraction
des caractéristiques de l’ECG, il est nécessaire de procéder à la segmentation des
ondes qui forment l’ECG. Deux étapes sont proposées : la première, fondamentale,
est l’adaptation des algorithmes de détection des battements et de segmentation
développés pour l’adulte, au cas de l’ECG des nouveaux-nés prématurés. Un processus
d’optimisation multi-objectif à base d’algorithmes évolutionnaires est proposé pour
cette tâche. La seconde consiste en l’extraction des caractéristiques proprement dite.
Une fois la chaîne de segmentation adaptée aux ECG des prématurés, les séries
temporelles RR, d’amplitude des ondes R et de durée du complexe QRS sont extraites
de 32 nouveaux-nés prématurés présentant des fréquents épisodes d’apnée-bradycardie.
Ces séries sont analysées en quatre intervalles de temps : repos, avant, pendant et
après les épisodes d’apnée-bradycardie, pour caractériser ces événements.
– Le quatrième chapitre propose une courte revue bibliographique sur les stratégies
permettant de classer et de détecter précocement des dynamiques, les modèles Marko-
viens cachés et les modèles semi-Markoviens cachés sont alors introduits. Une méthode
de modélisation de dynamiques par MSMC, développée dans notre laboratoire, est
ensuite détaillée. Des améliorations sont proposées et constituent les principales
contributions de ce chapitre.
– Enfin, le cinquième chapitre détaille les résultats. L’approche est évaluée sur des
signaux simulés et est ensuite appliquée sur des signaux réels. Après une propo-
sition d’améliorations sur les observations dans l’étape d’apprentissage et de test,
4 Introduction
les résultats montrent que notre approche de détection des apnée-bradycardies par
modèles semi-Markovien cachés permet d’améliorer la détection de ces épisodes, tout
en présentant un temps de retard à la détection plus faible que les méthodes de
détection classiques utilisées aujourd’hui dans les USIN.
Une liste de publications associées à ce travail de thèse est présentée Annexe A.
Bibliographie 5
Bibliographie
Dumont, J. (2008). Fouille de dynamiques multivariées, application à des données temporelles
en cardiologie. PhD thesis, Université de Rennes 1.
Hernández, A. (2000). Fusion de signaux et de modèles pour la caractérisation d’arythmies
cardiaques. PhD thesis, Université de Rennes 1.
Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M.
(1999). Multisensor fusion for atrial and ventricular activity detection in coronary care
monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90.
Janvier, A., Khairy, M., Kokkotis, A., Cormier, C., Messmer, D., and Barrington, K. J.
(2004). Apnea is associated with neurodevelopmental impairment in very low birth weight
infants. J Perinatol, 24(12) :763–8.
Mabo, P., Pouillot, C., Kermarrec, A., Lelong, B., Lebreton, H., and Daubert, C. (1991).
Lack of physiological adaptation of the atrioventricular interval to heart rate in patients
chronically paced in the aair mode. Pacing Clin Electrophysiol, 14(12) :2133–42.
Martin, J., Hamilton, B., Sutton, P., Ventura, S., Menacker, F., Kirmeyer, S., and Mathews,
T. (2009). Births : Final data for 2006. Public Health Resources, page 65.
Mora, F. (1991). Monitoring intelligent en unité de soins intensifs pour coronariens :
connaissances et interfaces. PhD thesis, Université de Tours.
Passariello, G. (1991). Monitoring intelligent en unité de soins intensifs pour coronariens :
aspects traitement du signal. PhD thesis, Université de Tours.
Pichler, G., Urlesberger, B., and Müller, W. (2003). Impact of bradycardia on cerebral
oxygenation and cerebral blood volume during apnoea in preterm infants. Physiol Meas,
24(3) :671–80.
Schleich, J. M. (1993). La caractérisation d’arythmies en unité de soins intensifs pour
coronariens par approche de fusion de donnes multisources/multicapteurs. PhD thesis,
Université de Tours.
Siregar, P., Chahine, M., Lemoulec, F., and Le Beux, P. (1995). An interactive qualitative
model in cardiology. Comput Biomed Res, 28(6) :443–78.
Siregar, P., Coatrieux, J., and Le Beux, P. (1989). KISS : Knowledge based interactive
signal monitoring system. In AIM A10006 -1.2.A-F-R-890717.
Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de
Markov cachés. PhD thesis, Université de Rennes 1.
Urlesberger, B., Kaspirek, A., Pichler, G., and Müller, W. (1999). Apnoea of prematurity and
changes in cerebral oxygenation and cerebral blood volume. Neuropediatrics, 30(1) :29–33.
Zeitlin, J. (2009). Surveillance et évaluation de la santé périnatale en île-de-france à partir
des certificats de santé. Bulletin épidémiologique hebdomadaire, (44-45).
Chapitre 1
Présentation du contexte clinique
Ce premier chapitre a pour ambition de donner les bases physiologiques et techniques
nécessaires à la compréhension du problème clinique abordé : la détection des apnées-
bradycardies chez les nouveaux-nés prématurés. Les définitions liées à la prématurité et à
l’apnée néonatale sont présentées dans les deux premières sections. Une attention particulière
est portée sur les causes, conséquences et incidences d’une naissance prématurée et de
l’apnée-bradycardie du prématuré. Ensuite, les systèmes de monitoring utilisés dans les
unités de soins intensifs néonatals, leurs rôles et les principaux dispositifs de mesure sont
introduits dans la troisième section. Le déroulement de la détection d’un épisode d’apnée-
bradycardie est présenté ainsi que les délais observés dans le cycle de surveillance des
nouveaux-nés prématurés. Les généralités du système cardiovasculaire sont présentées dans
une quatrième section y compris la structure anatomique du cœur, l’activité électrique
cardiaque et le système spécialisé d’excitation-conduction du cœur. Enfin, les principes
de base d’électrocardiographie, ainsi que les particularités de l’électrocardiogramme du
prématuré sont exposés pour conclure le chapitre. Cette section est, bien entendu, capitale
pour la suite du mémoire puisqu’elle présente un état des lieux des pratiques cliniques,
qui seront utilisées comme référence, ainsi que les principales motivations de l’ensemble de
travaux proposés dans ce mémoire.
1.1 Le nouveau-né prématuré
Biologiquement, le fœtus requiert un certain nombre de semaines dans l’utérus maternel
pour que son organisme soit prêt à la vie extra-utérine. Si l’enfant naît avant d’avoir complété
ce cycle, il est confronté à un mode de fonctionnement auquel il n’est pas préparé et à un
environnement hostile avec les moyens dont il dispose. Une naissance prématurée est un risque
inhérent à la vie et elle est définie comme toute naissance qui survient avant 37 semaines
révolues d’aménorrhée, comptées à partir du premier jour des dernières règles. Plus de 12 %
7
8 Chapitre 1
(plus de 500000) des bébés nés aux États-Unis chaque année sont prématurés [Martin et al.,
2009] et près de 6 % (près de 55000) des naissances sont prématurées en France.
Suivant le terme de la naissance, quatre niveaux de prématurité existent actuellement
dans le contexte clinique :
– la faible prématurité, caractérisée par une naissance entre 33 et 37 semaines
d’aménorrhée (SA) ;
– la grande prématurité, entre 28 et 32 SA ;
– la très grande prématurité, de 25 à 27 SA ;
– l’extrême prématurité, de moins de 24 SA.
Les facteurs les plus déterminants dans la survie du nouveau-né prématuré sont sa
maturité, exprimée par l’âge gestationnel et son poids de naissance. L’enfant né à 35 semaines
reste, dans la majorité des cas, auprès de sa mère en maternité, alors que la survie de
l’enfant de 24 semaines reste encore et toujours très difficile [Bloch et al., 2003].
La prématurité est la principale cause de morbidité et de mortalité néonatale. Elle est
responsable d’environ 35 % des décès néonataux aux États-Unis [Mathews and MacDorman,
2008]. Le risque de décès est accru dans la première année de vie et la plupart se produisent
dans le premier mois de vie. Près de 30 % des prématurés nés à 23 SA survivent ; on passe à
50 % pour des prématurés nés à 24 SA, à 75 % pour des prématurés nés à 25 SA, et à plus
de 90 % pour des prématurés nés entre 27 et 28 SA. Il importe de souligner que ce taux de
mortalité a diminué depuis la mise en place d’unités de soins intensifs néonatals (USIN)
au début des années 1970. Ainsi, les avancées en médecine et en soins des prématurés ont
amélioré leurs chances de survie en mettant le seuil de viabilité à 22 SA mais sans réduire la
prédominance des naissances prématurées. En effet, le nombre d’enfants nés prématurément
est en augmentation en France et dans le monde. Par exemple, en Ile-de-France, une étude
récente a montré que le nombre de naissances prématurées a augmenté de 5,7 % à 6,3 %
entre 2002 et 2007 [Zeitlin, 2009].
Les causes de l’augmentation des naissances prématurées ne sont pas toutes connues,
même si l’on sait qu’environ 60 % des naissances prématurées sont provoqués pour des
raisons médicales et les cas restant sont spontanés. Un âge plus tardif (plus de 35 ans) ou
précoce (moins de 18 ans) et les grossesses multiples conduisent souvent à des accouchements
prématurés. Des problèmes obstétriques tels que le col ouvert ou le décollement du placenta ;
une maladie de la mère comme la listériose, le diabète ou l’hypertension, et un milieu social
défavorisé contribuent également aux naissances prématurées [Bloch et al., 2003; Rosenberg
et al., 2005; Goldenberg et al., 2008].
Plus l’enfant est prématuré, plus graves et fréquents sont les problèmes d’adaptation et
son traitement est d’autant plus complexe. Les problèmes couramment rencontrés sont :
– Respiratoires : syndrome de détresse respiratoire, maladie des membranes hyalines
et dysplasie bronchopulmonaire,
1.1. Le nouveau-né prématuré 9
– Neurologiques : apnée du prématuré, rétinopathie, infirmité motrice cérébrale et
hémorragie cérébrale intraventriculaire,
– Cardiovasculaires : persistance du canal artériel,
– Infectieux : septicémie, pneumonie et infection urinaire,
– Hématologiques : anémie, ictère et thrombopénie,
– Métaboliques : hypoglycémie, hypocalcémie et hypothermie,
– Digestifs : entérocolite nécrosante et résidus gastriques.
L’une des complications les plus importantes est l’apnée du prématuré. Celle-ci est
un thème d’investigation en vigueur et de nombreuses recherches ont été effectuées ces
dernières années pour essayer d’expliquer les causes, les conséquences et identifier les
meilleurs traitements [Poets et al., 1993; Perlman, 2001; Janvier et al., 2004; Finer et al.,
2006; Naulaers et al., 2007; Abu-Shaweesh and Martin, 2008; Poets, 2010; Zhao et al., 2011].
S’y ajoutent des recherches technologiques en vue de détecter efficacement les épisodes
d’apnées, tout en réduisant le nombre d’appareils mis au chevet du bébé [Pichardo et al.,
2003; Pravisani et al., 2003; Cruz et al., 2006; Beuchée et al., 2007; Portet et al., 2007; Belal
et al., 2011].
Certains problèmes liés à une naissance prématurée compromettent le pronostic à court
terme et d’autres pèsent lourdement sur le pronostic à moyen et long terme comme le
développement physique, psychologique ou comportemental. Les conséquences à long terme
de la prématurité ne deviennent évidentes que lorsque l’enfant est d’âge scolaire : à l’âge de
5 ans, 12 % des grands prématurés présentent des déficiences intellectuelles (de modérées à
sévères), 36 % présentent des troubles moteurs, sensoriels ou cognitifs (5 % sévères, 9 %
modérés et 25 % mineurs) et 34 % ont besoin des soins spéciaux [Larroque et al., 2008].
À l’âge adulte, les risques de déficience médicale et sociale semblent augmenter avec la
diminution de l’âge gestationnel à la naissance et, en absence de problèmes médicaux,
le niveau scolaire atteint, les revenus et le succès familial diminuent avec le degré de
prématurité [Moster et al., 2008].
Les prématurés sont pris en charge dans une USIN où ils sont maintenus dans une
couveuse ou incubateur, qui reproduit les conditions de développement fœtal en contrôlant
sa température, l’hygrométrie et en limitant l’exposition du nouveau-né à l’environnement
extérieur (virus, bactéries, . . . ). Plus la naissance est prématurée, plus longue est la
durée d’hospitalisation [Naulaers et al., 2007]. Un monitoring continu est effectué sur des
paramètres vitaux comme la température, la respiration, la fonction cardiaque, l’oxygénation
et l’activité cérébrale. Les thérapies peuvent inclure la nutrition par cathéters intraveineux,
la supplémentation d’oxygène, la ventilation mécanique et les médicaments. Cependant, les
USIN impliquent des coûts de santé importants et l’exposition du nouveau-né à différentes
sources de stress environnemental (alarmes des moniteurs dans l’USIN, bruit ambiant, . . . )
[Perlman, 2001]. De plus, diverses études montrent l’importance de l’intégration dans le
milieu familial pour le développement du nouveau-né. Généralement sont autorisés à quitter
10 Chapitre 1
l’hôpital les prématurés qui présentent une bonne thermorégulation, une alimentation orale
parfaite et qui ne présentent pas d’apnée-bradycardies dans une période de 3 à 7 jours [Baird,
2004]. La persistance d’événements cardio-respiratoires peuvent retarder la sortie de l’enfant
de l’hôpital [Eichenwald et al., 1997]. Dans ce cas, un monitoring cardio-respiratoire à
domicile, jusqu’à 43-44 semaines d’âge postnatal, peut offrir une alternative à un séjour
prolongé à l’hôpital [Darnall et al., 1997].
1.2 Les apnées-bradycardies du nouveau-né prématuré
L’apnée du prématuré se définit par une interruption prolongée du flux ventilatoire
pendant plus de 15 à 20 secondes et témoigne d’une instabilité de la régulation du rythme
respiratoire. Elle entraîne alors un ralentissement du rythme cardiaque (bradycardie), une
cyanose, témoin de l’hypoxémie, hypoxie et acidose [Bloch et al., 2003]. La bradycardie est
définie par une chute de la fréquence cardiaque (FC), au dessous de 100 battements par
minute (bpm) ou d’au moins 33 % par rapport à une valeur moyenne, pendant 4 secondes
ou plus [Poets et al., 1993]. La bradycardie se produit généralement dans les sept premières
secondes de l’apnée et atteint la FC minimale autour de 13 secondes [Di Fiore et al., 2001;
Dorostkar et al., 2005]. Les apnées doivent être différenciées de la respiration périodique
du prématuré, où des bouffées ventilatoires, d’amplitude progressivement croissante puis
décroissante, alternent avec de brèves interruptions qui ne présentent aucun caractère
pathologique [Laugel et al., 2000].
La majorité des grands prématurés ont des apnées-bradycardies durant les premières
semaines. Cependant, elles disparaissent progressivement au cours de la maturation et ont
généralement disparu après 40 SA. D’après HOFSTETTER et al. [Hofstetter et al., 2008],
98 % des prématurés de 25 à 28 SA présentent des épisodes d’apnée et 90 % des épisodes
de bradycardie ; à 36 SA, 67 % présentent toujours des épisodes d’apnée et seulement 17 %
ont des épisodes de bradycardie. Ces constats laissent suggérer par certains auteurs que le
système cardiovasculaire mûrit plus rapidement que le système respiratoire chez les très
grands prématurés [Hofstetter et al., 2008]. De plus, 83 % des épisodes de bradycardies
sont associés aux épisodes d’apnées [Poets et al., 1993]. Concernant la durée des apnées,
73 % ont une durée de 10-14 secondes, 17 % de 15-19 secondes et 10 % supérieure à
20 secondes [Hofstetter et al., 2008].
L’apnée peut être du type symptomatique si elle provient d’une pathologie (infection,
anémie, hypoxie, hypoglycémie, hypothermie, etc.) ou idiopathique si elle est uniquement
due à l’immaturité des mécanismes de contrôle de la respiration. En outre, basées sur la
présence ou l’absence de mouvements respiratoires, l’apnée est classée dans trois catégories :
– Centrale : se produisant en l’absence des mouvements respiratoires ;
– Obstructive : se produisant en présence des mouvements respiratoires ;
1.2. Les apnées-bradycardies du nouveau-né prématuré 11
– Mixte : contenant des éléments d’apnée centrale et obstructive.
L’observation clinique de l’enfant ou le monitoring cardio-respiratoire continu permettent
de détecter uniquement l’apnée centrale, contrairement à l’apnée obstructive, où seule la
détection des phénomènes associés, comme la bradycardie et l’hypoxémie, permet de
soupçonner sa survenue. Les apnées les plus longues et les plus fréquentes sont souvent
mixtes (de 50 à 70 % des cas), les apnées courtes (moins de dix secondes) sont surtout de
type central (de 10 à 25 % des cas) et les obstructives sont peu fréquentes (de 12 à 20 % des
cas) [Laugel et al., 2000]. Les apnées courtes sont considérées comme non pathologiques car
elles ne s’accompagnent habituellement pas de bradycardies ni d’hypoxémie. En revanche,
celles qui dépassent les 20 secondes sont considérées comme graves car elles sont suivies
par une chute de la saturation, puis de la bradycardie, résultant de l’hypoxémie et dont la
profondeur est proportionnelle à la durée de l’apnée.
Les apnées-bradycardies du prématuré sont des phénomènes qui reflètent une forme
d’inadaptation à la vie extra-utérine. Elles sont liées à l’immaturité physiologique de
plusieurs éléments du système respiratoire : centres neuronaux, chémorécepteurs centraux
et périphériques, afférences et efférénces réflexes. Elles peuvent aussi être provoquées ou
aggravées par l’association d’une infection, hypoxie ou pathologie intracrânienne. D’ailleurs,
elles sont plus fréquentes lorsque la température de l’environnement est plus élevée [Tourneux
et al., 2008] et lors de sommeils agités (majoritaire chez le prématuré).
Même s’il n’existe pas de risque accru de mort subite du nourrisson par la persistance
des apnées-bradycardies [Abu-Shaweesh and Martin, 2008], les apnées longues suivies
des bradycardies profondes (inférieure à 80 bpm) produisent une chute du débit sanguin
cérébrale, une baisse de la pression artérielle, une diminution de l’oxygénation cérébrale
et une dépression de l’amplitude de l’électroencéphalogramme (EEG) [Pichler et al., 2003;
Urlesberger et al., 1999]. De plus, elles entraînent des modifications de l’oxygénation
tissulaire et de l’équilibre hémodynamique. La répétition de ces épisodes est associée à un
moins bon devenir neuromoteur à trois ans [Janvier et al., 2004].
Les apnées-bradycardies demeurent un problème clinique préoccupant en néonatalogie,
qui impose de nombreux défis dans les stratégies thérapeutiques à suivre. Les thérapies
appropriées sont données en raison des mécanismes qui provoquent l’apparition de ces
épisodes. Une stimulation cutanée permet, dans la plupart des cas, la rupture des épisodes
d’apnée-bradycardie. Des médicaments (comme la théophylline ou la caféine), l’augmentation
d’oxygène à l’aide d’une canule nasale, la respiration assistée par pression positive continue
(CPAP, Continuous Positive Airway Pressure) et la ventilation mécanique peuvent aussi
être employés pour traiter l’apnée-bradycardie, selon sa sévérité. La répétition d’épisodes
d’apnée-bradycardie et les risques associés justifient le monitoring continu des fréquences
respiratoires et cardiaques et le traitement pharmacologique. Cette surveillance cardio-
respiratoire continue permet également d’évaluer l’efficacité de traitements mis en place et
de détecter une éventuelle récidive des apnées-bradycardies après l’arrêt des traitements.
12 Chapitre 1
1.3 Les systèmes de monitoring automatisés
La fragilité initiale des nouveaux-nés prématurés réclame, en plus d’une attention
médicale et l’emploi de techniques adéquates pour maintenir et réguler leurs fonctions de
bases, une surveillance continue dans une USIN pendant plusieurs semaines. Peu gênant
pour l’enfant, les dispositifs automatisés de surveillance permettent au personnel soignant,
d’un seul regard sur un écran, de vérifier les principales fonctions vitales du prématuré
(température, fréquences cardiaque et respiratoire, pression artérielle, saturation en oxygène
du sang, . . . ) et de prendre rapidement les mesures adaptées à tout instant : stimulation
manuelle pour arrêter une apnée-bradycardie, oxygénation, ventilation au masque, voire
intubation.
Le système de monitoring fait partie de la routine dans les USIN et a contribué
énormément à ce qu’un prématuré puisse survivre à un âge gestationnel de plus en plus
jeune. Même si ces dispositifs ont progressé énormément en qualité et en fiabilité au cours
de ces dernières années et représentent un progrès considérable en matière de sécurité, ils
ne remplacent pas l’observation directe sur l’enfant. En effet, ces dispositifs ne sont pas
dotés « d’intelligence » (interprétation d’une mesure parasitée qui déclenche une alarme) et
présentent des limites (l’alarme ne se déclenchera pas en apnée obstructive si le nourrisson
continue de faire l’effort respiratoire). Pour les alarmes, les moniteurs actuellement utilisables
pour la surveillance des nouveaux-nés dans les USIN utilisent uniquement des seuils fixes
basés sur des a priori, alors que des seuils adaptatifs et relatifs aux variables analysées ont
montré des améliorations sur la détection [Cruz et al., 2006; Beuchée et al., 2007].
1.3.1 L’équipement dans l’USIN
Dans une USIN, l’enfant est raccordé à un moniteur qui comprend plusieurs modules
d’acquisition des données physiologiques spécifiques et indépendants (i.e. température,
électrocardiogramme, respiration, pressions artérielle, saturation d’oxygène (SpO2), acidité
gastrique (pH), etc.). Ainsi, le système de monitoring est en général composé de différents
éléments (voir figure 1.1 et figure 1.2) :
– Un thermomètre qui mesure la température corporelle de l’enfant afin de la maintenir
autour de 36,8 oC. Ce thermomètre est appliqué sur la peau du nouveau-né et est
relié à un thermostat qui produit de l’air chaud dans la couveuse ;
– Trois petites électrodes adhésives collées sur le thorax, abdomen, bras ou jambe qui
mesurent la FC et la fréquence respiratoire. 100 et 180 bpm et 25 et 80 cycles par
minutes correspondent en général aux valeurs minimales et maximales pour déclencher
l’alarme ;
– Un brassard gonflé à intervalles réguliers et enroulé autour du bras ou de la jambe,
qui permet d’estimer la pression artérielle lorsque le brassard se dégonfle ;
1.3. Les systèmes de monitoring automatisés 13
– Un capteur fixé à la main ou au pied qui surveille la saturation en oxygène dans le
sang dont les seuils inférieur et supérieur d’alarme sont fixés autour de 8 % et 95 %
de la valeur nominale ;
– Un capteur chauffant attaché sur la peau qui détermine la pression du gaz carbo-
nique dissout dans le sang. Les limites inférieure et supérieure sont 35 mmHg et
55 mmHg [Dageville, 2007].
Canule nasale
Cathéter artériel
Cathéter central
périphérique
Figure 1.1 – Image d’un prématuré. On peut y voir certains dispositifs de mesure (Reportés
sur la figure).
Infirmière
Moniteur
Couveuse
Figure 1.2 – Système de monitoring utilisé dans l’USIN de Rennes.
De plus, des échantillons de sang peuvent être prélevés à partir d’une veine ou d’une
artère. L’imagerie par ultrasons ou par rayons X peut être utilisée pour examiner le cœur,
les poumons et d’autres organes internes. D’autres dispositifs de monitoring fournissent
des mesures complémentaires mais sont généralement limités à la recherche, telles que la
pneumographie d’impédance, la pléthysmographie d’inductance respiratoire et le dioxyde
de carbone de fin d’expiration [Atkinson and Fenton, 2009].
Après l’initialisation du système de monitoring, un processus itératif et continu d’ac-
quisition des données, d’estimation de l’état de l’enfant, de détection et de validation des
14 Chapitre 1
événements à risque et d’application des actions thérapeutiques est mis en place (voir
figure 1.3). Ainsi lorsqu’une apnée-bradycardie survient, un membre de l’équipe soignante
averti par les alarmes se dirige à la chambre appropriée, se lave les mains et applique une
stimulation tactile suffisamment douce pour ne pas être agressive pour l’enfant, telle que
frictionner la peau au niveau de la plante du pied ou du thorax, jusqu’à arrêter l’épisode
d’apnée-bradycardie. D’ailleurs, plusieurs alarmes peuvent s’activer au moment d’une apnée-
bradycardie : l’alarme de respiration si les mouvements respiratoires s’arrêtent, l’alarme
d’oxygénation si la quantité d’oxygène dans le sang diminue, ou l’alarme de FC en cas de
bradycardie.
Détection/
Validation
Diagnostic
Thérapie Acquisition
Figure 1.3 – Cycle de surveillance d’un prématuré dans une USIN
1.3.2 Délais dans le cycle de surveillance
Comme nous l’avons relevé, les apnées-bradycardies sont des événements très fréquents
qui peuvent mettre l’enfant en danger vital immédiat en absence d’une intervention rapide
et adaptée. Par conséquent, le temps entre le début et la fin de l’épisode joue un rôle
important. Ce temps peut être décomposé en plusieurs états de duré différentes : i) le
début de l’apnée, ii) le début de la bradycardie, iii) le temps nécessaire au diagnostic de
l’apnée-bradycardie par le système de monitoring et l’émission de l’alarme sonore, iv) le
temps pris par l’équipe soignante pour cesser son activité en cours (les soins d’un autre
enfant, se laver les mains afin d’éviter tout risque de contamination, se rendre au chevet du
bébé souffrant qui peut être situé dans une autre chambre), et enfin v) l’application de la
thérapie (stimulation tactile douce parmi d’autres) jusqu’à l’arrêt l’épisode.
Les délais actuellement observés en clinique restent longs pour les bébés en détresse. Plus
le temps d’intervention est long plus il est difficile d’arrêter l’épisode d’apnée-bradycardie
conduisant ainsi à des problèmes importants et à des conséquences qui peuvent être
irréversibles. Le retard d’intervention moyen, mesuré depuis l’activation de l’alarme jusqu’à
l’application de la thérapie a été estimé autour de 33 secondes, avec une durée moyenne
de stimulation tactile de 13 secondes pour obtenir la résolution de l’événement d’apnée-
bradycardie [Pichardo et al., 2003].
1.4. Généralités du système cardiovasculaire 15
Les bénéfices attendus d’une détection précoce de l’épisode d’apnée-bradycardie sont :
i) réduire l’ampleur et la durée de l’apnée-bradycardie, ii) diminuer le recours à des thérapies
compliquées telles que les manœuvres de réanimation ou d’intubation, iii) limiter les risques
et les complications associés à ces épisodes, et iv) raccourcir la durée d’hospitalisation dans
l’USIN et le coût lié.
1.4 Généralités du système cardiovasculaire
Le système cardiovasculaire est un système composé du cœur et des vaisseaux sanguins.
Ce système assure un flux de sang continu aux organes et aux tissus cellulaires du corps
pour leur fournir de l’oxygène et des nutriments, évacuer les produits métaboliques générés
pendant leur activité et transporter les hormones produites par les glandes endocrines vers
les récepteurs.
1.4.1 Le cœur et l’activité électrique cardiaque
Le cœur est un organe musculaire situé dans la cavité thoracique qui fonctionne comme
une pompe autonome, assurant la progression du sang à l’intérieur des vaisseaux. Il est
constitué de quatre cavités contractiles (voir figure 1.4), deux supérieures : les oreillettes
gauche et droite qui reçoivent le sang veineux et sont séparées par le septum interauriculaire
et deux cavités inférieures : les ventricules gauche et droit, divisés par le septum interventri-
culaire, qui assurent l’expulsion du sang respectivement dans la circulation pulmonaire et
dans la circulation systémique. Les ventricules sont séparés des oreillettes au moyen des
valves auriculo-ventriculaires, formées par des ailerons de tissu connectif. La valve tricuspide
sépare l’oreillette et le ventricule droit et la valve mitrale sépare l’oreillette gauche du
ventricule gauche. La fonction des valves auriculo-ventriculaires est d’éviter une réentrée du
sang aux oreillettes une fois qu’il est arrivé aux ventricules tandis que les valves sigmoïdes
(pulmonaire et aortique) évitent le retour du sang vers les ventricules, une fois expulsé vers
l’artère pulmonaire et vers l’aorte.
Les événements cardiaques qui se produisent depuis le début d’un battement du cœur
au début du prochain sont appelés le cycle cardiaque. Le cycle cardiaque est constitué d’une
période de relaxation appelé diastole, au cours de laquelle le cœur se remplit de sang, suivie
d’une période de contraction appelée systole.
La paroi du cœur est composée de muscles en trois couches :
1. Le péricarde est l’enveloppe extérieure du cœur et se compose d’une couche de
cellules épithéliales et de tissu conjonctif ;
16 Chapitre 1
Atrium droit
Atrium gauche
Veine cave
supérieure
Aorte
Artère pulmonaire
Veine
pulmonaire
Valve mitrale
Valve aortique
Ventricule
gauche
Ventricule droit
Veine cave
inférieure
Valve
tricuspide
Valve sigmoïde
Poumons
Figure 1.4 – Structure anatomique du cœur. Image d’après [Guyton and Hall, 1956].
2. Le myocarde est la couche intermédiaire et se compose majoritairement de fibres
contractiles ;
3. L’endocarde se trouve à l’intérieur et se compose d’une couche additionnelle de
cellules épithéliales et de tissu conjonctif.
Pour accomplir la fonction de pompe, le myocarde est constitué principalement de deux
types de tissus :
1. Le tissu de conduction ou tissu nodal : Ce tissu est constitué de cellules présentant
des propriétés spécialisées d’excitabilité, de conductibilité et d’automaticité. Ces
propriétés permettent la génération régulière et spontanée des impulsions électriques
et la conduction de ces impulsions d’une manière organisée au travers du myocarde,
afin d’assurer une contraction adéquate et un pompage efficace ;
2. Le tissu myocardique contractile : Ce type de tissu est largement majoritaire et
présente aussi des propriétés d’excitabilité et de conductibilité cellulaire. Cependant,
à la différence du tissu nodal, il est constitué de cellules pourvues d’un grand nombre
de fibres musculaires capables de se contracter.
Chaque cellule cardiaque (nodale ou myocardique) est entourée et remplie avec une
solution qui contient des ions. Les trois plus importants sont : le sodium (Na+), le potassium
(K+) et le calcium (Ca2+). Au repos, l’intérieur de la membrane cellulaire est chargé
négativement par rapport à l’extérieur, qui est pris comme référence. Cette différence
de potentiel, ou potentiel de repos cellulaire, est voisin de −85 mV pour les cellules
ventriculaires et dépend des concentrations ioniques dans les milieux intracellulaire et
extracellulaire. Les processus actifs et passifs de mouvements des ions au travers des canaux
ioniques, qui traversent la membrane cellulaire, et la propagation de ces ions, cellule à
cellule, constituent les fondements de l’activité électrique cellulaire. Quand une impulsion
1.4. Généralités du système cardiovasculaire 17
électrique d’amplitude suffisante arrive à une cellule excitable, l’intérieur de cette cellule
devient rapidement positif par rapport à l’extérieur. Ce processus est connu comme la
dépolarisation cellulaire. Le retour de la cellule cardiaque stimulée à son état de repos est
appelé repolarisation cellulaire. L’enregistrement des différences de potentiel mesurées
entre les milieux intracellulaire et extracellulaire, pendant les processus de dépolarisation
et repolarisation d’une cellule, correspond au potentiel d’action (PA). Ce dernier est
constitué de cinq phases (voir figure 1.5) :
1. La phase 0 ou de dépolarisation rapide : Après une excitation électrique au-
dessus du seuil d’activation (ou potentiel liminaire) de la cellule au repos, les potentiels
mesurés présentent une inversion rapide de polarité. Cette dépolarisation est générée
par l’ouverture transmembranaire qui permet l’entrée passive de Na+ vers le milieu
intracellulaire.
2. La phase 1 ou début de la repolarisation : Elle se caractérise par une repolari-
sation rapide et de courte durée, due à l’inactivation des canaux Na+ et l’effusion de
K+.
3. La phase 2 ou plateau : Pendant cette phase, la repolarisation continue mais à une
vitesse très lente. Le plateau est principalement dû à l’ouverture des canaux calciques,
qui permettent la diffusion lente et passive du Ca2+ vers l’intérieur de la cellule.
4. La phase 3 ou repolarisation rapide : Elle est caractérisée par une repolarisation
majeure, produite par la fermeture des canaux ioniques spécifiques, qui emmène la
cellule au potentiel de repos original. Il existe aussi, dans la dernière partie de la
phase 3, une activation des canaux de potassium, qui permet l’expulsion active de ces
ions, facilitant le retour à la négativité originale du potentiel transmembranaire.
5. La phase 4 : Elle correspond au potentiel de repos, où la cellule devient plus faci-
lement excitable. Les caractéristiques de cette phase dépendent du type de cellule
concernée.
Amplitude(mV)
Temps (s)
Potentiel
liminaire
-85
20
PRA PRR
0 0,4 0,8
PRA PRR
0
1
2
3
4
0
1
2
3
Figure 1.5 – Potentiel d’action des cellules cardiaques ventriculaires.
La propriété d’excitabilité cellulaire change pendant les différentes phases du PA. Pendant
18 Chapitre 1
les phases 0, 1, 2 et la première partie de la phase 3 (usuellement jusqu’aux alentours
de −50 mV), une stimulation externe sera incapable de provoquer un nouveau PA. Cette
période est appelée la période réfractaire absolue (PRA). La durée de la PRA dépend de
la fréquence à laquelle la cellule est stimulée, plus longue pour des fréquences cardiaques
plus basses et inversement pour des fréquences de stimulation plus importantes. La période
réfractaire relative (PRR) est associée à la dernière partie de la phase 3 (souvent pour des
potentiels inférieurs à −50 mV ). Pendant la PRR, une stimulation d’amplitude supérieure
à la normale (supra-stimulus) peut provoquer un nouveau PA qui présentera une durée de
la phase 0 rallongée en fonction de la prématurité de la stimulation. Ces deux processus
d’adaptation de la durée de la PRA et de la phase 0 correspondent aux propriétés d’hystérésis
de la fonction cellulaire.
1.4.2 Le système spécialisé d’excitation-conduction du cœur
Le système spécialisé d’excitation-conduction comprend : le nœud sinusal, les voies
spécialisées internodales, le nœud auriculo-ventriculaire (A-V), le faisceau de His, les branches
droite et gauche et les fibres de Purkinje (voir figure 1.6). Les cellules associées à chacune
de ces parties du système d’excitation-conduction présentent une pente de dépolarisation
diastolique lente (phase 4) différente. Dans le cas physiologique normal, cette pente est plus
prononcée sur le nœud sinusal. Ainsi, le nœud sinusal est appelé le pacemaker dominant du
cœur.
Nœud
sinusal
Voies spécialisées
internodales
Nœud A-V
Branche droite
Faisceau de His
Branche gauche
Fibres de Purkinje
Figure 1.6 – Système spécialisé de conduction du cœur. Image d’après [Guyton and Hall,
1956].
L’activité électrique normale du cœur suit la séquence d’activation suivante :
1. Le nœud sinusal : L’activité électrique est générée spontanément dans le nœud
sinusal. Il est situé dans la partie haute de la paroi intérieure de l’oreillette droite,
au niveau où débouche la veine cave supérieure. L’impulsion cardiaque initiée dans
1.5. L’électrocardiogramme du nouveau-né prématuré 19
le nœud sinusal est transmise aux deux oreillettes. Cette activation est facilitée au
moyen des voies spécialisées internodales qui relient le nœud sinusal au nœud A-V.
2. Le nœud auriculo-ventriculaire : Il est situé en bas de l’oreillette droite et est
constitué de cellules qui présentent une conduction électrique lente. L’activation
électrique qui arrive au nœud A-V est physiologiquement ralentie (approximativement
100 ms) avant d’arriver au faisceau de His. Cette propriété physiologique du nœud A-V
permet de protéger les ventricules d’un nombre excessif d’activations du nœud A-V et
d’activations auriculaires et concède aux oreillettes un temps de vidange plus grand,
ce qui optimise la contraction ventriculaire.
3. Le faisceau de His : Il est situé dans la partie haute du septum interventriculaire
et ses fibres traversent le tissu connectif (non excitable) qui séparent électriquement
les oreillettes des ventricules. Dans les cas normaux, le nœud A-V et le faisceau de
His constituent la seule voie de propagation de l’activité électrique cardiaque entre les
oreillettes et les ventricules. L’ensemble de ces deux structures est souvent appelé la
jonction auriculo-ventriculaire. Le faisceau de His comprend un tronc initial qui se
divise en deux branches, droite pour le ventricule droit et gauche pour le ventricule
gauche.
4. Les fibres de Purkinje : Les branches du Faisceau de His finissent dans un réseau
de fibres qui arrivent dans les parois ventriculaires. Les fibres de Purkinje terminent
en anastomoses avec les fibres myocardiques musculaires, facilitant leur excitation.
En l’absence de toute stimulation nerveuse ou humorale, le muscle cardiaque est capable
de générer sa propre activité électrique, ce qui lui permet de se contracter de manière
rythmique. Cette propriété constitue l’automatisme cardiaque, la fréquence cardiaque
intrinsèque chez l’homme se situant aux environs de 100 à 120 bpm.
1.5 L’électrocardiogramme du nouveau-né prématuré
La direction du flux et l’amplitude des courants électriques générées par les processus
de dépolarisation et de repolarisation de l’ensemble des cellules myocardiques peuvent
être détectées par des électrodes disposées sur la surface du thorax. Le signal électrique
obtenu est appelé un électrocardiogramme (ECG). L’analyse de cette activité électrique s’est
révélée comme une technique primordiale pour le diagnostic des maladies cardiovasculaires
et constitue un outil fondamental dans le monitoring cardiaque.
Les processus de dépolarisation et de repolarisation des structures myocardiques se
présentent dans l’ECG comme une séquence de déflections ou d’ondes superposées sur une
ligne de potentiel zéro, appelée ligne isoélectrique (voir figure 1.7). L’ordre et la morphologie
de ces ondes dépendent d’une part de la structure anatomique d’initiation de l’impulsion
20 Chapitre 1
électrique (i.e. le nœud sinusal, une structure jonctionelle, . . . ) et d’autre part de la séquence
de conduction au travers du myocarde.
P
Q
R
S
T
Segment
ST
Intervalle PR
Intervalle QT
Complexe
QRS
Intervalle RR
R
Segment
PR
Figure 1.7 – Ondes, intervalles et segments dans l’ECG.
En examinant un ECG, on reconnaît :
– La dépolarisation auriculaire : Représentée dans l’ECG par l’onde P. Cette onde
se caractérise au niveau spectral par une composante basse fréquence de faible énergie,
qui limite souvent son observation dans plusieurs dérivations ECG, spécialement dans
des conditions de bruit ;
– La repolarisation auriculaire : Représentée par l’onde Ta et de direction opposée
à celle de l’onde P. Généralement l’onde Ta n’est pas visible dans l’ECG car elle
coïncide avec le complexe QRS d’amplitude plus importante ;
– La dépolarisation ventriculaire : Représentée par la déflection de plus grande
amplitude de l’ECG. le complexe QRS est constituée de trois ondes consécutives : les
ondes Q, R et S, qui sont associées respectivement aux vecteurs moyens d’activations
septale, ventriculaire et basale ;
– La repolarisation ventriculaire : Reflétée par l’onde T.
Outre les formes d’ondes, un battement cardiaque est aussi caractérisé par plusieurs
segments et intervalles (voir figure 1.7) :
– L’intervalle RR : Il sépare les sommets de deux ondes R consécutives qui définissent
la FC instantanée ;
– L’intervalle PR : Il est mesuré entre le début de l’onde P et le début du complexe
QRS. Cet intervalle représente le temps de conduction de l’activité électrique des
oreillettes aux ventricules ;
– Le segment PR : C’est la période temporelle comprise entre la fin de l’onde P
1.5. L’électrocardiogramme du nouveau-né prématuré 21
et le début du complexe QRS. Il représente le temps de transmission du front de
dépolarisation par le nœud auriculo-ventriculaire ;
– Le segment ST : Il est compris entre la fin du complexe QRS (ou point J) et le
début de la phase ascendante de l’onde T. Ce segment correspond au temps pendant
lequel l’ensemble des cellules myocardiques sont dépolarisées (phase de plateau) et
donc, dans le cas normal, doit être isoélectrique ;
– L’intervalle QT : Il représente le temps entre le début du complexe QRS et la fin
de l’onde T. Il donne une indication de la longueur des phases de dépolarisation et de
repolarisation ventriculaire (longueur moyenne d’un PA ventriculaire).
L’intervalle QT varie en fonction de la FC. Par conséquent il est généralement corrigé
(QTc), le plus souvent en utilisant la formule de BAZETT [Bazett, 1920] :
QTc = QT/
√
RR (1.1)
Une naissance prématurée est un bouleversement pour le système cardiovasculaire. En
effet, chez le prématuré, les fermetures des shunts foramen ovale et du canal artériel peuvent
ne pas être complètes, laissant une communication entre les circuits droit et gauche du cœur.
Dans ce cas, une partie du débit sanguin dans l’aorte va retourner vers l’artère pulmonaire
et, pour assumer la surcharge de débit engendrée par cette fuite, une augmentation du débit
cardiaque doit se produire [Dageville, 2007]. Cependant, le myocarde du prématuré contient
moins d’éléments contractiles et est plus compliant que celui de l’adulte. La réponse aux
changements de précharge (mécanisme de Frank-Starling) reste donc fonctionnelle seulement
dans une plage étroite de pression de fin de diastole du ventricule gauche [Kirkpatrick et al.,
1976]. Pour satisfaire l’augmentation de la demande d’oxygène du corps du prématuré, la
FC est doublée, mais les dépenses cardiaques engendrées sont deux fois supérieures à celles
de l’adulte, dû en partie à cette contractilité réduite. Ainsi, la FC d’un prématuré est aux
alentours de 150 bpm.
Si l’électrocardiogramme de l’adulte a été très étudié tant sur l’analyse de la morphologie
des ondes (P, QRS, T), des intervalles temporels (PR, QT) que des durées (P, QRS, T), ce
qui a permis d’établir des normes avec l’âge, l’ECG du prématuré est moins connu.
La FC très élevée, le faible épaisseur de la cage thoracique et le processus de dévelop-
pement du système cardio-respiratoire et du myocarde chez les nouveaux-nés prématurés
produisent des ECG très différents de ceux des adultes normaux. Les différences les plus
remarquables sont :
– Les intervalles (RR, PR et QT) et les durées des ondes (P, T et complexe QRS) sont
plus courts ;
– La taille du ventricule droit est plus épaisse que le ventricule gauche chez les nouveaux-
nés tandis que le ventricule gauche est beaucoup plus épais chez les adultes. Cette
prédominance du ventricule droit s’exprime dans l’ECG par une déviation axiale du
22 Chapitre 1
complexe QRS vers la droite (entre 65o et 174o) [Costa et al., 1964; Park, 2007] ;
– Les ondes R sont de plus grande amplitude dans la dérivation frontale aVR (voltage
unipolaire augmentée sur le bras droit) et dans les dérivations précordiales V4 (5e
espace intercostal gauche, sur la ligne médioclaviculaire), V1 (4e
espace intercostal
droit, bord droit du sternum) et V2 (4e
espace intercostal gauche, bord gauche du
sternum).
– Les ondes S sont plus profondes dans la dérivation frontale I (mesure bipolaire entre
bras droit et bras gauche) et dans les dérivations précordiales V5 (même horizontale
que V4, ligne axillaire antérieure) et V6 (même horizontale que V4, ligne axillaire
moyenne).
– L’intervalle QTc est prolongé chez les prématurés [Costa et al., 1964]. Au cours des
6 premiers mois de vie, l’intervalle QTc est considéré comme normal à moins de
0,49 secondes. Après l’enfance, ce seuil est généralement de 0,44 secondes [Sharieff
and Rao, 2006].
– Les modifications de l’onde T sur l’ECG ont tendance à être non spécifiques et sont
souvent une source de controverses. On convient que les ondes T plates ou inversées
sont normales. En fait, les ondes T dans les dérivations V1 à V3 sont généralement
inversées après la première semaine de vie jusqu’à l’âge de 8 ans [Sharieff and Rao,
2006].
– L’onde P est de plus grande amplitude et plus pointue dans la dérivation frontale
II (mesure bipolaire entre bras droit et jambe gauche) et la dérivation précordiale
V1 [Costa et al., 1964].
La figure 1.8a présente un exemple d’ECG d’un adulte. Cet ECG correspond à une
personne sédentaire, sans complication cardiaque, de sexe masculin et âgé de 20 ans. Sa FC
est d’environ 82 bpm. De même, un exemple d’ECG d’un nouveau-né prématuré est montré
figure 1.8b. Cet ECG correspond à celui d’un bébé de sexe masculin, de 32 semaines d’âge
gestationnel et de 1575 grammes de poids. Il présentait plus d’une bradycardie par heure,
n’avait pas d’infection systémique, pas de traitement médicamentaux à la caféine et n’avait
pas besoin de respiration assistée par CPAP.
L’examen de ces deux ECG montre explicitement ces différences, qui sont quantifiées et
résumées dans le tableau 1.1 qui reporte les valeurs des ECG normaux pédiatriques observés
chez les nouveaux-nés, nourrissons, enfants et adolescents [Sharieff and Rao, 2006]. Ce
tableau présente la gamme des valeurs normales de la FC, l’axe du complexe QRS, la durée
de l’intervalle PR et la durée du complexe QRS. Des changements rapides se produisent
dans la première année de vie en raison de l’évolution de la circulation et de la physiologie
cardiaque. Après l’enfance, les changements ultérieurs sont moins rapides jusqu’à la fin de
l’adolescence et à l’âge adulte.
1.6. Conclusion 23
0 0.5 1 1.5 2 2.5 3
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Amplitude(mV)
Temps (s)
(a) ECG d’un adulte
0 0.5 1 1.5 2 2.5 3
−0.5
0
0.5
1
Amplitude(mV)
Temps (s)
(b) ECG d’un nouveau-né prématuré
Figure 1.8 – Exemples des ECG.
Tableau 1.1 – Valeurs normales de l’ECG pédiatrique par âge.
Âge
FC
(bpm)
Axe QRS
(degré)
Intervalle PR
(s)
Intervalle QRS
(s)
1re
semaine 90–160 60–180 0,08–0,15 0,03–0,08
1–3 semaines 100–180 45–160 0,08–0,15 0,03–0,08
1–2 mois 120–180 30–135 0,08–0,15 0,03–0,08
3–5 mois 105–185 0–135 0,08–0,15 0,03–0,08
6–11 mois 110–170 0–135 0,07–0,16 0,03–0,08
1–2 ans 90–165 0–110 0,08–0,16 0,03–0,08
3–4 ans 70–140 0–110 0,09–0,17 0,04–0,08
5–7 ans 65–140 0–110 0,09–0,17 0,04–0,08
8–11 ans 60–130 -15–110 0,09–0,17 0,04–0,09
12–15 ans 65–130 -15–110 0,09–0,18 0,04–0,09
>16 ans 50–120 -15–110 0,12–0,20 0,05–0,10
1.6 Conclusion
Les apnées-bradycardies représentent une préoccupation quotidienne pour les soignants
des unités des soins intensifs néonatals. Elles surviennent en effet très fréquemment chez les
nouveaux-nés prématurés, avec une fréquence d’autant plus élevée que l’âge gestationnel
est faible, témoignant d’une immaturité du système cardio-respiratoire. Elles mettent le
nouveau-né en danger vital car l’oxygénation et la perfusion tissulaire sont compromises
et imposent parfois des choix thérapeutiques difficiles. Elles sont susceptibles d’affecter le
développement à long terme, prolonger la période d’hospitalisation et imposent parfois une
télésurveillance à domicile.
24 Chapitre 1
L’impossibilité de ne prévenir ni les apnées-bradycardies, ni leurs conséquences, impose
une surveillance cardio-respiratoire rigoureuse et continue qui permet une intervention
rapide et adaptée à tout instant. La détection précoce de ces épisodes permettrait de réduire
les risques associés, de favoriser le développement des nouveaux-nés prématurés, d’améliorer
leur qualité de vie et de diminuer la durée d’hospitalisation. En effet, le traitement médical
de première intention consiste en la stimulation douce et manuelle du bébé. Même si cette
stimulation du nouveau-né au moment de l’apnée-bradycardie reste la méthode la plus
efficace, l’expérience montre que pour les bébés en détresse, les délais d’interventions restent
longs avec un retard d’intervention moyen (mesuré depuis l’activation de l’alarme jusqu’à
l’application de la thérapie) autour de 33 secondes, et un temps de stimulation manuelle de
13 secondes pour terminer l’épisode apnéique [Pichardo et al., 2003].
Pour répondre à ce problème, des systèmes de stimulation vibrotactile, aussi sûrs et
efficaces que la stimulation manuelle, ont été développés récemment [Pichardo et al., 2003;
Beuchée et al., 2007]. Cependant, les délais d’interventions sont finalement peu réduits
car le temps nécessaire au diagnostic de la bradycardie (10 secondes en moyenne après le
début de l’apnée) n’est pas pris en compte. Une manière de réduire encore ce temps est de
proposer un méthode de détection précoce des événements de bradycardie voire de prédire
l’apparition de la bradycardie. Ces objectifs constituent le thème principal de recherche de
ce mémoire de thèse et des solutions à base de modèles de Markov cachés seront proposées
au chapitres 4 et 5.
On a vu également que la compréhension des changements physiologiques cardiaques
associés à l’âge et à la maturation ainsi que la capacité d’interpréter l’ECG (durée des
segments et intervalles, déviations d’axes et morphologies des ondes) et sa relation avec
l’âge, sont des outils très importants au moment de différencier les ECG normaux des ECG
pathologiques. Le chapitre 3 permettra de répondre à cette problématique difficile.
Bibliographie 25
Bibliographie
Abu-Shaweesh, J. M. and Martin, R. J. (2008). Neonatal apnea : what’s new ? Pediatr
Pulmonol, 43(10) :937–44.
Atkinson, E. and Fenton, A. C. (2009). Management of apnoea and bradycardia in neonates.
Paediatrics and Child Health, 19(12) :550–554.
Baird, T. M. (2004). Clinical correlates, natural history and outcome of neonatal apnoea.
Semin Neonatol, 9(3) :205–11.
Bazett, H. (1920). An analysis of the time-relations of electrocardiograms. Heart, 7 :353–370.
Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu-
rity. Physiological Measurement, 32 :523.
Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique
automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré.
IRBM, 28(3-4) :124–130.
Bloch, H., Lequien, P., and Provasi, J. (2003). L’enfant prématuré. Armand Colin.
Costa, A. F., Faul, B. C., Ledbetter, M. K., and Oalmon, M. C. (1964). The electrocardio-
gram of the premature infant. American Heart Journal, 67(1) :4–14.
Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm
fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in
Cardiology, volume 33, pages 473–476.
Dageville, C. (2007). Le début de la vie d’un grand prématuré expliqué à ses parents. Erès.
Darnall, R. A., Kattwinkel, J., Nattie, C., and Robinson, M. (1997). Margin of safety for
discharge after apnea in preterm infants. Pediatrics, 100(5) :795–801.
Di Fiore, J. M., Arko, M. K., Miller, M. J., Krauss, A., Betkerur, A., Zadell, A., Kenney,
S. R., and Martin, R. J. (2001). Cardiorespiratory events in preterm infants referred for
apnea monitoring studies. Pediatrics, 108(6) :1304–8.
Dorostkar, P. C., Arko, M. K., Baird, T. M., Rodriguez, S., and Martin, R. J. (2005).
Asystole and severe bradycardia in preterm infants. Biol Neonate, 88(4) :299–305.
Eichenwald, E., Aina, A., and Stark, A. (1997). Apnea frequently persists beyond term
gestation in infants delivered at 24 to 28 weeks. Pediatrics, 100(3) :354.
Finer, N. N., Higgins, R., Kattwinkel, J., and Martin, R. J. (2006). Summary proceedings
from the apnea-of-prematurity group. Pediatrics, 117(3 Pt 2) :S47–51.
Goldenberg, R., Culhane, J., Iams, J., and Romero, R. (2008). Epidemiology and causes of
preterm birth. The Lancet, 371(9606) :75–84.
Guyton, A. and Hall, J. (1956). Textbook of medical physiology. Saunders, 11 edition.
Hofstetter, A. O., Legnevall, L., Herlenius, E., and Katz-Salamon, M. (2008). Cardiorespira-
tory development in extremely preterm infants : vulnerability to infection and persistence
of events beyond term-equivalent age. Acta Paediatr, 97(3) :285–92.
26 Bibliographie
Janvier, A., Khairy, M., Kokkotis, A., Cormier, C., Messmer, D., and Barrington, K. J.
(2004). Apnea is associated with neurodevelopmental impairment in very low birth weight
infants. J Perinatol, 24(12) :763–8.
Kirkpatrick, S. E., Pitlick, P. T., Naliboff, J., and Friedman, W. F. (1976). Frank-starling re-
lationship as an important determinant of fetal cardiac output. Am J Physiol, 231(2) :495–
500.
Larroque, B., Ancel, P.-Y., Marret, S., Marchand, L., André, M., Arnaud, C., Pierrat, V.,
Rozé, J.-C., Messer, J., Thiriez, G., Burguet, A., Picaud, J.-C., Bréart, G., Kaminski,
M., and group group group group, E. S. (2008). Neurodevelopmental disabilities and
special care of 5-year-old children born before 33 weeks of gestation (the epipage study) :
a longitudinal cohort study. Lancet, 371(9615) :813–20.
Laugel, V., Belladdale, J., Escande, B., Messer, J., and Simeoni, U. (2000). Apnées du
nouveau-né prématuré. Journal de Pédiatrie et de Puériculture, 13(2) :67–71.
Martin, J., Hamilton, B., Sutton, P., Ventura, S., Menacker, F., Kirmeyer, S., and Mathews,
T. (2009). Births : Final data for 2006. Public Health Resources, page 65.
Mathews, T. J. and MacDorman, M. F. (2008). Infant mortality statistics from the 2005
period linked birth/infant death data set. Natl Vital Stat Rep, 57(2) :1–32.
Moster, D., Lie, R. T., and Markestad, T. (2008). Long-term medical and social consequences
of preterm birth. N Engl J Med, 359(3) :262–73.
Naulaers, G., Daniels, H., Allegaert, K., Rayyan, M., Debeer, A., and Devlieger, H. (2007).
Cardiorespiratory events recorded on home monitors : the effect of prematurity on later
serious events. Acta Paediatr, 96(2) :195–8.
Park, M. (2007). Pediatric cardiology for practitioners.
Perlman, J. M. (2001). Neurobehavioral deficits in premature graduates of intensive care–
potential medical and neonatal environmental risk factors. Pediatrics, 108(6) :1339–48.
Pichardo, R., Adam, J. S., Rosow, E., Bronzino, J., and Eisenfeld, L. (2003). Vibrotactile
stimulation system to treat apnea of prematurity. Biomed Instrum Technol, 37(1) :34–40.
Pichler, G., Urlesberger, B., and Müller, W. (2003). Impact of bradycardia on cerebral
oxygenation and cerebral blood volume during apnoea in preterm infants. Physiol Meas,
24(3) :671–80.
Poets, C. (2010). Apnea of prematurity : What can observational studies tell us about
pathophysiology ? Sleep Medicine, 11(7) :701–707.
Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship
between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7.
Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia
boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc,
2007 :3288–91.
Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction
of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages
725–728. IEEE.
Bibliographie 27
Rosenberg, T., Garbers, S., Lipkind, H., and Chiasson, M. (2005). Maternal obesity and
diabetes as risk factors for adverse pregnancy outcomes : differences among 4 racial/ethnic
groups. American Journal of Public Health, 95(9) :1545.
Sharieff, G. Q. and Rao, S. O. (2006). The pediatric ecg. Emergency Medicine Clinics of
North America, 24(1) :195–208.
Tourneux, P., Cardot, V., Museux, N., Chardon, K., Léké, A., Telliez, F., Libert, J.-P.,
and Bach, V. (2008). Influence of thermal drive on central sleep apnea in the preterm
neonate. Sleep, 31(4) :549–56.
Urlesberger, B., Kaspirek, A., Pichler, G., and Müller, W. (1999). Apnoea of prematurity and
changes in cerebral oxygenation and cerebral blood volume. Neuropediatrics, 30(1) :29–33.
Zeitlin, J. (2009). Surveillance et évaluation de la santé périnatale en île-de-france à partir
des certificats de santé. Bulletin épidémiologique hebdomadaire, (44-45).
Zhao, J., Gonzalez, F., and Mu, D. (2011). Apnea of prematurity : from cause to treatment.
European journal of pediatrics, pages 1–9.
Chapitre 2
Position du problème et démarche
proposée
Comme mentionné dans le chapitre 1, les apnées-bradycardies sont un problème fré-
quemment observé chez les nouveaux-nés prématurés. Leur durée, profondeur et répétition
dépendent de plusieurs facteurs : l’âge gestationnel, le poids, la présence d’infection et
aussi le délai entre le début de l’épisode et l’intervention par l’équipe soignante. Une haute
fréquence de ces épisodes peut conduire à des complications à court terme et affecter le
développement neurologique de l’enfant. C’est pourquoi, dans les USIN, les dispositifs de
monitoring cardio-respiratoires sont utilisés pour surveiller l’enfant et détecter les épisodes
d’apnée-bradycardie le plus précocement possible.
Plusieurs définitions de bradycardie sont proposées dans la pratique clinique néonatale.
Ces définitions sont toutes basées sur l’analyse de la FC de l’enfant ou la série chronologique
RR 1, déterminée par le moniteur cardio-respiratoire. Généralement, deux paramètres sont
utilisés pour détecter les bradycardies : un seuil δ et un paramètre de durée τ. Ainsi,
une bradycardie est détectée lorsque l’intervalle RR dépasse δ pendant un temps τ. Ces
paramètres sont souvent modifiés empiriquement en se basant sur des connaissances a priori,
comme par exemple, les caractéristiques physiologiques de l’enfant (âge gestationnel, poids),
les caractéristiques pathologiques (présence ou absence d’infection), l’historique des épisodes
et l’évolution de l’enfant. Évidemment, la modification de ces paramètres a une conséquence
directe sur la quantité de fausses détections (spécificité élevée), le nombre d’épisodes non
détectés (sensibilité élevée) et le retard de la détection.
La difficulté du problème, comme mentionné dans la conclusion du précèdent chapitre,
réside dans le fait que ces temps de détection restent encore trop longs. L’objectif de
ce chapitre est de proposer une méthode de détection présentant un compromis optimal
1. La durée du cycle cardiaque en secondes est : RR = 60/FC, où FC est donnée en bpm.
29
30 Chapitre 2
entre sensibilité, spécificité et retard à la détection. Dans la première section, une analyse
des travaux antérieurs sur ce problème et, en particulier, ceux développés au sein de nos
laboratoires : GBBA (Université Simón Bolívar, Caracas) et LTSI (Université de Rennes 1,
Rennes) est présentée. Ensuite, la méthodologie proposée pour la détection d’événements et
pour l’évaluation clinique des traitements proposés dans ce travail est détaillée et justifiée.
Finalement, la méthodologie d’évaluation des performances de détection est exposée.
2.1 Travaux antérieurs
L’équipe SEPIA (Surveillance, Explication et Prévention des Ischémies et des Arythmies
cardiaques) du LTSI (Laboratoire de Traitement du Signal et de l’Image), travaille sur cette
problématique depuis plusieurs années. Les travaux de l’équipe se concentrent principalement
sur la modélisation du système nerveux autonome (SNA) et le monitoring des apnées-
bradycardies du prématuré. Plus spécifiquement, l’équipe s’intéresse à étudier :
– L’influence du SNA du nouveau-né prématuré sur la FC [Pladys et al., 2008; Beuchée,
2005]. Cette influence est déterminée en évaluant la variabilité de la fréquence cardiaque
(VFC) par deux types de mesure : l’une dans le domaine temporel et l’autre dans le
domaine spectral.
– Le système cardio-respiratoire de l’agneau fœtal ou nouveau-né [Gaillot et al., 2005;
Pladys et al., 2008; Patural et al., 2010] en collaboration avec le Québec (Sherbrooke et
Montréal). En effet, en menant des études sur l’agneau fœtal, les chercheurs ont réussi
à mieux comprendre le phénomène d’apnée-bradycardie des nouveaux-nés prématurés.
– La relation entre les apnées-bradycardies et les infections [Beuchée et al., 2009], ainsi
que sa relation avec les vaccins.
– Le traitement de la bradycardie par stimulation kinesthésique après la détection des
épisodes de bradycardies [Beuchée et al., 2007].
– La modélisation et la validation de modèles sur des données animales, pour mieux
comprendre les mécanismes complexes du couplage cardio-respiratoire du nouveau-
né [Le Rolle et al., 2008]. Une thèse est également en cours actuellement au laboratoire
sur ce sujet.
– L’EEG du prématuré de façon à quantifier les temps de sommeil calme, les effets des
médicaments.
– Un système de monitoring intégrant tous ces modules basés sur une architecture multi-
agents [Cruz, 2007; Hernández et al., 2007a,b]. La partie détection de bradycardie
est actuellement en évaluation dans le cadre d’un projet PHRC sur trois centres
hospitaliers : Rennes, Nantes et Tours.
Concernant la détection des apnées-bradycardies chez les nouveaux-nés prématurés,
de nombreuses études ont été réalisées et sont sommairement présentées dans la section
suivante.
2.1. Travaux antérieurs 31
2.1.1 Détection de bradycardies
En pratique, dans les USIN la détection des bradycardies est réalisée en se basant sur
les trois définitions suivantes :
1. Détection par seuil d’amplitude fixe : Ce principe consiste à détecter une bra-
dycardie tout simplement quand l’intervalle RR instantané (RR(k) où k est l’indice
temporel) dépasse un seuil prédéfini. Toutefois, plusieurs problèmes se posent avec
cette méthode. Tout d’abord, en augmentant le seuil, le nombre des fausses détections
sont diminuées au détriment du nombre d’épisodes de bradycardie non détectés et
vice-versa. Par conséquent, c’est une méthode peu robuste, en raison du compromis
entre les quantités des fausses détections et les quantités des non détections. De
plus, un simple faux négatif du détecteur des battements entraînera une détection
de bradycardie et il convient de souligner que les caractéristiques particulières de
l’ECG des prématurés produisent plusieurs faux négatifs et faux positifs dans l’étape
de détection des battements. En cas de détection, il existe d’emblée un retard, mesuré
entre le début de l’épisode et l’instant de croisement du seuil, comme l’illustre la
figure 2.1. Dans l’exemple montré dans cette figure, deux détections différentes de
l’épisode sont obtenues avec ce détecteur.
0 20 40 60 80 100 120
200
300
400
500
600
700
800
900
1000
Bradycardie
Détection 1
Seuil
RR(ms)
Temps (s)
Détection 2
Retard1
Retard 2
Figure 2.1 – Utilisation d’un seuil d’amplitude fixe pour détecter les bradycardies à partir
des séries RR. Dans cet exemple, la détection se fait lorsque RR(k) ≥ 600 ms, où k est
l’indice temporel.
2. Détection par seuil d’amplitude et durée fixe : Cette méthode est une amé-
lioration de la méthode précédente et consiste à détecter une bradycardie lorsque
l’intervalle RR(k) dépasse le seuil prédéfini pendant un temps également prédéfini,
ces deux paramètres étant aussi fixés sur des a priori. Cette méthode est la plus
utilisée par les systèmes de monitoring actuels et par les spécialistes. Elle permet de
prendre en compte uniquement les bradycardies significatives et profondes. D’ailleurs,
32 Chapitre 2
le paramètre temporel a plusieurs effets sur la détection. Un effet positif, puisqu’il
permet la diminution du nombre de fausses détections comme par exemple celles dues
aux faux négatifs du détecteur des battements, tout en gardant la même quantité de
non détection de la méthode précédente. Cependant, cette méthode induit des retards
plus importants à la détection. La figure 2.2 montre un exemple en utilisant cette
méthode et permet d’apprécier (figure 2.1) l’augmentation du retard de la détection.
0 20 40 60 80 100 120
200
300
400
500
600
700
800
900
1000
Bradycardie
Seuil
RR(ms)
Temps (s)
Détection
Retard
4 s
Figure 2.2 – Utilisation d’un seuil d’amplitude et durée fixes pour détecter les bradycardies
à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 600 ms
pendant 4 secondes, où k est l’indice temporel.
3. Détection par seuil d’amplitude relatif : Du fait que la durée du cycle cardiaque
dépend en grande partie de l’âge gestationnel et que cette durée évolue au cours du
temps, même pendant la journée, une nouvelle méthode a été proposée de manière
à prendre en compte des changements dans l’intervalle RR par rapport au seuil qui
change au cours du temps [Poets et al., 1993]. Dans cette méthode, une bradycardie
est détectée lorsque l’intervalle RR instantané (RR(k)) dépasse le seuil relatif : un
pourcentage de l’intervalle RR moyenné dans une fenêtre glissante (RRbase) et qui
précède l’intervalle RR actuel. De plus, un paramètre temporel est utilisé afin de
réduire la quantité de fausses détections. Le nombre des fausses détections et d’épisodes
manqués ainsi que le retard de la détection sont ajustés en changeant : le pourcentage
du seuil, la taille de la fenêtre pour déterminer la moyenne de l’intervalle RR et le
temps passé au-dessus du seuil. Cette méthode est plus avantageuse que les méthodes
précédentes. En effet, puisque le seuil est adaptatif, la détection est moins sensible aux
changements de rythme basal du prématuré. En revanche, la taille de la fenêtre pour
déterminer la moyenne modifie la dynamique du seuil (son taux de changement) et en
conséquence : i) en cas de changement rapide de l’intervalle RR, la détection peut être
réalisée plus précocement qu’en utilisant un seuil fixe mais, ii) en cas de changement
lent, la détection peut être réalisée plus tardivement ou l’épisode peut être manqué.
2.1. Travaux antérieurs 33
La figure 2.3 montre un exemple de détection d’un épisode de bradycardie en utilisant
un seuil relatif. Le seuil est fixé à 33 % de la moyenne des intervalles RR dans une
fenêtre glissante de 20 secondes qui précèdent l’intervalle RR actuel. La détection est
réalisée lorsque l’intervalle RR instantané dépasse le seuil relatif pendant au moins
4 secondes : RR(k) ≥ 1, 33RRbase. Les changements du seuil au cours du temps sont
clairement observés. On constate aussi que l’instant de détection est plus précoce que
ceux de l’exemple reporté sur la figure 2.2.
0 20 40 60 80 100 120
200
300
400
500
600
700
800
900
1000
1100
Temps (s)
Seuil
RR(ms)
Détection
4 s
Retard
Bradycardie
Figure 2.3 – Utilisation d’un seuil relatif pour détecter les bradycardies à partir des séries
RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 1, 33RRbase pendant 4 s,
où k est l’indice temporel et RRbase est la valeur moyenne de la série RR calculée dans une
fenêtre glissante de 20 secondes qui précède l’intervalle RR actuel.
La simplicité de ces trois détecteurs et la diminution du nombre de fausses alarmes
(spécificité élevée) ont permis de les voir acceptées facilement par les spécialistes. Cependant,
ces méthodes sont peu robustes. Plusieurs bradycardies ne sont pas détectées ou que
tardivement. Des améliorations ont donc été apportées.
Une première approche sur la prédiction à court terme de l’épisode de bradycardie
chez les nouveaux-nés prématurés, en utilisant la fouille de données, a été introduite par
PRAVISANI et al. [Pravisani et al., 2003]. Des mesures linéaires et non linéaires de la VFC
ont été extraites sur des périodes de 3 minutes précédant le début de la bradycardie jusqu’au
début de l’épisode, en utilisant une fenêtre glissante de 20 secondes et un recouvrement
de 15 secondes. Les mesures linéaires analysées correspondent à l’énergie dans les bandes
de basse fréquence (LF, Low Frequency) et haute fréquence (HF, High Frequency) et le
coefficient LF/HF [Task Force, 1996]. Les mesures non linéaires explorées correspondent
aux mesures de l’entropie approximée et l’entropie spectrale [Rezek and Roberts, 1998].
L’évolution de ces paramètres a été étudiée par analyse en composante principale (ACP) et
analyse hiérarchique ascendante [Ward, 1963]. Sur un ensemble de 13 épisodes appartenant
à 5 nouveaux-nés prématurés, ils ont constaté une diminution du coefficient LF/HF avant le
34 Chapitre 2
début de la bradycardie et une diminution simultanée du composant LF, montrant ainsi une
réduction de la modulation sympathique et une augmentation du tonus vagal. De plus, une
diminution progressive de l’entropie approximée et de l’entropie spectrale a été observée,
montrant ainsi que le système est de plus en plus régulier et prévisible avant la bradycardie.
En outre, des profils d’évolution de la VFC en utilisant l’ACP ont été mis en évidence pour
10 épisodes mais il n’a pas été possible d’identifier une description unique des classes. Ces
résultats montrent qu’aucun des paramètres étudiés étaient capables à lui seul de prédire
la survenue d’une bradycardie. Cependant il semblait que chaque variable contribue à la
prédiction de l’événement.
Une autre étude consiste à utiliser la théorie des changements abrupts de valeur
moyenne [Basseville and Nikiforov, 1993] pour proposer une nouvelle méthode de dé-
tection des bradycardies [Beuchée et al., 2007]. La détection de changement de valeur
moyenne est faite à partir du Cusum test [Basseville and Nikiforov, 1993] et consiste à
confronter deux hypothèses composites : présence et absence de bradycardie à chaque
instant. Cette méthode détecte avec une sensibilité de 96,84 %, une spécificité de 96,60 %
et un retard à la détection de -2,85 battements (autour de 1,2 secondes) par rapport aux
annotations manuelles d’un expert (test réalisé sur 1188 battements en bradycardie chez 40
nouveaux-nés prématurés) [Cruz et al., 2006]. La valeur négative du retard à la détection
obtenue s’explique par le fait que l’annotation a été définie à l’instant de croisement du
seuil de 600 ms et non pas au tout début de l’événement d’apnée-bradycardie.
Une autre méthode, basée sur la fusion optimale de détecteurs, a permis d’améliorer la
performance de la détection des bradycardies [Cruz et al., 2006]. Les algorithmes fusionnés
correspondent aux méthodes de seuil et de durée fixe (RR(k) ≥ 600 ms pendant 4 s ou plus),
de seuil relatif (RR(k) ≥ 1, 33RRbase pendant 4 s ou plus) et de détection par changements
abrupts. La fusion optimale consiste à effectuer la somme pondérée des résultats de chaque
détecteur. Les coefficients de pondération sont trouvés en utilisant un critère d’optimisation
proposé par [Chair and Varshney, 1986]. Cet algorithme a obtenu une sensibilité de 97,67 %,
une spécificité de 97,00 % et un retard à la détection de -2,22 battements (autour de 1
seconde) sur la même base de données.
D’autres algorithmes ont été proposés dans la littérature. L’un d’entre eux utilise la
méthode présentée par YU et al. [Yu et al., 2002] qui cherche un changement abrupt dans
la valeur moyenne dans une fenêtre mobile pour détecter la bradycardie [Portet et al.,
2007]. Une sensibilité de 90,20 %, une valeur prédictive positive de 61,30 % ainsi qu’un
temps de retard médian de 8 secondes et d’écart-type de 35,3 secondes pour le début
de la bradycardie, ont été reportés sur une base de données annotée. Une autre façon
de détecter les bradycardies est d’appliquer une technique d’apprentissage automatique
par arbre de décision. Dans [Portet et al., 2007], la méthode C4.5 [Quinlan, 1993] est
utilisée pour apprendre l’arbre de décision dont les attributs sont : la valeur brute, la
superficie, la pente linéaire, l’écart-type, l’amplitude minimale, l’amplitude maximale, la
2.1. Travaux antérieurs 35
dérivée maximale, la moyenne et la médiane de la série RR. Une fois appris, la sortie de
l’arbre de décision est lissée par une fenêtre Blackman de 31 échantillons et les début et fin
des épisodes sont cherchés par comparaison à un seuil. Une sensibilité de 78,20 %, une valeur
prédictive positive de 68,70 %, un temps de retard médian de 7 secondes et un écart-type
de 8,5 secondes, ont été obtenus.
Récemment, une approche fondée sur l’intervalle RR, la fréquence respiratoire et la SpO2,
extraites de 2426 heures d’enregistrement de 54 nouveaux-nés (44±7 heures) a été proposée
pour la détection d’apnée du prématuré sur des segments préalablement choisis [Belal
et al., 2011]. Trois approches, combinant détection et classification, ont été reportées et
comparées. Les auteurs montrent alors qu’en exploitant les dérivées de l’intervalle RR, de la
fréquence respiratoire et de la SpO2, initialement pré-traitées (un filtre médian et un filtre
passe-bas sont appliqués sur les données) et une règle de fusion à base d’un ET logique,
des performances très satisfaisantes (100 % de sensibilité et 96,19 % de spécificité) sont
enregistrées sur une base de données pré-sélectionnées. Les résultats reportés ici, établis en
parallèle à l’étude reportée dans ce mémoire de thèse, sont donc intéressants, confirment le
bien-fondé de notre démarche mais appellent à quelques remarques :
– la classification de l’évènement « présence » ou « absence » d’apnée du prématuré
a été déterminée sur des segments prédéfinis et non pas en proposant d’effectuer la
détection en ligne,
– le temps de retard de la détection n’a pas été évalué, et comme précisé auparavant,
est crucial pour notre étude,
– la fréquence d’échantillonnage de 1 Hz apparaît à nos yeux trop basse pour l’analyse
de la série RR, car il a été montré des composantes spectrales liées à la régulation du
SNA dans les bandes LF de 0,02 à 0,2 Hz et HF de 0,2 à 1,5 Hz [Chatow et al., 1995;
Beuchée, 2005],
– une fusion de type ET augmente la sensibilité en détriment de la spécificité alors
que des études antérieures ont montré que la fusion optimale pourrait être plus
pertinente [Cruz et al., 2006].
2.1.2 Système multi-agents de monitoring appliqué aux soins néonatals
La thèse de CRUZ [Cruz, 2007], développée entre le Groupe de Bio-ingénierie et
Biophysique appliquée (GBBA, en espagnol Grupo de Bioingeniería y Biofísica Aplicada) à
Caracas au Vénézuela et le LTSI à Rennes, a proposé un système de monitoring intelligent
(INTEM) basé sur une architecture de systèmes multi-agents. Ce système est composé de
plusieurs agents intelligents qui interagissent selon certaines relations et avec un objectif.
Ainsi, dans ces travaux, quatre agents sont utilisés pour accomplir les tâches classiques du
processus de monitoring : acquisition, traitement, diagnostic et thérapie. Un agent différent
est associé à chacune de ces étapes.
36 Chapitre 2
Le système de monitoring est composé de plusieurs dispositifs (c.f. figure 2.4) :
– Un dispositif d’acquisition de données qui acquiert un ECG de deux voies à une
fréquence d’échantillonnage de 1 kHz. Ce dispositif est lié par signal radio-fréquence
au dispositif qui délivre la stimulation et à celui qui capte la lumière du moniteur. De
plus, il est aussi connecté par bluetooth à la station de monitoring.
– Un dispositif qui délivre une stimulation vibrotactile au bébé. Il est composé d’un
vibreur, tel que recommandé par [Lovell et al., 1999], développé par la société Audio-
logical Engineering. Le vibreur est placé sur l’abdomen du prématuré et est activé
chaque fois qu’une bradycardie survient. L’intensité de la stimulation vibrotactile
peut être réglée manuellement, à l’aide des boutons, ou à partir de la station de
monitoring.
– Un ordinateur portable qui sert de station de monitoring et qui permet d’enregistrer
l’ECG du prématuré et d’appliquer les traitements du signal en temps-réel. Sur l’écran
sont affichés l’ECG, un battement moyen, la courbe de VFC, la FC, etc.
– Un dispositif qui capte la lumière du moniteur installé dans l’USIN. Il est composé
d’une diode photosensible collée devant l’écran du moniteur et qui capte la lumière
lorsque ce moniteur détecte une apnée-bradycardie. La fonction de ce dispositif est de
comparer les instants de détection des bradycardies du moniteur installé dans l’USIN
et le système de monitoring développé au LTSI.
Dispositif
d'acquisition d'ECG
Électrodes
Dispositif qui délivre
la stimulation vibrotactile
Vibreur
Station de monitorage
Antenne
Figure 2.4 – Dispositifs utilisés dans le système INTEM.
Cette station de monitoring accueille l’ensemble d’algorithmes qui ont été développés, no-
tamment des approches de fusion de données pour la détection multivoie des QRS [Hernández
et al., 1999] et pour la détection d’épisodes d’apnée-bradycardies. L’architecture proposée
et les méthodes d’activation du vibreur ont fait l’objet d’un dépôt de brevet [Hernández
et al., 2007a,b].
2.2. Méthodologie proposée 37
2.1.3 Conclusion
L’analyse de ce bref état de l’art montre qu’un certain nombre de résultats ont été obtenus
au laboratoire dans cette thématique et que des avancées significatives ont été obtenues
ces dernières années pour la détection robuste et précoce des épisodes d’apnée-bradycardie.
Cependant, des améliorations peuvent encore être apportées.
1. Ces algorithmes ont tous été utilisés pour analyser l’intervalle RR alors que d’autres
variables peuvent apporter de l’information supplémentaire (amplitude de l’onde R,
intervalle QT).
2. Les seuils de décision sont souvent ajustés manuellement et empiriquement basés sur
des a priori. Il serait souhaitable d’optimiser automatiquement les paramètres de ces
méthodes de traitement.
3. Comme il a été montré, quelle que soit la méthode utilisée pour détecter les brady-
cardies, l’étude de l’évolution des indicateurs se limite à leur tracé en fonction du
temps et la décision finale (bradycardie présente ou absente) est simplement basée
sur des fonctions de décision à simple seuil. Pour améliorer la détection, il apparaît
donc important de prendre en considération l’évolution temporelle des indicateurs
extraits et si possible leur évolution conjointe. L’objectif est donc de proposer une
méthode qui exploite l’évolution temporelle de séries multivariées, afin d’améliorer la
performance de la détection : sensibilité, spécificité et retard de la détection.
2.2 Méthodologie proposée
Tel qu’évoqué dans la conclusion précédente, l’objectif est l’analyse de la dynamique
des séries temporelles extraites de l’ECG pour détecter les épisodes d’apnée-bradycardie
chez les nouveaux-nés prématurés. Ces séries peuvent être composées d’une seule variable
(univariée) ou de plusieurs variables (multivariées).
La figure 2.5 résume les principales étapes du travail réalisé. Les paragraphes suivants
détaillent les blocs : base de données, extraction de caractéristiques et prise de décision.
2.2.1 Base de données
En premier lieu, l’ECG des nouveaux-nés prématurés doit être acquis. Dans cette
étude, les données sont obtenues à partir d’une cohorte de 32 nouveaux-nés prématurés
hospitalisés dans les USIN à l’hôpital universitaire de Rennes entre juin 2003 et juin 2004.
Ces enfants présentaient plus d’une bradycardie par heure. Les critères d’exclusion étaient
38 Chapitre 2
ECG
Personnel soignant
Intervention
Extraction de
caractéristiques
Base de données
Prise de
décision
Figure 2.5 – Étapes du processus de détection des apnées-bradycardies proposées dans cette
thèse.
les suivants : médicaments connus pour influencer le SNA à l’exception de la caféine,
l’assistance respiratoire intra-trachéale, une lésion intra-cérébrale ou une malformation.
Au moment de l’enregistrement, le poids de naissance médian était de 1235 g (1065, 1360),
l’âge médian était de 31,2 semaines (29,7, 31,9) et l’âge post-natal était de 12,1 jours (6,7,
19,5). Six enfants présentaient une infection systémique, seize avaient une aide respiratoire
de pression nasale avec ventilation spontanée en pression positive continue et dix-sept
étaient traités avec de la caféine.
Tous les enregistrements ont été acquis en utilisant le système Powerlab/Graphique v4.2
installé sur un ordinateur Pentium III. Ils se composaient d’un ECG acquis sur une voie
pendant 1 heure à une fréquence d’échantillonnage de 400 Hz. Les enfants ont été placés
dans des couveuses, positionnés sur le côté, enroulés dans un cocon. La lumière a été éteinte,
les volets extérieurs baissés et la porte fermée afin d’obtenir une pièce calme et sans lumière
vive [Beuchée, 2005].
2.2.2 Extraction de caractéristiques
L’objectif de cette étape est d’extraire les caractéristiques les plus importantes de l’ECG
et de générer les séries temporelles utiles pour la détection des épisodes de bradycardie. Elle
comporte plusieurs étapes, représentées dans la figure 2.6 :
– Le pré-traitement de l’ECG : Cette étape de débruitage du signal ECG est
composé d’un ensemble de filtres.
– La détection des battements : Elle permet de repérer les battements cardiaques.
Nous avons repris une version améliorée de l’algorithme de PAN et TOMPKINS [Pan
and Tompkins, 1985; Cruz, 2007].
– La segmentation des battements : Elle permet d’identifier les instants de début
2.2. Méthodologie proposée 39
et de fin des ondes qui composent l’ECG. Nous avons utilisé l’algorithme développé
dans notre laboratoire [Dumont, 2008] et qui emploie une approche temps-échelles
par décomposition en ondelettes du signal ECG issue de la littérature [Martínez et al.,
2004; Li et al., 1995].
– L’optimisation des méthodes par algorithmes évolutionnaires : Les méthodes
reportées dans la littérature de détection et de segmentation des battements ne sont pas
adaptées à l’ECG des prématurés. Une procédure d’optimisation des paramètres, basée
sur des algorithmes évolutionnaires, permettra de résoudre ce problème multi-objectif
et d’ajuster automatiquement les paramètres de ces méthodes.
– L’extraction des séries temporelles : Une fois les méthodes de la chaîne de seg-
mentation d’ECG adaptées aux ECG des prématurés, la prochaine étape comporte
l’extraction des indicateurs les plus pertinents pour caractériser les épisodes d’apnée-
bradycardie. Cette information correspond aux indicateurs utilisés par les cardiologues
pour caractériser le cycle cardiaque comme les intervalles et amplitudes des ondes
présentées (voir figure 1.7), ainsi que le rythme cardiaque. Cette étape permet de
réduire la dimension des données et de conserver une information interprétable par les
spécialistes. L’automatisation de cette étape permet un gain de temps ainsi qu’une
meilleure répétabilité des analyses effectuées. Les séries temporelles retenues corres-
pondent aux variables suivantes : intervalle RR, amplitudes de l’onde R et durées des
QRS.
Pré-traitement
de l'ECG
Segmentation
des battements
Détection
des battements
Oui
NoOptimisation des
méthodes par
algorithmes
évolutionnaires
Paramètres
des méthodes
optimisés ?
Extractions des
séries temporelles
Figure 2.6 – Étape d’extraction des caractéristiques de la démarche proposée.
2.2.3 Prise de décision
L’objectif est ici d’émettre une décision sur la présence ou absence d’un épisode d’apnée-
bradycardie, en exploitant les dynamiques des variables étudiées et non seulement leurs
valeurs instantanées. Nous avons retenu une approche à base de modèles semi-Markoviens
cachés (MSMC). Ce choix sera justifié plus en détail au chapitre 4 mais il nous apparaissaient
évident que les MSMC étaient adaptés à la fois pour traiter la dynamique, prendre en
compte plusieurs variables simultanément, et proposer un processus de décision entièrement
basé sur la vraisemblance des modèles. Cette étape comporte les phases montrées figure 2.7 :
– L’apprentissage des modèles MSMC : une fois les séries temporelles obtenues,
40 Chapitre 2
des modèles qui caractérisent la dynamique des variables dans chaque état physiopa-
thologique sont créés. Un pré-traitement des séries est d’abord nécessaire afin de les
rendre utilisables dans le contexte des MSMC. Ce pré-traitement consiste à unifor-
miser la dynamique qui caractérise les épisodes de bradycardies tout en minimisant
la variabilité intra-individus et inter-individus. Ainsi, l’information présente dans
l’évolution temporelle des indicateurs est mise en évidence. Des MSMC sont créés
et appris à partir des ensembles des séries multivariées. Cet apprentissage implique
plusieurs sous-étapes, telles que le choix des séries à utiliser, le nombre d’états par
modèle, l’initialisation des modèles, l’ajustement des paramètres afin de maximiser
une vraisemblance, la taille des séries, etc. Cette étape est très importante car de
petits changements dans une de ces sous-étapes impliquent des modifications impor-
tantes dans les résultats obtenus, comme par exemple une mauvaise initialisation des
paramètres du MSMC.
– Le test de vraisemblance : une fois que les modèles sont créés, l’appartenance au
modèle de nouvelles séries (vraisemblance) est déterminée.
– La détection de la bradycardie : un rapport de vraisemblance au cours du temps
est utilisé pour détecter les épisodes d’apnée-bradycardie. Une bradycardie sera
détectée lorsque la vraisemblance d’un modèle est supérieure aux autres modèles
testés. Cependant, afin d’éviter des fausses alarmes, un seuil sur les différences entre
les log-vraisemblances est ajouté. Les détecteurs univariées et multivariées peuvent
être utilisés, afin de prendre en compte la dynamique des indicateurs de manière
individuelle (univariée) ou de manière conjointe (multivariée).
– L’alarme : finalement, une fois l’épisode d’apnée-bradycardie détecté, une alarme va
alerter l’équipe soignante qui se dirigera ensuite dans la chambre du prématuré afin
d’appliquer la thérapie nécessaire.
Test de
vraisemblance
Apprentissage des
modèles MSMC
Détection de
la bradycardie
Alarme
Figure 2.7 – Étape de prise de décision de la démarche proposée.
2.3 Méthodologie d’évaluation des performances de détection
Dans le domaine du traitement du signal et du monitoring, la performance d’un détecteur
est déterminée principalement par trois critères :
1. La sensibilité (SEN) : qui est la capacité à détecter les évènements d’intérêt lorsque
ces épisodes sont présents.
2.3. Méthodologie d’évaluation des performances de détection 41
2. La spécificité (SPC) : qui représente la capacité à refuser les évènements qui ne sont
pas d’intérêt.
3. Le temps de retard à la détection (TRD) : qui exprime le temps écoulé entre le
début de l’évènement d’intérêt et l’instant de la détection.
Ainsi, dans notre cas spécifique de détection des bradycardies, la SEN mesure les
évènements de bradycardie correctement détectés tandis que la SPC prend en compte les
évènements sans bradycardie correctement refusés. Le temps de TRD est un critère très
important car il est souhaitable de détecter les épisodes de bradycardies le plus rapidement
possible.
La SEN est exprimée par
SEN =
VP
VP + FN
(2.1)
tandis que la SPC est donnée par
SPC =
VN
VN + FP
(2.2)
où
– VP (nombre de Vrais Positifs) est le nombre d’évènements de bradycardies détectées
correctement par le détecteur,
– VN (nombre de Vrais Négatifs) est le nombre d’évènements estimés correctement
comme non bradycardies par le détecteur,
– FP (nombre de Faux Positifs) représente le nombre d’évènements de bradycardies
détectées incorrectement par le détecteur, ce paramètre est équivalent au nombre de
fausses alarmes,
– FN (nombre de Faux Négatifs) traduit le nombre d’évènements de bradycardie non
détectées par le détecteur, ce paramètre est équivalent au nombre de non détections.
La probabilité de détection (Pd) ou taux de vrai positif (TVP) est égale à la SEN. La
probabilité de fausse alarme (Pfa) ou taux de faux positif (TFP) est égale à
TFP =
FP
VN + FP
= 1 − SPC (2.3)
La valeur prédictive positive (VPP), différent à la SEN, est la proportion d’évènements
de bradycardie correctement détectés et est définie par
VPP =
VP
VP + FP
(2.4)
Pour notre application, un VP se produit lorsqu’une détection est entourée d’une
annotation dans une fenêtre de taille wV P secondes, centrée sur l’annotation donnée. La
figure 2.8 montre un exemple d’une série RR avec un épisode de bradycardie. L’annotation
42 Chapitre 2
de l’épisode par un spécialiste et la détection fournie par le détecteur y sont reportés. Les
cas détectés et annotés comme bradycardie sont mis à un (1) et à zéro (0) sinon. On observe
comment les indicateurs VP, VN, FP et FN sont déterminés à l’aide la fenêtre de recherche
wV P .
0 20 40 60 80 100 120 140 160 180
400
500
600
700
800
900
1000
RR(ms)
Temps (s)
Début de la
bradycardie
Fin de la
bradycardie
0 20 40 60 80 100 120 140 160 180
Annotation
Temps (s)
0
1
0 20 40 60 80 100 120 140 160 180
Détection
Temps (s)
0
1
FP TPTN FNTN TN
TRD
. . .
Figure 2.8 – Méthodologie d’évaluation des performances de détection. La fenêtre wV P est
centrée dans l’échantillon de détection analysé.
2.3.1 Courbe COR
La tâche principale d’un bon détecteur est de maximiser la sensibilité ainsi que la
spécificité tout en réduisant le retard à la détection. Pour accomplir cette tâche, les
paramètres du détecteur (γ) sont souvent optimisés en utilisant des courbes caractéristiques
opérationnelles du récepteur (COR). Ces courbes décrivent la TVP vs. TFP (ou Pd vs. Pfa)
où chaque point de la courbe est obtenu en utilisant une valeur spécifique d’un paramètre
du détecteur. C’est donc la modification d’un paramètre du détecteur qui permettra de
construire une courbe COR. Par conséquent, il existera un réseau de courbes pour un
2.3. Méthodologie d’évaluation des performances de détection 43
ensemble de paramètres. Il s’agit donc d’un problème multi-paramètre à optimiser qui n’est
pas simple à résoudre. La solution consiste souvent à modifier paramètre par paramètre
et conserver pour chaque courbe COR associée à un paramètre, le paramètre optimal
maximisant les performances.
Une détection optimale donnerait un point dans le coin supérieur gauche de la courbe
COR avec comme coordonnées (0,1), ce qui représente une sensibilité de 100 % (pas de
FN) et une spécificité de 100 % (pas de FP). Le point (0,1) est aussi appelé une détection
parfaite. Une détection aléatoire, telle qu’une décision par pile ou face, donnerait un point
au long de la ligne diagonale (ligne de non-discrimination) de la courbe. La figure 2.9
montre trois exemples de courbes COR. Chaque point de la courbe COR correspond à
un paramètre spécifique. On y a reporté le point de détection parfaite (0,1) et la ligne de
non-discrimination.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
TFP
TVP
Détection parfaite
Figure 2.9 – Exemples de courbes COR. Le cercle représente le point de détection parfaite,
les étoiles représentent une détection avec une TFP = 0, 05 (5 %) et les carrés correspondent
à la distance la plus courte au point (0,1).
Le paramètre optimal du détecteur est choisi en maximisant la probabilité de détection
et en diminuant la quantité de fausses alarmes. Trois critères sont souvent employés pour
cela :
1. Un critère consiste à maximiser l’aire sous la courbe COR, cependant, dans notre
cas, parfois la courbe ne couvre pas la totalité de la plage TFP = {0, . . . , 1}, ce qui
empêche une comparaison entre différents courbes COR.
2. Un autre critère consiste à fixer un point spécifique à atteindre dans la courbe, comme
par exemple une TFP = 0, 02 (2 %) et à chercher la valeur la plus grande de TVP
parmie les courbes COR analysées.
44 Chapitre 2
3. Un dernier critère consiste à minimiser la distance entre la courbe COR et la détection
parfaite, correspondant aux valeurs TVP = 1 et TFP = 0.
Dans l’exemple montré figure 2.9, en considérant les trois critères exposés, le meilleur
détecteur est celui associé à :
1. la courbe COR pointillée si on considère l’aire sous la courbe COR
2. la courbe COR pointillée si on fixe une TFP = 0, 05 (5 %)
3. la courbe COR continue si on considère la distance la plus courte à la détection
parfaite.
Nous avons choisi le dernier critère exposé car il permet de choisir le paramètre optimal
γ sans a priori. La distance la plus courte à la détection parfaite (DCDP) est donnée par
l’expression :
DCDP(γ) = min
γ
(1 − TVP(γ))2 + TFP(γ)2 (2.5)
2.4 Conclusion
Dans ce chapitre, les méthodes de détection d’épisodes d’apnée-bradycardie utilisées
dans l’USIN ainsi que les travaux qui ont déjà été proposés dans ce domaine, ont été
révisés. Parmi les faiblesses relevées, on souligne que les systèmes de monitoring actuels
ne permettent pas d’analyser la dynamique des variables en cours d’acquisition et que la
plupart des méthodes développées sont basées sur une analyse univariée (série temporelle
RR). Cependant, une analyse de la dynamique des caractéristiques extraites de l’ECG
semble appropriée pour améliorer la performance de détection.
Une méthodologie pour la détection précoce d’épisodes d’apnée-bradycardie a été
proposée dans ce chapitre, elle s’appuie sur la fouille de données multidimensionnelles.
Elle est fondée sur quatre étapes principales : l’acquisition des données, l’extraction de
caractéristiques (présentée au chapitre 3), la prise de décision pour l’analyse des dynamiques
(présentée au chapitre 4) et l’alerte du personnel soignant en cas de détection d’apnée-
bradycardie.
Les performances de détection seront évaluées dans ce travail en analysant trois critères :
la sensibilité (capacité à détecter les évènements), la spécificité (capacité à refuser les
évènements) et le retard à la détection (temps écoulé entre le début de l’évènement et sa
détection). L’objectif est de maximiser la sensibilité et la spécificité tout en réduisant le
retard à la détection. Le chapitre 5 évaluera ces critères dans la détection d’événements
d’intérêt, sur signaux synthétiques et réels.
Bibliographie 45
Bibliographie
Basseville, M. and Nikiforov, I. V. (1993). Detection of abrupt changes : theory and
application. Prentice-Hall, Inc., Upper Saddle River, NJ, USA.
Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu-
rity. Physiological Measurement, 32 :523.
Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona-
talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome
apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1.
Beuchée, A., Carrault, G., Bansard, J. Y., Boutaric, E., Bétrémieux, P., and Pladys, P.
(2009). Uncorrelated randomness of the heart rate is associated with sepsis in sick
premature infants. Neonatology, 96(2) :109–14.
Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique
automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré.
IRBM, 28(3-4) :124–130.
Chair, Z. and Varshney, P. (1986). Optimal data fusion in multiple sensor detection systems.
Aerospace and Electronic Systems, IEEE Transactions on, AES-22(1) :98–101.
Chatow, U., Davidson, S., Reichman, B., and Akselrod, S. (1995). Development and
maturation of the autonomic nervous system in premature and full-term infants using
spectral analysis of heart rate fluctuations. Pediatric research, 37(3) :294.
Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD
thesis, Universidad Simón Bolívar.
Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm
fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in
Cardiology, volume 33, pages 473–476.
Dumont, J. (2008). Fouille de dynamiques multivariées, application à des données temporelles
en cardiologie. PhD thesis, Université de Rennes 1.
Gaillot, T., Beuchée, A., Jaillard, S., Storme, L., Nuyt, A. M., Carré, F., and Pladys,
P. (2005). Influence of sympathetic tone on heart rate during vagal stimulation and
nitroprusside induced hypotension in ovine fetus. Auton Neurosci, 123(1-2) :19–25.
Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M.
(1999). Multisensor fusion for atrial and ventricular activity detection in coronary care
monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90.
Hernández, A., Cruz, J., and Carrault, G. (2007a). Dispositif de supervision et de stimulation
destine à lutter contre l’apnée du sommeil. Pat Numb - WO2007EP55723 20070611.
Hernández, A., Cruz, J., and Carrault, G. (2007b). Dispositif intégré auto-adaptatif de
surveillance et de stimulation sur base de signaux physiologiques, par exemple sur base
de fréquence cardiaque, procédé et programme d’ordinateur correspondants. Pat Numb -
FR2908624.
46 Bibliographie
Le Rolle, V., Hernández, A., Carrault, G., Samson, N., and Praud, J. (2008). A model
of ventilation used to interpret newborn lamb respiratory signals. In Engineering in
Medicine and Biology Society, 2008. EMBS 2008. 30th Annual International Conference
of the IEEE, pages 4945–4948. IEEE.
Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet
transforms. IEEE Trans Biomed Eng, 42(1) :21–8.
Lovell, J. R., Eisenfeld, L., Rosow, E., Adam, J., Lapin, C., and Bronzino, J. D. (1999).
Vibrotactile stimulation for treatment of neonatal apnea : a preliminary study. Conn
Med, 63(6) :323–5.
Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet-
based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng,
51(4) :570–81.
Pan, J. and Tompkins, W. J. (1985). A real-time QRS detection algorithm. IEEE Transac-
tions on Biomedical Engineering, BME-32(3) :230–236.
Patural, H., St-Hilaire, M., Pichot, V., Beuchée, A., Samson, N., Duvareille, C., and Praud,
J.-P. (2010). Postnatal autonomic activity in the preterm lamb. Res Vet Sci.
Pladys, P., Arsenault, J., Reix, P., Rouillard Lafond, J., Moreau-Bussière, F., and Praud,
J. (2008). Influence of prematurity on postnatal maturation of heart rate and arterial
pressure responses to hypoxia in lambs. Neonatology, 93(3) :197.
Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship
between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7.
Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia
boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc,
2007 :3288–91.
Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction
of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages
725–728. IEEE.
Quinlan, J. R. (1993). C4.5 : programs for machine learning. Morgan Kaufmann Publishers
Inc., San Francisco, CA, USA.
Rezek, I. and Roberts, S. (1998). Stochastic complexity measures for physiological signal
analysis. Biomedical Engineering, IEEE Transactions on, 45(9) :1186–1191.
Task Force (1996). Heart rate variability : standards of measurement, physiological inter-
pretation and clinical use. task force of the european society of cardiology and the north
american society of pacing and electrophysiology. Circulation, 93(5) :1043–65.
Ward, J. (1963). Hierarchical grouping to optimize an objective function. Journal of the
American statistical association, 58(301) :236–244.
Yu, J., Hunter, J., Reiter, E., and Sripada, S. (2002). Recognising visual patterns to
communicate gas turbine time-series data. In Proceedings of ES2002, pages 105–118.
Springer.
Chapitre 3
Analyse multi-variée de l’ECG pour
la détection et la caractérisation de
l’apnée-bradycardie des
nouveaux-nés prématurés
L’objectif de ce chapitre est d’étudier le contenu d’information des caractéristiques
extraites de l’ECG avant, pendant et après les épisodes d’apnée-bradycardie, avec le but
de les intégrer dans une approche de détection précoce d’épisodes d’apnée-bradycardie.
Afin d’atteindre cet objectif et d’extraire les caractéristiques d’intérêt, deux grandes étapes
doivent être suivies ; d’une part, la détection précise de chaque battement et d’autre part,
la segmentation de chaque complexe QRS. Pour la première étape, plusieurs algorithmes
de détection des complexes QRS ont été proposés dans la littérature [Pan and Tompkins,
1985; Köhler et al., 2002; Chen et al., 2006; Arzeno et al., 2008]. Cependant, ces méthodes
ont été développées pour l’ECG de l’adulte et, à notre connaissance, aucune d’entre elles
n’ont été adaptées aux caractéristiques spécifiques de l’ECG du nouveau-né prématuré
(FC supérieure à celles des adultes, durée du complexe QRS plus courte . . .). En ce qui
concerne la deuxième étape, les méthodes basées sur une transformée en ondelettes pour
la décomposition de l’ECG, suivie d’un ensemble de règles heuristiques pour segmenter
les principales caractéristiques de chaque battement ont également été proposées dans
la littérature [Li et al., 1995; Martínez et al., 2004; Dumont et al., 2010]. Encore une
fois, à notre connaissance, ces méthodes sont spécifiques aux caractéristiques de l’ECG
adulte. Par conséquent, les méthodes pour les deux étapes doivent être tout d’abord
adaptées aux propriétés spécifiques de l’ECG du nouveau-né prématuré. Ces adaptations
sont généralement effectuées manuellement, en modifiant les paramètres de chaque méthode.
Toutefois, en raison du nombre important de paramètres utilisés dans les deux méthodes,
47
48 Chapitre 3
cette démarche n’est pas aisée.
Dans ce chapitre, un processus d’optimisation proposé initialement dans [Hernández
et al., 2002; Dumont et al., 2010] est adapté. Synthétiquement, on cherche à minimiser la
probabilité d’erreur de détection et la moyenne et l’écart-type du jitter de détection, sur
une base de données annotées, en optimisant les paramètres de la chaîne de traitement par
un algorithme évolutionnaire.
Une brève étude bibliographique des techniques de segmentation de l’ECG est présentée
au début du chapitre suivi de la présentation en détail des techniques de détection et de
segmentation utilisées dans ce mémoire. Cependant, comme les méthodes de détection des
battements et de segmentation de l’ECG ne sont pas aptes à travailler sur les ECG des
prématurés, une procédure d’optimisation est proposée et ensuite présentée. Enfin, une
analyse du complexe QRS sous différentes conditions physiopathologiques est conduite,
afin de caractériser les épisodes d’apnée-bradycardie chez les nouveaux-nés prématurés.
Les résultats du chapitre sont divisés en trois parties : la performance du détecteur des
battements optimisé, la performance de la segmentation du QRS optimisé et l’analyse
statistique des séries temporelles extraites de l’ECG des prématurés. L’information extraite
de ces détecteurs optimisés est analysée dans le chapitre suivant au moyen des modèles
semi-Markovien cachés.
3.1 Segmentation des ondes : position du problème et biblio-
graphie
L’étape de segmentation de l’ECG consiste à identifier les instants de début, de fin
et les extrema des ondes P, Q, R, S et T de chaque battement du signal. Les outils de
segmentation automatique (ou semi-automatique) de l’ECG intègrent différentes étapes
de transformation ou de modélisation de l’ECG. Les fondements des différentes méthodes
issues de la littérature sont brièvement commentées dans cette section.
3.1.1 Algorithme basé sur la dérivée filtrée
Cette méthode consiste à générer le signal dérivé filtré passe-bas du signal ECG [Laguna
et al., 1994]. L’algorithme détecte les extrema du signal filtré à l’aide d’un seuil adaptatif et
définit le pic de l’onde R comme le passage à zéro entre le maximum et le minimum du
signal filtré dans une fenêtre temporelle prédéfinie. Ce principe est également utilisé pour
définir les pics des ondes Q et S. Pour les ondes P et T, un deuxième filtrage passe-bas
est employé et des fenêtres temporelles sont fixées afin de repérer les pentes significatives
(une fenêtre relative à la FC est utilisée pour l’onde T). Les points de croisements par
3.1. Segmentation des ondes : position du problème et bibliographie 49
zéro des signaux dérivés-filtrés et des seuils relatifs aux amplitudes des pentes significatives
sont employés pour définir les pics et les limites des ondes P et T. Cette méthode est une
solution envisageable mais des remarques s’imposent : d’une part, l’algorithme comporte
de nombreuses approches subjectives (les recherches des points fiduciaux sont basées sur
des seuils plus ou moins approximatifs) et d’autre part, le filtre passe-bas utilisé coupe des
fréquences significatives de l’onde T.
3.1.2 Algorithme basé sur le filtrage adaptatif
Dans cette méthode, l’ECG est filtré par un filtre classique puis par un filtre adap-
tatif [Soria-Olivas et al., 1998]. La méthode inclut une étape d’apprentissage qui permet
l’estimation d’une constante d’adaptation introduite dans le filtre adaptatif. Les résultats
obtenus sont satisfaisants mais la méthode ne peut être employée sans une pré-détection par
un cardiologue. De plus, il est difficile de préciser les différences de performance avec une
approche totalement automatique car les auteurs n’ont pas réalisé de tests sur des bases de
données.
3.1.3 Algorithme basé sur la modélisation physiologique
Cette méthode modélise des potentiels d’action à partir d’un modèle physiologique
de la phase de repolarisation ventriculaire afin d’ajuster, puis de segmenter l’onde T de
l’ECG [Vila et al., 2000]. Le modèle physiologique est constitué d’une somme de deux
potentiels d’action. Les paramètres du modèle sont estimés par optimisation non linéaire
de l’erreur quadratique moyenne entre le modèle et le signal (algorithme du type Gauss-
Newton). L’onde T est segmentée en analysant les dérivées première et seconde de l’équation
obtenue. Des améliorations de segmentation en comparaison avec l’algorithme basé sur
la dérivée filtrée [Laguna et al., 1994] ont été reportées. Ainsi, cette approche devient
intéressante en présence de bruit [Wong, 2004]. Une limitation de la méthode est qu’elle ne
permet que la segmentation de l’onde T.
3.1.4 Algorithme basé sur le réalignement temporel
Dans cette méthode, le battement à segmenter est comparé et ré-aligné avec une
base de données de battements préalablement segmentés. Un réalignement temporel par
programmation dynamique (DTW, Dynamic Time Warping) est utilisé et consiste à réaligner
les points d’une série temporelle un à un, sur une autre série prise comme référence, de
manière à minimiser une distance cumulée sur l’ensemble des points. La méthodologie à
base de DTW peut être soit une approximation linéaire par morceaux [Vullings et al., 1997]
50 Chapitre 3
ou soit une approximation constante adaptative par morceaux [Zifan et al., 2006]. Cette
méthode est dépendante de l’ensemble des battements de référence et il est difficile de
comparer tous les battements annotés au battement à traiter en temps réel.
3.1.5 Algorithme basé sur la modélisation Markovienne
Les modèles Markoviens ont été d’abord appliqués pour la segmentation des complexes
QRS en 1993 [Coast, 1993], puis pour la segmentation de l’ensemble des ondes [Thora-
val, 1995]. Les premiers modèles ont intégré dans les états des informations de pentes,
d’amplitudes ou de durées des ondes [Koski, 1996; Clavier and Boucher, 1996]. De plus,
en exploitant les coefficients d’une décomposition en ondelettes, de bons résultats ont été
obtenus [Hughes et al., 2003]. Les modèles de Markov sont particulièrement adaptés pour
la décomposition de la séquence ECG. Cependant, leur application sur de grandes bases de
données est peu fréquente. En effet, le choix des caractéristiques dont la dynamique doit
être modélisée demeure un problème, ainsi que le grand nombre de données nécessaires à
l’apprentissage.
3.1.6 Algorithme basé sur la transformée en ondelettes
La transformée en ondelettes fait partie des méthodes d’analyse de signaux, dites
temps-échelle, qui ont suppléé la transformée de Fourier pour l’analyse des signaux non
stationnaires. La transformée en ondelettes décompose un signal f(t) en une somme pondérée
de fonctions de bases qui sont des versions dilatées et translatées d’une fonction ψ appelée
ondelette mère :
f(t) =
a∈Z k∈Z
cakψ(sa
t − k) (3.1)
Pour un scalaire s fixé, tel que |s| < 1, le coefficient a contrôle l’échelle à laquelle le
signal est analysé : si a est grand, les caractéristiques temporelles longues (i.e. les basses
fréquences) sont analysées ; si a est faible les caractéristiques courtes (les hautes fréquences)
sont analysées.
Les ondes P et T ont des durées statistiquement similaires et occupent de ce fait, dans
l’espace transformé, le même ensemble d’échelles d’analyse car les composantes fréquentielles
de ces ondes se recouvrent totalement. Cependant, la durée des ondes P et T est très différent
à la durée du complexe QRS et en conséquence l’ensemble d’échelles d’analyse du complexe
QRS est différent. Une portion des composantes fréquentielles de ce dernier recouvre la
totalité des composantes fréquentielles des ondes P et T.
Les extrema locaux de la décomposition d’un niveau de résolution correspondent aux
3.2. Détection et segmentation automatique du QRS 51
plus fortes pentes présentes dans le signal ECG et aux passages par zéro des extrema
locaux du signal ECG. La recherche des minima et maxima passe par la définition des
fenêtres temporelles, limitant la zone de recherche, et par la définition de seuils, permettant
uniquement la conservation des minima et maxima significatifs.
La principale difficulté de cette méthode est liée à la définition de nombreux paramètres,
les fenêtres temporelles et les seuils, qui sont ajustés empiriquement. Pour résoudre ce
problème, une solution a été proposée [Dumont et al., 2010]. Il s’agit d’une chaîne de
segmentation d’ECG dont les paramètres de la méthode de segmentation ont été optimisés
par algorithmes évolutionnaires.
3.2 Détection et segmentation automatique du QRS
Les paragraphes qui suivent ont pour volonté de présenter la chaine de traitement
que nous avons développée. De manière générale, la segmentation automatique de l’ECG
peut être décomposée en trois grandes étapes (montrées figure 3.1) et expliquées dans les
sous-sections suivantes.
Segmentation des
battements
Détection des
battements
Pré-traitement
de l'ECG
Extraction des
battements
Figure 3.1 – Étapes de la segmentation du signal ECG
3.2.1 Pré-traitement de l’ECG
Cette étape consiste principalement à éliminer certains bruits qui perturbent le signal
ECG tels que :
– Les déviations de la ligne de base : Elles correspondent aux déviations de basses-
fréquences de l’amplitude de l’ECG liées principalement aux mouvements du patient
et à sa respiration. Plusieurs techniques ont été développées afin de soustraire la ligne
de base de l’ECG : le filtrage adaptatif et les approximations par splines [Meyer and
Keiser, 1977; Sörnmo, 1993; Jane et al., 1992]. Toutefois, pour résoudre ce problème
particulier, nous avons choisi d’appliquer un algorithme à base de bancs de filtres multi-
cadences [Shusterman et al., 2000]. Les étapes de filtrage et de sous-échantillonnage
de cet algorithme permettent de réaliser un filtre dont la fréquence de coupure est
bien maîtrisée, tout en évitant les déphasages et les temps de calcul plus longs qui
seraient introduits par un filtre unique (mais d’ordre plus élevé).
– L’interférence à 50/60 Hz : C’est un bruit qui provient de l’alimentation des
appareils de mesure. Pour éliminer cette interférence, des méthodes basées sur des
52 Chapitre 3
filtres passe-bande ou des filtres adaptatifs sont utilisées [Levkov et al., 2005]. Dans
ce mémoire, le filtrage adaptatif a été retenu car il permet de suivre les changements
de phases et d’amplitudes de l’interférence [Ziarani and Konrad, 2002].
3.2.2 Détection des battements
La seconde étape est associée à la détection des complexes QRS de l’ECG. La dé-
tection automatique des battements a connu depuis de nombreuses années de multiples
développements. Une bibliographie est reportée dans [Köhler et al., 2002].
Nos avons utilisé un algorithme de détection des QRS en temps réel développé dans
notre laboratoire [Cruz, 2007]. Cet algorithme est inspiré du travail de PAN et TOMP-
KINS [Pan and Tompkins, 1985]. Il calcule la position d’un point, appelé point fiducial
(PF), correspondant à la pente maximale, pour chaque complexe QRS détecté. Ce point se
situe où la version filtrée passe-bande du signal ECG présente l’énergie la plus élevée.
L’algorithme de détection des QRS adapté peut être représenté de façon synthétique
comme l’illustre la figure 3.2. Les quatre premières étapes sont analogues à celles proposées
par PAN et TOMPKINS [Pan and Tompkins, 1985], où premièrement le signal ECG (x[n])
est traité par un filtre passe-bande (cascade des filtres passe-bas et passe-haut) avec des
fréquences de coupure fcLow et fcHigh pour produire xPB[n]. Deuxièmement, la sortie
(xPB[n]) est dérivée (xD[n]) et troisièmement une quadration est appliquée au signal dérivé
pour produire xQ[n] qui est ensuite intégré sur une fenêtre glissante de taille TMWI afin de
produire xI[n]. Le signal ECG à traiter par le détecteur des battements est gardé dans un
tampon circulaire de taille HISTO et le processus commence lorsque le tampon est rempli.
La dernière étape de la chaîne de détection des QRS est basée sur des seuils qui
sont continuellement ajustés par un ensemble de règles heuristiques, afin de suivre les
changements du signal ECG. Cependant, au lieu d’utiliser deux ensembles de seuils, comme
dans le travail de PAN et TOMPKINS [Pan and Tompkins, 1985], un seuil référé aux
maxima du signal transformé xI[n], est utilisé.
Le seuil adaptatif (THR) est calculé en utilisant l’équation 3.2, où δ est une constante,
Speak est la moyenne des NP pics du signal supérieur à THR (Speak) et Npeak est la
moyenne des NP pics du signal inférieur THR (Npeak). Speak et Npeak sont déterminés
en utilisant les équations 3.3 et 3.4, respectivement. Les pics supérieurs à THR sont classés
comme des complexes QRS (y[n]).
THR = Npeak + δ(Speak − Npeak) (3.2)
3.2. Détection et segmentation automatique du QRS 53
Filtre
passe-bande
ECG
Pics du QRS
Filtre
différenciateur
Quadration
Intégrateur
Règles de décision
Figure 3.2 – Représentation en bloc du processus de détection des battements.
Speak =
1
NP
NP
i=1
Speaki (3.3)
Npeak =
1
NP
NP
i=1
Npeaki (3.4)
L’algorithme applique une période de suppression réfractaire (TRefr) et une fenêtre
de recherche (TPeak) dans le signal filtré passe-bande (xPB[n]) pour la détection de crête
maximale (PF). Si un QRS n’est pas trouvé pendant TRRlim, le seuil THR est réinitialisé et
un nouveau processus de détection des QRS commence à partir du dernier QRS correctement
détecté.
54 Chapitre 3
Le tableau 3.1 récapitule les paramètres du détecteur des battements à optimiser. Le
pseudo-code de la méthode de détection des battements utilisée est montré dans l’algo-
rithme 1.
Tableau 3.1 – Paramètres de la méthode de détection des battements à optimiser.
Paramètre Description
fcLow Fréquence de coupure du filtre passe-bas
fcHigh Fréquence de coupure du filtre passe-haut
TMWI Taille de la fenêtre glissante de l’intégrateur
NP Nombre de pics pour déterminer sa valeur moyenne
δ Constante pour la détermination du seuil adaptatif
TRefr Période de suppression réfractaire
TPeak Taille de la fenêtre pour détecter la crête maximale QRS
TRRlim Temps limite pour réinitialiser la détection des QRS
Algorithme 1 Pseudo-code de la méthode de détection des battements.
// Filtrage passe-bande
Réaliser le filtrage passe-bande de x pour obtenir xP B
// Différenciateur
Calculer la dérivée de xP B pour obtenir xD
// Quadration
xQ[n] = xD[n]2
// Intégrateur
Réaliser l’intégration de xQ dans une fenêtre glissante de taille TMW I afin d’obtenir xI
// Initialisation de THR
Pendant une période de TINI secondes (usuellement initialisé à 6 secondes), estimer
xImax = max(xI)
Détecter les pics > xImax/2
Utiliser ces pics comme les premiers QRS
Initialiser les premiers NP Npeak pics à 0
Calculer THR selon l’équation 3.2
// Règles de décision
Ignorer les pics qui sont détectés TRefr secondes après le dernier QRS
Classifier le pic comme Speak s’il est plus grand que THR ou Npeak en cas contraire
Actualiser la valeur de THR selon l’équation 3.2
Chercher la crête maximale du QRS dans xP B, TPeak seconds avant Speak
Réinitialiser THR s’il n’y a pas eu de détection pendant TRRlim
3.2.3 Extraction des battements
Chaque battement détecté est extrait de l’ECG et délimité dans une fenêtre temporelle
autour du complexe QRS. Il est ensuite recalé sur des battements prototypes qui représentent
des types de morphologies différentes. Les battements prototypes sont créés par la moyenne
des battements les plus récents détectés dans un historique de 10 secondes. Seuls les
battements qui présentent une corrélation croisée normalisée supérieure à 0,96 sont utilisés
3.2. Détection et segmentation automatique du QRS 55
pour mettre à jour les battements prototypes. Dans le cas contraire, le battement courant
devient alors lui-même un prototype.
3.2.4 Segmentation des battements par ondelettes
L’étape de segmentation automatique est la plus complexe. En effet, effectuer une
délimitation précise des ondes est une tâche difficile pour plusieurs raisons : i) le signal ECG
est non-stationnaire, ii) les battements peuvent présenter un rapport signal sur bruit (RSB)
faible, iii) une grande variété de morphologies d’ondes existe, même parmi les sujets sains,
iv) il n’y a pas de définition universelle sur les positions des bornes des ondes (en particulier
pour les ondes Q et T), la variabilité portant sur la segmentation peut être élevée même
entre cardiologues [Party, 1985] et v) les composantes spectrales des ondes se chevauchent.
Compte-tenu de ces difficultés, une approche temps-fréquence a été retenue dans cette
thèse pour segmenter les battements telle que l’algorithme basé sur la transformée en
ondelettes initialement proposé par LI et al. [Li et al., 1995] et modifié récemment par
DUMONT et al. [Dumont et al., 2010].
Dans l’algorithme de segmentation par ondelettes, chaque battement prototype actualisé
est décomposé en cinq niveaux de détail, W1
2 à W5
2 , par une cascade de filtres (en octave) :
des filtres de détail G(z) (passe-haut) et des filtres d’approximation H(z) (passe-bas).
La délimitation précise des ondes est faite en utilisant des règles de décision basées sur
l’amplitude du signal décomposé. Afin de favoriser la résolution temporelle dans les différentes
échelles et l’invariance temporelle, la cascade de filtres est implémentée sans décimation
(même fréquence d’échantillonnage dans toutes les échelles de décomposition) [Martínez
et al., 2004]. La figure 3.3 montre les différentes étapes de la segmentation des battements
par transformée en ondelettes. Pour ne pas alourdir la présentation, nous avons reporté la
présentation de la transformée en ondelettes annexe B.
En raison du contenu à haute fréquence des complexes QRS, seules la première et la
deuxième échelle ont été analysées dans cette thèse. Dans la version initiale de l’algorithme,
les échelles 3 à 5 sont utilisées pour la segmentation des ondes P et T [Dumont et al., 2010].
Dans ce travail les ECG de la base de données ne montrent pas ces ondes de façon claire et
cette possibilité n’a donc pas été explorée.
Plusieurs paramètres temporels et de seuils sont utilisés afin de trouver les limites des
ondes. Les paramètres temporels sont :
– TR1 et TR2, utilisés pour la recherche des ondes R avant et après le PF,
– TQlim utilisé pour trouver l’onde Q,
– TSlim utilisé pour rechercher les ondes S.
56 Chapitre 3
Corrélation et
Moyennage
Règles de
décision
Règles de
décision
Détection:
QRSon,
Q, R, S
et QRSoff
Détection:
Pon, P et Poff
Ton, T et Toff
Banc de filtres de la décomposition en ondelettes
Battements
templates
Battements
Figure 3.3 – Banc de filtres de la décomposition en ondelettes (sans décimation). G(z) et
H(z) sont respectivement les filtres passe-haute et passe-bas. Wk
2 x[n] sont les sorties des
filtres aux échelles 2k (k = 1, 2, . . . , 5) pour le battement x[n].
Pour faire face aux variations importantes de la FC observées chez les nouveaux-nés
prématurés, une approche, proposée ici, est de définir les différents paramètres temporels
comme des versions proportionnelles à l’intervalle RR :
Ti = miRR (3.5)
où i ∈ {R1, R2, Qlim, Slim}, et mi est le facteur d’échelle devant être optimisé.
Les seuils liés aux amplitudes sur la deuxième échelle de la transformation en ondelettes
(W2
2 ) sont également exprimés en tant que facteurs proportionnels comme suit :
– Le seuil γQRSpre est utilisé pour trouver des pentes significatives de l’onde Q. Il est
proportionnel à l’amplitude maximale de l’échelle 2 dans la fenêtre de recherche
TQlim et est donné par :
γQRSpre = mγQRSpre max(|W2
2 x[n]|) (3.6)
où mγQRSpre est le facteur d’échelle à être optimisé et n ∈ TQlim
– Le seuil γQRSpost est utilisé pour trouver des pentes importantes de l’onde S. Il est
proportionnel à l’amplitude maximale de l’échelle 2 dans la fenêtre de recherche
TSlim. Il est calculé en utilisant l’équation 3.7, où mγQRSpost est le facteur d’échelle
3.2. Détection et segmentation automatique du QRS 57
à être optimisé et n ∈ TSlim.
γQRSpost = mγQRSpost max(|W2
2 x[n]|) (3.7)
– Le seuil ξQRSon est utilisé pour la recherche du début du complexe QRS (QRSon). Il
est lié à l’amplitude de la première pente importante dans W2
2 , et est calculé comme
suit :
ξQRSon =
mξQRSonp
W2
2 x[nfirst] ∀ W2
2 x[nfirst] > 0
mξQRSonn
W2
2 x[nfirst] ∀ W2
2 x[nfirst] < 0
(3.8)
où mξQRSonp
et mξQRSonn
sont les facteurs d’échelle à être optimisés et W2
2 x[nfirst]
correspond à l’échelle 2 de la décomposition en ondelettes du signal x à la première
pente significative (nfirst).
– Le seuil ξQRSoff est utilisé pour la recherche de la fin du complexe QRS (QRSoff). Il
est lié à l’amplitude de la dernière pente significative dans W2
2 , et est donné par :
ξQRSoff =
mξQRSoffp
W2
2 x[nlast] ∀ W2
2 x[nlast] > 0
mξQRSoffn
W2
2 x[nlast] ∀ W2
2 x[nlast] < 0
(3.9)
où mξQRSoffp
et mξQRSoffn
sont les facteurs d’échelle à être optimisés et W2
2 x[nlast]
correspond à l’échelle 2 de la décomposition en ondelettes du signal x à la dernière
pente significative (nlast).
Un test pour vérifier si les pics trouvés sont plus éloignés du niveau iso-électrique que
le début ou la fin du complexe QRS a été effectué comme dans les travaux de DUMONT
et al. [Dumont et al., 2010]. Par conséquent, la détection du niveau iso-électrique (ISOp)
est une contrainte importante. SMRDEL et JAGER [Smrdel and Jager, 2004] définissent
le ISOp comme la partie la plus plate dans l’intervalle PQ. Ce niveau iso-électrique est
segmenté en définissant les paramètres temporels suivants :
– TPQ : fenêtre de recherche temporelle pour le ISOp.
– TIso : taille de la fenêtre où la forme d’onde est la plus plate.
TPQ et TIso peuvent aussi être représentés comme une fonction de l’intervalle RR en
utilisant l’équation 3.5.
Le tableau 3.2 récapitule les paramètres de la méthode de segmentation des QRS
à optimiser. Le pseudo-code de la méthode de segmentation des QRS est montré dans
l’algorithme 2. La figure 3.4 résume les indicateurs temporels qui seront déterminés dans la
segmentation. Pour plus de détails concernant l’algorithme de segmentation, nous invitons
le lecteur à consulter les références [Martínez et al., 2004; Dumont et al., 2010].
58 Chapitre 3
Tableau 3.2 – Paramètres de la méthode de segmentation des QRS à optimiser.
Paramètre Description Utilisation
mR1 Constante de proportionnalité TR1 = mR1RR
mR2 Constante de proportionnalité TR2 = mR2RR
mQlim Constante de proportionnalité TQlim = mQlimRR
mSlim Constante de proportionnalité TSlim = mSlimRR
mγQRSpre Constante de proportionnalité γQRSpre = mγQRSpre max(|W2
2 x[n]|)
mγQRSpost Constante de proportionnalité γQRSpost = mγQRSpost max(|W2
2 x[n]|)
mξQRSonp
Constante de proportionnalité ξQRSon = mξQRSonp
W2
2 x[nfirst]
mξQRSonn
Constante de proportionnalité ξQRSon = mξQRSonn
W2
2 x[nfirst]
mξQRSoffp
Constante de proportionnalité ξQRSoff = mξQRSoffp
W2
2 x[nlast]
mξQRSfofn
Constante de proportionnalité ξQRSoff = mξQRSoffn
W2
2 x[nlast]
mPQ Constante de proportionnalité TPQ = mPQRR
mISO Constante de proportionnalité TIso = mISORR
Q
R
S
QRSoffQRSon
ISOp
Figure 3.4 – Indicateurs à repérer pour l’algorithme de segmentation.
3.3 Optimisation de la chaîne de segmentation d’ECG
Comme indiqué précédemment, les paramètres du processus de détection des battements
et les paramètres de la méthode de segmentation des complexes QRS doivent être adaptés
au traitement des signaux ECG acquis des nouveaux-nés prématurés, caractérisé par un
faible RSB, une FC plus élevée et de fréquents épisodes de bradycardie.
Dans le problème d’optimisation, le modèle est connu, ainsi que la réponse souhaitée
(sortie). La tâche consiste à trouver les entrées qui conduisent à cette sortie [Eiben and Smith,
2003], comme l’illustre simplement la figure 3.5. Ainsi, dans le problème d’optimisation
posé, l’objectif est de trouver une solution globalement satisfaisante de l’ensemble des
paramètres (entrées) des méthodes de la chaîne de segmentation (modèle), afin que la
segmentation automatique (sortie) ressemble aux annotations manuelles des cardiologues
des ondes enregistrées dans une base de données (spécifiées).
Cependant, des contraintes doivent être prises en compte dans le choix de la procédure
3.3. Optimisation de la chaîne de segmentation d’ECG 59
Algorithme 2 Pseudo-code de la méthode de segmentation des QRS.
Calculer les niveaux de décompositions W1
2 x[n] et W2
2 x[n]
// Détection de l’onde R
Calculer TR1 et TR2 selon l’équation 3.5
Définir une fenêtre de recherche sur W2
2 x[n] de TR1 secondes avant et TR2 secondes après le PF
Calculer les deux plus grandes extrémités de signes opposés de cette fenêtre (npre et npost) centrés
dans le PF
L’onde R correspond au croisement par zéro entre ces deux extrémités sur W1
2 x[n]
En cas de plusieurs croisements par zéro, utiliser celui associé à la plus grande amplitude de x[n]
// Détection du ISOp
Calculer TP Q et TIso selon l’équation 3.5
Définir une fenêtre de recherche sur x[n] de TP Q secondes avant l’onde R
Le ISOp correspond à la partie la plus plate de taille TIso de cette fenêtre
// Détection de l’onde Q
Calculer TQlim selon l’équation 3.5
Calculer mγQRSpre
selon l’équation 3.6
Définir une fenêtre de recherche sur W2
2 x[n] de TQlim secondes avant npre
Calculer les maxima locaux de cette fenêtre supérieure à mγQRSpre
Calculer les croisements par zéro entre ces maxima locaux sur W1
2 x[n].
L’onde Q est sélectionnée selon le signe et la séquence des maxima locaux
// Détection du QRSon
Calculer ξQRSon selon l’équation 3.8
Définir une fenêtre de recherche sur W2
2 x[n] de TQlim secondes avant npre
Chercher le premier maximum local (nfirst) dans cette fenêtre
Chercher le point où W2
2 x[n] est inférieur à ξQRSon : QRSon1
Calculer les minima locaux avant nfirst
QRSon est le point le plus proche du complexe QRS entre QRSon1 et les minima trouvés
// Détection de l’onde S
Calculer TSlim selon l’équation 3.5
Définir une fenêtre de recherche sur W2
2 x[n] de TSlim secondes après npost
Calculer les maxima locaux de cette fenêtre supérieure à mγQRSpost
Calculer les croisements par zéro entre ces maxima locaux sur W1
2 x[n].
L’onde S est sélectionnée selon le signe et la séquence des maxima locaux
// Détection du QRSoff
Calculer ξQRSoff selon l’équation 3.9
Définir une fenêtre de recherche sur W2
2 x[n] de TSlim secondes après npost
Chercher le dernier maximum local (nlast) dans cette fenêtre
Chercher le point où W2
2 x[n] est inférieur à ξQRSoff : QRSoff1
Calculer les minima locaux après nlast
QRSoff est le point le plus proche du complexe QRS entre QRSoff1 et les minima trouvés
Modèle
connu
Entrée
?
Sortie
spécifié
Figure 3.5 – Le problème d’optimisation.
d’optimisation. Par exemple, la présence des multiples optima locaux de la fonction de coût
peuvent conduire à des mauvais choix de paramètres. En outre, les algorithmes de la méthode
de segmentation sont composés de différents paramètres (seuils, fenêtres temporelles, . . . ) et
de fait, le critère évaluant les performances sera très certainement une fonction discontinue
dans l’espace des paramètres. Ces contraintes ne sont pas compatibles avec l’utilisation
60 Chapitre 3
des méthodes d’optimisation multivariées basées sur les gradients (méthodes de Gauss-
Newton) ou des méthodes du simplex [Nelder and Mead, 1965], qui risquent de s’arrêter
dans des minima locaux. D’un autre côté, les méthodes d’optimisation stochastique, telles
que les algorithmes évolutionnaires (AE) [Eiben and Smith, 2003], dont la continuité de
la fonction de coût ainsi que sa dérivée ne sont pas exigées, sont particulièrement bien
adaptés pour ce type problème. Les AE, méthodes d’optimisation inspirées sur les théories de
l’évolution et la sélection naturelle, ont d’ailleurs déjà été utilisés avec succès dans différentes
applications biomédicales, pour estimer de larges ensembles de paramètres [Hernández et al.,
2002; Herrero et al., 2008; Dumont et al., 2010]. Les fondements sur les AE sont reportés
annexe C.
3.3.1 Méthode proposée
Le problème d’adaptation peut être considéré comme la minimisation d’une fonction
de coût en comparant les événements observés (annotations des ondes) et la sortie de
l’algorithme (détection des ondes).
Deux AE indépendants ont été appliqués de manière séquentielle : le premier, nommé
AE1, permet d’optimiser les paramètres du détecteur des battements alors que le second,
AE2, permet d’optimiser les paramètres de la méthode de segmentation des QRS. Un
schéma explicatif est montré dans la figure 3.6. Un tel fractionnement est possible car la
segmentation des QRS ne sera optimale que si le détecteur de battements est déjà optimisé.
Détection de batements
AE1
Base de données
Segmentation des QRS
AE2
Paramètres
optimisés
Base de données
Figure 3.6 – Optimisation par application des AE de manière séquentielle.
La figure 3.7 montre la méthodologie à suivre pour optimiser les paramètres à partir d’une
base de données annotée appropriée et un AE. Les types d’annotations sont différents dans
chaque méthodologie : des annotations du PF pour optimiser le détecteur des battements
(AE1) et des annotations du ISOp et de la position du pic de l’onde R, du QRSon et du
QRSoff pour optimiser la segmentation des QRS (AE2).
L’AE minimise une fonction de coût qu’il convient de définir. Comme proposé par
DUMONT et al. [Dumont et al., 2010], la fonction coût devant être minimisée par l’AE
combine trois critères :
1. La probabilité d’erreur de détection (Perr) : Il s’agit d’une estimation quan-
titative de la performance de la méthode. Elle est déterminée par l’équation 3.10,
3.3. Optimisation de la chaîne de segmentation d’ECG 61
Figure 3.7 – Méthodologie d’optimisation des paramètres des méthodes. Les annotations
et les détections dépendent de la méthode à optimiser. La méthode est le détecteur des
battements dans un premier essai et la segmentation du QRS après.
où SENi est la sensibilité (équation 2.1) et VPPi est la valeur prédictive positive
(équation 2.4) de chaque caractéristique i ∈ {PF, onde R, QRSon, QRSoff, ISOp}.
Perri = (1 − SENi)2 + (1 − VPPi)2 (3.10)
2. La moyenne du jitter de détection (µDJ) : Elle est calculée pour chaque ca-
ractéristique i comme la moyenne, pour tous les segments disponibles (X), de la
moyenne du jitter entre l’annotation (Ann) et la détection (Det) obtenus à partir de
Y battements sur chaque segment, comme suit :
µDJi =
1
X
X
x=1
Y
y=1 Annx
i (y) − Detx
i (y)
Nx
(3.11)
où Nx est le nombre de battements par segment.
3. L’écart-type du jitter de détection (σDJ) : Il est déterminé pour chaque ca-
ractéristique i comme la moyenne de l’écart-type du jitter de détection de chaque
segment (σx
i ) :
σDJi =
X
x=1 σx
i
X
(3.12)
62 Chapitre 3
Les fonctions de coût (CF1 et CF2 pour AE1 et AE2) sont alors calculées comme suit :
CF1 = PerrPF + µDJPF + σDJPF (3.13)
CF2 =
I
i=1
Perri + µDJi + σDJi (3.14)
où PF est le point fiducial et i ∈ {onde R, QRSon, QRSoff, ISOp}.
3.3.2 Optimisation des paramètres
Dans AE1, servant à optimiser le détecteur des battements, les paramètres à optimiser
ont été largement modifiés par rapport aux paramètres originaux montrés dans [Pan and
Tompkins, 1985] pour créer la population initiale. Dans AE2, utilisé pour optimiser la
méthode de segmentation des complexes QRS, les paramètres d’échelle liés à la fenêtre
de recherche temporelle ont été définis à partir des positions extrêmes possibles et des
connaissances physiologiques sur la durée de chaque onde, alors que les paramètres liés à
l’échelle des seuils ont été largement modifiés par rapport à ceux proposés dans [Martínez
et al., 2004; Dumont et al., 2010], pour créer la population initiale. La sélection par
classement et les opérateurs génétiques standards des chromosomes à valeurs réelles (cross-
over simple, arithmétique et heuristique, mutation multi-non uniforme et non uniforme)
ont été utilisés dans les deux AE [Michalewicz, 1996].
Vingt paramètres ont été employés dans la méthodologie d’optimisation : huit à partir
du détecteur des battements (tableau 3.1) et douze à partir de la méthode de segmentation
automatique des complexes QRS (tableau 3.2). Les AE ont été appliqués pour 80 générations
de 200 individus, avec une probabilité de croisement de 0,7 et une probabilité de mutation
élevée pendant les premières générations et faible à la fin [Bäck and Schütz, 1996]. Une
comparaison des performances avant et après optimisation des paramètres dans les deux
méthodes a été réalisée par l’évaluation de SEN (équation 2.1), VPP (équation 2.4), µDJ
(équation 3.11) et σDJ (équation 3.12) sur des ensembles de test.
Pour résoudre ce problème d’optimisation, deux sous-ensembles de données (DB1 et
DB2), constitués à partir de la base de données détaillée dans la section 2.2 page 37 ont été
formés (c.f. figure 3.8) :
1. Le sous-ensemble DB1, appliqué pour adapter la méthode de détection des batte-
ments de l’ECG du nouveau-né prématuré, est composé de 50 segments d’ECG, définis
sur un support temporel de cinq minutes avant le début d’un épisode de bradycardie
jusqu’à deux minutes après la fin, et ne contenant qu’un seul épisode de bradycardie
pendant toute cette période. Ce sous-ensemble est composé de segments d’ECG d’un
ou plusieurs patients. Seulement 27 patients de la base de données ont présenté au
moins un épisode tel que décrit ci-dessus. DB1 est caractérisée par 51655 battements
3.3. Optimisation de la chaîne de segmentation d’ECG 63
(autour de 1000 battements par segment ECG). Les positions de l’onde R ont été
annotées pour chaque battement par un expert.
2. Le sous-ensemble DB2, appliqué pour adapter la méthode de segmentation des
QRS de l’ECG du nouveau-né prématuré, est composé de 93 segments d’ECG, choisis
au hasard à partir de la base de données complète et avec au moins un segment
ECG par patient. Chaque segment d’ECG est composé d’une phase de repos, suivie
d’un ou plusieurs épisodes de bradycardie. Ce fichier est composé de 4464 battements
(48 battements par segment). Les positions de l’onde R, du QRSon, du QRSoff et du
ISOp ont été annotées pour chaque battement par un expert. Obtenir ces annotations
battement à battement est une tâche difficile, particulièrement en présence de bruit.
Des annotations précises ont pu être obtenues uniquement pour les 93 segments d’ECG
sélectionnés.
Dans tous les cas, les événements de bradycardie ont été détectés et annotés par
l’analyse de l’intervalle RR. Un épisode de bradycardie est défini comme une augmentation
de l’intervalle RR sur un seuil fixé à 600 ms, pendant une durée de quatre secondes ou
plus [Poets et al., 1993]. Les moniteurs néonataux sont en général basés sur cette méthode
de détection simple.
Enregistrements d'ECG
- 32 nouveau-nés prématurés
- Apnée-bradycardie récurrent
DB1L
- 25 segments d'ECG
- 50 battements par segment
DB2:
- Permet d'adapter la méthode de segmentation
du QRS
- 93 segments d'ECG contenant episodes
de repos et de bradycardie
- 48 battements par segment
- Annotation: position du ISOp, QRSon, QRSoff
et onde R.
DB1:
- Permet d'adapter la méthode de détection
des battements
- 50 segments d'ECG
- 1 bradycardie par segment
- segments d'ECG > 7 minutes
- Annotation: position des ondes R
DB2L
- 47 segments d'ECG
DB2T
- 46 segments d'ECG
DB1T
- La totalité du DB1
Figure 3.8 – Construction des différentes bases de données utilisées pour effectuer les
processus d’adaptation et la phase d’évaluation.
Deux ensembles d’apprentissage et deux ensembles de test ont été construits pour réaliser
l’optimisation (voir Figure 3.8) :
– Le premier ensemble d’apprentissage (DB1L) est composé de 25 segments
d’ECG à partir de DB1 (la moitié des segments d’ECG de DB1). Cette base de
données est utilisée pour AE1.
– Le deuxième ensemble d’apprentissage (DB2L) constitué à partir de DB2,
contient 47 segments d’ECG choisis au hasard. Cette base de données est utilisée
pour AE2.
64 Chapitre 3
– Le premier ensemble de test (DB1T), utilisé pour tester les paramètres optimaux
trouvés pour le détecteur de battement, est composé de l’ensemble DB1.
– Le deuxième ensemble de test (DB2T) basé sur DB2 contient les 46 autres
segments d’ECG. Cette base de données est utilisée pour tester les paramètres
optimaux du processus de segmentation des QRS.
Plusieurs morphologies de complexes QRS sont présentes dans ces quatre ensembles
de données. La comparaison entre les annotations et les détections a été réalisée dans une
fenêtre temporelle de 10 ms.
3.4 Résultats de détection et de segmentation
Les résultats sont présentés en deux parties : i) l’évaluation de la détection des battements
avec les paramètres optimaux obtenus par AE1 et ii) l’évaluation de la méthode de
segmentation des complexes QRS avec les paramètres optimaux obtenus par AE2. Par
simplicité, le signal ECG a été sur-échantillonné à 500 Hz, afin de s’accorder avec la fréquence
d’échantillonnage du détecteur des battements et la méthode de segmentation des QRS.
3.4.1 Performances du détecteur des battements
Les valeurs des paramètres du détecteur de battements avant et après la méthode
d’optimisation sont présentées dans le tableau 3.3. Ces valeurs ont été déterminées en
utilisant AE1 sur DB1L et ont été choisis comme les valeurs moyennes, pour cinq réalisations
différentes de l’AE, des meilleurs individus de la dernière génération. Comparativement à
ceux utilisés chez les adultes [Pan and Tompkins, 1985], les paramètres optimaux montrent
une augmentation des fréquences de coupure du filtre passe-bas et du filtre passe-haut, qui
indiquent évidemment que le complexe QRS des nouveaux-nés prématurés est généralement
plus fin, avec un contenu fréquentiel plus élevé que les QRS des adultes. En outre, on
observe une diminution de la taille de la fenêtre glissante de l’intégrateur, qui peut aussi
s’expliquer par la teneur plus élevée en fréquence du complexe QRS des prématurés. Ces
paramètres ont été utilisés pour évaluer la performance de la méthode de détection des
QRS sur DB1T.
Le tableau 3.4 montre les performances de la méthode de détection en utilisant DB1T,
avant (avec les paramètres réglés pour l’ECG d’adulte) et après (avec les paramètres
réglés pour l’ECG du prématuré) le processus d’optimisation. La SEN et la VPP ont été
obtenues en utilisant une fenêtre de recherche de 10 ms. Ce tableau montre clairement une
amélioration dans la détection du PF.
3.4. Résultats de détection et de segmentation 65
Tableau 3.3 – Valeurs des paramètres de la méthode de détection des battements avant
(pour les adultes) et après (pour les nouveaux-nés prématurés) le processus d’optimisation.
Paramètre Avant Après Unité
fcLow 15 20,71 Hz
fcHigh 5 9,49 Hz
TMWI 150 78,41 ms
NP 5 7 Battements
δ 0,31 0,1485
TRefr 200 233,54 ms
TPeak 20 30,75 ms
TRRlim 1500 1959,46 ms
Tableau 3.4 – Performances du détecteur des battements avant et après le processus
d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés
pour l’ECG du prématuré.
Indicateur SEN (%) VPP (%) µDJ (ms) σDJ (ms)
Avant Après Avant Après Avant Après Avant Après
PF 91,20 97,74 92,22 98,03 3,51 1,18 15,60 10,23
3.4.2 Performances de la méthode de segmentation des QRS
Le tableau 3.5 montre les paramètres optimaux de la méthode de segmentation des QRS
par ondelettes, en utilisant AE2 sur DB2L. Un exemple des valeurs de paramètres optimaux,
déterminé pour un intervalle RR typique de 400 ms, est illustré dans le tableau 3.6. Une
comparaison entre notre approche et les travaux de DUMONT et al. [Dumont et al., 2010],
ainsi que ceux de SMRDEL et JAGER [Smrdel and Jager, 2004] est également reportée dans
ce tableau. On observe une réduction de toutes les fenêtres de recherche et une augmentation
du seuil utilisé pour trouver les ondes Q (γQRSpre), du seuil lié à l’amplitude de la première
pente négative significative pour trouver le QRSon (ξQRSonn) et du seuil lié à l’amplitude
de la dernière pente négative significative pour trouver le QRSoff (ξQRSoffn). On peut
également observer une diminution du seuil de détection des ondes S (γQRSpost), du seuil lié
à l’amplitude de la première pente positive significative pour trouver le QRSon (ξQRSonp) et
du seuil lié à l’amplitude de la dernière pente positive significative pour trouver le QRSoff
(ξQRSoffp).
Le tableau 3.7 montre les performances de la méthode de segmentation des QRS basée
sur les ondelettes, en utilisant les paramètres optimaux sur DB2T, avant et après le processus
d’optimisation. Ce tableau montre une amélioration dans la détection du QRSon, QRSoff
66 Chapitre 3
Tableau 3.5 – Valeurs optimales des paramètres de la méthode de segmentation des QRS.
Paramètre Valeur
mR1 0,1211
mR2 0,0990
mQlim 0,1030
mSlim 0,1170
mγQRSpre 0,1241
mγQRSpost 0,0909
mξQRSonp
0,0486
mξQRSonn
0,0800
mξQRSoffp
0,1635
mξQRSoffn
0,6995
mPQ 0,1192
mISO 0,0149
Tableau 3.6 – Exemple des fenêtres de recherche et des seuils utilisés dans la méthode de
segmentation des QRS. Les paramètres de notre approche ont été déterminés en utilisant
les paramètres optimaux (Tableau 3.5) pour un intervalle RR typique de 400 ms. Les autres
approches correspondent aux paramètres utilisés par [Dumont et al., 2010] et [Smrdel and
Jager, 2004].
Paramètre Approche proposée Autres approches
TR1 48,44 ms 118† ms
TR2 39,60 ms 111† ms
TQlim 40,12 ms 88† ms
TSlim 46,80 ms 154† ms
mγQRSpre 0,1241 0,09†
mγQRSpost 0,0909 0,11†
mξQRSonp
0,0486 0,07†
mξQRSonn
0,0800 0,07†
mξQRSoffp
0,1635 0,21†
mξQRSoffn
0,6995 0,23†
TPQ 47,68 ms 108‡ ms
TISO 5,96 ms 20‡ ms
† [Dumont et al., 2010]
‡ [Smrdel and Jager, 2004]
et du ISOp. Cependant, pour trouver l’onde R, la SEN reste identique avant et après le
processus d’optimisation. Concernant le calcul de la VPP pour ces indicateurs, FP serait
toujours égal à 0 dans la fenêtre de recherche car ces indicateurs sont toujours présents.
Ceci conduirait à une VPP = 100 %.
3.5. Analyse du QRS pour la caractérisation de l’apnée-bradycardie 67
Tableau 3.7 – Performances de la segmentation des QRS, avant et après le processus
d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés
pour l’ECG du prématuré.
Indicateur SEN (%) µDJ (ms) σDJ (ms)
Avant Après Avant Après Avant Après
Onde R 98,46 98,46 1,39 1,69 1,44 0,66
QRSon 40,33 90,21 43,48 3,07 11,61 1,27
QRSoff 77,07 80,24 7,81 4,49 5,64 2,64
ISOp 0 80,61 48,88 4,29 2,61 2,29
Les performances obtenues après le processus d’optimisation sont comparables à celles
rapportées par ailleurs dans la littérature en utilisant des paramètres et des bases de données
d’ECG standard d’adultes [Dumont et al., 2010; Martínez et al., 2004; Pan and Tompkins,
1985].
3.5 Analyse du QRS pour la caractérisation de l’apnée-bradycardie
3.5.1 Principe et objectif de l’étude
Une fois le complexe QRS détecté et segmenté, des nouvelles séries temporelles peuvent
être construites à partir des indicateurs tels que les amplitudes des ondes et la durée des
intervalles et segments de l’ECG. Dans ce travail les séries temporelles de la durée du cycle
cardiaque (RR), l’amplitude de l’onde R (Ramp) et la durée du complexe QRS (QRSd)
ont été déterminées et analysées pour chaque segment d’ECG de DB1. La série RR est
déterminée classiquement comme la différence successive des instants de détection des ondes
R de l’ECG. L’amplitude de l’onde R est déterminée comme la différence entre le pic de
l’onde R et le ISOp. La durée du complexe QRS est calculée comme la différence entre la
fin et le début du QRS (QRSoff − QRSon). La figure 3.9 montre la façon de déterminer
Ramp et QRSd pour un battement synthétique. Les séries correspondantes aux amplitudes
des ondes Q et S peuvent être analysées que dans certains cas. Ces ondes sont en effet de
très faible amplitude et parfois absentes de l’ECG acquis.
Quatre intervalles ont été utilisés pour analyser chaque série, comme illustré dans la
figure 3.10 :
– L’intervalle T1 défini dès le début de chaque segment d’ECG de DB1 (5 minutes
avant la bradycardie) jusqu’à la deuxième minute. Cet intervalle contient les FC au
repos (sans aucune perturbation liée à un événement d’apnée-bradycardie).
68 Chapitre 3
P
Q
R
S
T
QRSd
Ramp
Figure 3.9 – Amplitude de l’onde R (Ramp) et durée du complexe QRS (QRSd) pour un
battement synthétique.
– L’intervalle T2 correspond au temps écoulé entre la troisième et la cinquième minute.
Dans cet intervalle, il n’y a pas d’événement bradycardie, mais l’épisode d’apnée a
déjà commencé (repéré sur la trace de respiration).
– L’intervalle T3 défini lors de l’événement de bradycardie. Les épisodes d’apnée et
bradycardie sont présents.
– L’intervalle T4 défini entre la fin de la bradycardie et la fin du segment d’ECG. Dans
cet intervalle, de manière générale, la FC revient à sa valeur de repos.
Les séries Ramp ont été normalisées en les divisant par la valeur la plus élevée dans
l’intervalle T1.
Une comparaison entre l’intervalle T1 (considéré comme référence) et les autres intervalles
(T2, T3 et T4) a été effectuée afin de trouver des variations importantes à l’aide de plusieurs
critères :
– La moyenne pondérée (wµ) : Calculée avec l’équation 3.15 où TS ∈ {RR, Ramp,
QRSd}, Ti ∈ {T1, T2, T3, T4}, µTSx
Ti est la moyenne de la moyenne de chaque
enregistrement x et Nx est le nombre de battements par enregistrement.
wµTi =
X
x=1 NxµTSx
Ti
X
x=1 Nx
(3.15)
– L’écart-type pondéré (wσ) : Calculé pour chaque série temporelle TS et pour
chaque intervalle Ti avec :
wσTi =
X
x=1 NxσTSx
Ti
X
x=1 Nx
(3.16)
où σTSx
Ti est la moyenne de l’écart-type de chaque enregistrement x.
– La moyenne de la différence absolue (µDA) : Calculée pour chaque série tem-
3.5. Analyse du QRS pour la caractérisation de l’apnée-bradycardie 69
0 200 400 600 800 1000
400
600
800
1000
1200
1400
0 200 400 600 800 1000
40
60
80
100
120
140
0 200 400 600 800 1000
0.7
0.8
0.9
1
1.1
RR(ms)QRSd(ms)Ramp
Échantillons
Échantillons
Échantillons
T1 T2 T3 T4
T1 T2 T3 T4
T1 T2 T3 T4
Repos Avant bradycardie
Bradycardie
Après bradycardie
Figure 3.10 – De haut en bas respectivement, intervalles d’analyses de séries temporelles
RR, QRSd et Ramp.
porelle TS avec :
µDAT1−Ti =
X=Xi
x1=xi=1 |µTSx1
T1 − µTSxi
Ti|
X
(3.17)
où µTSx1
T1 est la moyenne de l’intervalle T1, µTSxi
Ti est la moyenne des autres intervalles
(i = {2, 3, 4}) et X est le nombre d’enregistrements.
– L’écart-type de la différence absolue (σDA) : Calculé pour chaque série tempo-
relle TS avec :
σDAT1−Ti =
X=Xi
x1=xi=1 |σTSx1
T1 − σTSxi
Ti|
X
(3.18)
où σTSx1
T1 est la moyenne de la différence absolue de l’écart-type de l’intervalle T1,
σTSxi
Ti est la moyenne de la différence absolue de l’écart-type des autres intervalles
(i = {2, 3, 4}).
Le test d’hypothèse de Mann–Whitney U a été utilisé pour analyser les variations entre
les intervalles, où une valeur de p < 0, 05 est considérée comme significative.
70 Chapitre 3
3.5.2 Résultats
Les séries temporelles représentant RR, Ramp et QRSd ont été extraites des 50 segments
d’ECG de vingt-sept nouveaux-nés prématurés avec un épisode de bradycardie par segment.
Ces caractéristiques sont particulièrement intéressantes car une étude récente réalisée chez
l’adulte souffrant d’apnée obstructive du sommeil indique que les changements de la pression
intra-thoracique lors de l’épisode apnée obstructive du sommeil peuvent se traduire par des
changements dans les ondes de l’ECG [Penzel et al., 2006]. Une augmentation de la durée
du cycle cardiaque en présence de bradycardie peut élargir la durée de la dépolarisation des
ventricules correspondant à la durée du complexe QRS.
Le tableau 3.8 montre les valeurs de wµ et de wσ des séries temporelles RR, Ramp et
QRSd pour tous les intervalles analysés. Les résultats pour les séries RR et QRSd montrent
les valeurs les plus élevées pour l’intervalle T3 (cas de bradycardie), suivie par l’intervalle
T2 et les valeurs les plus faibles pour le T1. En ce qui concerne Ramp, la valeur le plus basse
de wµ est obtenue pour T3 (ainsi que la valeur la plus élevée pour wσ). Une diminution est
observée dans wµ de T1 à T3 ainsi qu’une augmentation de wσ de T1 à T3. La valeur le
plus grande de wµ est obtenue dans le dernier intervalle.
Tableau 3.8 – wµ et wσ des séries temporelles RR, Ramp et QRSd, pour tous les intervalles
analysés.
Série temporelle T1 T2 T3 T4
wµ wσ wµ wσ wµ wσ wµ wσ
RR (ms) 407,90 14,60 414,58 28,43 712,01 147,94 413,89 19,72
Ramp 0,8233 0,0605 0,8187 0,0638 0,8155 0,0754 0,8293 0,0661
QRSd (ms) 61,03 5,887 61,58 6,22 66,35 15,06 61,43 7,08
Les valeurs de µDA et de σDA sont indiquées dans le tableau 3.9. Ces valeurs sont
calculées entre l’intervalle T1 et les autres intervalles, pour les séries temporelles RR, Ramp
et QRSd. Pour toutes les séries temporelles, des valeurs élevées de µDA et de σDA sont
obtenues entre T1 et T3.
Les résultats des tests d’hypothèse de Mann–Whitney U sont présentés dans le ta-
bleau 3.10, calculé pour la moyenne des séries RR, Ramp et QRSd, entre les intervalles
analysés. Comme prévu, des différences significatives entre les intervalles T1 et T3 sont
observées pour les séries temporelles RR. En ce qui concerne la différence moyenne entre
l’intervalle T1 et les autres intervalles, des différences significatives ont été observées pour
toutes les séries temporelles lors de la comparaison T1 − T2 vs. T1 − T3 et T1 − T3 vs.
T1 − T4.
3.5. Analyse du QRS pour la caractérisation de l’apnée-bradycardie 71
Tableau 3.9 – µDA et σDA entre l’intervalle T1 et les autres intervalles, pour les séries
temporelles RR, Ramp et QRSd.
Série temporelle T1 − T2 T1 − T3 T1 − T4
µDA σDA µDA σDA µDA σDA
RR (ms) 11,26 15,31 285,06 123,24 13,93 8,76
Ramp 0,0442 0,0192 0,0966 0,0388 0,0585 0,0238
QRSd (ms) 2,02 1,66 10,67 9,38 2,57 2,17
Tableau 3.10 – tests d’hypothèse de Mann–Whitney U pour la moyenne des séries RR,
Ramp et QRSd.
Intervalle p(RR) p(Ramp) p(QRSd)
T1 vs. T2 0,2931 0,7174 0,8713
T1 vs. T3 <0,0001† 0,6075 0,1044
T1 vs. T4 0,2655 0,4061 0,6816
T1 − T2 vs. T1 − T3 <0,0001† 0,0002† <0,0001†
T1 − T2 vs. T1 − T4 <0,3092 0,0973 0,5602
T1 − T3 vs. T1 − T4 <0,0001† 0,0231† <0,0001†
† Statistiquement significatif
La figure 3.11 montre les boîtes à moustache de la moyenne par intervalle des 50 séries
RR, Ramp et QRSd et la différence de la moyenne entre l’intervalle T1 et les autres
intervalles pour les mêmes séries temporelles. On montre que la plus grande différence dans
la moyenne est obtenue entre les intervalles T1 et T3 pour toutes les séries.
La figure 3.12 montre un segment typique présentant de faibles différences entre l’in-
tervalle T1 et les autres intervalles. La figure 3.13 montre un segment typique avec des
différences significatives entre l’intervalle T1 et les autres intervalles. Les changements
dans Ramp sont clairement observés dans les figures 3.12c et 3.13c, liés à l’épisode de
bradycardie montré dans les séries RR (figures 3.12a et 3.13a). En outre, il est observé dans
les figures 3.12d et 3.13d des erreurs dans le processus de segmentation automatique du
QRS où le QRSon et QRSoff ne sont pas toujours bien détectés. Ceci est également observé
dans les figures 3.12b et 3.13b où la série QRSd montre plusieurs artefacts.
72 Chapitre 3
T1 T2 T3 T4
400
500
600
700
800
900
Values
T1−T2 T1−T3 T1−T4
0
100
200
300
400
500
Values
(a)
T1 T2 T3 T4
0.2
0.4
0.6
0.8
1
1.2
Values
T1−T2 T1−T3 T1−T4
0
0.1
0.2
0.3
0.4
Values
(b)
T1 T2 T3 T4
40
60
80
100
120
Values
T1−T2 T1−T3 T1−T4
0
20
40
60
Values
(c)
Figure 3.11 – Boîtes à moustaches de la moyenne des séries par intervalle et de la différence
de la moyenne des séries entre l’intervalle T1 et les autres intervalles, pour les séries
temporelles : (a) RR, (b) Ramp et (c) QRSd.
3.5. Analyse du QRS pour la caractérisation de l’apnée-bradycardie 73
0 200 400 600 800 1000
200
300
400
500
600
700
800
900
1000
RRinterval(ms)
T1 T2 T4T3
(a)
0 200 400 600 800 1000
50
60
70
80
90
100
110
120
130
QRSduration(ms)
(b)
0 200 400 600 800 1000
0.5
0.6
0.7
0.8
0.9
1
1.1
NormalizedR−waveamplitude(V)
(c)
1.079 1.08 1.081 1.082 1.083
−2
−1
0
1
2
3
4
ECGamplitude(V)
x10
5
x10
5
(d)
Figure 3.12 – Segment typique présentant de petites différences entre l’intervalle T1 et les
autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles, alors
que dans (d), les lignes verticales en pointillé représentent la segmentation automatique du
QRS (QRSon, pic de l’onde R et QRSoff).
74 Chapitre 3
0 200 400 600 800
400
500
600
700
800
900
1000
RRinterval(ms)
T2T1 T3 T4
(a)
0 200 400 600 800
40
50
60
70
80
90
100
110
120
QRSduration(ms)
(b)
0 200 400 600 800
0.2
0.4
0.6
0.8
1
NormalizedR−waveamplitude(V)
(c)
1.088 1.089 1.09 1.091 1.092
−4
−2
0
2
4
6
ECGamplitude(V)
x10
5
x10
-4
(d)
Figure 3.13 – Segment typique présentant de différences significatives entre l’intervalle T1
et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles,
alors que dans (d), les lignes verticales en pointillé représentent la segmentation automatique
du QRS (QRSon, pic de l’onde R et QRSoff).
3.6. Conclusions 75
3.6 Conclusions
Ce chapitre était centré sur la détection et la segmentation optimales de l’activité
électrique ventriculaire du nouveau-né prématuré. Les difficultés liées au RSB, aux situations
variables, à la difficulté d’observer certaines ondes et surtout aux très grandes modifications
de l’ECG du prématuré par rapport à l’ECG de l’adulte ont nécessité de repenser totalement
l’analyse de l’ECG du nouveau-né. Dans ce contexte, notre approche a été d’exploiter des
algorithmes récemment mis au point au laboratoire et de les adapter à l’ECG très différent
du prématuré et de nous limiter à la détection et la segmentation du complexe QRS.
Afin d’adapter ces algorithmes de détection et de segmentation aux propriétés spécifiques
de l’ECG des nouveaux-nés prématurés, une méthodologie d’optimisation basée sur deux
AE indépendants a donc été proposée pour optimiser les 8 paramètres du détecteur et
les 12 paramètres de la méthode de segmentation. La probabilité d’erreur de détection,
la moyenne et l’écart-type du jitter de la détection ont été combinées pour construire la
fonction de coût à minimiser par chaque AE. Deux ensembles d’apprentissage distincts ont
été utilisés pour chaque AE. Les paramètres optimaux ont montré une amélioration de la
performance de la détection des battements et de la segmentation automatique du complexe
QRS, sur les enregistrements d’ECG acquis à partir de 32 nouveaux-nés prématurés. Sur
deux ensembles de test, les paramètres optimaux estimés augmentent la sensibilité et la
valeur prédictive positive du point fiducial, des débuts et des fins du complexe QRS et du
niveau iso-électrique. En outre, une réduction de la moyenne et de l’écart-type du jitter de
la détection a été obtenue pour le point fiducial, le début et la fin du complexe QRS et le
niveau iso-électrique. Même si les paramètres optimaux de la méthode de segmentation basée
sur les ondelettes ne modifient pas la performance de la détection de l’onde R, l’écart-type
du jitter de la détection a été diminué. En contre partie, le biais expérimental à la détection
a légèrement augmenté.
Malgré les performances supérieures obtenues après l’application du processus d’op-
timisation pour la détection du début et de la fin des complexes QRS, la méthode de
segmentation doit être encore améliorée. La difficulté de la segmentation du complexe QRS
dans ce contexte peut être observée, en particulier dans la figure 3.12d, où le début du QRS
est parfois placé plus proche de la fin de l’onde P et la fin du QRS est placée plus ou moins
loin de l’onde S en fonction de la morphologie du segment ST. En effet, la faible fréquence
d’échantillonnage d’origine, les changements fréquents de l’axe électrique cardiaque, les
changements dans le segment PR et le faible RSB de ces signaux ECG rendent très difficile
l’obtention robuste des instants du début et de fin du complexe QRS. Une analyse combinée
de l’ECG multi-voies devrait permettre d’améliorer ce point.
L’analyse des séries temporelles de la durée du cycle cardiaque (RR), de l’amplitude de
l’onde R (Ramp) et des durées des complexes QRS (QRSd) ont été réalisées sur 50 segments
76 Chapitre 3
d’ECG de 27 nouveaux-nés prématurés. Lorsque les valeurs de repos sont utilisés comme
référence (pendant T1), les tests d’hypothèse de Mann–Whitney U pour la moyenne
de chaque série temporelle ont montré des variations significatives (p < 0, 05) entre les
intervalles précédant la bradycardie et au cours de la bradycardie (T1−T2 vs. T1−T3). Des
variations significatives ont été aussi obtenus entre l’épisode de bradycardie et la période de
repos qui le suit (T1 − T3 vs T1 − T4). Ces résultats ont été obtenus pour toutes les séries
temporelles analysées.
Les principales contributions des travaux présentés dans ce chapitre ont été : i) la
proposition de méthodes de détection et de segmentation de l’activité électrique ventriculaire,
spécifiques au nouveau-né prématuré et ii) l’observation des modifications de l’amplitude
de l’onde R et de la durée du complexe QRS, associée à la survenue des épisodes d’apnée-
bradycardie.
Ces travaux ont été publiés dans un article de journal international [Altuve et al., 2011]
et dans une conférence internationale [Altuve et al., 2009]. Les résultats de ce chapitre
montrent les bénéfices potentiels d’une approche multidimensionnelle pour la détection
précoce et la caractérisation des apnée-bradycardies. D’autre part, l’analyse de différences
montre explicitement des distinctions entre la phase stable du bébé et la phase d’apnée-
bradycardie. Ceci suggère non pas d’analyser les valeurs instantanées mais plutôt de prendre
en compte les dynamiques de ces séries. L’objet du prochain chapitre est de proposer une
méthodologie adaptée à cette problématique.
Bibliographie 77
Bibliographie
Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009).
Analysis of the QRS complex for apnea-bradycardia characterization in preterm infants.
In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual International
Conference of the IEEE, pages 946–949. IEEE.
Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011).
Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in preterm
infants. International Journal of Biomedical Engineering and Technology, 5(2/3) :247–265.
Arzeno, N., Deng, Z., and Poon, C. (2008). Analysis of first-derivative based qrs detection
algorithms. Biomedical Engineering, IEEE Transactions on, 55(2) :478–484.
Bäck, T. and Schütz, M. (1996). Intelligent mutation rate control in canonical genetic
algorithms. In Ras, Z. W. and Michalewicz, M., editors, ISMIS, volume 1079 of Lecture
Notes in Computer Science, pages 158–167. Springer.
Chen, S., Chen, H., and Chan, H. (2006). A real-time qrs detection method based on
moving-averaging incorporating with wavelet denoising. Computer methods and programs
in biomedicine, 82(3) :187–195.
Clavier, L. and Boucher, J. (1996). Segmentation of electrocardiograms using a Hidden
Markov Model. In Proceedings of the 18th Annual International Conference of the IEEE
Engineering in Medicine and Biology Society, 1996. Bridging Disciplines for Biomedicine,
pages 1409–1410.
Coast, D. (1993). Segmentation of high-resolution ECGs using hidden Markov models. In
1993 IEEE International Conference on Acoustics, Speech, and Signal Processing, 1993.
ICASSP-93., volume 1.
Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD
thesis, Universidad Simón Bolívar.
Dumont, J., Hernández, A. I., and Carrault, G. (2010). Improving ecg beats delineation
with an evolutionary optimization process. IEEE Trans Biomed Eng, 57(3) :607–15.
Eiben, A. and Smith, J. (2003). Introduction to evolutionary computing. Springer Verlag.
Hernández, A. I., Carrault, G., Mora, F., and Bardou, A. (2002). Model-based interpretation
of cardiac beats by evolutionary algorithms : signal and model interaction. Artificial
Intelligence in Medicine, 26(3) :211–235.
Herrero, J., Blasco, X., Martínez, M., Ramos, C., and Sanchis, J. (2008). Non-linear
robust identification using evolutionary algorithms : : Application to a biomedical process.
Engineering Applications of Artificial Intelligence, 21(8) :1397–1408.
Hughes, N., Tarassenko, L., and Roberts, S. (2003). Markov models for automated ECG
interval analysis. Advances in Neural Information Processing Systems, 16.
Jane, R., Laguna, P., Thakor, N., and Caminal, P. (1992). Adaptive baseline wander removal
in the ECG : Comparative analysis with cubic spline technique. Computers in Cardiology,
pages 143–143.
78 Bibliographie
Köhler, B.-U., Hennig, C., and Orglmeister, R. (2002). The principles of software qrs
detection. IEEE Eng Med Biol Mag, 21(1) :42–57.
Koski, A. (1996). Modelling ECG signals with hidden Markov models. Artificial Intelligence
in Medicine, 8(5) :453–471.
Laguna, P., Jané, R., and Caminal, P. (1994). Automatic detection of wave boundaries
in multilead ecg signals : Validation with the cse database. Computers and Biomedical
Research, 27(1) :45–60.
Levkov, C., Mihov, G., Ivanov, R., Daskalov, I., Christov, I., and Dotsinsky, I. (2005).
Removal of power-line interference from the ecg : a review of the subtraction procedure.
Biomed Eng Online, 4 :50.
Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet
transforms. IEEE Trans Biomed Eng, 42(1) :21–8.
Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet-
based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng,
51(4) :570–81.
Meyer, C. and Keiser, H. (1977). Electrocardiogram baseline noise estimation and removal
using cubic splines and state-space computation techniques. Computers and Biomedical
Research, 10(5) :459–470.
Michalewicz, Z. (1996). Genetic algorithms+ data structures. Springer.
Nelder, J. and Mead, R. (1965). A simplex method for function minimization. The computer
journal, 7(4) :308.
Pan, J. and Tompkins, W. J. (1985). A real-time QRS detection algorithm. IEEE Transac-
tions on Biomedical Engineering, BME-32(3) :230–236.
Party, T. C. W. (1985). Recommendations for measurement standards in quantitative
electrocardiography. Eur Heart J, 6(10) :815–25.
Penzel, T., Nottrott, M., Canisius, S., Greulich, T., Becker, H. F., and Vogelmeier, C.
(2006). P428 ecg morphology changes improves detection of obstructive sleep apnea. Sleep
Medicine, 7(Supplement 2) :S101–S102.
Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship
between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7.
Shusterman, V., Shah, S. I., Beigel, A., and Anderson, K. P. (2000). Enhancing the precision
of ecg baseline correction : selective filtering and removal of residual error. Comput Biomed
Res, 33(2) :144–60.
Smrdel, A. and Jager, F. (2004). Automated detection of transient st-segment episodes in
24 h electrocardiograms. Med Biol Eng Comput, 42(3) :303–11.
Soria-Olivas, E., Martinez-Sober, M., Calpe-Maravilla, J., Guerrero-Martinez, J., Chorro-
Gasco, J., and Espi-Lopez, J. (1998). Application of adaptive signal processing for
determining the limits of P and T waves in an ECG. IEEE Transactions on Biomedical
Engineering, 45(8) :1077–1080.
Bibliographie 79
Sörnmo, L. (1993). Time-varying digital filtering of ecg baseline wander. Med Biol Eng
Comput, 31(5) :503–8.
Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de
Markov cachés. PhD thesis, Université de Rennes 1.
Vila, J., Gang, Y., Presedo, J., Fernández-Delgado, M., Barro, S., and Malik, M. (2000).
A new approach for TU complex characterization. IEEE Transactions on Biomedical
Engineering, 47(6) :764–772.
Vullings, H., Verhaegen, M., and Verbruggen, H. (1997). ECG segmentation using time-
warping. In Advances in Intelligent Data Analysis. Reasoning about Data : Second
International Symposium, IDA-97, London, UK, August 1997. Proceedings, page 275.
Springer.
Wong, S. (2004). Segmentation de l’intervalle RT et description par analyse factorielle de
la variabilité de la fréquence cardiaque et de la repolarisation ventriculaire. PhD thesis,
Université de Rennes 1.
Ziarani, A. K. and Konrad, A. (2002). A nonlinear adaptive method of elimination of power
line interference in ecg signals. IEEE Trans Biomed Eng, 49(6) :540–7.
Zifan, A., Saberi, S., Moradi, M., and Towhidkhah, F. (2006). Automated ECG Segmentation
Using Piecewise Derivative Dynamic Time Warping. International Journal of Biological
and Medical Sciences, 1(3).
Chapitre 4
Modélisation de la dynamique de
séries temporelles multivariées
Le chapitre précédent a clairement mis en évidence que l’analyse de la dynamique
d’indicateurs physiologiques était essentielle pour la caractérisation des épisodes d’apnée-
bradycardie chez les prématurés. Il a aussi montré que les méthodes de détection disponibles
actuellement n’exploitent pas cette dynamique. L’objet de ce chapitre est donc de répondre
à la problématique de la prise en compte de cette dynamique dans la détection d’événements
cardio-respiratoires. Il concerne également l’extraction de nouvelles informations contenues
dans de grands volumes de données physiologiques qui présente encore des difficultés d’ordre
méthodologique et technique, en particulier dans le contexte biomédical.
La position du problème d’un point de vue de la fouille de données temporelles et
multidimensionnelles est donc présentée dans un premier paragraphe pour la caractérisation
des indicateurs extraits de l’ECG. Les modélisations stochastiques, comme les modèles de
Markov cachés et les modèles semi-Markoviens cachés, ont été choisies comme approches
méthodologiques pour réaliser cette fouille de données. Ce choix est justifié dans le premier
paragraphe. Les modèles de Markov et de semi-Markov cachés sont ensuite définis, en
particulier leurs architectures, les procédures utilisées pour l’estimation des paramètres et
l’utilisation des distributions gaussiennes pour définir le temps passé dans les états et les
probabilités d’émission d’observations. Une méthodologie proposée, dans notre laboratoire,
pour l’initialisation des paramètres des modèles est détaillée ainsi que la détermination du
nombre d’états par modèle et l’évaluation de la vraisemblance qu’une séquence d’observation
soit générée pour un modèle. L’utilisation des modèles Markoviens cachés et de modèles
semi-Markoviens cachés, sur des études conduites antérieurement au laboratoire, pour les
tâches de classification et de détection sur des situations cliniques réelles est montrée.
L’analyse des résultats nous a conduit à proposer des modifications qui sont finalement
81
82 Chapitre 4
présentées. Ces modifications, qui constituent les principales contributions de ce chapitre,
concernent notamment l’utilisation des lois uniforme et non uniforme pour quantifier
les séries temporelles et la prise en compte des versions retardées de la série temporelle.
La première cherche à augmenter le rapport signal sur bruit et à optimiser le vecteur
d’observation par état. La deuxième cherche à incrémenter l’observabilité du système tout
en conservant le même nombre de sources. Une méthodologie empirique est enfin proposée
pour rechercher les valeurs optimales des paramètres des modèles.
4.1 Position du problème et état de l’art
4.1.1 Positionnement du problème
La détection des épisodes d’apnée-bradycardie est basée sur le fait que l’apnée du
prématuré entraîne souvent, quelques secondes après, un ralentissement de la FC et une
chute de la SpO2. Si l’apnée est souvent observée chez les nouveaux-nés prématurés, elle
n’est considérée pathologique que lorsqu’elle s’accompagne d’une bradycardie ou d’une
désaturation d’oxygène. La détection de l’apnée-bradycardie du prématuré a été largement
étudiée depuis quelques années. Cependant, la plupart ces travaux exploitent une seule
caractéristique extraite de l’ECG : la durée du cycle cardiaque sous forme d’une série
temporelle appelée RR. Parmi les travaux dédiés à détecter les épisodes d’apnée-bradycardie
on peut citer notamment ceux de :
– POETS [Poets et al., 1993] qui suggère l’utilisation d’un seuil relatif à l’amplitude de
la série RR,
– PRAVISANI et al [Pravisani et al., 2003] qui analysent les mesures linéaires et non
linéaires de la VFC par ACP et par analyse hiérarchique ascendante,
– CRUZ et al [Cruz et al., 2006], PORTET et al [Portet et al., 2007], et BELAL et
al [Belal et al., 2011] qui utilisent la technique des changements abrupts de valeur
moyenne,
– CRUZ et al [Cruz et al., 2006] qui réalisent une fusion optimale des détecteurs
d’apnée-bradycardie reportés dans la littérature,
– PORTET et al [Portet et al., 2007] qui exploitent diverses caractéristiques de la série
RR (superficie, pente, amplitudes minimale et maximale, dérivée, moyenne, etc.) par
arbres de décision,
– BELAL et al [Belal et al., 2011] qui utilisent les séries RR, fréquence respiratoire
et SpO2 pour détecter l’apnée du prématuré par des techniques comme la somme
cumulée, la corrélation et la dérivée.
Tel qu’il a été montré dans le chapitre précèdent, certaines caractéristiques extraites de
l’ECG, comme par exemple l’amplitude de l’onde R, la durée du complexe QRS et l’intervalle
RR, contiennent des informations pertinentes qui peuvent être prises en compte dans une
4.1. Position du problème et état de l’art 83
démarche de détection précoce de l’apnée-bradycardie. De plus, l’examen de ces séries
renseigne sur les différents systèmes physiologiques impliqués dans cette pathologie (système
nerveux autonome, respiratoire, circulatoire, etc.) et leur interaction avec l’environnement.
Comme déjà mentionné, l’intérêt principal de ce travail de thèse est de développer une
technique de détection des épisodes d’apnée-bradycardie robuste, efficace et applicable en
temps-réel, basée exclusivement sur des indicateurs extraits du signal ECG. Cette approche
pourrait, à terme, être intégrée dans un dispositif communicant, facile à appliquer sur les
nouveaux-nés, avec un encombrement minimal (seul l’ECG serait acquis). Ce travail se
place donc dans le domaine de la détection précoce d’événements dans un contexte bruité et
non-stationnaire, où l’extraction des connaissances nécessaires pour optimiser la détection
doit être réalisée à partir de bases de données cliniques multivariées.
4.1.2 Fouille de données temporelles multivariées
La fouille de données désigne le processus d’extraction de nouvelles informations non-
triviales et utiles (connaissances) à partir de grandes quantités de données, par l’utilisation
des méthodes issues de la statistique et de l’intelligence artificielle. Les méthodes de
fouille de données ont été appliquées sur des contextes variés, comme la prédiction, la
classification, le clustering, la recherche par contenu ou encore la visualisation et la détection
d’anomalies [Witten and Frank, 2005]. Quelques travaux ont été plus précisément consacrés
à l’analyse de séries temporelles [Povinelli, 2001; Kantardzic and Press, 2003; Mörchen, 2006;
Laxman and Sastry, 2006]. Ces méthodes de fouille de données peuvent être appliquées,
dans le domaine biomédical, pour identifier l’information utile contenue dans des larges
bases de données cliniques ou biologiques, afin d’en extraire des connaissances qui pourront
être exploitées dans une finalité diagnostique ou thérapeutique.
Dans ce travail de thèse, des méthodes de fouille de données temporelles et multivariées
sont proposées et appliquées dans le contexte de la détection d’événements physiopatho-
logiques. La figure 4.1 illustre ce problème d’extraction des connaissances à partir des
caractéristiques extraites de l’ECG. Trois exemples des séries RR, RAMP et QRSd y sont
reportés dans différents états physiopathologiques du nouveau-né prématuré : au repos
(en haut), en présence d’un ralentissement de la FC non pathologique (au milieu) et en
présence d’une bradycardie profonde (en bas). Sur les figures 4.1g, 4.1h et 4.1i, le début
de la bradycardie est indiqué par un losange et la détection effectuée par le système de
monitoring installé dans l’USIN est représentée par un cercle. Il apparaît clairement qu’une
analyse classique (basée uniquement sur les amplitudes instantanées de ces séries) ne serait
pas efficace. On observe également la complexité des séries à traiter. Les tendances cachées à
repérer peuvent être observées dans une ou plusieurs variables à la fois (cas uni et multivarié
respectivement), en même temps ou avec des différences significatives de phase. L’analyse
de l’évolution temporelle (dynamique) de ces variables n’est pas souvent prise en compte,
84 Chapitre 4
dû en partie à la complexité des méthodes à utiliser. Cependant, il est évident que ces
dynamiques apportent des nouvelles connaissances pour la caractérisation de la pathologie.
La problématique principale à laquelle nous sommes confrontés dans ce travail est donc
d’identifier et de caractériser des dynamiques spécifiques, permettant de détecter le plus
précocement possible les événements pathologiques (i.e. une détection proche du losange
dans les Figures 4.1g, 4.1h et 4.1i).
0 20 40 60 80 100 120
300
350
400
450
500
550
600
650
700
750
RR(ms)
Temps (s)
(a)
0 20 40 60 80 100 120
0.5
0.6
0.7
0.8
0.9
1
1.1
RAMP
Temps (s)
(b)
0 20 40 60 80 100 120
40
42
44
46
48
50
52
54
56
58
60
QRSd(ms)
Temps (s)
(c)
0 20 40 60 80 100 120
300
350
400
450
500
550
600
650
700
750
RR(ms)
Temps (s)
(d)
0 20 40 60 80 100 120
0.5
0.6
0.7
0.8
0.9
1
1.1
RAMP
Temps (s)
(e)
0 20 40 60 80 100 120
40
42
44
46
48
50
52
54
56
58
60
QRSd(ms)
Temps (s)
(f)
0 20 40 60 80 100 120
300
350
400
450
500
550
600
650
700
750
RR(ms)
Temps (s)
(g)
0 20 40 60 80 100 120
0.5
0.6
0.7
0.8
0.9
1
1.1
RAMP
Temps (s)
(h)
0 20 40 60 80 100 120
40
42
44
46
48
50
52
54
56
58
60
QRSd(ms)
Temps (s)
(i)
Figure 4.1 – Exemples des séries temporelles extraites de l’ECG sur trois instants différents.
Dans (a), (b) et (c) on observe les séries RR, RAMP et QRSd respectivement dans une
période de repos. Dans (d) la série RR pressente un ralentissement du cœur qui produit des
variations dans les séries RAMP (e) et QRSd (f). Dans (g), (h) et (i) on observe les séries
RR, RAMP et QRSd respectivement en présence d’un épisode d’apnée-bradycardie dont le
cercle correspond à la détection effectuée par la méthode classique (RR ≥ 600 ms pendant
4 s) et le losange représente le début de la bradycardie.
La démarche générale choisie dans cette deuxième partie de la thèse, pour la détection
d’événements d’apnée-bradycardie, est basée sur le cadre de la fouille de données temporelles
4.1. Position du problème et état de l’art 85
et multivariées. Cette démarche est classiquement représentée par le diagramme reporté
figure 4.2 et détaillée comme suit :
Base de données
Sélection
Pré-traitement
Transformation
Outils de fouille
Évaluation
Connaissances
Nouveaux-nés prématurés
Section 2.2.1
Signaux ECG
Nettoyage, extraction de caracteristiques
Chapitre 3
Caractérisation des dynamiques multivariées
Section 4.1.3
Application de la fouille de données
Section 4.3.6 et 4.4
Validation et vérification des résultats
Section 2.3
Figure 4.2 – Étapes du processus de fouille de données et leur correspondance dans cette
thèse.
1. Sélection. Des signaux ECG bruts ont été acquis dans l’USIN de Rennes, sur des
nouveaux-nés prématurés présentant des épisodes d’apnées-bradycardie fréquents.
L’étape de sélection consiste à choisir les segments d’ECG exploitables en termes
de rapport signal sur bruit et en fonction des pathologies et des types d’événement
observés dans chaque enregistrement. L’interaction avec les pédiatres a été capitale
dans cette étape. Des annotations des épisodes d’apnée-bradycardie ont été effectuées
par les spécialistes et ont servi de point de repère des évènements à détecter et dans
la mise au point et validation des méthodes de détection développées.
2. Pré-traitement. Il consiste à nettoyer au mieux le signal ECG, puis à en extraire
l’information utile pour caractériser les épisodes d’apnée-bradycardie. Cette informa-
tion correspond aux indicateurs utilisés par les cardiologues pour caractériser le cycle
cardiaque (notamment les intervalles et amplitudes des ondes présentées figure 1.7)
ainsi que le rythme cardiaque instantané. Cette étape d’extraction est fondamentale
car elle permet de réduire la dimension des données (par rapport aux signaux bruts) et
de conserver une information interprétable par les spécialistes. Le troisième chapitre
86 Chapitre 4
de ce mémoire a été dédié à cette étape de nettoyage/extraction. L’une des difficultés
rencontrées est le choix de seuils de décisions optimaux et ce chapitre a montré une
méthode d’optimisation des seuils basée sur des algorithmes évolutionnaires.
3. Transformation. A l’issu de l’étape d’extraction de caractéristiques on dispose
de N séries temporelles multivariées de différentes tailles Tn : n ∈ {1, 2, . . . , N},
constituées d’une succession de vecteurs d’observations :
O = {o1
1:T1
, o2
1:T2
, . . . , oN
1:TN
} (4.1)
où on
1:T1
est le ne
vecteur d’observation et o1:T = o1, o2, . . . , oT est la séquence d’ob-
servation multivariée de taille T qui regroupe les M variables x à chaque instant t et
définies dans RM :
ot =






x1
t
x2
t
...
xM
t






(4.2)
L’objectif à ce stade est de proposer une transformation permettant de caractériser la
dynamique de l’ensemble d’observations O, en fonction des états physiopathologiques
à classer ou à détecter. La section 4.1.3 décrit les différentes approches existantes
dans la littérature et indique le type de méthode privilégiée dans ce travail de thèse.
4. Outils de fouille. Dans cette étape on définit les méthodes utilisées pour extraire
l’information utile à partir des bases de données disponibles, en exploitant les trans-
formations définies dans l’étape précédente. Les sections 4.3.6 et 4.4 présentent les
outils méthodologiques proposés pour cette étape.
5. Évaluation. L’application des étapes précédentes va produire une série de résultats
de détection de l’évènement d’intérêt, en conséquence, dans cette étape, on choisit
l’outil de fouille qui apporte la meilleure solution à notre problème, c’est-à-dire, celui
qui donne la meilleure performance de détection. Cette performance est évaluée en
fonction des valeurs de sensibilité, spécificité et retard à la détection et c’est la distance
la plus courte à la détection parfaite qui permettra de choisir le meilleur outil de
fouille appliqué (c.f. section 2.3).
Le reste de ce chapitre présente les méthodes adaptées à chacune des étapes décrites
précédemment.
4.1.3 Caractérisation des dynamiques de séries temporelles
L’analyse et la caractérisation des dynamiques de séries temporelles est un vaste domaine
de recherche qui continue à se développer depuis son apparition dans les années 80. On
4.1. Position du problème et état de l’art 87
relève notamment des applications en traitement du signal, comme par exemple dans le
domaine de reconnaissance de la parole [Chibelushi et al., 2002; Beritelli et al., 2006; Dufour
et al., 2009], la bioinformatique [Mittag et al., 2010; Csizmok et al., 2008; Givaty and Levy,
2009], la climatologie [Maseng and Bakken, 1981; Kusiak et al., 2009; Fan et al., 2009],
etc. Cette caractérisation de dynamiques est fréquemment décomposée en deux problèmes
distincts [Mörchen, 2006] :
1. L’estimation de mesures de similarité, basée sur la forme ou sur les caractéristiques in-
trinsèques du signal. Les méthodes basées sur la forme nécessitent peu de connaissances
a priori et sont bien adaptées aux problèmes de classification, mais la résolution de
problèmes de prédiction et de prise en compte de données multivariées à dynamiques
hétérogènes n’est pas directe. Les méthodes basées sur les caractéristiques nécessitent
plus de connaissances a priori sur les données (sélection des caractéristiques infor-
matives). La définition d’une distance dans l’espace des caractéristiques n’est pas
évidente, qui plus est, dans le cas de données temporelles multivariées.
2. Les approches à base de modèles. Elles permettent, pour la plupart, la prise en compte
de séries temporelles multidimensionnelles et de différentes tailles. L’introduction de
connaissances a priori peut être réalisée à plusieurs niveaux de détail, en fonction de
l’application visée. Cette approche permet également de mesurer l’adéquation d’un
individu à un modèle donné (tâche de classification) ou de réaliser des prédictions,
par simulation. Cependant, elle est, en général, plus difficile à mettre en œuvre et est
particulièrement dépendante de la quantité et de la qualité des données utilisées dans
la période d’apprentissage ou de validation du modèle.
L’analyse des paragraphes précédents a orienté notre choix vers les approches à base de
modèles de type « boîte noire ». Ce choix se justifie par le fait que, dans notre problème de
caractérisation des dynamiques des séries temporelles extraites de l’ECG, i) les connaissances
a priori directement exploitables sont limitées, ii) plusieurs variables peuvent contenir de
l’information utile et ces variables doivent être traitées de manière conjointe (multivariée)
et iii) les dynamiques des différentes variables étudiées sont hétérogènes, car elles sont
la conséquence de processus physiologiques fonctionnant avec des constantes de temps
très différentes. De plus, les approches à base de modèles permettent d’aborder l’étape de
prédiction et les paramètres identifiés (même dans le cas des modèles à « boîte noire »),
peuvent être utilisés pour mieux comprendre les phénomènes physiologiques observés.
Plusieurs méthodes ont été proposées dans la littérature pour la modélisation des
dynamiques des séries temporelles multivariées :
– les modèles dans les espaces de phases reconstruits [Suzuki et al., 2003; Kong et al.,
2009; Garcia and Almeida, 2006],
– les filtres de Kalman [Kalman et al., 1960; Houtekamer and Mitchell, 2001; Fahrmeir,
1992],
– les réseaux bayésiens dynamiques [Murphy, 2002; Zweig and Russell, 1998],
– les réseaux de neurones artificiels [Raman and Sunilkumar, 1995; Bishop, 1995],
88 Chapitre 4
– les modèles de Markov cachés [Rabiner, 1989],
– les modèles semi-Markovien cachés [Ferguson, 1980; Yu, 2010].
Des travaux de doctorat récents effectués dans notre laboratoire (thèse de DUMONT J.
[Dumont, 2008]) ont été dédiés à l’étude et à la comparaison de ces principales méthodes de
modélisation des dynamiques sur des séries temporelles issues du domaine biomédical, dans
un cadre d’analyse de données physiologiques temporelles et multivariées. Les résultats de ce
travail ont montré que les modèles Markoviens cachés (MMC) et les modèles semi-Markoviens
cachés (MSMC) présentent un certain nombre de propriétés qui les rendent particulièrement
adaptés à la modélisation des dynamiques de séries temporelles en cardiologie.
Dans les sections suivantes, un rappel de la théorie des modèles de Markov et semi-
Markov cachés est présenté. L’approche méthodologique proposée dans les travaux de
DUMONT [Dumont, 2008; Dumont et al., 2008, 2009b,a] est ensuite décrite brièvement.
Enfin, des améliorations proposées dans le présent travail aux méthodes existantes sont
détaillées.
4.2 Les modèles de Markov et semi-Markov cachés
Dans cette section, une brève introduction aux MMC et MSMC et leurs propriétés de
base est présentée. Pour en savoir plus, on invite le lecteur à se reporter aux travaux de
EPHRAIM et MERHAV [Ephraim and Merhav, 2002] ou MACDONALD et ZUCCHINI
[MacDonald and Zucchini, 1997] pour les MMC et KULKARNI [Kulkarni, 2010] ou YU
[Yu, 2010] pour les MSMC.
Un MMC est un processus doublement stochastique où le processus stochastique sous-
jacent est une chaîne de Markov d’états finis et à temps discret. La séquence d’états n’est
pas observable (d’où le terme « caché ») et influence un autre processus stochastique qui
produit une séquence d’observations. La structure de base des MMC est illustrée dans la
figure 4.3.
S2S1 S3
O1 O2 O3
Observations
Chaîne de Markov (non observée)
Figure 4.3 – Structure de base d’un modèle de Markov caché.
4.2. Les modèles de Markov et semi-Markov cachés 89
Introduits par BAUM et PETRIE [Baum and Petrie, 1966], les MMC ont été appliqués
dans un grand nombre de domaines comme :
– la biologie [Churchill, 1992; Pedersen and Hein, 2003; Munshaw and Kepler, 2010],
– la reconnaissance de la parole [Rabiner, 1989],
– le traitement de l’image [Yamato et al., 1992],
– la reconnaissance de texte [Chen et al., 1994].
Cependant, en raison d’une probabilité non nulle d’auto-transition d’un état, la durée d’un
état MMC suit une distribution géométrique. Cela rend les MMC inadaptés dans certaines
applications, telles que la reconnaissance des gènes humains dans l’ADN [Burge and Karlin,
1997] ou la modélisation des séries chronologiques financières [Bulla and Bulla, 2006].
Pour résoudre ce problème, FERGUSON [Ferguson, 1980] a proposé un modèle qui
permet des distributions de temps de séjours arbitraires pour le processus caché. Comme le
processus caché devient semi-Markovien, ce modèle est appelé un modèle semi-Markovien 1
caché (également connu sous le nom de MMC de durée variable ou MMC de durée explicite).
FERGUSON a considéré les MSMC comme une approche alternative aux MMC pour
la modélisation de la parole, car ces derniers n’étaient pas assez souples pour décrire le
temps passé dans un état donné. Après ce travail pionnier, plusieurs problèmes liés aux
MSMC ont été étudiés par différents auteurs, par exemple, LEVINSON [Levinson, 1986],
GUEDON [Guédon, 2003], SANSOM et THOMSON [Sansom and Thomson, 2001], YU et
KOBAYASHI [Yu and Kobayashi, 2003], BULLA [Bulla, 2006]. La structure de base des
MSMC est illustrée figure 4.4.
Différentes hypothèses ont été considérées dans la littérature pour la distribution
des observations, ainsi que pour la représentation du temps passé dans un état. Pour
cette dernière, trois types de modélisation sont principalement utilisés : par une famille
paramétrique de distributions continues [Levinson, 1986], par une famille des distributions
exponentielles [Mitchell and Jamieson, 1993] ou par la loi binomiale négative [Durbin, 1998].
S2S1 S3
Observations
Chaîne de Markov (non observée)
O1 On On+1 On+m On+m+1 On+m+h
Figure 4.4 – Structure de base d’un modèle de semi-Markov caché.
1. Un processus semi-Markovien a la propriété suivante : la probabilité de passer d’un état caché i vers
un autre j dépend uniquement du temps passé depuis l’entrée en l’état actuel i. Au contraire, la propriété
d’un processus Markovien suppose que la probabilité de changer d’état dépend uniquement de l’état actuel.
90 Chapitre 4
Même si le domaine d’application le plus commun des MSMC est la reconnaissance de
la parole [Ferguson, 1980], ces modèles ont été appliqués avec succès dans des nombreux
autres domaines :
– l’électrocardiographie [Thoraval, 1995; Dumont, 2008],
– la reconnaissance de textes [Kundu et al., 1997; Weinman et al., 2009],
– la reconnaissance des gènes humains dans l’ADN [Burge and Karlin, 1997; Aydin
et al., 2006],
– l’analyse des modes de ramification et de floraison des plantes [Guédon et al., 2001],
– l’analyse des données pluviométriques [Sansom and Thomson, 2001],
– la modélisation des séries chronologiques financières [Bulla and Bulla, 2006].
L’application des MMC et des MSMC dans ces différents domaines est principalement
due à leur polyvalence et leur résolubilité mathématique, car ils sont caractérisés par les
propriétés suivantes [MacDonald and Zucchini, 1997] :
– Disponibilité de tous les moments : moyenne, variance, autocorrélations.
– L’évaluation d’une séquence d’observation est facile à calculer, son calcul est linéaire
dans le nombre d’observations et de nombreux algorithmes existent.
– Les distributions marginales, souvent représentées par des lois des probabilités géo-
métriques, gaussiennes, etc., peuvent être déterminées aisémment et les observations
manquantes peuvent être manipulés avec un effort mineur, du fait des lois des proba-
bilités utilisées.
– Les distributions conditionnelles P(Y = y|X = x) sont disponibles, grâce au processus
doublement stochastique et à l’architecture des modèles, l’identification des valeurs
aberrantes est possible car des probabilités très faibles seront obtenues pour ces valeurs
et les distributions prévues peuvent être calculées.
4.2.1 Architecture des modèles
Soit S = {1, . . . , M} l’ensemble d’états d’une chaîne de Markov. La séquence d’états est
désignée par S1:T S1, . . . , ST , où St ∈ S est l’état à l’instant t. Une réalisation de S1:T
est dénotée comme s1:T .
La séquence d’observation est souvent notée par O1:T O1, . . . , OT , où Ot ∈ V est
l’observation à l’instant t et V = {ν1, ν2, . . . , νK} est l’ensemble de valeurs observables.
Dans les MMC, une observation est produite dans chaque état i car les états n’ont pas
une durée. Par exemple, pour la séquence d’observation o1:T , la séquence d’états Markoviens
sous-jacente est s1:T = i1, i1, i1, i2, . . . , in où n
m=1 sm = T et i1, i2, . . . , in ∈ S.
Par opposition, dans les MSMC, chaque état i a une durée d variable, qui est associée
au nombre d’observations produites lorsqu’on reste dans l’état. La durée des états est
une variable aléatoire et prend une valeur entière dans l’ensemble D = {1, 2, . . . , D}. Par
4.2. Les modèles de Markov et semi-Markov cachés 91
exemple, pour la séquence d’observation o1:T , la séquence d’états semi-Markovien sous-
jacente est s1:T = i1, i2, . . . , in et la séquence de durées des états est d1:T = d1, d2, . . . , dn,
où n
m=1 dm = T, i1, i2, . . . , in ∈ S et d1, d2, . . . , dn ∈ D.
La probabilité de transition entre les états de i → j, ∀i = j, est définie par :
aij P(St+1 = j|St = i), (4.3)
avec j∈S{i} aij = 1 et la probabilité d’auto-transition aii = 0 pour les MMC et aii = 0
pour les MSMC, où i, j ∈ S.
Dans les MSMC, la durée d’occupation d’un état est indépendante de la durée de l’état
antérieur et n’est conditionnée que sur l’état actuel. Par conséquent, la probabilité de
durée de l’état dans les MSMC est notée par :
pi(d) P(St+d−1 = i|St = i) (4.4)
Comme mentionné auparavant, les MMC n’ont pas une probabilité de durée définie.
La probabilité d’émission d’observations de l’état i est définie par :
bi(νk) P(ot = νk|St = i), (4.5)
avec νk
bi(νk) = 1 et la probabilité de l’état initial sera définie par :
πi P(S1 = i), (4.6)
avec i πi = 1.
Donc, l’ensemble des paramètres λMMC du MMC est défini par :
λMMC
{aij, bi(νk), πi}. (4.7)
et l’ensemble des paramètres λMSMC du MSMC est défini par :
λMSMC
{aij, bi(νk), πi, pi(d)} (4.8)
Le tableau 4.1 résume les principaux paramètres et caractéristiques des MMC et MSMC
et synthétise la notation utilisée dans ce manuscrit.
Un exemple d’un MMC, est représenté dans la figure 4.5. Le premier état i1 est choisi
selon la probabilité π1. Dans l’état i1 l’observation o1 est produite selon la probabilité
d’émission d’observation bi1 (o1). Il transite (reste) vers l’état i1 d’après la probabilité de
92 Chapitre 4
Tableau 4.1 – Résumé des principaux paramètres et caractéristiques des MMC et MSMC.
Paramètre Symbole MMC MSMC
Élément de la matrice de transition aij j∈S{i} aij = 1 aii = 0
Probabilité d’observation bi(νk) νk
bi(νk) = 1 νk
bi(νk) = 1
Probabilité de durée pi(d) Non définie Explicite†
Probabilité de l’état initial πi i πi = 1 i πi = 1
† Détaillée section 4.3.1
transition a11 et produit l’observation o2 selon la probabilité bi1 (o2). Ensuite, il transite
vers i2 d’après a12 et produit o3 selon bi2 (o3). Ensuite, il transite vers i2, . . . , in jusqu’à ce
que la dernière observation soit produite.
Figure 4.5 – Principe de fonctionnement d’un modèle Markovien caché.
Un exemple d’un MSMC, inspiré de YU [Yu, 2010], est représenté dans la figure 4.6.
Le premier état i1 est choisi selon la probabilité π1. Le processus reste pendant une du-
rée d1 = 2 dans l’état i1 et deux observations sont donc produites dans cet intervalle
de temps o1, o2 , suivant les probabilités d’émission d’observations bi1 (o1), bi1 (o2) . Il
transite vers l’état i2 d’après la probabilité de transition a12 où il va rester d = 3 unités de
temps et produire trois observations o3, o4, o5 selon les probabilités d’émission d’observa-
tions bi2 (o3), bi2 (o4), bi2 (o5) . Ensuite, il transite vers i3, . . . , in jusqu’à ce que la dernière
observation soit produite.
Figure 4.6 – Principe de fonctionnement d’un modèle semi-Markovien caché.
4.2. Les modèles de Markov et semi-Markov cachés 93
Dans notre problème de modélisation de la dynamique des séries temporelles extraites
de l’ECG, le temps passé dans un état peut être d’une importance capitale, ou du moins,
tout aussi important que les transitions entre états : il est notamment possible que certains
états se distinguent par des temps de passage très courts et d’autres par des temps de
passage beaucoup plus élevés. À partir des figures 4.5 et 4.6, on peut constater plusieurs
avantages des MSMC par rapport aux MMC, qui les rendent particulièrement adaptés à
notre application :
– Dans les MMC la probabilité de rester dans un même état n’est pas explicite et elle
suit une loi géométrique pi(d) = ad
ii(1 − aii) qui est une représentation irréaliste de
la durée des séquences d’observations analysées, car elle suppose que les temps de
passage courts sont plus probables que les temps de passage longs.
– Les MSMC re-définissent de manière plus explicite le temps passé dans chaque
état par des distributions paramétriques qui leur sont spécialement affectées. Cette
représentation est plus adaptée à notre application où des lois Gaussiennes sont
souvent observées.
– Le temps passé dans un état dans les MSMC est un paramètre appris comme les
autres paramètres.
– Dans les MMC le temps passé dans un état est une variable discrète tandis que dans
les MSMC le temps passé dans un état peut être représenté par une variable continue
avec des valeurs µ ± σ.
4.2.2 Estimation des paramètres des modèles
Les paramètres des MMC et MSMC sont généralement estimés en utilisant la méthode
du maximum de vraisemblance (MV). L’ensemble des paramètres λ (λMSMC et λMMC)
sont obtenus à partir des observations O1:T . λ est estimé, puis re-estimé de sorte que la
fonction de vraisemblance
L(λ; O1:T ) = P(O1:T |λ) (4.9)
augmente et converge vers sa valeur maximale, où P(O1:T |λ) est la probabilité que la
séquence observée O1:T soit générée par le modèle avec l’ensemble de paramètres λ.
Les deux approches les plus courantes pour estimer les paramètres d’un MMC sont
l’algorithme espérance-maximisation (EM) [Dempster et al., 1977] et la maximisation directe
numérique de la vraisemblance [Campillo and Le Gland, 1989]. Cependant, l’algorithme
EM est la méthode préférée en raison de sa plus grande stabilité [Bulla and Bulla, 2006].
L’algorithme EM cherche à trouver le MV par l’application itérative de deux étapes :
– Étape 1 « Espérance » (E) : détermine l’espérance de la log-vraisemblance selon les
données observées O1:T et les paramètres courants λ(t) :
Q(λ|λ(t)
) = E [log L(λ; O1:T )] (4.10)
94 Chapitre 4
– Étape 2 « Maximisation » (M) : trouve les paramètres qui maximisent cette quantité :
λ(t+1)
= arg max
λ
Q(λ|λ(t)
) (4.11)
Pour l’estimation des paramètres λ, l’algorithme forward-backward [Levinson, 1986] et
l’algorithme de Viterbi [Forney Jr, 1973] sont souvent employés. Ces deux algorithmes sont
issus d’une approche itérative EM. L’algorithme forward-backward considère l’ensemble des
observations pour déterminer L(λ; O1:T ) tandis que la méthode de Viterbi ne prend en
compte que le chemin optimal.
Évidemment, les résultats obtenus de ces algorithmes de type EM dépendent fortement
du choix des valeurs initiales. Une solution possible, proposée par DUMONT [Dumont, 2008]
permet l’initialisation des paramètres à partir d’un enchaînement des modèles constitués
par : i) un partitionnement de données par l’algorithme K-means, ii) un modèle de mélanges
de gaussiennes, iii) un MMC et finalement iv) un MSMC. Cette méthode d’initialisation,
ainsi que l’approche méthodologique globale proposée par DUMONT, seront détaillées dans
la section suivante.
4.3 Rappel de la méthode proposée par DUMONT J.
La thèse de DUMONT J. [Dumont, 2008] s’est concentrée sur la modélisation des
dynamiques des séries temporelles en cardiologie par MSMC. Pendant ces travaux, une
méthode basée sur des MSMC à densité d’observation continue a été proposée pour la
classification, le clustering et la représentation des données physiologiques temporelles
et multivariées. Cette méthode a été évaluée sur des données réelles dans la détection
d’événements ischémiques et la caractérisation de la réponse autonomique des patients
souffrant d’un syndrome de Brugada. D’un point de vue clinique, l’ensemble des résultats
obtenus montre l’importance de l’analyse de la dynamique des séries temporelles dans la
distinction d’états physiopathologiques de l’individu.
Dans cette section, les principales contributions des travaux de DUMONT sont présentées
brièvement, car ils sont à la base des propositions réalisées dans le présent travail de thèse.
4.3.1 Les distributions des durées et d’observation
La distribution des durées des états des MSMC (pi(d)) peut être paramétrique ou
non paramétrique. De même, la distribution des observations des MSMC et des MMC
(bi(νk)) peut être paramétrique ou non paramétrique, discrète ou continue et dépendante
ou indépendante des durées de l’état, selon le cas. La distribution des observations peut
également être définie par un mélange de distributions. Une discussion plus approfondie sur
4.3. Rappel de la méthode proposée par DUMONT J. 95
les différentes distributions de durées et des observations peut être trouvée dans YU [Yu,
2010]. Dans l’approche proposée par DUMONT, la distribution des durées des états pi(d) et
la distribution d’observation bi(νk) sont modélisées par une densité de probabilité gaussienne
de type :
f(x; µ, σ2
) =
1
σ
√
2π
e−1
2 (x−µ
σ )
2
(4.12)
pour le cas univarié où x correspond aux données associées aux durées des états et aux
données associées aux observations et µ et σ2 définissent respectivement la moyenne et la
variance de x. Pour le cas multivarié, elle est définie comme :
f(x; µ, Σ) =
1
(2π)n/2|Σ|1/2
e−
1
2(x−µ)TΣ−1(x−µ)
(4.13)
où x correspond aux données associées aux observations multivariées, n est le nombre de
dimensions, µ est le vecteur de moyennes de x (µ ∈ Rn), Σ est la matrice de covariance semi-
définie positive de x (Σ ∈ Rn×n), l’exposant T est la transposée et |Σ| est le déterminant de
Σ. Cette expression se réduit à la densité de probabilité gaussienne univariée (équation 4.12)
si Σ est un scalaire (matrice 1 × 1).
On utilise la nomenclature f(x) ∼ N(µ, σ2) (où f(x) ∼ N(µ, Σ)) pour représenter cette
densité de probabilité gaussienne. Ainsi, d’une part, pour représenter les temps de passage
pi(d) ∼ N(µd
i , σd
i
2
), où les scalaires µd
i et σd
i
2
définissent respectivement la moyenne et
la variance des gaussiennes assignées à chaque état i, et d’autre part, pour représenter
la probabilité d’observation bi(νk) ∼ N(µνk
i , σνk
i
2
), où les scalaires µνk
i et σνk
i
2
définissent
respectivement la moyenne et la variance des gaussiennes assignées à chaque état i. Dans le
cas multivarié, la distribution d’observation est représentée par une densité de probabilité
gaussienne multidimensionnelle bi(νk) ∼ N(µνk
i , Σνk
i ), où µνk
i est le vecteur des centres des
gaussiennes multivariées de chaque état et Σνk
i sa matrice de covariance.
4.3.2 Méthodologie utilisée pour l’estimation des paramètres des MSMC
L’algorithme de Viterbi [Forney Jr, 1973] a été choisi pour l’estimation des paramètres
car i) c’est l’algorithme le plus populaire de programmation dynamique pour l’estimation du
MV de la séquence des états d’un MMC, ii) il converge plus rapidement vers un maximum
local, iii) il est moins sensible aux problèmes de stabilité numérique (par exemple lorsque les
vraisemblances observées bj(νk) deviennent très petites) et iv) il est aisément transposable
aux MSMC. Par ailleurs, les paramètres du modèle seront estimés avec le plus grand nombre
de séries temporelles possibles, limitant ainsi le risque de tomber dans des minima locaux
erronés. Pour ne pas alourdir la présentation, nous avons reporté Annexe D la présentation
de l’algorithme de Viterbi.
Au cours de l’étape de rétropropagation de l’algorithme de Viterbi, plusieurs variables
96 Chapitre 4
sont enregistrées pour permettre la mise à jour des paramètres du modèle dans l’étape de
maximisation de l’algorithme EM. Dans le cas des MMC, ces variables enregistrées sont les
suivantes :
– ηi : Nombre de passages dans l’état i,
– ξi : Somme des initialisations dans l’état i,
– ζij : Somme des transitions de l’état i à l’état j,
Elles permettent la mise à jour de l’ensemble des paramètres λMMC :
πi =
ξi
j ξj
,
aij =
ζij
j=i ζij
,
µνk
i = t ωt
i(Ot)
t ωt
i
,
Σνk
i = t ωt
i(OtOT
t )
t ωt
i
− µνk
i (µνk
i )T
,
(4.14)
où l’exposant T signifie la transposée et ωt
i(Ot) est égal à 1 lorsque le chemin optimal se
trouve dans l’état i à l’instant t, et à zéro sinon.
Dans le cas des MSMC, les variables enregistrées sont les mêmes que pour le cas des
MMC plus une variable qui caractérise la durée des états et qui correspond à la somme des
durées dans l’état i (ϑi).
Ainsi, la mise à jour de l’ensemble des paramètres λMSMC est semblable au cas MMC
sauf pour les probabilités de transition et de durée des états où on utilise les règles suivantes :
aij =
ζij
j=i ζij
,
µd
i =
ϑi
ηi
,
σd
i
2
=
ϑ2
i
ηi
− (µd
i )2
.
(4.15)
Initialisation de l’ensemble de paramètres des modèles
L’initialisation de l’ensemble de paramètres du MSMC a été réalisée à partir des
paramètres d’un MMC. Cela est justifié par le fait que l’apprentissage des paramètres des
MSMC est sensible à son initialisation. Cette méthodologie est présentée figure 4.7, elle
met en jeux différents éléments :
– Une base de données d’apprentissage, qui comporte plusieurs séquences d’observations
O1:T pour ajuster les paramètres des modèles en maximisant L(λ; O1:T ) (équation 4.9).
4.3. Rappel de la méthode proposée par DUMONT J. 97
– Un algorithme k-means pour initialiser les centres des gaussiennes (ˇµi) d’un modèle
de mélanges de gaussiennes (MMG). Le centre de chaque gaussienne correspond au
barycentre de chaque état dans l’espace d’observation.
– Une procédure EM permet d’estimer les centres (˜µi) et covariances (˜Σi) du MMG.
– Un algorithme de Viterbi pour l’estimation des paramètres d’un MMC équivalent :
probabilité de transition (ˆaij), probabilité d’état initial (ˆπi) et les centres (ˆµi) et
covariances (ˆΣi) de la probabilité d’émission des observations. Les paramètres ˆaij
et ˆπi sont initialisés avec une probabilité uniforme et ˜µi et ˜Σi sont utilisées comme
valeurs initiaux de ˆµi et de ˆΣi.
– Un MMC équivalent pour initialiser les paramètres du MSMC. Les chemins le plus plau-
sibles (déterminées sur les séquences d’observations) et le temps passé dans chaque état
du MMC sont utilisés pour l’initialisation des moyennes (µd
i ) et variances (σd
i
2
) des pro-
babilités de temps de séjour des états. Finalement, l’algorithme de Viterbi, étendu aux
MSMC, est utilisé pour l’estimation de λMSMC = {aij, bi(µνk
i , Σνk
i ), πi, pi(µd
i , σd
i
2
)}.
Base de données
d'apprentissage
k-means
Modèle de
mélanges gaussiens
Espérance-Maximisation
Modèle de
Markov caché
Algorithme
de Viterbi
Modèle de
semi-Markov caché
Algorithme
de Viterbi modifié
Figure 4.7 – Procédure utilisée pour l’apprentissage des MSMC à partir d’une base de
données, d’après DUMONT [Dumont, 2008].
4.3.3 Estimation du nombre d’états
Le nombre d’états cachés M est généralement supposé connu dans le cadre de certaines
applications. Toutefois, dans notre contexte, le nombre d’états est inconnu dans la pratique
et doit être estimé. Créer des modèles avec un nombre approprié d’états n’est pas un
problème trivial : un modèle avec trop d’états va sur-apprendre les observations, tandis
qu’un modèle avec trop peu d’états va décrire mal les observations qui lui sont affectées.
98 Chapitre 4
Le critère d’information bayésien (BIC) [Schwarz, 1978], largement utilisé pour estimer
M dans le contexte de fouille de données [Katz, 1981; Li et al., 2002; Dumont et al., 2009b],
a été retenu dans ces travaux. Le BIC ne nécessite pas de connaissances a priori et favorise
les modèles plus simples par rapport aux modèles plus complexes [Schwarz, 1978].
Le nombre d’états est donc estimé en utilisant :
ˆM = arg max
M
log L λ(M); O1:T − f(M)
log I
2
(4.16)
où I est le nombre de séquences d’observations et f(M) est le nombre de paramètres du mo-
dèle en fonction du nombre d’états M. En utilisant des distributions des durées et d’observa-
tions gaussiennes, f(M) = M(1+2M +M2) pour le cas MMC et f(M) = M(3 + 2M + M2)
pour le cas MSMC.
4.3.4 Évaluation d’une séquence observée
Notre objectif pour les applications ciblées sera de reconnaître plusieurs dynamiques
différentes. Ce problème n’est rien d’autre qu’un problème de classification. L’intérêt est que
les MMC et MSMC offrent un cadre théorique direct pour répondre à cette problématique.
Cette tâche consiste à déterminer la probabilité d’une séquence de sortie particulière, compte
tenu des paramètres du modèle. Ce problème peut être traité efficacement en utilisant
l’algorithme de Viterbi (Annexe D). Pour le cas MMC, ceci revient à choisir :
P(O1:T |λMMC
) = max
j∈S
δT (j)
= max
j∈S
max
i∈S
δT−1(i)aij bj(oT )
(4.17)
où δt(i), définie par l’équation 4.18, représente le maximum de vraisemblance d’une trajec-
toire unique jusqu’au temps t, qui prend en compte les premières t observations et s’arrête
à l’état i.
δt(i) max
s1:t−1
P(s1, s2, . . . , st = i, o1:t|λ) (4.18)
Pour le cas de MSMC, on utilise :
P(O1:T |λMSMC
) = max
j∈S,d∈D
δT (j, d)
= max
j∈S,d∈D
max
i∈S{j},d ∈D
δT−d(i, d )aij pj(d)bj(oT−d+1:T )
(4.19)
où δt(i, d), définie par l’équation 4.20, représente le maximum de vraisemblance d’une
trajectoire unique jusqu’au temps t, qui prend en compte les premières t observations et
4.3. Rappel de la méthode proposée par DUMONT J. 99
s’arrête à l’état i de durée d.
δt(i, d) max
s1:t−d
P(s1:t−d, St−d+1:t = i, o1:t|λ) (4.20)
4.3.5 Un exemple de modélisation d’observations bivariées par MSMC
Un exemple de modélisation d’observations bivariées est présenté dans cette section
en utilisant les MSMC. L’objectif est de montrer leur aptitude à prendre en compte des
dynamiques complexes. Le système de Rössler (équation 4.21) a été utilisé pour générer des
séries bivariées : x&y = [ x
y ], x&z = [ x
z ] et y&z = [ y
z ]. Un bruit blanc gaussien a été ajouté
aux séries afin d’obtenir un rapport signal sur bruit (RSB) de 15 dB. L’équation 4.16 a été
utilisée pour déterminer le nombre d’états optimal de chaque MSMC.
dx
dt
= −y − z
dy
dt
= x + ay
dz
dt
= b + z(x − c)
(4.21)
La figure 4.8 montre les caractéristiques des MSMC chargés de modéliser les observations.
Dans ces figures, les ellipses noires décrivent chaque état (centre) et leurs matrices de
covariance (axes de l’ellipse), les chiffres correspondent au temps moyen passé dans chaque
état et les flèches d’épaisseurs variables représentent les coefficients de la matrice de
transition.
−6 −4 −2 0 2 4 6 8
−8
−6
−4
−2
0
2
4
6
4.25
3.8583
8.8667
3.38
2.745
3.1733
8.1667
7.325
4.5333
2.8649
6.425
7.5667
5.2167
2.9267
(a)
−6 −4 −2 0 2 4 6 8
−1
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5833
3.0056
5
5
25.2167
3.8662
5.51365.5136 4.0111
3
5.0067
(b)
−6 −4 −2 0 2 4 6
−1
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
3.8114
8.5944
7
3
2.98612.9861
11.0056
4
8.2533
3
3.0133
86
(c)
Figure 4.8 – Modélisation des séries bivariées issues d’un attracteur de Rössler par des
MSMC. On observe dans (a) la projection dans le plan x&y d’un MSMC avec 14 états,
dans (b) la projection dans le plan x&z d’un MSMC avec 10 états et dans (c) la projection
dans le plan y&z d’un MSMC avec 12 états.
L’invariance des paramètres des MSMC à la multiplication et à l’addition d’une des
100 Chapitre 4
variables par une quantité fixe a été aussi testée. L’objectif de ce test est d’étudier le
comportement des paramètres lorsque i) une des variables montre des variations d’amplitude
importantes (cas de la multiplication) et ii) une des variables présente une composante
continue et est de fait translatée par rapport à la variable d’origine (cas de l’addition). Ce
test est important car, dans notre application réelle, les variables ne se trouvent pas dans le
même niveau d’amplitude.
Les séquences d’observations bivariées x&z à 15 dB ont été donc modifiées afin de
produire les séquences d’observation 1000x&z = [ 1000x
z ] et (1000 + x)&z = [ 1000+x
z ]. Trois
MSMC sont chargés de modéliser les observations x&z, 1000x&z et (1000+x)&z. Le nombre
d’états des MSMC a été fixé à 10 états. On observe figure 4.9 que les caractéristiques des
trois MSMC sont quasi identiques. On a constaté que le fait de multiplier une variable a
plus d’effets sur les paramètres du MSMC que le fait d’ajouter une composante continue
aux séries. Cependant, ces petites différences sont minimes et sont dues à une initialisation
différente de chaque MSMC. Cet exemple montre clairement l’aptitude des MSMC à
prendre en compte seulement les dynamiques des séries analysées et non pas leurs valeurs
instantanées.
−8 −6 −4 −2 0 2 4 6 8
−2
−1
0
1
2
3
4
5
6
7
8
666666666
12.2612.2612.2612.2612.2612.2612.2612.2612.26
19.2219.2219.2219.2219.2219.2219.2219.2219.22 999999999
5.20375.20375.20375.20375.20375.20375.20375.20375.2037
5.00675.00675.00675.00675.00675.00675.00675.00675.0067
9.93339.93339.93339.93339.93339.93339.93339.93339.9333
4.99334.99334.99334.99334.99334.99334.99334.99334.9933444444444
4.00674.00674.00674.00674.00674.00674.00674.00674.0067
(a)
−8000 −6000 −4000 −2000 0 2000 4000 6000 8000
−2
−1
0
1
2
3
4
5
6
7
8
4.44674.44674.44674.44674.44674.44674.44674.44674.4467
555555555
8.73038.73038.73038.73038.73038.73038.73038.73038.7303
3.99333.99333.99333.99333.99333.99333.99333.99333.9933
5.52595.52595.52595.52595.52595.52595.52595.52595.5259
19.844619.844619.844619.844619.844619.844619.844619.844619.8446
333333333
8.89868.89868.89868.89868.89868.89868.89868.89868.8986
6.00676.00676.00676.00676.00676.00676.00676.00676.0067
131313131313131313
(b)
992 994 996 998 1000 1002 1004 1006 1008
−2
−1
0
1
2
3
4
5
6
7
8
19.013319.013319.013319.013319.013319.013319.013319.013319.0133
666666666
10.653310.653310.653310.653310.653310.653310.653310.653310.6533
10.683310.683310.683310.683310.683310.683310.683310.683310.6833
5.99335.99335.99335.99335.99335.99335.99335.99335.9933
4.77044.77044.77044.77044.77044.77044.77044.77044.7704
666666666
444444444
999999999
4.00674.00674.00674.00674.00674.00674.00674.00674.0067
(c)
Figure 4.9 – Comparaison des MSMC chargés de modéliser des séries bivariées : Projection
dans le plan x&z dans (a) pour les séries originaux, dans (b) pour 1000x&z et dans (c)
pour (1000 + x)&z.
4.3.6 Classification/détection par MMC et par MSMC
Les MMC et MSMC peuvent être utilisés pour classer/détecter des évènements d’intérêt
en analysant la vraisemblance. Pour cette approche, K modèles sont utilisés pour représenter
K dynamiques différentes de l’ensemble d’observations analysé (univarié ou multivarié).
L’hypothèse sous-jacente étant que ces différentes dynamiques sont associées à des états
ou événements physiopathologiques distincts, qui doivent être discriminés. Les séquences
d’observations contenant les K dynamiques sont extraites des séries temporelles. Ces
dernières sont réduites par rapport à l’écart type mesuré sur des enregistrements de
référence, afin d’analyser les différents indicateurs extraits avec le même poids. De plus,
4.3. Rappel de la méthode proposée par DUMONT J. 101
pour chaque série temporelle, la médiane sur les L premières secondes, est soustraite et ce
sont les variations par rapport à cette référence qui sont conservées.
Les K modèles ne partageant pas nécessairement le même nombre d’états Mk, ∀ k ∈
{1, 2, . . . , K}, ceux ci sont déterminés par l’intermédiaire de l’équation 4.16. Une phase
d’apprentissage est d’abord appliquée à chaque modèle, afin d’estimer chaque λk à partir
des séquences d’observations, fournis dans un ensemble d’apprentissage. Pendant cette
phase, λk est initialisé selon la méthodologie détaillée dans la section 4.3.2 page 96 et
l’algorithme de Viterbi est ensuite appliqué pour obtenir la valeur finale de λk, par l’étape
EM. L’apprentissage est atteint lorsque la log-vraisemblance
Lk
= log P(O1:T |λk
) (4.22)
converge vers une valeur maximale, où P(O1:T |λk) est la probabilité que la séquence
d’observation O1:T soit généré par le modèle avec des paramètres λk.
Une fois la phase d’apprentissage terminée, les K modèles sont appliqués dans une phase
de vérification à un ensemble de séquences d’observations, fournis dans un ensemble de test.
Cette étape consiste à déterminer la probabilité qu’une séquence observée O1:T soit générée
par un modèle avec paramètres λk (équation 4.17 et équation 4.19).
Dans le cas de classification, la séquence observée est attribuée au modèle le plus
vraisemblable, parmi les K modèles concurrents :
kwin = arg max
k∈K
Lk
= arg max
k∈K
log P(O1:T |λk
) (4.23)
Un pourcentage d’individus de la classe à modéliser est utilisé dans l’étape d’apprentis-
sage et le reste des individus est utilisé dans l’étape de test. De plus, le nombre d’individus
dans chaque classe doit être le même pour éviter des résultats biaisés. La figure 4.10 montre
la méthodologie suivie pour la classification des observations à partir du maximum de
vraisemblance en utilisant les MSMC. Dans cette exemple, 20 % des individus de chaque
classe sont utilisés pour l’estimation des paramètres des modèles MSMC et, une fois estimés
les paramètres de tous les modèles, l’étape de test utilise 80 % des observations restantes
dans chaque classe.
Dans le cas de détection, la log-vraisemblance pour l’instant t et le modèle k,
Lk
t = log P(Ot−T+1:t|λk
) (4.24)
est déterminée en utilisant une fenêtre glissante de longueur T. La détection de l’événement
102 Chapitre 4
Basededonnées
Classe 1 Classe 2 Classe. . .
20 %
Apprentissage
20 % 20 %
MSMC 1
80 %
Test
MSMC 2 MSMC
80 % 80 %
. . .
. . .
MSMC 1 MSMC 2 MSMC
Figure 4.10 – Méthodologie de classification utilisée en utilisant les MSMC.
α (α ∈ {k}) est finalement effectuée lorsque l’équation suivante est vérifiée :
Lα
t − Lk
t > δα,k
∀ k ∈ {1, 2, . . . , K} − {α} (4.25)
où δα,k sont des seuils fixés qui doivent être optimisés.
À la différence du cas de classification, dans l’approche de détection le nombre d’états
du modèle caractérisant l’évènement à détecter est déterminé en utilisant l’équation 4.16,
tandis que l’autre modèle hérite du nombre d’états de ce modèle. Ceci permet de différencier
les séries en priorité en fonction de leurs dynamiques et non en fonction de leurs amplitudes.
Évaluation des performances de classification
L’évaluation des performances de classification est effectuée à travers des tableaux de
contingences. Un tableau de contingence se construit en mettant sur les lignes les données de
référence et sur les colonnes la classification, telle que montré tableau 4.2. Le taux d’erreur
global (TEG) et le taux d’erreur par classe k (TECk) peuvent être déterminés en utilisant
les équations 4.26 et 4.27.
4.3. Rappel de la méthode proposée par DUMONT J. 103
TEG = 1 −
K
i=1
xii
K
i=1
K
j=1
xij
(4.26)
TECk = 1 −
xkk
K
i=1
xki
(4.27)
Tableau 4.2 – Tableau de contingence.
Classification
Classe 1 . . . Classe K
Référence
Classe 1 x11 . . . x1K
...
...
...
...
Classe K xK1 . . . xKK
Lorsqu’on se restreint à deux classes et on s’intéresse à détecter, par exemple, la classe 1 :
SEN = 1 − TEC1 (4.28)
et
SPC = 1 − TEC2 (4.29)
Résultats sur des signaux réels
Cette méthode a été évaluée dans des situations cliniques réelles [Dumont, 2008].
Un clustering hiérarchique de type descendant avec une augmentation progressive du
nombre de MSMC a été proposé pour : i) la classification d’épisodes ischémiques à partir
d’enregistrements Holter, extraits de la base de données LTST [Jager et al., 2003] et ii) la
classification de patients atteints du syndrome de Brugada, à partir d’ECG acquis lors
d’une épreuve d’effort. Les taux d’erreur global (équation 4.26) sont respectivement de 29 %
et de 24,5 % alors que les approches ne prenant pas en compte les dynamiques présentent
des TEG de 46,7 % et 29,6 %, respectivement.
L’approche a été aussi appliquée à la détection de l’ischémie myocardique sur la base
de données STAFF3 [García et al., 1999], qui regroupe des enregistrements d’angioplastie
coronaire transluminale percutanée (PTCA) où l’instant de début du processus ischémique
est très précisément annoté. L’originalité de cette démarche repose sur l’analyse de la
104 Chapitre 4
dynamique des séries temporelles extraites de l’ECG, alors que les méthodes traditionnelles
sont fondées sur des règles de décision statique. Après l’extraction d’un vecteur de caracté-
ristiques, à partir de signaux ECG de la base de données, la dynamique est caractérisée par
un MSMC. Le détecteur utilise un « MSMC de référence » et un « MSMC ischémique » et
puis compare la log-vraisemblance des séries temporelles aux MSMC. Les valeurs optimales
de L et T ont été de 20 et 140 secondes respectivement. Les résultats obtenus montrent
de très bonnes performances de détection : une sensibilité de 96 % et une spécificité de
80 % lorsque la série RT est utilisée (cas univarié) et une sensibilité de 94,7 % et une
spécificité de 71,9 % lorsque les séries RT et Ramp sont analysées de manière conjointe (cas
multivarié) [Dumont et al., 2009b,a].
4.3.7 Synthèse sur les MSMC
Cette approche basée sur des MSMC présente plusieurs avantages par rapport à d’autres
méthodes de modélisation des dynamiques des séries temporelles :
– Les MSMC représentent les dynamiques de manière simple et peuvent être comparés
entre eux.
– Ils sont bien adaptés au traitement multivarié et des versions rapides des algorithmes
d’apprentissage des paramètres existent.
– Ils offrent une représentation graphique de la dynamique grâce aux états.
– Ils peuvent représenter l’évolution temporelle d’une série grâce aux paramètres pi(d).
– Ils ne nécessitent pas de connaissances a priori sur les données à traiter.
– M est le seul hyper-paramètre à régler.
– Il est possible de donner une interprétation physiologique raisonnable aux états
(« cachés ») de la chaîne de Markov.
Une approche basée sur des réseaux neuronaux artificiels (RNA) pourrait être également
capable de caractériser la dynamique de ces séries temporelles. Cependant, une interprétation
physiologique du phénomène étudié et un contrôle de différents étapes du RNA serait plus
difficile. D’ailleurs, les RNA ont été récemment appliqués par BELAL [Belal et al., 2011] et
curieusement n’ont pas montré une amélioration de performance de détection/classification
des épisodes d’apnée du prématuré par rapport à d’autres méthodes (somme pondérée,
corrélation, dérivée).
4.4 Contributions de ce travail de thèse
Même si les résultats obtenus dans les travaux de DUMONT [Dumont, 2008; Dumont
et al., 2009a] ont été très satisfaisants sur les données cardiaques utilisées, plusieurs améliora-
tions peuvent être envisagées dans la méthode de détection proposée. Dans notre application
de détection précoce des épisodes d’apnée-bradycardie des nouveaux-nés prématurés, ces
4.4. Contributions de ce travail de thèse 105
améliorations visent à incrémenter les performances détection et à diminuer le temps de
retard à la détection, en utilisant une approche multivariée des séries temporelles extraites
de l’ECG.
L’un des objectifs du présent travail de thèse a été donc de poursuivre les développe-
ments de cette approche en s’intéressant plus particulièrement aux aspects décrits dans les
paragraphes suivants.
4.4.1 Évaluation du temps de retard à la détection (TRD)
L’évaluation du retard à la détection, défini comme le temps écoulé entre l’instant
d’annotation et la détection de l’épisode, n’a pas été considérée dans les travaux précédents.
Ce paramètre est fondamental pour évaluer la performance du détecteur en particulier dans
le cadre d’une détection précoce en temps réel. En cas de détection, le TRD est déterminé
dans la fenêtre de recherche des vrais positifs, centrée dans l’annotation donnée, tel que
détaillé dans la section 2.3.
4.4.2 Exploration de l’hétérogénéité des modèles
Dans la méthode de détection proposée par DUMONT [Dumont et al., 2009b,a], les K
modèles utilisés pour caractériser les K dynamiques de la séquence d’observation partagent
le même nombre d’états (M1 = M2 = . . . = MK), même si il a été déterminé à l’aide du
critère BIC (équation 4.16). Toutefois, l’hétérogénéité des modèles pourrait aussi améliorer
les performances car, chaque modèle explore des dynamiques différentes et, par conséquent,
peut nécessiter un nombre d’états différent.
4.4.3 Adaptation au traitement en ligne
Afin de pouvoir l’appliquer sur un système de monitoring des nouveaux-nés prématurés,
la méthode de détection développée doit être adaptée au traitement en ligne. En effet,
l’implémentation proposée dans DUMONT [Dumont et al., 2009b,a] est restreinte au
traitement par blocs et n’est pas adaptée à notre cas. Les pré-traitements des observations
exposés dans la section précédente (section 4.3.6), tels que la normalisation des séries et
la soustraction de la médiane dans les L premiers secondes de chaque série, ne sont pas
retenus.
En effet, la méthode de normalisation des séquences d’observations proposée par DU-
MONT [Dumont et al., 2009a] risque de produire de valeurs trop faibles de Σνk
i , conduisant
à des problèmes numériques lors de l’étape d’apprentissage. Dans le présent travail, et vu
106 Chapitre 4
la propriété d’invariance à la multiplication de l’approche proposée (section 4.3.5), nous
multiplions les séquences d’observations par une quantité importante et arbitraire, pour
palier ce problème. De plus, afin d’incrémenter la vraisemblance d’un état en particulier
pour qu’il soit le premier état (π1) de la séquence d’états de la chaîne de Markov et de
favoriser un chemin en particulier dans l’algorithme de Viterbi, la variabilité d’amplitude
du premier échantillon des observations (O1) doit être minimisée. Une procédure récursive
à été proposée pour centrer les séquences d’observation, où la moyenne est déterminée dans
une fenêtre de taille L :
ˆO1:T = Ot−T+1:t −
1
L
t−T
m=t−T−L+1
Om (4.30)
où ˆO1:T est maintenant l’observation à prendre en compte par le modèle. Dans ce cas, la
log-vraisemblance pour instant t et le modèle k est maintenant déterminée par :
Lk
t = log P( ˆO1:T |λk
) (4.31)
et la détection est déterminée en utilisant l’équation 4.25.
Dans le cas particulier de la série RR, cette moyenne est déterminée jusqu’au moment
où RR(t) ≥ 600 et son calcul est repris lorsque la détection de l’épisode d’apnée-bradycardie
est terminée. La figure 4.11 résume la méthode de détection en ligne d’apnée-bradycardie
proposée dans cette thèse, en utilisant une fenêtre glissante d’observation. On y a reporté
la série RR comme série temporelle à caractériser.
4.4.4 Optimisation de la distribution d’états dans la gamme dynamique
des séries observées
Les MMC et MSMC peuvent être appliqués directement sur les séries extraites, mais
dans notre cas, ces séries sont le résultat d’une étape de segmentation automatique d’ECG
qui peut induire des erreurs. Il était donc intéressant d’évaluer l’intérêt d’une quantification
des observations, comme étape préalable du processus d’estimation des paramètres des
modèles. Cette quantification permet de réduire la variabilité du signal, d’augmenter le
RSB et de garder uniquement les dynamiques le plus importantes présentes dans le signal.
De plus, comme les MMC et MSMC ont un nombre fini d’états représentant la gamme
dynamique de l’amplitude du signal, la quantification permet de faciliter l’affectation des
observations aux états dans l’étape de récursion de l’algorithme de Viterbi.
La quantification des séries permet la représentation d’un signal continu par des valeurs
discrètes. Ces valeurs discrètes sont séparées par un intervalle appelé pas de quantification
et symbolisé ∆. Deux méthodes de quantification ont été évaluées dans cette thèse :
4.4. Contributions de ce travail de thèse 107
0 20 40 60 80 100 120 140 160 180
400
500
600
700
800
900
1000
RR(ms)
Temps (s)
Soustraction de moyenne
Test
Apprentissage
Modèles
Observations
Classe 1 Classe k
Détection
Figure 4.11 – Processus de détection en ligne d’apnée-bradycardie proposé dans cette thèse.
1. La loi uniforme avec un pas de quantification de taille constante ∆QU, tel que
montré figure 4.12a. L’objectif est de trouver un compromis dans la taille du pas
de quantification qui permet d’augmenter la performance de détection : un pas de
quantification très faible (∆QU → 0) produit une séquence d’observation qui n’est pas
quantifiée tandis qu’un pas de quantification très grand (∆QU → ∞) élimine l’intérêt
d’utiliser une probabilité d’observation gaussienne étant donné que seulement un état
suffirait pour représenter la gamme de l’amplitude du signal et le calcul de bj(νk)
(ou bj(νk)) ne serait pas possible parce que σνk
1
2
→ 0 (ou Σνk
1 → 0). Afin d’obtenir
∆QU optimal pour chaque variable, la procédure décrite dans l’algorithme 3 a été
proposée. Dans ce manuscrit, les variables notées avec l’indice QU ont été quantifiées
avec la méthode uniforme, comme par exemple pour la variable RRQU.
2. La loi non uniforme avec des pas de quantification de taille variable ∆QNU qui
dépendent de la distribution du signal, tel que montré figure 4.12b. Le vecteur ∆QNU
est déterminé en comparant la somme cumulée des valeurs de l’histogramme normalisé
avec un seuil δQNU, tel que montré dans algorithme 4. Les K classes de la variable à
quantifier sont concaténées en employant le même nombre d’échantillons par classe,
108 Chapitre 4
afin de ne pas biaiser la taille du pas de quantification. Afin d’obtenir un ∆QNU optimal
pour chaque variable, la procédure décrite dans l’algorithme 5 a été proposée. Les
variables notées avec l’indice QNU ont été quantifiées avec la méthode non uniforme,
comme par exemple pour la variable RRQNU.
Algorithme 3 Pseudo-code pour déterminer ∆QU optimal.
1: Initialiser ∆QU basé sur un a priori : la médiane de la valeur absolue de la dérivée de la séquence
d’observation µ1/2(|dx
dt |)
2: Estimer Mk
en utilisant l’équation 4.16
3: Estimer λk
4: Réaliser la détection
5: Déterminer DCDP selon l’équation 2.5
6: Modifier la valeur de ∆QU
7: Répéter 2-6 jusqu’à obtenir la valeur de DCDP la plus faible
−4000 −3000 −2000 −1000 0 1000 2000
−3500
−3000
−2500
−2000
−1500
−1000
−500
0
500
1000
1500
Sortie
Entrée
(a)
−4000 −3500 −3000 −2500 −2000 −1500 −1000 −500 0 500 1000
−3500
−3000
−2500
−2000
−1500
−1000
−500
0
500
1000
Entrée
Sortie
(b)
Figure 4.12 – Quantificateur (a) uniforme et (b) non uniforme.
Algorithme 4 Pseudo-code de la méthode de quantification non uniforme proposée.
Construire le vecteur x comme la concaténation des classes de la variable à quantifier en employant
le même nombre d’échantillons par classe
Calculer y = hist(x) l’histogramme normalisé de la variable x
Définir le seuil δQNU
k = 1
j = 1
pour i = 1 to length(y) faire
si
i
m=k ym > δQNU alors
∆QNUj
= yi − yk
k = i
fin si
fin pour
4.4.5 Exploitation des retards physiologiques dans les séries observées
Nous explorons ici la possibilité d’augmenter l’observabilité du système tout en conservant
le même nombre de sources. Des séries bivariées mono-sources ont été donc construites en
4.4. Contributions de ce travail de thèse 109
Algorithme 5 Pseudo-code pour déterminer ∆QNU optimal.
1: Initialiser δQNU
2: Estimer Mk
en utilisant l’équation 4.16
3: Estimer λk
4: Réaliser la détection
5: Déterminer DCDP selon l’équation2.5
6: Modifier la valeur de δQNU
7: Répéter 2-6 jusqu’à obtenir la valeur de DCDP plus petite
intégrant la version retardée de la série univariée. En ce sens, une matrice d’observation
est construite, en intégrant la version originale de la séquence observée à l’instant t et la
version retardée de la séquence observée à l’instant t − τ, où τ est un délai prédéfini. Cette
matrice d’observation peut être représentée comme suit :
O =
Ot−T+1:t
Ot−τ−T+1:t−τ
(4.32)
Dans le cas de la série RR, l’application d’un tel retard présente également une résonance
physiologique puisque l’on sait que l’intervalle RR à un instant t dépend des précédents
par des mécanismes de régulation autonomique qui ont, principalement, deux dynamiques
différentes pour les systèmes sympathique (plus lent) et parasympathique (plus rapide). Ces
matrices d’observation seront représentées en gras dans le présent document, tel que RR.
Recherche du retard τ optimal
Pour la série RR, la recherche d’une valeur a priori de τ nous conduit à l’analyse
spectrale de la VFC. À partir d’études expérimentales, le spectre de fréquences de la
VFC est divisée principalement en quatre bandes de fréquence choisies pour sa pertinence
physiologique [Task Force, 1996]. Dans le cas des nouveaux-nés prématurés, deux bandes de
fréquence nous intéressent :
– L’énergie du signal dans les basses fréquences (LF) de 0,02 à 0,2 Hz est expliquée
à la fois par un phénomène de résonance dans la boucle liée au délai de la réponse
vasculaire à la modulation adrénergique, par une rythmicité endogène centrale de
l’activité sympathique et par l’activité du tonus parasympathique [Chatow et al.,
1995; Beuchée, 2005].
– L’énergie du signal dans les hautes fréquence (HF) de 0,2 à 1,5 Hz est associée à
l’arythmie sinusale respiratoire (oscillation de la durée de l’intervalle RR corrélée à la
fréquence respiratoire), mais aussi à l’activité parasympathique (action du nerf vague
sur le cœur) [Chatow et al., 1995; Beuchée, 2005].
La différence entre les deux pics (LF et HF) est d’environ 0,9 Hz, ce qui correspond à
une demi-période de 0,556 secondes. Par conséquent, la valeur optimale de τ sera recherchée
110 Chapitre 4
autour de cette valeur, dans un ensemble prédéfini de valeurs :
τ = {0,34, 0,45, 0,56, 0,67, 0,78}
Pour les autres séries (Ramp et QRSd), il n’existe pas d’a priori pour déterminer la
valeur de τ. Par conséquent, les valeurs candidats de τ seront choisis empiriquement dans
l’ensemble des valeurs suivantes :
τ = {0,25, 0,5, 0,75, 1}
Finalement, pour chaque valeur de τ et pour chaque variable étudiée, Mk sera déterminé
(équation 4.16), λk sera estimé et la détection sera effectuée. τ optimal correspond donc à
la valeur qui minimise la DCDP.
4.4.6 Synthèse de la fouille de données appliquées dans cette thèse
Pour la caractérisation des séries temporelles multivariées par modèles semi-Markovien
cachés, deux approches seront étudiées : la première, basée sur la classification des séquences
d’observation à partir du maximum de vraisemblance et la deuxième, fondée sur une
approche de détection en ligne d’un évènement d’intérêt à partir de la comparaison des
log-vraisemblances des séries temporelles.
Dans la démarche de classification, les procédures peuvent être décomposées en quatre
grandes parties :
1. la construction des ensembles d’apprentissage et de test, contenant des séquences
d’observation de taille T secondes et associées à K évènements différents à classer
(K classes),
2. l’apprentissage de K modèles à partir des séquences d’observation fournies dans
l’ensemble d’apprentissage,
3. l’évaluation (test) de l’appartenance aux K modèles de nouvelles séquences d’observa-
tion, fournies dans l’ensemble de test et
4. l’évaluation des performances de classification.
À partir d’une base de données contenant les séquences d’observations de K classes,
20 % des séquences d’observations sont attribuées à l’ensemble d’apprentissage et 80 % des
séquences d’observations sont assignées à l’ensemble de test. Dans l’étape d’apprentissage,
l’ensemble de paramètres des modèles λk, k ∈ {1, 2, . . . , K} sont estimés à partir des
séquences d’observation en utilisant l’algorithme de Viterbi et le nombre d’états par modèle
Mk est déterminé par intermédiaire du critère BIC (équation 4.16). Dans l’étape de
test, les séquences d’observations sont attribuées au modèle k le plus vraisemblable selon
4.5. Conclusion 111
l’équation 4.23. L’expérience apprentissage/test est répétée 10 fois avec différents tirages,
afin d’obtenir des résultats indépendants du tirage effectué, en conséquence, une procédure
de Monte Carlo est appliquée pour sélectionner les données de l’apprentissage et du test.
Finalement, les performances de classification sont évaluées à partir du taux d’erreur global
(TEG équation 4.26) et du taux d’erreur par classe k (TECk équation 4.27).
De même que pour la classification, la démarche de détection en ligne, peut être
décomposée en six grandes parties :
1. la construction de l’ensemble d’apprentissage, contenant des séquences d’observation
de taille T secondes et associées à K évènements différents à détecter,
2. l’apprentissage de K modèles à partir des séquences d’observation fournies dans
l’ensemble d’apprentissage,
3. la construction de l’ensemble de test, contenant de séries temporelles de tailles
différentes et dont les K évènements différents à détecter peuvent être présents, à des
instants de temps différents, ou peuvent être absents,
4. l’application (test) des K modèles aux séries temporelles, fournies dans l’ensemble de
test, pour déterminer les log-vraisemblances,
5. la détection de l’évènement en ligne selon le rapport de vraisemblance et
6. l’évaluation des performances de détection.
L’étape d’apprentissage est identique à celle montrée pour la classification. L’étape de test
consiste à calculer log-vraisemblance pour l’instant t et le modèle k (Lk
t = log P(Ot−T+1:t|λk))
dans une fenêtre glissante de longueur T. La détection de l’événement α (α ∈ {k}) est réali-
sée à partir de Lα
t − Lk
t > δα,k, ∀ k ∈ {1, 2, . . . , K} − {α}. Finalement, Les performances
de détection sont évaluées par courbes COR en analysant la sensibilité (équation 2.1), la
spécificité (équation 2.2) et le temps de retard à la détection (TRD, section 2.3).
4.5 Conclusion
Les fondements de la fouille de données temporelles et multidimensionnelles dans le
contexte biomédical ont été abordés dans ce chapitre pour la caractérisation des séries
temporelles multivariées extraites de l’ECG. Les différentes étapes du processus de fouille
de données temporelles multivariées suivies dans cette thèse ont été présentées. Une analyse
des travaux initiés dans notre laboratoire nous a conduit à l’utilisation d’une approche basée
sur les modèles Markoviens cachés et les modèles semi-Markoviens cachés. Ces modèles ont
été décrits de façon détaillée dans ce chapitre, en particulier l’architecture, l’estimation
des paramètres, l’utilisation d’une loi gaussienne pour représenter la durée des états et la
probabilité d’émission d’observations, le choix du nombre d’états à utiliser et l’évaluation
des séquences d’observations par les modèles. La méthodologie d’initialisation de paramètres
112 Chapitre 4
des modèles à partir d’une procédure de K-means et d’un modèle de mélange de gaussiennes
a été aussi abordée. Pour le calcul des vraisemblances, l’algorithme de Viterbi a été retenu
tant pour le cas Markovien que pour le cas semi-Markovien.
Les différences entre les modèles Markoviens cachés et les modèles semi-Markoviens
cachés ont été soulignées pour la caractérisation des séries temporelles dont la dynamique
contient de l’information. Ces différences concernent plus particulièrement la définition de
la loi du temps passé dans les états de la chaîne de Markov (une loi géométrique dans le cas
Markovien et, dans cette thèse, une loi gaussienne dans le cas semi-Markovien). Pour notre
application, il a été précisé le principal avantage d’appliquer des modèles semi-Markoviens
cachés : leur capacité à représenter explicitement l’évolution temporelle d’une série dans
un paramètre. Un exemple de modélisation de séries temporelles bivariées synthétiques,
issues du système de Rössler, a montré l’adéquation des modèles semi-Markovien cachés
à tenir compte de l’évolution temporelle des variables analysées et non pas leurs valeurs
instantanées.
Des procédures de classification des séquences d’observation et de détection en ligne d’un
évènement d’intérêt, par modèles Markoviens et semi-Markoviens cachés, ont été décrites. La
méthode de classification est basé sur l’affectation des séquences d’observation multivariées
à des modèles à partir du maximum de vraisemblance. La détection en ligne est fondée sur
les différences des log-vraisemblances des séquences d’observations construites estimées sur
une fenêtre glissante. Ces procédures de classification et de détection ont été déjà appliquées
pour la classification de patients atteints du syndrome de Brugada et pour la détection
de l’ischémie myocardique. Dans ce chapitre, nous avons proposé des modifications dans
le but d’améliorer les performances de classification et de favoriser une détection précoce
d’épisodes d’apnée-bradycardie chez les prématurés. Ces améliorations concernent i) la
quantification uniforme et non uniforme des séquences d’observations afin d’optimiser la
distribution du vecteur d’observation par état et ii) la prise en compte des versions retardées
du signal observé pour augmenter l’observabilité du système exploité. Ces améliorations
correspondent aux principales contributions méthodologiques de ce chapitre.
Dans le chapitre suivant, des tests en simulation viendront compléter les résultats
préliminaires montrés dans ce chapitre et le choix entre les MMC et MSMC sera d’abord
abordée sur des signaux synthétiques issus du modèle de FitzHugh-Nagumo. Ensuite,
la classification et la détection proposées seront appliquées sur ces signaux synthétiques
afin d’optimiser les différentes étapes. Finalement, la classification et la détection précoce
d’épisodes d’apnée-bradycardie sera détaillée sur la base de données présentée au chapitre 3.
Bibliographie 113
Bibliographie
Aydin, Z., Altunbasak, Y., and Borodovsky, M. (2006). Protein secondary structure
prediction for a single-sequence using hidden semi-Markov models. BMC bioinformatics,
7(1) :178.
Baum, L. E. and Petrie, T. (1966). Statistical inference for probabilistic functions of
finite-state Markov chains. Annals of Mathematical Statistics, 37(6) :1554–1563.
Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu-
rity. Physiological Measurement, 32 :523.
Beritelli, F., Casale, S., Russo, A., and Serrano, S. (2006). A speech recognition system based
on dynamic characterization of background noise. In Signal Processing and Information
Technology, 2006 IEEE International Symposium on, pages 914–919. IEEE.
Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona-
talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome
apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1.
Bishop, C. (1995). Neural networks for pattern recognition. Oxford university press.
Bulla, J. (2006). Application of hidden Markov models and hidden semi-Markov models
to financial time series. PhD thesis, Niedersächsische Staats-und Universitätsbibliothek
Göttingen.
Bulla, J. and Bulla, I. (2006). Stylized facts of financial time series and hidden semi-Markov
models. Computational statistics & data analysis, 51(4) :2192–2209.
Burge, C. and Karlin, S. (1997). Prediction of complete gene structures in human genomic
DNA1. Journal of molecular biology, 268(1) :78–94.
Campillo, F. and Le Gland, F. (1989). Mle for partially observed diffusions : direct
maximization vs. the em algorithm. Stochastic Processes and their Applications, 33(2) :245–
274.
Chatow, U., Davidson, S., Reichman, B., and Akselrod, S. (1995). Development and
maturation of the autonomic nervous system in premature and full-term infants using
spectral analysis of heart rate fluctuations. Pediatric research, 37(3) :294.
Chen, M., Kundu, A., and Zhou, J. (1994). Off-line handwritten word recognition using a
hidden Markov model type stochastic network. IEEE Transactions on Pattern Analysis
and Machine Intelligence, pages 481–496.
Chibelushi, C., Deravi, F., and Mason, J. (2002). A review of speech-based bimodal
recognition. Multimedia, IEEE Transactions on, 4(1) :23–37.
Churchill, G. A. (1992). Hidden markov chains and the analysis of genome structure.
Computers & Chemistry, 16(2) :107–115.
Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm
fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in
Cardiology, volume 33, pages 473–476.
114 Bibliographie
Csizmok, V., Felli, I., Tompa, P., Banci, L., and Bertini, I. (2008). Structural and dynamic
characterization of intrinsically disordered human securin by NMR spectroscopy. Journal
of the American Chemical Society, 130(50) :16873–16879.
Dempster, A., Laird, N., Rubin, D., et al. (1977). Maximum likelihood from incomplete data
via the EM algorithm. Journal of the Royal Statistical Society. Series B (Methodological),
39(1) :1–38.
Dufour, R., Esteve, Y., Deléglise, P., and Béchet, F. (2009). Local and global models
for spontaneous speech segment detection and characterization. In Automatic Speech
Recognition & Understanding, 2009. ASRU 2009. IEEE Workshop on, pages 558–561.
IEEE.
Dumont, J. (2008). Fouille de dynamiques multivariées, application à des données temporelles
en cardiologie. PhD thesis, Université de Rennes 1.
Dumont, J., Carrault, G., Gomis, P., Wagner, G., and Hernández, A. (2009a). Detection of
myocardial ischemia with hidden Semi-Markovian models. In Computers in Cardiology,
2009, pages 121–124. IEEE.
Dumont, J., Hernández, A., Gomis, P., and Carrault, G. (2009b). Classification de séries
temporelles par modèles markoviens cachés, application à l’ischémie myocardique. In
XXII Colloque GRETSI.
Dumont, J., Hernández, A. I., Fleureau, J., and Carrault, G. (2008). Modelling temporal
evolution of cardiac electrophysiological features using hidden semi-markov models. Conf
Proc IEEE Eng Med Biol Soc, 2008 :165–8.
Durbin, R. (1998). Biological sequence analysis : Probabilistic models of proteins and nucleic
acids. Cambridge Univ Pr.
Ephraim, Y. and Merhav, N. (2002). Hidden markov processes. Information Theory, IEEE
Transactions on, 48(6) :1518–1569.
Fahrmeir, L. (1992). Posterior mode estimation by extended Kalman filtering for multivariate
dynamic generalized linear models. Journal of the American Statistical Association,
87(418) :501–509.
Fan, W., Ma, J., and Zhu, H. (2009). A thunderstorm forecast model based on weighted
SVM and data field. In 2009 Sixth International Conference on Fuzzy Systems and
Knowledge Discovery, pages 160–164. IEEE.
Ferguson, J. (1980). Variable duration models for speech. In Proceedings of the Symposium
on the Application of hidden Markov models to Text and Speech, volume 1, pages 143–179.
Forney Jr, G. (1973). The viterbi algorithm. Proceedings of the IEEE, 61(3) :268–278.
García, J., Wagner, G., Sörnmo, L., Lander, P., and Laguna, P. (1999). Identification of the
occluded artery in patients with myocardial ischemia induced by prolonged percutaneous
transluminal coronary angioplasty using traditional vs transformed ecg-based indexes.
Computers and Biomedical Research, 32(5) :470–482.
Garcia, S. and Almeida, J. (2006). Multivariate phase space reconstruction by nearest
neighbor embedding with different time delays. Arxiv preprint nlin/0609029.
Bibliographie 115
Givaty, O. and Levy, Y. (2009). Protein sliding along DNA : dynamics and structural
characterization. Journal of molecular biology, 385(4) :1087–1097.
Guédon, Y. (2003). Estimating hidden semi-markov chains from discrete sequences. Journal
of Computational and Graphical Statistics, 12(3) :604–639.
Guédon, Y., Barthélémy, D., Caraglio, Y., and Costes, E. (2001). Pattern analysis in
branching and axillary flowering sequences. Journal of Theoretical Biology, 212(4) :481–
520.
Houtekamer, P. and Mitchell, H. (2001). A sequential ensemble Kalman filter for atmospheric
data assimilation. Monthly Weather Review, 129(2) :123–137.
Jager, F., Taddei, A., Moody, G., Emdin, M., Antolič, G., Dorn, R., Smrdel, A., Marchesi,
C., and Mark, R. (2003). Long-term ST database : a reference for the development
and evaluation of automated ischaemia detectors and for the study of the dynamics of
myocardial ischaemia. Medical and Biological Engineering and Computing, 41(2) :172–182.
Kalman, R. et al. (1960). A new approach to linear filtering and prediction problems.
Journal of basic Engineering, 82(1) :35–45.
Kantardzic, M. and Press, I. (2003). Data mining : concepts, models, methods, and algorithms.
Wiley-Interscience.
Katz, R. (1981). On some criteria for estimating the order of a Markov chain. Technometrics,
23(3) :243–249.
Kong, L., Yang, C., Wang, Y., and Gui, W. (2009). Generic phase space reconstruction
method of multivariate time series. In Control and Decision Conference, 2009. CCDC’09.
Chinese, pages 3752–3755. IEEE.
Kulkarni, V. (2010). Modeling and analysis of stochastic systems. CRC Press.
Kundu, A., He, Y., and Chen, M.-Y. (1997). Efficient utilization of variable duration
information in hmm based hwr systems. In ICIP (3), pages 304–307.
Kusiak, A., Zheng, H., and Song, Z. (2009). Wind farm power prediction : a data-mining
approach. Wind Energy, 12(3) :275–293.
Laxman, S. and Sastry, P. (2006). A survey of temporal data mining. Sadhana, 31(2) :173–
198.
Levinson, S. (1986). Continuously variable duration hidden Markov models for automatic
speech recognition. Computer Speech & Language, 1(1) :29–45.
Li, C., Biswas, G., Dale, M., and Dale, P. (2002). Matryoshka : A HMM based temporal
data clustering methodology for modeling system dynamics. Intelligent Data Analysis,
6(3) :281–308.
MacDonald, I. and Zucchini, W. (1997). Hidden Markov and other models for discrete-valued
time series, volume 70. Chapman & Hall/CRC.
Maseng, T. and Bakken, P. (1981). A stochastic dynamic model of rain attenuation.
Communications, IEEE Transactions on, 29(5) :660–669.
116 Bibliographie
Mitchell, C. and Jamieson, L. (1993). Modeling duration in a hidden Markov model with
the exponential family. In Proc. ICASSP, pages 331–334. Citeseer.
Mittag, T., Kay, L., and Forman-Kay, J. (2010). Protein dynamics and conformational
disorder in molecular recognition. Journal of Molecular Recognition, 23(2) :105–116.
Mörchen, F. (2006). Time series knowledge mining. PhD thesis, Philipps-Universität
Marburg.
Munshaw, S. and Kepler, T. (2010). SoDA 2 : a Hidden Markov Model approach for
identification of immunoglobulin rearrangements. Bioinformatics, 26(7) :867.
Murphy, K. (2002). Dynamic bayesian networks : representation, inference and learning.
PhD thesis, Citeseer.
Pedersen, J. S. and Hein, J. (2003). Gene finding with a hidden markov model of genome
structure and evolution. Bioinformatics, 19(2) :219–227.
Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship
between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7.
Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia
boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc,
2007 :3288–91.
Povinelli, R. (2001). Identifying temporal patterns for characterization and prediction of
financial time series events. Temporal, Spatial, and Spatio-Temporal Data Mining, pages
46–61.
Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction
of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages
725–728. IEEE.
Rabiner, L. R. (1989). A tutorial on hidden Markov models and selected applications in
speech recognition. Proceedings of the IEEE, 77(2) :257–286.
Raman, H. and Sunilkumar, N. (1995). Multivariate modelling of water resources time
series using artificial neural networks. Hydrological Sciences Journal/Journal des Sciences
Hydrologiques, 40(2) :145–164.
Sansom, J. and Thomson, P. (2001). Fitting hidden semi-Markov models to breakpoint
rainfall data. Journal of Applied Probability, 38 :142–157.
Schwarz, G. (1978). Estimating the dimension of a model. The annals of statistics,
6(2) :461–464.
Suzuki, T., Ikeguchi, T., and Suzuki, M. (2003). Multivariable nonlinear analysis of foreign
exchange rates. Physica A Statistical Mechanics and its Applications, 323 :591–600.
Task Force (1996). Heart rate variability : standards of measurement, physiological inter-
pretation and clinical use. task force of the european society of cardiology and the north
american society of pacing and electrophysiology. Circulation, 93(5) :1043–65.
Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de
Markov cachés. PhD thesis, Université de Rennes 1.
Bibliographie 117
Weinman, J., Learned-Miller, E., and Hanson, A. (2009). A discriminative semi-Markov
model for robust scene text recognition. In Pattern Recognition, 2008. ICPR 2008. 19th
International Conference on, pages 1–5. IEEE.
Witten, I. and Frank, E. (2005). Data Mining : Practical machine learning tools and
techniques. Morgan Kaufmann Pub.
Yamato, J., Ohya, J., and Ishii, K. (1992). Recognizing human action in time-sequential
images using hidden Markov model. In Proc. Comp. Vis. and Pattern Rec, pages 379–385.
Yu, S.-Z. (2010). Hidden semi-markov models. Artificial Intelligence, 174(2) :215–243.
Yu, S.-Z. and Kobayashi, H. (2003). An efficient forward-backward algorithm for an
explicit-duration hidden markov model. Signal Processing Letters, IEEE, 10(1) :11–14.
Zweig, G. and Russell, S. (1998). Speech recognition with dynamic Bayesian networks. In
Proceedings of the National Conference on Artificial Intelligence, pages 173–180. John
Wiley & Sons LTD.
Chapitre 5
Application des MSMC sur des
signaux simulés et réels
Nous avons déjà justifié et expliqué tout au long de ce mémoire l’intérêt de prendre en
compte les dynamiques des séries temporelles dans le cadre de la détection d’événements
physiopathologiques. C’est ainsi que finalement dans ce chapitre, les résultats de classification
et de détection, exploitant les dynamiques temporelles des observations multivariées par
des MMC et par des MSMC, sont présentés. Dans ce chapitre, la classification correspond à
l’identification de séquences d’observations qui contiennent ou pas un événement d’intérêt.
Une procédure hors-ligne (en batch) est utilisée pour cette tâche de classification et l’instant
précis de l’arrivée de l’événement n’est pas estimé. La détection est réalisée à partir d’une
procédure récursive spécifique et a comme but l’estimation de l’instant précis des événements
d’intérêt. Les améliorations proposées dans le chapitre 4, comme la quantification des
observations et la prise en compte de versions retardées des observations, sont ici appliquées
sur des signaux simulés et sur des signaux réels.
Les travaux sur signal simulé sont présentés dans la section 5.1 et ont comme objectif
de montrer la faisabilité de notre approche et d’optimiser la structure des MMC ou MSMC
pour l’analyse de la dynamique de variables. Le modèle de FitzHugh-Nagumo [Fitzhugh,
1961] a été utilisé pour générer des signaux simulés bivariés, qui ont été ensuite contaminés
avec plusieurs niveaux de bruit. Ce modèle est particulièrement adapté à notre problème
car ses deux variables d’état présentent des dynamiques hétérogènes (variables d’état lente
et rapide du modèle) et ces dynamiques peuvent être modifiées par l’ajustement d’un
paramètre.
La section 5.2 présente l’application des méthodes proposées sur des séries temporelles
multivariées réelles. Elles correspondent aux caractéristiques extraites de l’ECG de nouveaux-
nés prématurés (RR, Ramp et QRSd), tel que décrit dans le chapitre 3 de ce manuscrit.
119
120 Chapitre 5
Deux approches sont proposées et évaluées pour i) la classification de segments de séries
multivariées en fonction de la présence ou absence d’un événement d’apnée-bradycardie et
ii) la détection en ligne de ces événements. Les performances de classification sont évaluées à
partir des tableaux de contingence, par le calcul du taux d’erreur global et du taux d’erreur
par classe. Dans le cas de la détection en ligne, la performance est en plus analysée par la
détermination des valeurs de sensibilité et spécificité. Les performances de détection en ligne
sont évaluées à partir de courbes COR, en fonction des valeurs de sensibilité, spécificité
et temps de retard à la détection. Un effort particulier est réalisé ici pour optimiser les
paramètres du MSMC et pour trouver la combinaison optimale d’observables à inclure
en fonction de leur complémentarité. Les résultats obtenus de l’approche proposée sont
comparés aux techniques classiques de détection d’apnée-bradycardie utilisées aujourd’hui
en USIN. Enfin, une procédure de fusion décentralisée est détaillée et appliquée sur les
meilleurs résultats de détection.
5.1 Évaluation de la faisabilité des MSMC sur signal simulé
Dans cette section, nous allons procéder à la validation de la faisabilité des approches
proposées au chapitre 4 sur des signaux synthétiques, avant d’étendre leur application aux
signaux réels. La procédure de génération des signaux synthétiques bruités, avec le modèle
de FitzHugh-Nagumo, est décrite dans la section 5.1.1. Des séries temporelles bivariées,
avec deux dynamiques légèrement différentes, peuvent être produites avec ce modèle, à
partir de la modification d’un de ces paramètres. De plus, une procédure de réduction
d’amplitude a été appliquée aux séries temporelles synthétisées, afin de créer des observables
très difficilement différentiables à partir de la seule analyse de leurs valeurs instantanées.
Les processus de classification et de détection dans ce type de signaux sont particulièrement
difficiles et doivent exploiter la dynamique des variables.
Une fois les signaux simulés, les quatre expériences suivantes ont été réalisées :
1. Comparaison entre les MMC et les MSMC (section 5.1.2) : L’objectif est ici d’évaluer
l’aptitude de ces modèles à classer des observations en fonction de leurs dynamiques.
Les résultats obtenus ayant confirmé la supériorité des MSMC, les expériences suivantes
ont été donc exécutées en utilisant ce type de modèle.
2. Étude de la performance de classification pour différentes valeurs du nombre d’états
des MSMC (section 5.1.3) : La finalité de cette expérience est d’analyser l’impact de
M dans les valeurs de TEG, car, tel que reporté au chapitre 4, une trop grande valeur
de M présente un risque de sur-apprentissage, tandis qu’une valeur trop faible peut
conduire à une mauvaise représentation des observations.
3. Classification des séquences d’observations basée uniquement sur la dynamique des
observables (section 5.1.4) : Dans cette expérience, les modifications proposées dans
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 121
le chapitre 4 (quantification et prise en compte de la version retardée des séries
temporelles) sont appliquées. L’objectif est ici de mesurer l’impact de la quantification,
uniforme et non uniforme, des observations et l’influence de la prise en compte des
données précédentes dans le processus de décision.
4. Détection d’un évènement d’intérêt basée uniquement sur la dynamique des observables
(section 5.1.5). L’intérêt est ici d’évaluer l’impact des modifications proposées dans les
valeurs de sensibilité, spécificité et retard à la détection, sur des signaux simulés dont
la dynamique est finement modifiée à partir des paramètres du modèle FitzHugh-
Nagumo.
5.1.1 Le modèle de FitzHugh-Nagumo pour la génération des séries syn-
thétiques
Les expériences d’évaluation de l’approche proposée ont été conduites sur des séries
temporelles générées par un modèle de FitzHugh-Nagumo [Fitzhugh, 1961]. Le modèle de
FitzHugh-Nagumo (MFN) est un modèle générique, constitué de deux variables, qui est
utilisé pour décrire un système excitable (comme par exemple une cellule myocardique) à
partir des équations suivantes :
dv
dt
= 3(v −
1
3
v3
+ r + I)
dr
dt
= −
1
3
(v − a + 0.8r)
(5.1)
où v est le potentiel de membrane (variable rapide), r est la variable de récupération
(variable lente), I est la valeur du courant d’excitation externe et a est un paramètre qui
peut changer l’état de repos et la dynamique du système.
Dans le MFN, les variables v et r sont fréquemment initialisées à une valeur de « repos »
(point fixe) et une perturbation est appliquée au moyen de la variable I pour déclencher
une excursion dans l’espace des phases des variables v et r, avant de retourner à leurs
valeurs de repos. L’algorithme de Runge-Kutta d’ordre 4 [Jameson et al., 1981], avec un
pas d’intégration variable, a été utilisé pour simuler des séries temporelles r et v, avec deux
dynamiques différentes, en fonction de la valeur du paramètre a, qui a été modifié selon
une distribution uniforme dans l’intervalle :
a1 ∼ U(0,58, 0,62)
a2 ∼ U(0,78, 0,82)
(5.2)
La figure 5.1a illustre un diagramme de phases (r en abscisses et v en ordonnées) et les
figures 5.1b et 5.1c montrent des exemples des séries temporelles v et r respectivement, pour
122 Chapitre 5
plusieurs valeurs du paramètre a. On distingue bien les deux classes de séries temporelles
générées (avec a1 et a2).
−200 0 200 400 600 800 1000
−1000
−800
−600
−400
−200
0
200
400
0.58
0.6
0.62
0.78
0.8
0.82
Générées avec
Générées avec
(a)
290 295 300 305 310 315 320
−1000
−800
−600
−400
−200
0
200
400
Générées avec
Temps (s)
0,58
0,6
0,62
0,78
0,8
0,82
Générées avec
Valeurs de
(b)
290 295 300 305 310 315 320
0
200
400
600
800
1000
0.58
0.6
0.62
0.78
0.8
0.82
Temps (s)
Générées avec
Générées avec
(c)
Figure 5.1 – Exemple de séries temporelles issues du MFN pour différentes valeurs du
paramètre a : (a) dynamique dans le plan bivariée v&r, (b) dynamique de la variable v
et (c) dynamique de la variable r. On distingue bien les deux classes de séries temporelles
générées.
En utilisant ce modèle, deux bases de données ont été construites : la première, utilisée
dans les expériences de classification, est composée des séquences d’observations de 10 s
avec trois dynamiques différentes (perturbation avec a1, perturbation avec a2 et sans
perturbation). La seconde base a été créée pour conduire les procédures de détection en
ligne et est composée des séries temporelles de 400 s avec deux dynamiques présentes dans
chaque série (une période sans perturbation suivie d’une période avec une excursion produite
pour la perturbation associée à a1 ou à a2 et suivie d’une dernière période sans perturbation).
Ces deux bases de données sont présentées en détail dans les sections suivantes.
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 123
Base de données synthétiques pour la classification
Dans le cas de classification, trois sous-ensembles ont été construits pour effectuer les
étapes d’apprentissage et test des MMC et des MSMC :
– LSMFN1 : comprenant 400 séquences d’observations r, v et v&r au « repos » (sans
perturbation) dont la moitié des séquences ont été générées aléatoirement avec a1 et
l’autre moitié avec a2.
– LSMFN2 : regroupant 200 séquences d’observations r, v et v&r générées avec a1 et
en présence d’une perturbation de valeur constante I = −0.2. Ces séquences ont été
choisies de sorte que le début de la perturbation I correspond au début de la séquence.
I = 0.2 a été maintenu pendant 5 secondes et après I = 0 jusqu’à la 10me seconde.
– LSMFN3 : représentée par 200 séquences d’observations r, v et v&r générées de la
même manière que LSMFN2 mais en utilisant a2.
Chaque sous-ensemble représente une classe à différencier. L’amplitude des séquences
synthétisées a été réduite en la divisant par la valeur absolue maximale trouvée dans
LSMFN2 et LSMFN3. Ensuite, les séquences d’observations ont été multipliées par 1000
pour éviter que Σνk
i → 0 (c.f. section 4.4.3). Finalement, un bruit blanc gaussien a été
ajouté aux observations afin d’obtenir différentes valeurs de RSB : 5, 10, 15, 20 dB.
La figure 5.2 représente un exemple des trois types de dynamiques (trois classes) à classer
en utilisant la variable r avec un RSB de 5 dB. On peut observer la similitude des séries
dans les classes LSMFN2 et LSMFN3, ce qui rend la tâche de classification particulièrement
difficile.
0 1 2 3 4 5 6 7 8 9 10
−200
0
200
400
600
800
1000
1200
LSMFN1
LSMFN2
LSMFN3
Temps (s)
Figure 5.2 – Dynamiques des classes appartenant à la variable r à 5 dB.
124 Chapitre 5
Base de données synthétiques pour la détection
Dans le cas de détection, l’apprentissage des K modèles est effectué en utilisant 20 %
des séquences d’observation de chaque sous-ensemble LSMFNk, k in{1, 2, 3}, présentés
dans la section précédente. Le sous-ensemble de test est constitué par 400 séries temporelles
r, v et v&r, de taille 400 secondes chacune, générées avec le MFN (équation 5.1). Une
perturbation de valeur constante (I = −0.2) est introduite dans l’intervalle [300,305] (5
secondes de durée). Deux dynamiques différentes ont été générées en modifiant le paramètre
a selon l’équation 5.2 : a1 et a2. Parmi les 400 séries temporelles, 200 ont été générées avec
a1 et 200 avec a2. L’amplitude des séries temporelles a été réduite en la divisant par sa
valeur absolue maximale. Ensuite, les séries temporelles ont été multipliées par 1000 pour
éviter que σνk
2
i → 0 et un bruit blanc gaussien a été ajouté aux séries temporelles afin
d’obtenir différentes valeurs de RSB : 5, 10, 15, 20 dB. La figure 5.3 montre un exemple de
la dynamique de la série temporelle r (sans contamination) pour une valeur de a = 0, 58.
0 50 100 150 200 250 300 350 400
−200
0
200
400
600
800
1000
Temps (s)
Début de la stimulation
10 s
Figure 5.3 – Exemple d’une réalisation de la variable r, générée avec a1 = 0, 58.
5.1.2 Étude comparative de classification par MMC et MSMC
L’objectif de cette étude est de comparer les performances des MMC et des MSMC dans
la classification de séquences d’observations univariées présentant des valeurs d’amplitudes
égales, mais des dynamiques légèrement différentes.
Apprentissage des modèles
Des séries temporelles univariées r des sous-ensembles LSMFNk, k ∈ {1, 2, 3}, ont été
utilisées. K = 3 MMC et K = 3 MSMC ont été crées pour apprendre la dynamique de
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 125
chaque classe. C’est à dire, pour modéliser LSMFNk, un MMC avec paramètres λMMCk
et
un MSMC avec paramètres λMSMCk
ont donc été créés. Le nombre d’états par modèle a
été déterminé avec l’équation 4.16 seulement pour le MSMC, puis MMMCk
= MMSMCk
.
Le tableau 5.1 liste le nombre d’états des MSMC pour différentes valeurs de RSB. On
peut constater que i) MMSMC1
< MMSMC2,3
pour tous les niveaux de RSB, car la gamme
dynamique des séquences d’observations dans LSMFN1 est plus étroite que celles dans
LSMFN2 et LSMFN3, ii) MMSMCk
diminue au fur et à mesure que le RSB augmente, car la
gamme dynamique du signal se réduit lorsque RSB augmente et iii) MMSMC2
= MMSMC3
car, comme prévu et dû au processus de réduction d’amplitude, les dynamiques des classes
LSMFN2 et LSMFN3 sont comparables.
Tableau 5.1 – Estimation du nombre d’états par MSMC pour différentes valeurs de RSB,
pour modéliser la dynamique de la variable r.
RSB (dB) MMSMC1
(États) MMSMC2
(États) MMSMC3
(États)
5 7 12 12
10 7 12 12
15 7 10 10
20 6 9 9
Test des modèles et évaluation des performances de classification
Des tableaux de contingence ont été construits, afin de déterminer TEG (équation 4.26)
et TECk (équation 4.27). Le tableau 5.2 montre un exemple d’un tableau de contingence.
Pour cet exemple, TEG = 8, 58 %, TEC1 = 0 %, TEC2 = 17, 88 % et TEC3 = 7, 88 %.
Tableau 5.2 – Tableau de contingence en utilisant les MSMC pour classer trois dynamiques
observées dans la variable r à 5 dB. Chaque élément du tableau représente la somme des
éléments correspondants sur les 10 répétitions.
Classification
LSMFN1 LSMFN2 LSMFN3
Référence
LSMFN1 1600 0 0
LSMFN2 0 1314 286
LSMFN3 0 126 1474
Nous avons observé que, indépendamment de la valeur du RSB, les valeurs de TEG et
de TECk sont plus faibles en utilisant des MSMC qu’avec des MMC. Le tableau 5.3 montre
les performances de classification des séquences d’observations issues de la variable r à 5 dB
de RSB, en utilisant les MMC et les MSMC. En outre, et comme attendu, le TEG diminue
126 Chapitre 5
quand le RSB augmente. À titre d’exemple, en utilisant les MSMC, le TEG est de 8, 58 %,
7, 27 %, 6, 82 % et 5, 14 % à 5, 10, 15 et 20 dB, respectivement. À partir des tableaux 5.2
et 5.3, on peut noter que la classe LSMFN2 est la plus difficile à classifier et que la portion
des séquences d’observations de LSMFN2, attribuées à LSMFN3, est plus grande que la
portion des séquences d’observations de LSMFN3 attribuées à LSMFN2.
Tableau 5.3 – Comparaison des performances de classification entre les MMC et les MSMC
pour la classifications des séquences d’observations issues de la variable r à 5 dB et pour 10
réalisations des étapes apprentissage/test.
Modèle TEG (%) TEC1 (%) TEC2 (%) TEC3 (%)
MMC 52,22 71,12 35,81 49,21
MSMC 8,58 0 17,88 7,88
Ce manque de potentiel d’un MMC pour modéliser ces séquences d’observations et
permettre sa classification peut être expliqué par le fait que les états sont caractérisés par
des temps de passage longs et des nombreuses observations sont produites au sein d’un
même état. Une loi géométrique, caractérisée par des temps de passage très courts est donc
une représentation irréaliste du temps passé dans chaque état. Une loi Gaussienne (utilisée
dans le MSMC), avec des valeurs µ ± σ, représente mieux le temps passé dans les états
dans ces séquences d’observations.
Une solution possible pour améliorer la performance des MMC est d’augmenter si-
gnificativement le nombre d’états. Cependant, on risque de tomber dans des problèmes
surapprentissage (overfitting) ou d’avoir des états trop fins, avec des faibles probabilités
d’observation (Σνk
i → 0) conduisant à des problèmes de stabilité numérique. De plus, la
charge de calcul d’un tel modèle serait inutilement élevée. Les performances supérieures
obtenues avec les MSMC reflètent l’exploitation des propriétés de dépendance temporelle des
séquences d’observations et seront donc les seuls modèles utilisés dans le reste du document
pour caractériser les séries temporelles uni ou multivariées.
5.1.3 Étude de la performance de classification en fonction du nombre
d’états
Cette étude permet d’observer l’évolution du TEG de classification pour différentes
valeurs de M. Seule la classification réalisée par MSMC a été étudiée car, dans le paragraphe
précèdent, les MSMC ont montré des meilleures performances de classification par rapport
aux MMC.
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 127
Apprentissage des modèles
Les séquences d’observations correspondent à la variable r des classes LSMFNk, k =
{1, 2, 3}, avec un RSB = 5 dB. k = 3 MSMC ont été créés pour apprendre la dynamique
de LSMFNk. M1 = 7 a été estimé par le critère BIC et nous avons fait varier M2 et M3
de 2 à 12.
Résultats de classification
La figure 5.4 montre le TEG en fonction de M2 et M3, pour la classification des
classes LSMFNk, k = {1, 2, 3}, issues de la variable r avec un RSB = 5 dB. L’examen
de la courbe reportée montre que les meilleures performances ont été obtenues pour un
nombre d’états similaires pour M2 et M3. On observe que lorsque le nombre d’états est
très différent, les performances se dégradent : M2 = M3 = 7 états, TEG = 1, 04 % ;
M2 = 2 états, M3 = 12 états, TEG = 33 %. Cela peut être expliqué par le fait que les
dynamiques des observables dans les classes LSMFN2 et LSMFN3 sont très proches et,
en cas d’hétérogénéité trop importante entre les valeurs de M2 et M3, c’est le modèle le
plus complexe qui proposera la plus haute vraisemblance à la fois pour les classes LSMFN2
et LSMFN3. Le modèle le plus simple n’étant pas capable de reproduire la dynamique
observée.
0
2
4
6
8
10
12
0
2
4
6
8
10
12
0
5
10
15
20
25
30
35
Erreurglobale(%)
M2 M3
Figure 5.4 – TEG (%) en fonction du nombre d’états des MSMC pour la classification de
trois classes issues de la variable r à 5 dB.
Ces résultats illustrent aussi que, le seul hyper-paramètre des MSMC à ajuster, c’est-à-
dire, le nombre d’états du modèle M, est une variable qui affecte sensiblement la performance
de classification et doit être estimé de la meilleure manière possible. De plus, cette estimation
doit être réalisée de façon spécifique à chaque MSMC à utiliser, en fonction de la complexité
128 Chapitre 5
des dynamiques que chaque modèle devra reproduire. Dans notre cas, le critère BIC est
utilisé pour calculer cet hyper-paramètre, en évaluant l’équation 4.16.
5.1.4 Étude de la performance de classification intégrant les améliora-
tions proposées
Dans cette section, le TEG de classification est analysé lorsque les améliorations proposées
au chapitre 4, telles que la quantification des séquences d’observations et la version retardée
de la série univariée, sont prises en compte.
Apprentissage des modèles
Les séquences d’observations correspondent à la variable r des classes LSMFNk, k =
{1, 2, 3} avec un RSB = 5 dB. Les séquences d’observations ont été quantifiées de manière
uniforme rQU (∆QU = 50) et de manière non uniforme rQNU (δQNU = 0, 001). La version
retardée des séquences d’observations a été aussi considérée avec une valeur de τ = 1 s :
r =
rt−T+1:t
rt−τ−T+1:t−τ
(5.3)
De plus, la quantification de r a été considérée : rQU (∆QU = 50) et rQNU (δQNU = 0, 001).
Les valeurs de ∆QU, δQNU et τ ont été choisies de manière empirique. Leurs valeurs optimales
seront déterminées pour la détection en ligne.
Pour chaque variable étudiée r, rQU, rQNU, r, rQU et rQNU, appartenant aux classes
LSMFNk, k = 3 MSMC ont été crées avec paramètres λk.
Les résultats de l’estimation de Mk sont montrés tableau 5.4. On peut constater que la
quantification uniforme permet de réduire le nombre d’états des modèles λ1, λ2 et λ3 d’une
manière similaire car la gamme dynamique de l’amplitude des séquences d’observations se
réduit uniformément dans tous les cas. Cependant, la quantification non uniforme permet de
réduire seulement le nombre d’états des modèles λ2 et λ3 chargé de modéliser les observations
qui présentent une gamme dynamique plus importante et une distribution non gaussienne.
Résultats de classification
Le tableau 5.5 montre les valeurs de TEG pour les variables analysées. L’analyse de ce
tableau montre que :
1. La quantification uniforme de la variable r permet de diminuer le taux d’erreur par
rapport au cas non quantifié car la variabilité des séquences d’observations est réduite
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 129
Tableau 5.4 – Estimation du nombre d’états par MSMC pour modéliser la dynamique des
différents versions de la variable r avec un RSB = 5 dB.
Variable M1 (États) M2 (États) M3 (États)
r 7 12 12
rQU 5 7 7
rQNU 7 10 10
r 5 14 14
rQU 4 11 11
rQNU 5 11 11
uniformément dans toutes les classes et les dynamiques les plus significatives des
séquences d’observation sont mises en évidence. Tout cela favorise la différentiation
des classes que se ressemblent (LSMFN2 et LSMFN3) et facilite l’affectation des
observations aux états dans l’étape de récursion de l’algorithme de Viterbi ;
2. La quantification non uniforme de la variable r améliore encore les performances de
classification par rapport aux cas non quantifié et quantifié uniformément. Ceci est dû
au fait que, avec la quantification non uniforme utilisée, la variabilité des séquences
d’observations est réduite seulement dans les portions où les données sont moins
fréquentes ;
3. La prise en compte de la version retardée de la séquence d’observation et la séquence
d’observation elle même accroît les performances de classification, car l’observabilité
du système est augmentée et l’information provenant de la variable rapide (v) (c.f
section 5.1.1) est synchronisée avec celle de la variable lente (r).
Tableau 5.5 – TEG pour classer trois dynamiques différents des variables r à 5 dB en
utilisant des MSMC sur 10 réalisations.
Variable TEG (%)
r 8,58
rQU 7,04
rQNU 6,98
r 0
rQU 0
rQNU 0
5.1.5 Détection en ligne d’évènements d’intérêt
Dans cette section, la détection en ligne de la perturbation I est réalisée en utilisant
l’approche basée sur des MSMC proposée au chapitre 4. Cette expérience est particulièrement
130 Chapitre 5
intéressante puisqu’une détection basée sur un simple seuil serait incapable de détecter et
distinguer la perturbation produite avec a1 de celle produite avec a2 (en partie à cause de
la phase de réduction d’amplitude). La détection de la stimulation générée avec a2 n’est
pas analysée car elle n’apporte pas d’informations supplémentaires pour notre objectif de
validation. Comme de très bons résultats de classification ont été obtenus en utilisant la
variable lente du MFN et afin de compliquer les tâches de détection en ligne, seulement la
variable rapide (v) sera utilisée dans cette section.
Apprentissage des modèles
Les séquences d’observations correspondent à la variable v des classes LSMFNk, k =
{1, 2, 3} avec un RSB = 5 dB. Elles ont été quantifiées de manière uniforme vQU et de
manière non uniforme vQNU. Le ∆QU optimal a été déterminé en utilisant l’algorithme 3 et
le ∆QNU optimal a été déterminé en utilisant l’algorithme 5.
La version retardée des séquences d’observations v a été également considérée. Pour la
recherche du τ optimal, nous nous sommes basés sur l’analyse spectrale des variables v et r,
car l’une influence l’autre. La différence en fréquence entre les pics observés dans le spectre
de fréquence des séries temporelles v et r (voir figure 5.5) est de 0,08 Hz, ce qui correspond
à une demi-période de 6,25 secondes. À partir de cette valeur, cinq valeurs différentes de τ
ont été générées :
τ = {3,75, 5, 6,25, 7,5, 8,75} (5.4)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1 v
r
Fréquence (Hz)
Energienormalisée
Figure 5.5 – Spectre des séries temporelles v et r.
Ensuite, pour chaque τ, Mk a été déterminé, λk a été estimé et la détection a été
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 131
effectuée. La valeur optimale de τ correspond donc à celle qui donne la valeur la plus faible
de DCDP (équation 2.5). De plus, une fois déterminé le τ optimal, les versions quantifiées
de v (vQU et vQNU) ont été utilisées et les ∆QU et ∆QNU optimaux ont été déterminés.
La figure 5.6 résumé les étapes du processus d’optimisation des paramètres ∆QU, ∆QNU
et τ utilisés dans cette thèse.
Initialiser
paramètre
Appliquer méthode
aux données
Base de données d'apprentissage
Classe 1 Classe k
Estimer et
Base de
données de test
Calculer
Choisir la valeur du
paramètre qui donne
la plus faible DCDP
Détecter
Calculer DCDP
Changer la valeur
du paramètre
Figure 5.6 – Étapes du processus d’optimisation des paramètres. paramètre correspond aux
valeurs de ∆QU, ∆QNU et τ et méthode correspond à quantification uniforme, quantification
non uniforme et prise en compte de la version retardée des séquences, respectivement.
Pour chaque variable étudiée v, vQU, vQNU, v, vQU et vQNU, appartenant aux classes
LSDMFNk, k = 3 MSMC ont été créés avec paramètres λk.
Résultats de la détection de la perturbation générée avec a1
Les séries temporelles univariées utilisées dans cette expérience correspondent à la
variable v avec un RSB = 5 dB, de l’ensemble de « test » décrit dans la section 5.1.1.
Une fenêtre glissante de taille T = 10 secondes a été retenue pour obtenir la séquence
d’observation et calculer les log-vraisemblances Lk. Deux seuils (δ2,1 et δ2,3) ont été utilisés
pour détecter la perturbation générée avec a1, en appliquant l’équation 4.25. La figure 5.7
montre deux séries temporelles v, l’une générée avec a1 et l’autre générée avec a2, pour un
132 Chapitre 5
RSB = 5 dB. Les instants de début et fin de l’évènement d’intérêt à détecter y sont reportés.
On peut observer la difficulté du problème : détecter la perturbation et la différencier avec
celle générée avec a1 et celle générée avec a2.
0 50 100 150 200 250 300 350 400 450
−1200
−1000
−800
−600
−400
−200
0
200
400
Temps (s)
v
généré avec a1
généré avec a2
(a)
280 285 290 295 300 305 310 315 320 325 330
−1200
−1000
−800
−600
−400
−200
0
200
400
généré avec a1
généré avec a2
Temps (s)
v
Début
annotation
Fin
annotation
(b)
Figure 5.7 – Dans (a), séries temporelles v générées avec a1 et a2 et dans (b), agrandissement
de (a).
Pour caractériser la variable v, les nombres d’états par MSMC selon le critère de BIC
ont été de : M1 = 6 états et M2 = M3 = 10 états. Les courbes de log-vraisemblance Lk
correspondant aux séries temporelles de la figure 5.7 sont montrées figure 5.8. On observe
comment les courbes de log-vraisemblance évoluent au cours du temps pour indiquer l’état
(« repos » ou « perturbation ») dans lequel on se trouve à l’instant t.
0 50 100 150 200 250 300 350 400 450
−30
−25
−20
−15
−10
−5
0
Temps (s)
Log-vraisemblance
(a)
280 285 290 295 300 305 310 315 320 325 330
−30
−25
−20
−15
−10
−5
Temps (s)
Log-vraisemblance
Début
annotation
Fin
annotation
(b)
Figure 5.8 – Dans (a), courbes des log-vraisemblances Lk, k = {1, 2, 3}, des séries temporelles
de la figure 5.7 et dans (b), agrandissement de (a).
La différence des log-vraisemblances (L2 − L1 et L2 − L3) sont montrées figure 5.9. Les
deux seuils L2 − L1 > δ2,1 et L2 − L3 > δ2,3 sont ajustés afin de maximiser la sensibilité et
la spécificité (DCDP équation 2.5).
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 133
280 285 290 295 300 305 310 315 320 325 330
−5
0
5
10
15
20
Différencedeslog-vraisemblance
Temps (s)
Début
annotation
Fin
annotation
Figure 5.9 – Différence des log-vraisemblances présentées dans la figure 5.8.
Le tableau 5.6 montre les résultats de détection de la perturbation générée avec a1 en
utilisant les MSMC. Cette valeur correspond aux valeurs des seuils δ2,1 et δ2,3, qui donnent
le point sur la courbe COR le plus proche de la détection parfaite (DCDP, équation 2.5).
Tableau 5.6 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de v.
Variable SEN (%) SPC (%) TRD (s)
v 89,29 97,98 2, 09 ± 0, 07
Détermination de ∆QU optimal Le nombre d’états pour chaque MSMC, pour les
différentes valeurs de ∆QU, est montré tableau 5.7. On peut constater que Mk diminue
lorsque que la taille du pas de quantification uniforme augmente, telle que montré dans la
démarche de classification de la section précédente (section 5.1.4). Le tableau 5.8 montre
les performances de détection de la perturbation générée avec a1, en utilisant les MSMC
pour apprendre la dynamique de la variable vQU pour différentes valeurs de ∆QU. Dans ce
tableau, la valeur optimale obtenue par estimation de la DCDP est ∆QU = 25. Ces résultats
montrent à nouveau l’intérêt de l’étape de quantification.
Détermination de ∆QNU optimal Le nombre d’états par MSMC pour les différentes
valeurs de δQNU, est montré tableau 5.9. On peut observer que M2 et M3 diminuent plus
que M1 au fur et à mesure que δQNU augmente, pour les raisons détaillées pour la variable
r dans la section précédente (section 5.1.4). Le tableau 5.10 montre les performances de
détection de la perturbation générée avec a1, en utilisant les MSMC pour apprendre la
dynamique de la variable vQNU pour différentes valeurs de δQNU. Dans ce tableau, la valeur
optimale qui donne la DCDP la plus faible est δQNU = 0, 003.
134 Chapitre 5
Tableau 5.7 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQU pour différentes valeurs de ∆QU.
∆QU M1 (États) M2 (États) M3 (États)
10 5 7 7
15 4 7 7
20 4 6 6
25 3 6 6
30 3 6 6
40 3 6 6
Tableau 5.8 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQU.
∆QU SEN (%) SPC (%) TRD (s)
10 89,25 98,08 1, 80 ± 0, 24
15 91,13 97,39 1, 60 ± 0, 06
20 92,12 97,97 1, 61 ± 0, 08
25 93,26 97,85 1, 41 ± 0, 24
30 88,18 98,15 2, 08 ± 0, 09
40 88,08 98,16 2, 09 ± 0, 06
Tableau 5.9 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQNU pour différentes valeurs de δQNU.
δQNU M1 (États) M2 (États) M3 (États)
0,0001 6 7 7
0,001 5 6 6
0,002 5 6 6
0,003 4 5 5
0,005 4 4 4
0,01 4 4 4
Détermination de τ optimal La figure 5.10 montre un exemple de deux séries mono-
source bivariées v, générées avec a1 et avec a2, pour un RSB = 5 dB et une valeur de
τ = 3, 75 s. On peut observer les différentes trajectoires produites par les deux séries.
Le nombre d’états par MSMC, pour les différentes valeurs de τ, est montré tableau 5.11.
On peut observer que, pour différentes valeurs de τ, M2 et M3 sont différents tandis que
M1 reste identique. Les valeurs de performance de détection en utilisant la variable v pour
différentes valeurs de τ sont montrées tableau 5.12. On peut observer que la meilleure
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 135
Tableau 5.10 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQNU.
δQNU SEN (%) SPC (%) TRD (s)
0,0001 90,16 95,76 1, 77 ± 0, 23
0,001 91,13 97,39 1, 69 ± 0, 19
0,002 90,66 98,33 1, 60 ± 0, 06
0,003 92,14 96,19 0, 16 ± 3, 12
0,005 89,34 95,63 0, 09 ± 2, 85
0,01 88,65 96,64 0, 44 ± 2, 53
−1200 −1000 −800 −600 −400 −200 0 200 400
−1200
−1000
−800
−600
−400
−200
0
200
400
généré avec a1
généré avec a2
Figure 5.10 – Séries mono-source bivariée v, générées avec a1 et avec a2, pour un
RSB = 5 dB et une valeur de τ = 3, 75 s.
performance est atteinte pour une valeur de τ = 5 secondes.
Tableau 5.11 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de
v pour différentes valeurs de τ.
τ M1 (États) M2 (États) M3 (États)
3,75 5 12 12
5 5 12 12
6,25 5 13 13
7,5 5 10 10
8,75 5 9 9
136 Chapitre 5
Tableau 5.12 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de v.
τ (s) SEN (%) SPC (%) TRD (s)
3,75 85,93 97,89 2, 89 ± 0, 07
5 90,25 97,61 1, 73 ± 1, 40
6,25 89,68 95,72 1, 09 ± 2, 87
7,5 85,85 97,27 2, 93 ± 0, 47
8,75 89,36 94,10 1, 2 ± 2, 90
Détermination de ∆QU optimal Une fois τ = 5 s optimal trouvé, nous allons
procéder à réaliser la quantification de v : vQU. Le nombre d’états par MSMC, pour les
différentes valeur de ∆QU, est montré tableau 5.13. Les valeurs de performance de détection
en utilisant la variable vQU pour différentes valeurs de ∆QU sont montrées tableau 5.14. La
quantification uniforme de la variable v ne produit pas d’amélioration de la performance de
détection par rapport au cas non quantifié.
Tableau 5.13 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de
v pour différentes valeurs de τ.
∆QU M1 (États) M2 (États) M3 (États)
5 5 8 8
10 4 7 7
15 3 6 6
20 3 6 6
Tableau 5.14 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQU.
∆QU (s) SEN (%) SPC (%) TRD (s)
5 90,06 96,68 2, 07 ± 0, 29
10 89,66 97,28 2, 08 ± 0, 89
15 79,24 94,71 0, 21 ± 3, 39
20 62,89 97,19 7, 40 ± 1, 19
Détermination de ∆QNU optimal Finalement, la quantification non uniforme de
v (vQNU) est réalisée pour la valeur optimale de τ = 5 s. Le nombre d’états par MSMC,
pour les différentes valeur de δQNU, est montré tableau 5.15. Les valeurs de performance
de détection en utilisant la variable vQNU pour différentes valeurs de δQNU sont montrées
5.1. Évaluation de la faisabilité des MSMC sur signal simulé 137
tableau 5.16. Encore une fois, la quantification non uniforme de la variable v ne produit
pas d’amélioration de la performance de détection par rapport au cas non quantifié.
Tableau 5.15 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de
vQNU pour différentes valeurs de δQNU.
δQNU M1 (États) M2 (États) M3 (États)
0,0001 5 8 8
0,001 4 7 7
0,005 3 6 6
0,01 3 6 6
Tableau 5.16 – Performance de détection de la perturbation avec a1, en utilisant des MSMC
pour apprendre la dynamique de vQNU.
δQNU (s) SEN (%) SPC (%) TRD (s)
0,0001 90,00 97,64 2, 1 ± 0, 05
0,001 89,98 96,99 2, 1 ± 0, 07
0,005 89,19 97,97 1, 5 ± 2, 14
0,01 90,31 93,56 −0, 8 ± 3, 98
Synthèse des résultats de détection
Les meilleurs résultats de détection obtenus sont reportés tableau 5.17, ainsi que dans
les figures 5.11a, qui montre les courbes COR, et 5.11b, qui présente les retards moyens de
détection. Dans ces figures, le point qui donne la valeur la plus faible de DCDP (valeurs
optimales de δ2,3 et δ2,1) est représenté par le caractère « x », pour chaque courbe. Ces
courbes sont construites en modifiant la valeur du seuil δ2,3, tout en conservant la valeur
du seuil δ2,1 qui délivre la plus faible DCDP.
Tableau 5.17 – Meilleures performances de détection de la perturbation produite avec a1,
en utilisant des MSMC.
Variable (s) Observation SEN (%) SPC (%) TRD (s)
v 89,29 97,98 2, 09 ± 0, 07
vQU ∆QU = 25 93,26 97,85 1, 41 ± 0, 24
vQNU δQNU = 0, 003 92,14 96,19 0, 16 ± 3, 12
v τ = 5 s 90,25 97,61 1, 73 ± 1, 40
138 Chapitre 5
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
0.8
0.82
0.84
0.86
0.88
0.9
0.92
0.94
0.96
TFP
TVP
(a)
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
0
1
2
3
4
5
6
7
TFP
TRD(s)
(b)
Figure 5.11 – Meilleures performances de détection de la perturbation produite avec a1, en
utilisant MSMC. Dans (a) courbes COR et dans (b) courbes TRD en fonction de TFP.
On peut observer dans le tableau 5.17 et dans les figures 5.11a et 5.11b, que la perfor-
mance de détection est améliorée lorsque l’étape de quantification est utilisée. La meilleure
performance de détection a été obtenue quand la quantification uniforme est appliquée
à la variable v (vQU), suivie du cas de quantification non uniforme (vQNU). Ces résultats
confirment donc l’intérêt de l’approche de détection par MSMC proposée, et mesurent
l’impact de l’étape de quantification et de la prise en compte de la version retardée sur les
performances de détection, dans un cas de détection très difficile.
5.2 Évaluation des MSMC sur signaux réels
L’analyse précédente sur signaux simulés a confirmé que l’approche par MSMC proposée
apparaît comme une méthode appropriée pour le problème posé dans ce travail de thèse. De
plus, l’apport de la quantification et de l’intégration d’une version retardée des observations
ont pu être mesurés. Cette section présente des résultats de l’application de la méthode
sur des signaux réels. Les séries temporelles à caractériser sont décrites dans la prochaine
sous-section. Cette dernière présente l’information qui va être prise en compte par les MSMC.
La deuxième sous-section montre la classification des épisodes d’apnée-bradycardie et la
troisième détaille les résultats de détection en ligne. Finalement, la fusion de détecteurs est
appliquée aux meilleurs détecteurs trouvés, dans la section 5.2.4.
5.2. Évaluation des MSMC sur signaux réels 139
5.2.1 Méthode proposée pour l’annotation des instants de début de bra-
dycardie
Les séries RR, Ramp et QRSd ont été extraites de l’ECG de 32 nouveau-nés prématurés
présentant des épisodes fréquents d’apnée-bradycardie, en appliquant la méthode proposée
dans le Chapitre 3. Pour mémoire, et en cas d’une lecture indépendante de ce chapitre,
ceci consiste à : i) détecter les battements cardiaques à partir des signaux ECG bruts,
ii) segmenter chaque battement détecté par un algorithme basé sur les ondelettes et
iii) former les séries temporelles RR (différences successives des ondes R), Ramp (différences
entre le pic de l’onde R et le niveau isoélectrique) et QRSd (différence entre la fin et le
début du complexe QRS) pour chaque individu de la base de données. Les séries ainsi
obtenues ont été uniformément sur-échantillonnées à une fréquence de 10 Hz, afin d’avoir
une résolution temporelle suffisante pour l’application des MSMC. De plus, la série Ramp a
été réduite, en la divisant par la valeur absolue maximale trouvée dans les deux premières
minutes.
Dans cette étude, les bradycardies ont été annotées manuellement avec l’aide d’un
clinicien. De plus, une procédure d’ajustement de courbe a été proposée pour situer, avec
la meilleure reproductibilité possible, le début de la bradycardie. Une fonction sigmoïde
(équation 5.5) est utilisée pour approcher la série temporelle RR aux alentours de l’instant
de début de la bradycardie :
f(t) = A +
B
1 + e
t−C
D
(5.5)
Le début de la bradycardie correspond au premier point où la dérivée de la fonction
sigmoïde est supérieure à 1. Un exemple d’approximation de la série temporelle RR est
montré figure 5.12. On y a reporté le point qui correspond à l’annotation du début de la
bradycardie.
Au total, 148 ensembles de séries temporelles (26, 25 ± 11, 37 minutes) de la base de
données de 32 nouveau-nés prématurés (constitués chacun des séries RR, Ramp et QRSd) ont
été utilisés et 233 épisodes de bradycardies ont été annotés avec une durée des bradycardies
de 21, 48 ± 16, 07 secondes.
5.2.2 Classification des séries temporelles : « présence » ou « absence »
d’apnée-bradycardie
Comme il a été présenté en introduction de ce chapitre, la tâche de classification
correspond à l’identification de séquences d’observations qui contiennent ou pas un événement
d’intérêt, tandis que la détection en ligne cherche à estimer l’instant d’apparition de ces
événements par une approche récursive. Il est important de préciser qu’il ne s’agit pas ici
140 Chapitre 5
0 5 10 15
2
4
6
8
10
12
14
16
0 5 10 15
350
400
450
500
550
600
650
700
750
800
Temps (s)
RR(ms)
DérivéeRRinterpolée
RR
RR interpolée
Dérivée RR interpolée
Figure 5.12 – Approximation de la série temporelle RR (représentée par des cercles) pendant
un épisode de bradycardie, par une fonction sigmoïde (courbe rouge continue). La courbe
noire pointillée correspond à la dérivée de la fonction sigmoïde et la ligne verticale correspond
à l’annotation du début de bradycardie.
de classifier les différents types d’épisode d’apnée-bradycardie comme par exemple, des
épisodes appartenant aux types centrale, obstructive ou mixte.
Les observations
Les 148 séries temporelles décrites précédemment ont été segmentées en blocs de
7 secondes. Ceci a produit un nombre total de 29667 blocs. Ces blocs ont été regroupés en
deux sous-ensembles :
1. le sous-ensemble LSC1 ou classe 1, composé de 146 blocs présentant une bradycardie
et choisis parmi les 233 épisodes de bradycardie annotés. Chaque bloc dans cette
classe est défini à partir du début de la bradycardie et avec une durée T = 7 secondes.
Le critère d’inclusion d’un bloc dans cette classe était que : i) avant le début de la
bradycardie la FC doit être sans ralentissement ni accélération, en conséquence, dès
t = 10 secondes avant le début de la bradycardie jusqu’au début de la bradycardie
|FC(t) − FCbase| < ±10 %, où FCbase est la FC de base mesurée dans une fenêtre
glissante de 5 minutes et ii) durant les premières 5 secondes de la bradycardie,
l’intervalle RR doit dépasser les points critiques RR ≥ 500 ms ou RR ≥ 33%RRbase
où RRbase = 60/FCbase. La figure 5.13 montre deux cas typiques qui ne doivent pas
être inclus dans sous-ensemble LSC1. Dans la figure 5.13a, on observe le cas où, avant
le début de la bradycardie, la FC présente un ralentissement et dans la figure 5.13b
on observe le cas où l’intervalle RR ne dépasse pas le seuil de 500 ms qu’après 20 s
dès l’annotation.
5.2. Évaluation des MSMC sur signaux réels 141
2. le sous-ensemble LSC2 ou classe 2, constitué de 1500 blocs choisis aléatoirement parmi
les segments de séries temporelles au repos. Ils ont également une durée de 7 secondes.
320 340 360 380 400 420
350
400
450
500
550
600
650
700
750
800
850
Débutdelabradycadie
Findelabradycadie
10 s
10%
(a)
1380 1400 1420 1440 1460 1480 1500 1520
400
500
600
700
800
900
RR(ms)
Temps (s)
7 s
Débutdelabradycadie
Findelabradycadie
Seuil
(b)
Figure 5.13 – Exemples des séries RR que ne doivent pas être incluses dans le sous-ensemble
LSC1. Dans (a) la FC présente un ralentissement avant le début de la bradycardie et dans
(b) l’intervalle RR ne dépasse pas le seuil de 500 ms que plus de 20 s après l’annotation.
A titre d’exemple, la figure 5.14 montre une série RR avec un épisode de bradycardie
significative. On y a reporté l’analyse par bloc des séries et la classe affectée à chaque bloc.
0 20 40 60 80 100 120 140 160 180
400
500
600
700
800
900
1000
RR(ms)
Temps (s)
Fin de la
bradycardie
Bradycardie
significative
Classe 1
7 s
Classe 2
7 s
Classe 2
7 s
Classe 2
7 s
Classe 2
7 s
Figure 5.14 – Exemple d’une série RR avec un épisode de bradycardie. Les différents blocs
segmentés et leur classe sont indiqués.
La durée des segments (7 secondes) à classer correspond au temps mesuré entre le début
de la bradycardie et le plus grand ralentissement de la FC observée en bradycardie sur la
moyenne spatiale des 233 blocs de séries RR (RR) tel que montré figure 5.15 et calculée
avec l’équation 5.6, où j ∈ {Deb, Deb + 1, . . . , Fin − 1, Fin}, Deb et Fin correspondent
aux instants de début et de fin des épisodes d’apnée-bradycardie.
RR(j) =
1
233
233
i=1
RRi(j) (5.6)
142 Chapitre 5
0 5 10 15
300
400
500
600
700
800
0 5 10 15
300
400
500
600
700
800
Temps (s)
Temps (s)
0 5 10 15
350
400
450
500
550
600
650
700
0 5 10 15
400
450
500
550
600
650
Temps (s)
Temps (s)
DébutannotationDébutannotationDébutannotationDébutannotation
Valeur maximale
7 s
Figure 5.15 – Procédure pour la détermination de la taille de la séquence d’observation sur
les signaux RR. RR correspond à la moyenne des 233 blocs de séries RR avec les épisodes
d’apnée-bradycardies.
De plus, afin de réduire la variabilité d’amplitude du premier échantillon des séries
temporelles, celles-ci ont été centrées de la façon décrite au chapitre 4 (équation 4.30) où la
moyenne, déterminée dans les L = 5 secondes qui précèdent le début de chaque segment, a
été enlevée aux séquences d’observation.
5.2. Évaluation des MSMC sur signaux réels 143
La figure 5.16 montre les 7 premières secondes de la série temporelle RR moyennée (RR)
et son écart type. On observe sur la figure 5.16a une variabilité importante dans l’amplitude
du premier échantillon de la série temporelle. Cette variabilité est évidemment réduite
en centrant les séries avec la procédure décrite (figure 5.16b). Une boîte à moustache du
premier échantillon de chaque série est montrée figure 5.17 pour renforcer cette justification.
0 1 2 3 4 5 6 7
350
400
450
500
550
600
650
700
750
800
Temps (s)
(a)
0 1 2 3 4 5 6 7
−50
0
50
100
150
200
250
300
350
400
Temps (s)
(b)
Figure 5.16 – Moyenne (ligne continue) et moyenne ± écart-type (lignes pointillées) de
7 premières secondes des séries RR en bradycardie. Dans (a) on observe la variation
d’amplitude du premier échantillon tandis que dans (b), cette variation est réduite en
supprimant aux séries la moyenne déterminée sur les 5 secondes qui précédent le début de
la bradycardie.
350
400
450
500
550
(a)
−40
−20
0
20
40
60
80
100
120
(b)
Figure 5.17 – Boîte à moustache du premier échantillon des série RR en bradycardie : (a)
RR non centrées et (b) RR centrées.
Finalement, les séquences d’observations des classes 1 et 2 ont été multipliées arbitraire-
ment par 1000 afin d’éviter que Σνk
i → 0.
144 Chapitre 5
Application de l’approche proposée dans le présent travail
Les améliorations proposées dans le chapitre 4, telles que la quantification des séquences
d’observations et la prise en compte de la version retardée de la série temporelle univariée,
sont appliquées aux variables des classes 1 et 2 :
– pour le cas RR : RRQU, RRQNU, RR, RRQU et RRQNU,
– pour le cas Ramp : RampQU, RampQNU, Ramp, RampQU et RampQNU,
– pour le cas QRSd : QRSdQU, QRSdQNU, QRSd, QRSdQU et QRSdQNU.
Les valeurs de τ, ∆QU et δQNU utilisées dans cette section, correspondent aux valeurs
optimales déterminées pour la détection en ligne (section 5.2.3 et Annexe E). Les valeurs
de τ sont : τ = 0, 67 s pour la variables RR et τ = 0, 5 s pour les variables Ramp et QRSd.
Le valeurs de ∆QU et δQNU sont montrées tableau 5.18.
Tableau 5.18 – Valeurs optimales des paramètres ∆QU et δQNU.
Variable ∆QU δQNU
RR 1300 0,05
Ramp 20 0,001
QRSd 10 0,001
RR 50 0,002
Ramp 20 0,001
QRSd 10 0,001
Apprentissage des MSMC
Pour chaque variable, K = 2 MSMC ont été créés pour apprendre la dynamique observée
dans les évènements « présence » et « absence » d’apnée-bradycardie des classes 1 et 2 :
i) un MSMC avec paramètres λ1 pour modéliser les segments avec bradycardies (classe 1)
et ii) un MSMC avec paramètres λ2 pour modéliser les segments en repos (classe 2).
Le nombre d’états des MSMC (M1 et M2) ont été estimés en utilisant l’équation 4.16.
20 % des séquences d’observations de chaque classe ont été utilisées pour l’estimation des
paramètres et 80 % pour évaluer l’appartenance des séquences d’observations aux modèles
selon l’équation 4.23. Une procédure de Monte Carlo est appliquée pour sélectionner les
données de l’apprentissage et du test.
Les résultats de l’estimation de Mk, k = 1, 2, est montré tableau 5.19. On peut constater
que : i) dans le cas des variables RR et RR, M1 et M2 diminuent lorsque la quantification
uniforme est appliquée, mais M1 diminue plus que M2 lorsque la quantification non uniforme
est appliquée, ii) dans le cas des variables Ramp, Ramp, QRSd et QRSd, M1 et M2
diminuent de manière semblable lorsque les quantifications uniforme ou non uniforme sont
5.2. Évaluation des MSMC sur signaux réels 145
appliquées. Cela est expliquée par le fait que l’histogramme des séries temporelles RR est
moins gaussien que pour les séries temporelles Ramp et QRSd.
Tableau 5.19 – Estimation du nombre d’états par MSMC pour modéliser les classes 1 et 2.
Variable M1 (États) M2 (États)
RR 13 11
RRQU 7 5
RRQNU 5 6
RR 15 12
RRQU 13 8
RRQNU 6 6
Ramp 8 7
RampQU 6 5
RampQNU 7 6
Ramp 12 10
RampQU 8 8
RampQNU 8 8
QRSd 7 7
QRSdQU 7 6
QRSdQNU 7 7
QRSd 10 8
QRSdQU 9 8
QRSdQNU 9 8
RR&Ramp 13 11
RR&RampQU 10 8
RR&RampQNU 4 6
RR&QRSd 8 8
RR&QRSdQU 8 8
RR&QRSdQNU 6 6
Performance de classification
L’expérience apprentissage/test a été répétée 10 fois afin d’obtenir des résultats indé-
pendants du tirage effectué.
Le tableau 5.20 montre les performances de classification obtenues. On peut constater
que : i) dans le cas de la variable RR, la quantification non uniforme et la prise en compte
d’une version retardée de l’observation permettent d’améliorer la classification (TEG=1,37 %
pour RR vs TEG=0,68 % pour RRQNU), ii) dans le cas des variables Ramp et QRSd, les
146 Chapitre 5
performances de classification ne sont pas satisfaisantes et la quantification des séquences
d’observation ne permet pas d’améliorer le TEG et iii) lorsque les séquences d’observa-
tion sont analysées de manière conjointe, les performances de classification s’améliorent
(TEG=1,37 % pour RR et TEG=36,68 % pour Ramp vs TEG=1,06 % pour RR&Ramp).
Tableau 5.20 – Performances de classification par MSMC en utilisant les signaux réels.
Variable TEG (%) SEN (%) SPC (%)
RR 1,37 99,91 97,36
RRQU 1,30 99,80 97,61
RRQNU 1,24 99,41 98,12
RR 0,94 98,72 99,41
RRQU 0,85 98,55 99,75
RRQNU 0,68 99,49 99,15
Ramp 36,68 58,55 68,10
RampQU 36,29 50,26 77,16
RampQNU 37,41 39,14 86,04
Ramp 36,19 44,79 82,83
RampQU 33,07 55,3 78,55
RampQNU 35,89 47,36 80,86
QRSd 40,00 42,48 77,53
QRSdQU 37,60 56,42 68,38
QRSdQNU 40,38 28,64 90,6
QRSd 40,08 37,61 82,23
QRSdQU 39,82 60,26 60,09
QRSdQNU 39,48 52,48 68,55
RR&Ramp 1,06 98,98 98,89
RR&RampQU 0,64 99,58 99,15
RR&RampQNU 0,72 100 98,57
RR&QRSd 0,94 99,75 98,38
RR&QRSdQU 0,64 99,75 98,98
RR&QRSdQNU 0,71 100 98,59
Sur la base de données à notre disposition, les résultats montrent qu’une analyse
multivariée et multi-source (intégrant plusieurs observables associées à des phénomènes
physiologiques différents, comme le RR&RampQU) présente les meilleures performances de
classification. Les améliorations que nous avons proposées prennent particulièrement leur
sens lorsque l’observabilité est réduite, par exemple dans les cas mono-source (i.e. seule la
série RR est disponible), les performances atteintes rejoignent alors celles du cas multivarié.
Les très faibles performances trouvées dans le cas des indicateurs Ramp et QRSd peuvent
5.2. Évaluation des MSMC sur signaux réels 147
être expliquées par le fait que nous avons choisi l’annotation du début de la bradycardie
(telle que décrite dans la section 5.2.1) comme point initial des séquences d’observation,
annotation réalisée par l’analyse des séries RR. Cependant, l’information utile peut être
présente sur d’autres séries avant cette annotation. Enfin, la recherche de l’instant optimal
où l’information se trouve est une tâche difficile qui peut être exécutée à partir d’une
méthodologie basée sur des algorithmes évolutionnaires, comme proposé au chapitre 3.
Cette démarche est placée comme une perspective de cette thèse.
5.2.3 Détection en ligne d’épisodes d’apnée-bradycardie
Les contraintes de notre cahier des charges consistent à réaliser la détection en ligne des
épisodes d’apnée-bradycardies. Cette détection est réalisée en utilisant l’approche basée sur
des MSMC proposée au chapitre 4.
Apprentissage
Les séquences d’observation utilisées dans la phase d’apprentissage des MSMC corres-
pondent au 20% des séquences d’observations, tirées aléatoirement à partir des éléments
présents dans les classes 1 et 2, décrites préalablement (section 5.2.2 page 140) : cas univariée
RR, Ramp, QRSd et cas bivariée RR&Ramp, RR&QRSd et Ramp&QRSd. La version
retardée des séquences d’observations a été également considérée : RR, Ramp et QRSd.
Pour chaque variable, les valeurs optimales de τ ont été déterminées comme proposé dans
le chapitre 4.
Les séquences d’observations ont été quantifiées de manière uniforme TSQU et de manière
non uniforme TSQNU, où
TS ∈ {RR, RR, Ramp, Ramp, QRSd, QRSd, RR&Ramp, RR&QRSd}.
Pour chaque variable, les valeurs optimales de ∆QU et ∆QNU ont été déterminées en utilisant
les algorithmes 3 et 5, respectivement.
Enfin, pour chaque variable analysée, appartenant aux classes 1 et 2, k = 2 MSMC ont
été crées : un MSMC avec paramètres λ1 modélise la dynamique de la bradycardie (classe
1) et un autre MSMC avec paramètres λ2 modélise les périodes de repos (classe 2). Pour
l’estimation de λk, 20 % des données de la classe 1 et 20 % des données de la classe 2 ont
été sélectionnées de manière aléatoire. Le nombre d’états de chaque modèle M1 et M2 ont
été déterminés en utilisant le critère BIC (équation 4.16).
148 Chapitre 5
Méthode de détection en ligne
La détection en ligne de l’évènement apnée-bradycardie est effectuée sur la totalité des 148
séries temporelles disponibles, présentant un total de 233 épisodes de bradycardie. Comme
détaillé au chapitre 4, la détection en ligne est basée sur l’analyse des log-vraisemblances
de chaque MSMC (équation 4.31). Une fenêtre glissante de taille T = 7 secondes a été
retenue pour obtenir la séquence d’observation Ot−T+1:t et calculer les log-vraisemblances
L1
t et L2
t . Par conséquent, seulement un seuil de détection est utilisé δ1,2 (équation 4.25).
La moyenne, déterminée dans une fenêtre de taille L = 5 secondes, a été enlevée aux
séquences d’observations avant d’être traitées par chaque MSMC (équation 4.30). La fenêtre
de longueur T est glissée par des sauts de 1 seconde (10 échantillons).
La figure 5.18 montre un exemple d’une telle détection en ligne, basée sur le calcul de
vraisemblance, en utilisant la variable RR. Deux épisodes de bradycardies y sont reportés
(figure 5.18a). Les courbes de log-vraisemblances (L1 et L2) évoluent au cours du temps et,
au moment de la bradycardie, L1 augmente et L2 diminue (figure 5.18b). On profite de ce
comportement pour calculer la différence des log-vraisemblances L1 − L2 (figure 5.18c) et
comparer cette différence au seuil δ1,2 pour détecter ces épisodes. On y a reporté aussi les
annotations de début et de fin de chaque épisode de bradycardie (lignes verticales pointillés
figures 5.18a et 5.18b).
La performance de détection a été évaluée par l’estimation de SEN (équation 2.1),
SPC (équation 2.2) et TRD pour différentes valeurs des seuils de détection, et analysée
par deux types de courbes COR : la première courbe représente classiquement la Pd vs.
Pfa et la seconde représente le TRD vs. Pfa. Les résultats de détection ont été évalués
également en termes de la DCDP (équation 2.5). Les valeurs de VP, VN, FP et FN
ont été déterminées pour chaque échantillon en comparant les détections obtenues avec
les annotations disponibles. Un VP se produit lorsqu’une détection est entourée d’une
annotation dans une fenêtre de 20 secondes, centrée à l’annotation donnée. Même si cette
fenêtre semble particulièrement large, nous avons justifié ce choix par le fait que nous
évaluons également le TRD comme un marqueur important pour la sélection de la méthode
de détection optimale et que les algorithmes proposés sont censés améliorer la détection
précoce des événements d’apnée-bradycardie.
Résultats sans prendre en compte les améliorations proposées
Le tableau 5.21 montre les résultats de détection de l’apnée-bradycardie pour les
cas univariés RR, Ramp et QRSd et pour les cas bivariées RR&Ramp, RR&Ramp et
Ramp&QRSd. La figure 5.19 montre les trois meilleures performances de détection de ce
tableau. Les méthodes classiques de détection de bradycardie (seuil fixe et seuil relatif)
sont également montrées comme référence dans le tableau 5.21 et la figure 5.19. Les valeurs
5.2. Évaluation des MSMC sur signaux réels 149
300 400 500 600 700 800 900
350
400
450
500
550
600
650
700
750
800
850
900
Temps (s)
RR(ms)
(a)
300 400 500 600 700 800 900
−140
−120
−100
−80
−60
−40
−20
0
Temps (s)
log-vraisemblance
(b)
300 400 500 600 700 800 900
−100
−80
−60
−40
−20
0
20
40
60
80
Temps (s)
Différencedeslog-vraisemblances
(c)
Figure 5.18 – (a) Série RR avec deux épisodes de bradycardie, (b) log-vraisemblance
des modèles : L1 (ligne segmentée) et L2 (ligne continue) et (c) différence entre les log-
vraisemblance : L1 − L2. Dans (a) et (c) les lignes verticales correspondent aux annotations
de début et fin de l’épisode de bradycardie.
du tableau correspondent aux valeurs des seuils δ2,1 et δ2,3 optimaux au sens du DCDP
(équation 2.5) et qui sont représentés par le caractère « x » dans la figure 5.19, pour chaque
courbe. Pour chaque variable, le nombre d’états des MSMC est le même que celui reporté
tableau 5.19.
Dans le tableau 5.21 et la figure 5.19, on peut observer que : i) la modélisation des
dynamiques des séries temporelles RR par MSMC améliore la performance de détection
par rapport aux méthodes de détection classiques (détection par seuil fixe ou par seuil
relatif) mais la détection se produit avec un retard plus important, ii) la modélisation par
MSMC des dynamiques des séries temporelles univariées Ramp et QRSd ne produisent
pas d’amélioration de la détection, iii) lorsque la dynamique des variables RR et Ramp et
RR et QRSd sont prises en compte de manière conjointe, les performances de détection
s’améliorent et le temps de détection se réduit par rapport aux versions univariées des séries
150 Chapitre 5
Tableau 5.21 – Performance de détection de l’apnée-bradycardie par MSMC, sans prendre
en compte les modifications proposées.
Variable SEN (%) SPC (%) TRD (s)
RR 74,20 92,77 6, 37 ± 7, 83
Ramp 63,64 76,28 6, 67 ± 15, 05
QRSd 66,43 66,51 6, 94 ± 13, 44
RR&Ramp 80,46 91,28 5, 24 ± 5, 09
RR&QRSd 81,22 88,23 4, 73 ± 5, 57
Seuil fixe 77,11 79,31 4, 63 ± 5, 04
Seuil relatif 73,35 87,36 4, 16 ± 8, 79
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
TFP
TVP
Seuil fixe
Seuil relatif
(a)
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
2
3
4
5
6
7
8
9
10
TFP
TRD(s)
Seuil fixe
Seuil relatif
(b)
Figure 5.19 – Performance de détection de l’apnée-bradycardie par MSMC, sans prendre
en compte les modifications proposées. Dans (a) courbes COR et dans (b) courbes TRD
moyen en fonction de TFP. Le caractère « x » représente le point correspondant à la DCDP.
considérées.
Résultats en utilisant les améliorations proposées
Comme décrit dans la section précédente sur signaux synthétiques, les approches de
classification et de détection par MSMC sont sensibles aux paramètres τ, ∆QU et ∆QNU,
ainsi qu’au nombre d’états M. L’optimisation de ces paramètres a été également abordée sur
les signaux réels, en utilisant la même approche que pour les signaux simulés. Les résultats
détaillés de chaque étape de l’optimisation sont présentés en Annexe E, afin d’alléger la
lecture de cette section. Tous les résultats montrés dans le reste de ce chapitre ont été donc
obtenus en utilisant les paramètres optimaux pour chaque type de modèle utilisé.
Le tableau 5.22 résume les 8 meilleures approches MSMC en termes de performance
5.2. Évaluation des MSMC sur signaux réels 151
de détection et les paramètres optimaux estimés pour chaque approche. La figure 5.20
montre les courbes COR associées à trois approches proposées dans ce tableau, et deux
approches classiques de la littérature, en indiquant dans chaque cas le point de détection
optimal en termes de la DCDP (caractère « x » sur les courbes). Les détections classiques
de bradycardie sont également montrées comme référence. On peut repérer, que la prise en
compte des dynamiques des séries temporelles extraites de l’ECG améliore les performances
de détection des épisodes d’apnée-bradycardie par rapport aux détecteurs classiques. De
plus, la quantification non uniforme des séries RR et de sa version retardée se montrent
comme les meilleures techniques. Même si nous n’avons pas réussi à prédire la survenue
de l’évènement apnée-bradycardie, les sept premiers résultats montrés dans ce tableau
indiquent que notre approche détecte, en moyenne, plus précocement que les méthodes de
détection classiques.
Tableau 5.22 – Huit meilleures approches de détection de bradycardies par MSMC, en
termes de performance.
Variable Paramètres optimaux SEN (%) SPC (%) TRD (s)
RRQNU δQNU = 0, 05 89,88 94,67 1, 93 ± 3, 34
RRQNU τ = 0, 67, δQNU = 0, 002 90,80 92,26 1, 12 ± 3, 62
RR τ = 0, 67 90,38 92,23 0, 92 ± 3, 56
RRQU τ = 0, 67, ∆QU = 50 89,94 91,95 0, 93 ± 3, 64
RRQU ∆QU = 1300 86,63 97,3 2, 33 ± 3, 15
RR&QRSdQU ∆RR
QU = 1300, ∆QRSd
QU = 0 85,87 87,85 1, 06 ± 3, 87
RR&QRSdQNU δRR
QNU = 0, 05, δQRSd
QNU = 0 82,62 92,16 1, 93 ± 4, 04
RR&Ramp - 80,46 91,28 5, 24 ± 5, 09
Seuil fixe - 77,11 79,31 4, 63 ± 5, 04
Seuil relatif - 73,35 87,36 4, 16 ± 8, 79
Si l’on utilise les règles de détection classiques : pour le détecteur de seuil fixe RR ≥
600 ms pendant 4 secondes et pour le détecteur de seuil relatif RR ≥ 33%RRbase ms
pendant 4 secondes, on obtient les résultats montrés tableau 5.23. On peut observer dans ce
tableau que les détecteurs classiques présentent une excellente spécificité mais une mauvaise
sensibilité, de plus, le retard à la détection est important. Avec les MSMC, on augmente la
sensibilité au détriment de la spécificité et on réduit par 10 le retard à la détection.
Tableau 5.23 – Performance de détection des méthodes classique dans leur point opérationnel.
Variable Sensibilité (%) Spécificité (%) TRD (s)
Seuil fixe 32,67 100 10, 74 ± 11, 22
Seuil relatif 32,60 100 8, 61 ± 4, 85
152 Chapitre 5
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Seuil fixe
Seuil relatif
TFP
TVP
(a)
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
−2
−1
0
1
2
3
4
5
6
7
8
TFPTRD(s)
Seuil fixe
Seuil relatif
(b)
Figure 5.20 – Performance de détection de l’apnée-bradycardie par MSMC. Dans (a) courbes
COR et dans (b) courbes TRD moyen en fonction de TFP. Le caractère « x » représente le
point correspondant à la DCDP.
D’autres travaux au laboratoire se sont intéressés à réduire le temps de retard à la
détection. C’est le cas de l’approche proposée par CRUZ [Cruz et al., 2006] qui effectue
la fusion optimale de trois détecteurs (détecteur fixe, détecteur relatif et détecteur par
changements abrupts sur la moyenne), par une méthode de fusion décentralisée [Hernández
et al., 1999]. Cette approche montre des valeurs de sensibilité et de spécificité de 97,67 %
et 97,00 % respectivement et une réduction de la détection à 2,22 battements (autour de
1 seconde) sur une base de données de 1188 épisodes de bradycardie de 40 individus. Il
faut signaler que le début de l’annotation des évènements dans ce travail correspond au
croisement de la série RR par 600 ms et dans notre cas le début de l’annotation a été placée
au point où la dérivée de la fonction sigmoïde qu’approche la série RR est supérieure à
1. De plus, la base de données et les procédures d’annotations ne sont pas identiques. Il
n’en reste pas moins, que cette étape de fusion a démontré son utilité, en particulier pour
améliorer la spécificité de la méthode de détection des ruptures [Cruz et al., 2006]. Dans
ce sens, l’étape finale d’évaluation de notre détecteur a été donc d’adapter la méthode de
fusion utilisée dans [Hernández et al., 1999; Cruz et al., 2006] et d’évaluer son intégration
avec la méthode par MSMC proposée dans cette thèse.
5.2.4 Fusion des détecteurs
Deux architectures de fusion de données sont souvent employées dans la littérature dans
le cadre de la détection d’événements : une architecture centralisée, où un modèle est
utilisé pour apprendre la dynamique de plusieurs variables de manière conjointe, et une
architecture décentralisée, où différents modèles sont utilisés pour analyser la dynamique
de chaque variable et chaque modèle produit une décision locale qui est combinée avec les
5.2. Évaluation des MSMC sur signaux réels 153
décisions des autres détecteurs. Dans cette thèse, lorsque les MSMC ont été appliqués pour
modéliser la dynamique de plusieurs variables physiologiques de manière conjointe, on a
réalisé une fusion centralisée. Ce type de fusion a montré, dans les sections précédentes,
la possibilité d’améliorer les performances de détection par rapport au cas univariée : les
valeurs SEN = 74, 20% et SPC = 92, 77% pour RR et SEN = 63, 64% et SPC = 76, 28%
pour Ramp passent à SEN = 80, 46% et SPC = 91, 28% pour RR&Ramp. Cependant,
la performance de détection obtenue par ce moyen n’a pas été la meilleure performance
reportée.
L’objectif de cette section est donc de combiner, d’une manière décentralisée, la décision
de chaque détecteur afin d’améliorer les performances de détection, tout en minimisant
le temps de retard à la détection. En effet, les détecteurs de bradycardie basés sur des
MSMC, montrés dans la section précédente, analysent différentes variables et différentes
dynamiques temporelles et, en conséquence, ils sont basés sur des hypothèses des réponses
physiologiques différentes. Ces détecteurs peuvent être considérés comme complémentaires
entre eux, ce qui nous motive à réaliser une fusion des décisions.
Différentes règles de fusion peuvent être utilisées pour combiner les décisions locales
de chaque détecteur. Les règles de fusion les plus simples consistent en l’application
d’opérateurs logiques ET (fusion ET) ou OU (fusion OU) aux décisions des détecteurs
locaux. Il y a aussi des règles plus complexes comme la fusion VOTE où la décision finale
est basée sur la décision des k des n détecteurs individuels. Des règles de fusion optimale
(fusion OPTIMALE), ont également été proposées, souvent basées sur la moyenne pondérée
des décisions individuelles en offrant un poids plus important aux détecteurs les plus
performants [Chair and Varshney, 1986]. Dans la méthode de fusion proposée par CHAIR
et VARSHNEY [Chair and Varshney, 1986], les coefficients de pondération peuvent être
optimisés à partir de courbes COR [Hernández et al., 1999].
Fusion des détections obtenues pour RR, Ramp et QRSd
Premièrement, la fusion décentralisée OU, ET, VOTE et OPTIMALE est réalisée pour
les trois variables : RR, RAMP et QRSd. Les résultats sont montrés tableau 5.24 et la
figure 5.21 montre les courbes COR. On peut constater une amélioration des performances
de détection en utilisant la fusion OPTIMALE, cependant, celle-ci reste en dessous des
meilleurs résultats reportés dans la section précédente.
Fusion des trois détecteurs par MSMC
Les règles de fusion OU, ET, VOTE et OPTIMALE vont maintenant être appliquées à
trois détecteurs de la section précédente : RRQNU, RRQNU et RR&QRSdQU. Les résultats
154 Chapitre 5
Tableau 5.24 – Performance de détection lors de la fusion des variables RR, Ramp et QRSd.
Règle Sensibilité (%) Spécificité (%) TRD (s)
RR 74,19 92,80 4, 63 ± 4, 20
RAMP 63,62 76,35 0, 59 ± 5, 56
QRSd 63,58 70,25 0, 32 ± 5, 51
ET 25,26 99,19 4, 16 ± 4, 29
OU 93,34 52,10 −0, 39 ± 5, 69
VOTE 67,98 87,85 0, 90 ± 5, 50
OPTIMALE 82,79 84,27 1, 13 ± 5, 42
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
OPTIM
RR
RAMP
QRSd
FPR
TPR
Figure 5.21 – Courbe COR.
de la fusion, ainsi que les MSMC présentant les meilleurs résultats sont montrés tableau
5.25. La figure 5.22 montre les courbes COR de ces détecteurs. On peut constater une légère
amélioration des performances de détection en utilisant la fusion OPTIMALE. Même si
l’amélioration apportée par la fusion décentralisée reste faible, ce résultat est intéressant
car il nous indique qu’il existe une information complémentaire entre les décisions locales
prises par l’analyse des séries RR (avec et sans l’introduction des versions retardées) et de
la durée du QRS, le tout basé sur une quantification non-uniforme. Le fait que la version
centralisée de cette fusion fournisse des performances plus faibles milite en faveur d’une
nouvelle structure des MSMC dans le cas multivarié, basée sur des modèles couplés (c.f.
Conclusion Générale et Perspectives).
5.3. Conclusion 155
Tableau 5.25 – Performance de détection lors de la fusion décentralisée des variables RRQNU,
RRQNU et RR&QRSdQU.
Méthode /
Règle de fusion Sensibilité (%) Spécificité (%) TRD (s)
RRQNU 89,88 94,67 1, 93 ± 3, 34
RRQNU 90,80 92,26 1, 12 ± 3, 62
RR&QRSdQU 85,87 87,85 1, 06 ± 3, 87
ET 78,67 96,71 2, 17 ± 3, 40
OU 94,43 86,14 0, 6 ± 3, 88
VOTE 90,52 92,23 1, 49 ± 3, 52
OPTIMALE 93,01 91,29 1, 13 ± 3, 58
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
TFP
TVP
Fusion décentralisée
(a)
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
−2
−1
0
1
2
3
4
5
6
7
8
TFP
TRD(s)
Fusion décentralisée
(b)
Figure 5.22 – Performance de détection lors de la fusion des variables RRQNU, RRQNU et
RR&QRSdQU. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP.
5.3 Conclusion
Dans ce chapitre, la caractérisation des séries temporelles multidimensionnelles et le
difficile problème de l’exploitation de la dynamique des séries temporelles biomédicales, pour
la détection précoce d’événements pathologiques, ont été adressés en utilisant l’approche
basée sur des modèles semi-Markovien cachés, exposée au chapitre 4. Deux démarches,
la classification et la détection en ligne, ont été évaluées en utilisant ces modèles sur des
signaux synthétiques (générés avec le modèle de FitzHugh-Nagumo) et réels (séries RR,
Ramp et QRSd, extraites de l’ECG de 32 nouveau-nés prématurés monitorés en USIN).
La combinaison de différentes méthodes de prétraitement proposées au chapitre 4, telles
que l’inclusion d’une étape de quantification des observations et la prise en compte des
versions retardées des observations pour construire des séries multivariées à partir des séries
156 Chapitre 5
univariées, ont été appliquées aux séries temporelles.
Les différentes expériences conduites sur les signaux synthétiques ont permis d’évaluer
la faisabilité de notre approche et d’optimiser la structure des modèles. Nous nous sommes
placés dans le contexte où l’information sur l’amplitude seule est insuffisante et rend
impossible l’utilisation des seuils pour réaliser la classification et la détection. La seule
source d’information dans ce cas se trouve dans la dynamique des variables. Dans ce
contexte, les modèles semi-Markovien cachés ont révélés être mieux adaptés que les modèles
Markoviens cachés et ont donc été retenus dans le reste du chapitre. Les résultats obtenus
dans les expériences de classification et de détection en ligne ont montré des améliorations
lorsque les étapes de quantification des séries et d’intégration du retard dans les observations
sont appliquées aux MSMC.
Concernant les signaux réels, l’annotation d’événements d’apnée-bradycardie (réalisée
par un spécialiste) a été finement ajustée par une procédure d’approximation de courbes,
où une fonction sigmoïde est utilisée pour approcher la série RR aux alentours de l’instant
de début de la bradycardie. Nous avons conscience que des nombreux tests ont été effectués,
ce qui ne facilite pas la lecture des performances. Le tableau 5.25 représente la synthèse
des meilleurs modèles proposés. Les performances de classification et de détection en ligne
d’épisodes d’apnée-bradycardie, par modèles semi-Markoviens cachés, ont montré être plus
élevées que les méthodes classiques, tout en minimisant les délais de détection (SEN=89,98 %,
SPC=94,67 % et TRD=1,93±3,34 s en modélisant, par MSMC, la dynamique de la série
RR quantifiée non uniformément vs SEN=73,35 %, SPC=87,96 % et TRD=4,16±8,79 s
en utilisant un seuil relatif dans l’analyse instantanée de la série RR). L’utilité de la
phase de quantification et de l’intégration des versions retardées des observations dans les
modèles semi-Markoviens cachés a également été évaluée et a montré une amélioration
des performances (en modélisant la dynamique de la série RR, on passe de SEN=74,20 %,
SPC=92,77 % et TRD=6,37±7,83 s à SEN=90,38 %, SPC=92,33 % et TRD=0,92±3,56 s
en intégrant sa version retardée et à SEN=89,98 %, SPC=94,67 % et TRD=1,93±3,34 s
avec une quantification non uniformément). Finalement, la fusion décentralisée de trois
détecteurs, basés sur des modèles semi-Markovien cachés, a permis une amélioration de
la performance de détection d’épisodes d’apnée-bradycardie par rapport aux détecteurs
individuels (on obtient des valeurs SEN=93,01 %, SPC=91,29 % et TRD=1,13±3,58 s
par fusion optimale de détecteurs donnant des valeurs SEN={89,88, 90,80, 85,87} %,
SPC={94,67, 92,26, 87,85} % et TRD={1,93±3,34, 1,12±3,62, 1,06±3,87} s). Ces résultats
sont importants puisque la minimisation du temps d’intervention des infirmières est une
priorité dans le domaine clinique qui nous concerne et la détection fiable et précoce des
événements d’apnée-bradycardie est le premier élément à optimiser pour réduire ces temps
d’intervention.
Bibliographie 157
Bibliographie
Chair, Z. and Varshney, P. (1986). Optimal data fusion in multiple sensor detection systems.
Aerospace and Electronic Systems, IEEE Transactions on, AES-22(1) :98–101.
Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm
fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in
Cardiology, volume 33, pages 473–476.
Fitzhugh, R. (1961). Impulses and physiological states in theoretical models of nerve
membrane. Biophysical Journal, 1(6) :445–466.
Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M.
(1999). Multisensor fusion for atrial and ventricular activity detection in coronary care
monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90.
Jameson, A., Schmidt, W., Turkel, E., et al. (1981). Numerical solutions of the euler
equations by finite volume methods using runge-kutta time-stepping schemes. AIAA
paper, 81 :1259.
Conclusions et perspectives
La détection précoce de l’apnée-bradycardie chez les prématurés est un sujet de recherche
majeure dans notre laboratoire depuis 10 ans. De nombreux travaux ont été développés au
cours de ces derniers années dans le but de caractériser ces épisodes [Beuchée, 2005; Cruz
et al., 2006; Beuchée et al., 2007; Cruz, 2007; Pladys et al., 2008b,a; Beuchée et al., 2009;
Altuve et al., 2009, 2011].
Les épisodes d’apnée-bradycardie chez les nouveaux-nés prématurés mettent en danger
sa vie et son avenir. Ces épisodes sont en partie la conséquence du développement partiel des
organes et des mécanismes de régulation cardio-respiratoires chez le nouveau-né prématuré
et justifient le monitoring continu en USIN avec des finalités diagnostiques et thérapeutiques.
Actuellement, dans les unités des soins intensifs néonatals, la détection des épisodes
d’apnée-bradycardie est réalisée en exploitant une seule variable extraite de l’électro-
cardiogramme : la durée du cycle cardiaque. Cependant, d’autres variables extraites de
l’électrocardiogramme peuvent être prises en compte dans une démarche de détection
multi-variable. Cette démarche est compatible avec les exigences imposées dans ces unités
des soins, où on limite au minimum nécessaire les instruments de mesure afin de favoriser le
développement de l’enfant et de le préserver dans un milieu aussi tranquille que possible
(approche de la NIDCAP [Als and Gibes, 1986]). L’objet de ce mémoire était donc de
proposer des solutions pour répondre à ces exigences.
Nous nous sommes en tout premier lieu intéressés à la segmentation de l’électrocar-
diogramme du nouveau-né prématuré. Ceci consiste à délimiter les ondes qui composent
chaque battement cardiaque. Plusieurs étapes sont nécessaires pour accomplir cette tâche :
l’élimination des interférences du signal électrocardiographique, la détection, le moyen-
nage et l’alignement des battements et, enfin, la segmentation des ondes proprement dite.
Dans le passé, ces méthodes ont été développées pour l’électrocardiogramme d’adultes.
Cependant, des différences remarquables entre l’électrocardiogramme de l’adulte et du
prématuré existent. Par exemple, la fréquence cardiaque de base du prématuré est trois
fois plus élevée, les ondes et intervalles sont plus courts et le complexe QRS est plus fin,
donnant ainsi des contenus spectraux de plus hautes fréquences. Par conséquent, notre
première contribution a été d’adapter les algorithmes de détection et de segmentation des
159
160 Conclusion
battements aux spécificités de l’ECG du nouveau-né prématuré. Une procédure basée sur les
algorithmes évolutionnaires a été proposée pour ajuster 8 paramètres du détecteur et 12 de
l’algorithme de segmentation. En outre, l’approche proposée intègre une adaptation continue
des fenêtres d’exploration temporelle de l’algorithme de segmentation, en fonction de la
fréquence cardiaque instantanée. Les performances mesurées après optimisation montrent
une amélioration significative de la sensibilité et de la valeur prédictive positive à la détection
des ondes et une réduction du jitter de la détection, pour les début et fin des ondes.
Une fois ces méthodes adaptées, les séries temporelles du cycle cardiaque (RR), l’ampli-
tude de l’onde R (Ramp) et de durée du QRS (QRSd) ont été constituées avant, pendant
et après les épisodes d’apnée-bradycardie de 32 nouveaux-nés prématurés. Les résultats
ont montré des différences significatives entre les intervalles précédant la bradycardie et au
cours de la bradycardie et nous ont motivés à exploiter la dynamique de ces séries dans un
processus de décision, afin de détecter le plus précocement possible la bradycardie.
Une approche par modèles Markoviens cachés a alors été introduite. Les modèles de
Markov cachés (MMC) et les modèles de semi-Markov cachés (MSMC) constituent des
outils puissants pour modéliser des observations multi-variées et continues. Les MMC sont
les plus populaires, cependant, la distribution géométrique des temps passés dans les états
est une contrainte et les tests sur données simulées ont montré leurs limites. Les MSMC sont
une généralisation des MMC où le temps passé dans un état peut suivre une loi Gaussienne
(parmi d’autres). Les MSMC, plus puissants que les MMC pour la modélisation des signaux
physiques, ont montré être plus aptes à modéliser les dynamiques, même si les méthodes
d’estimation de paramètres sont plus complexes et qu’ils sont limités à une représentation
stationnaire par morceaux des observations à modéliser. Cependant, ces modèles n’ont
pas besoin de connaissance a priori sur les données pour l’estimation des paramètres et le
nombre d’états reste le seul hyper-paramètre à ajuster.
Après une comparaison entre modèles semi-Markovien cachés et modèles Markovien
cachés, les tests effectués sur signaux simulés ont montré l’intérêt des approches semi-
Markoviennes en classification et en détection de trajectoires, en faisant abstraction de
l’amplitude des séries.
Les caractéristiques majeures des modèles que nous avons développée peuvent être
résumées de la manière suivante :
– l’utilisation de lois de distributions gaussiennes pour la prise en compte de l’évolution
temporelle des indicateurs extraits de l’électrocardiogramme.
– la proposition d’une modélisation multi-variée, avec des modèles qui explorent des
dynamiques différentes. Ceci implique d’adapter le nombre d’états pour chaque modèle.
– l’introduction d’une étape de quantification pour accentuer les dynamiques des séries
en faisant abstraction de l’amplitude.
– l’extension de l’observabilité par la prise en compte des versions retardées des séries
Conclusions et perspectives 161
étudiées.
– l’analyse multi-variée à base MSMC adaptée à la détection en temps réel.
Une comparaison avec les méthodes de détections classiques utilisées dans les unités de
soins intensifs néonataux a été également effectuée. Les valeurs de sensibilité, de spécificité
et du temps du retard à la détection, étudiées par des courbes opérationnelles du récepteur,
ont démontré que l’approche basée sur les modèles semi-Markovien est plus intéressante
que les méthodes classiques. La quantification des séries a amélioré les performances, tant
sur signaux simulés que sur signaux réels. En exploitant la dynamique des séries extraites
de l’électrocardiogramme, la détection d’épisodes d’apnée-bradycardie a été améliorée et le
temps de détection a été réduit par rapport aux détecteurs classiques, laissant espérer des
temps d’intervention des personnels soignants plus brefs.
Les perspectives de ce travail sont multiples et dirigées vers l’étude d’autres carac-
téristiques provenant de l’ECG du nouveau-né prématuré, telles que l’intervalle PR, la
morphologie de l’onde P et l’intervalle QT. Un travail antérieur développé dans notre labo-
ratoire a montré une amélioration de la détection de l’onde P de l’ECG adulte [Hernández
et al., 2000]. La méthodologie d’optimisation proposée dans ce document pourrait être
appliquée afin d’adapter l’algorithme de détection des ondes P à l’ECG des nouveaux-nés
prématurés. Nous pourrions alors focaliser notre étude sur la segmentation précise des
ondes P en analysant l’activité auriculaire du nouveau-né prématuré en présence ou non
d’apnée-bradycardie.
Afin d’améliorer la segmentation de l’électrocardiogramme, réalisée ici en exploitant
une seule voie, une approche de détection multi-voies pourrait être considérée. Deux
approches sont à retenir : i) la centralisée qui produit une segmentation unique en exploitant
l’information contenue dans chacune des voies et ii) la décentralisée dont la segmentation
correspond à la meilleure segmentation (ou à la moyenne, la médiane) réalisée sur chaque
voie.
La détection multi-variée analysée dans ce mémoire peut être vue comme une approche
par fusion centralisée, où les dynamiques sont exploitées de manière conjointe pour produire
une détection unique. Une fusion décentralisée a été également mise en œuvre et évaluée.
Même si théoriquement cette dernière approche doit produire des performances compa-
rables ou inférieures à l’approche centralisée, elle a produit une légère augmentation des
performances, tout en minimisant le retard à la détection. Ces résultats impliquent que
l’approche centralisée par MSMC, telle que présentée dans ce travail de thèse, doit être
encore améliorée. Nous pensons, en particulier, à la proposition d’architectures de MSMC
couplés, plus complexes à mettre en œuvre, mais qui permettront de mieux reproduire
les dynamiques de chaque variable indépendamment, tout en gardant une représentation
multivariée par couplage entre les états de chaque modèle [Pieczynski, 2003; Derrode and
Pieczynski, 2004].
162 Conclusion
Dans ce mémoire, nous n’avons pas prêté d’attention à l’origine de l’apnée. Succinctement,
les épisodes peuvent être classés en obstructifs, centraux et mixtes. En exploitant la théorie
semi-Markovienne préconisée ici, trois modèles, pour explorer la dynamique de chaque
classe d’apnée-bradycardie, pourraient être exploités pour identifier l’origine de l’apnée et
ainsi délivrer une thérapie optimale. D’autres variables pourraient être aussi analysées par
l’approche semi-markovienne. Par exemple, en analysant le temps passé entre les épisodes
d’apnée-bradycardie on peut supposer que, lorsque un certain temps sans détection s’est
écoulé, l’apparition d’un épisode devient plus probable. Cette approche pourrait permettre
aussi de modéliser le temps entre épisodes à partir des types d’apnée-bradycardie possibles
(centrale, obstructive ou mixte).
Enfin, nous n’avons pas pris en compte dans ce travail les autres modalités monitorées
telles que le flux respiratoire, les mouvements abdominaux, l’électromyogramme ou élec-
troencéphalogramme, car nous souhaitions développer un système de détection qui exploite
uniquement le signal électrocardiographique afin de réduire les appareils de mesures. Ces
mesures pourraient très bien être exploitées dans une approche multi-variable de détection
par modèles semi-Markovien. Enfin, l’approche par modèles de Markov cachés s’est enrichi
aussi d’extensions apparues récemment dans la littérature et qui pourraient être envisagées
dans un cadre de détection/classification des apnée-bradycardies. On peut citer :
– L’utilisation des modèles de Markov couplés [Pieczynski, 2003; Derrode and Pieczynski,
2004]. Dans cette approche, les modèles de Markov cachés sont utilisés pour chaque
variable et les états cachés au temps t pour chaque MMC sont conditionnés par les
états au temps t−1 de tous les MMC connexes. Dans les modèles de modèles de Markov
couplés, la markovianité du couple (processus caché, processus observé)=(X, Y ) est
considérée directement.
– L’usage des modèles de Markov triplet [Pieczynski and Desbouvries, 2005; Pieczynski,
2007]. Ces modèles permettent de traiter des observations non stationnaires, de
généraliser les modèles semi-markoviens cachés, d’effectuer la fusion de Dempster-
Shafer dans un cadre markovien et de mettre en place un filtrage optimal en présence
de sauts. Dans les modèles de Markov triplets, on introduit un processus U auxiliaire
qui sert d’outil de calcul du processus triplet markovien (processus caché, processus
auxiliaire, processus observé)=(X, U, Y ).
– L’emploi des arbres de Markov cachés [Crouse et al., 1998; He et al., 2008; Du-
rand et al., 2004]. Ces modèles permettent d’intégrer l’information multi-résolutions
temps/fréquence d’une décomposition en ondelettes. Ces modèles ont été conçus pour
la modélisation de la loi des coefficients d’une transformée en ondelettes, lorsque
ceux-ci sont non-gaussiens et non-indépendants.
– L’utilisation des modèles hybrides MMC/réseaux de neurones artificiels (RNA) [Tren-
tin and Gori, 2001; Hagen and Morris, 2005; Tóth and Kocsor, 2007; Garcia-Moral
et al., 2011]. L’estimation des probabilités d’émission des états des MMC, habituelle-
ment effectuée en utilisant des modèles de mélange gaussien, est substituée par des
Conclusions et perspectives 163
RNA. Toutefois, les exigences de calcul sont fortement augmentées en raison de la
nécessité d’entraîner la RNA.
– L’emploi des modèles de Markov cachés à effets mixtes [Altman, 2007; Delattre,
2010]. Ces modèles permettent la modélisation des multiples processus à la fois et
l’incorporation de covariables et des effets aléatoires dans les modèles. Ils sont adaptés
à l’analyse de données longitudinales recueillies lors d’essais cliniques.
– L’usage des chaînes de Markov évidentielles [Fouque et al., 2000; Lanchantin and
Pieczynski, 2005]. Ces modèles exploitent la théorie de l’évidence de Dempster-Shafer
pour l’analyse de données temporelles.
Comme on peut le voir, les perspectives tracées, sont autant de challenges à mener et
s’inscrivent finalement dans un cadre théorique unique où les approches semi-Markoviennes
jouent un rôle primordial étant donné leurs avantages : i) un hyper-paramètre à ajuster,
ii) aucune connaissance a priori, iii) une capacité à modéliser des observations multi-variées
et continues et iv) une représentation compacte de dynamiques.
164 Bibliographie
Bibliographie
Als, H. and Gibes, R. (1986). Newborn Individualized Developmental Care and Assessment
Program (NIDCAP). Training Guide. Dept of Psychiatry, Childrens Hospital, Boston,
Mass, 1 :1–2.
Altman, R. (2007). Mixed Hidden Markov Models. Journal of the American Statistical
Association, 102(477) :201–210.
Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009).
Analysis of the QRS complex for apnea-bradycardia characterization in preterm infants.
In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual International
Conference of the IEEE, pages 946–949. IEEE.
Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011).
Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in preterm
infants. International Journal of Biomedical Engineering and Technology, 5(2/3) :247–265.
Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona-
talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome
apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1.
Beuchée, A., Carrault, G., Bansard, J. Y., Boutaric, E., Bétrémieux, P., and Pladys, P.
(2009). Uncorrelated randomness of the heart rate is associated with sepsis in sick
premature infants. Neonatology, 96(2) :109–14.
Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique
automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré.
IRBM, 28(3-4) :124–130.
Crouse, M., Nowak, R., and Baraniuk, R. (1998). Wavelet-based statistical signal processing
using hidden Markov models. Signal Processing, IEEE Transactions on, 46(4) :886–902.
Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD
thesis, Universidad Simón Bolívar.
Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm
fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in
Cardiology, volume 33, pages 473–476.
Delattre, M. (2010). Inference in Mixed Hidden Markov Models and Applications to Medical
Studies. Journal de la Société Française de Statistique, 151(1) :90–105.
Derrode, S. and Pieczynski, W. (2004). Signal and image segmentation using pairwise
Markov chains. Signal Processing, IEEE Transactions on, 52(9) :2477–2489.
Durand, J., Goncalves, P., and Guédon, Y. (2004). Computational methods for hidden
Markov tree models-An application to wavelet trees. Signal Processing, IEEE Transactions
on, 52(9) :2551–2560.
Fouque, L., Appriou, A., and Pieczynski, W. (2000). An evidential Markovian model for
data fusion and unsupervised image classification. In Information Fusion, 2000. FUSION
2000. Proceedings of the Third International Conference on, volume 1, pages TUB4–25.
IEEE.
Bibliographie 165
Garcia-Moral, A., Solera-Urena, R., and Peláez-Moreno, C. (2011). Data Balancing for
Efficient Training of Hybrid ANN/HMM Automatic Speech Recognition Systems. Audio,
Speech, and Language Processing, IEEE Transactions on, 19(3) :468–481.
Hagen, A. and Morris, A. (2005). Recent advances in the multi-stream HMM/ANN hybrid
approach to noise robust ASR. Computer Speech & Language, 19(1) :3–30.
He, Z., You, X., and Tang, Y. (2008). Writer identification of Chinese handwriting documents
using hidden Markov tree model. Pattern Recognition, 41(4) :1295–1307.
Hernández, A. I., Carrault, G., and Mora, F. (2000). Improvement of a P-wave detector by
a bivariate classification stage. Transactions of the Institute of Measurement and Control,
22(3) :231–242.
Lanchantin, P. and Pieczynski, W. (2005). Chaînes et arbres de Markov évidentiels avec
applications à la segmentation des processus non stationnaires. traitement du signal,
22(1) :15–26.
Pieczynski, W. (2003). Pairwise markov chains. IEEE Transactions on Pattern Analysis
and Machine Intelligence, pages 634–639.
Pieczynski, W. (2007). Multisensor triplet Markov chains and theory of evidence. Interna-
tional Journal of Approximate Reasoning, 45(1) :1–16.
Pieczynski, W. and Desbouvries, F. (2005). On triplet Markov chains. In International
Symposium on Applied Stochastic Models and Data Analysis,(ASMDA 2005), Brest,
France. Citeseer.
Pladys, P., Arsenault, J., Reix, P., Rouillard Lafond, J., Moreau-Bussière, F., and Praud,
J. (2008a). Influence of prematurity on postnatal maturation of heart rate and arterial
pressure responses to hypoxia in lambs. Neonatology, 93(3) :197.
Pladys, P., Beuchée, A., Hernández, A., and Carrault, G. (2008b). Variabilité du rythme
cardiaque de l’enfant : principes et applications. Archives de Pédiatrie, 15(5) :611–613.
Tóth, L. and Kocsor, A. (2007). A segment-based interpretation of HMM/ANN hybrids.
Computer Speech & Language, 21(3) :562–578.
Trentin, E. and Gori, M. (2001). A survey of hybrid ANN/HMM models for automatic
speech recognition. Neurocomputing, 37(1-4) :91–126.
Annexe A
Liste des travaux liés à ce travail
1. Altuve, M., Carrault, G., Beuchée, A., Pladys, P., and Hernández. On-line apnea-
bradycardia detection using hidden semi-Markov models. In Engineering in Medicine
and Biology Society, 2011. EMBC 2011. Annual International Conference of the IEEE.
Travail soumis, dans l’attente d’une réponse.
2. Altuve, M ; Hernández, A, Carrault, G. Une approche multivariée pour la détection
d’épisodes d’apnée-bradycardie par modèles semi-Markoviens cachés. Colloque XXIIIe
Gretsi, Bordeaux, 5-8 septembre 2011. Accepté pour présentation orale.
3. Hernández, A.I ; Dumont, J. ; Altuve, M ; Beuchée, A ; Carrault, G. Evolutionary
optimization of ECG feature extraction methods : Applications to the monitoring
of adult myocardial ischemia and neonatal apnea bradycardia events, pages 1-36,
chapitre de livre dans : ECG Signal Processing, Classification and Interpretation : A
Comprehensive Framework of Computational Intelligence. Adam Gacek and Witold
Pedrycz (Editors). Springer-Verlag. Accepté pour publication.
4. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011).
Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in
preterm infants. International Journal of Biomedical Engineering and Technology,
5(2/3) :247–265.
5. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009).
Analysis of the QRS complex for apnea-bradycardia characterization in preterm
infants. In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual
International Conference of the IEEE, pages 946–949. IEEE.
167
Annexe B
La transformée en ondelettes pour la
segmentation des battements
Les filtres passe-haut (G(z)) et passe-bas (H(z)) de la figure 3.3 sont dérivés à partir
d’une ondelette mère ψ(t) de type spline quadratique, dont la transformée de Fourier est :
Ψ(Ω) = jΩ
sin Ω
4
Ω
4
4
(B.1)
Les réponses fréquentielles des filtres G(z) et H(z) sont données par l’équation B.2
tandis que ses réponses impulsionnelles sont données par l’équation B.3.
G(ejω
) = 4jejω/2
sin
ω
2
H(ejω
) = ejω/2
cos
ω
2
3 (B.2)
g[n] =
1
8
{δ[n + 2] + 3δ[n + 1] + 3δ[n] + δ[n − 1]}
h[n] = 2{δ[n + 1] − δ[n]}
(B.3)
La réponse en fréquence du filtre équivalent Qk(ejω) pour l’échelle de décomposition k est
donnée par B.4. Les réponses en fréquence d’amplitude des cinq premières échelles du filtre
équivalent Qk(ejω) sont représentées dans la figure B.1 pour une fréquence d’échantillonnage
de 250 Hz. Il est à noter que les fonctions de transfert montrent une caractéristique passe-bas
dérivée. La bande passante à 3 dB pour chaque échelle est montrée dans le tableau B.1 [Li
et al., 1995]
169
170 Annexe B
Tableau B.1 – Bande passante à 3 dB pour chaque échelle du filtre équivalente Qk(ejω)
Échelle Bande passante (Hz)
k = 21 62.5 ∼ 125.0
k = 22 18 ∼ 58.5
k = 23 8 ∼ 27
k = 24 4 ∼ 13.5
k = 25 2 ∼ 6.5
Qk(ejω
) =
G(ejω) k = 1
G(ej2k−1ω) k−2
l=0 H(ej2lω) k ≥ 2
(B.4)
0 20 40 60 80 100 120
0
0.5
1
1.5
2
2.5
3
3.5
4
Fréquence (Hz)
|Q |
k = 2
k = 3
k = 4
k = 5
k = 1
k
Figure B.1 – Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour les
échelles 1 à 5 pour une fréquence d’échantillonnage de 250 Hz.
De plus, pour obtenir les filtres à d’autres fréquences d’échantillonnage, les réponses
impulsionnelles du filtre équivalent à 250 Hz sont ré-échantillonnées [Martínez et al., 2004].
Les réponses en fréquence des filtres à 500 Hz et 1 kHz sont montrées figure B.2. Il peut
être observé que les réponses en fréquence du banc de filtres adaptés constituent une bonne
approximation des filtres d’origine.
Bibliographie 171
0 50 100 150 200 250
0
0.5
1
1.5
2
2.5
3
3.5
4
|Q |k
Fréquence (Hz)
(a)
0 50 100 150 200 250 300 350 400 450 500
0
0.5
1
1.5
2
2.5
3
3.5
4
Fréquence (Hz)
|Q |k
(b)
Figure B.2 – Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour une
fréquence d’échantillonnage de (a) 500 Hz et (b) 1000 Hz.
Bibliographie
Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet
transforms. IEEE Trans Biomed Eng, 42(1) :21–8.
Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet-
based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng,
51(4) :570–81.
Annexe C
Les algorithmes évolutionnaires
Les AE sont des méthodes de recherche stochastique qui s’inspirent des principes de
la sélection naturelle Darwiniens du XIXe
siècle et imitant la métaphore de l’évolution
biologique naturelle.
Le principe derrière les AE est le suivant [Eiben and Smith, 2003] : étant donnée une
population d’individus dans un certain environnement qui a des ressources limitées, les
rivalités entraînent une sélection naturelle (survie du plus fort) et donc, une augmentation
de l’aptitude de la population. Un ensemble de candidats (des individus de la population)
est choisi aléatoirement. Ensuite, une fonction de coût à maximiser est appliquée aux
candidats comme une mesure d’aptitude et, sur les bases de ces valeurs, certains meilleurs
candidats sont choisis pour semer la prochaine génération. Ceci est fait par l’application de
la recombinaison et/ou de la mutation. D’un coté, la recombinaison est un opérateur qui est
appliqué à deux ou plusieurs candidats sélectionnés (les soi-disant parents) produisant un
ou plusieurs nouveaux candidats (les enfants), et de l’autre, la mutation est appliquée à un
candidat et résulte en la création d’un nouveau. En résumé, l’exécution des opérations de
recombinaison et de mutation des parents conduit à la création d’un ensemble de nouveaux
candidats (la descendance) qui rivalisent ensuite avec les anciens, en fonction de leurs
aptitudes et probablement en fonction de l’âge, pour une place dans la prochaine génération.
Ce processus est réitéré jusqu’à ce qu’un candidat avec une qualité suffisante (une solution)
soit trouvé ou qu’une limite de calcul précédemment fixée soit atteinte.
La base des AE repose fondamentalement sur deux qualités : d’une part, les opérateurs
de variation (recombinaison et mutation) qui créent la diversité dans la population et
facilitant ainsi la nouveauté, et d’autre part, la sélection qui augmente la qualité moyenne
des solutions dans la population. Un diagramme général d’un algorithme évolutionnaire,
d’après EIBEN et SMITH [Eiben and Smith, 2003], est montré figure C.1.
Les éléments les plus importants d’un AE sont donc :
173
174 Annexe C
Initialisation
Terminaison
Sélection des parents
Sélection des survivants
Recombinaison
Mutation
Population
Parents
Enfants
Figure C.1 – Principe de fonctionnement d’un algorithme évolutionnaire.
– la représentation (codage des individus)
– la fonction d’évaluation (fonction de coût)
– la population
– le mécanisme de sélection des parents
– les opérateurs de variation, recombinaison et mutation
– le mécanisme de sélection des survivants
Pour une application d’optimisation donnée, il est nécessaire de spécifier chacun de ces
éléments et de définir une procédure d’initialisation et une condition de terminaison.
C.1 Représentation (définition des individus)
La représentation correspond au lien entre le contexte du problème original dans le
« monde réel » et l’espace de solutions du problème dans le « monde AE ». Les objets qui
forment une solution possible dans le contexte du problème original sont appelés phénotypes,
alors que leur codage, c’est-à-dire, les individus au sein de l’AE, sont appelés génotypes.
Un individu est un élément de l’espace de recherche. Plusieurs types de codages ont été
proposés dans la littérature, comme le binaire, très utilisés à l’origine, et celui à valeurs
réelles, utilisé plus fréquemment de nos jours. Ce dernier est notamment appliqué lorsque
les valeurs à coder viennent d’une distribution à valeurs continues, comme dans le cas
d’optimisation de la méthode de segmentation d’ECG présentée dans cette thèse.
C.2 Fonction d’évaluation (fonction de coût)
Le rôle de la fonction d’évaluation est de mesurer le degré d’adaptation de la population
à son environnement. Il s’agit d’une fonction ou d’une procédure qui assignent une mesure
de qualité aux génotypes. C’est d’ailleurs cette fonction que l’AE cherche à maximiser.
C.3. Population 175
C.3 Population
L’objectif de la population est de garder des solutions possibles. Une population est
constituée par un ensemble fini de génotypes, où de multiples copies d’un individu sont
possibles. Cependant, il faut souligner que les individus ne changent pas ; c’est la population
qui le fait.
C.4 Mécanisme de sélection des parents
Le résultat fourni par la fonction de coût va permettre de sélectionner les individus
ayant la meilleure performance. Ainsi, les individus choisis vont devenir parents de la
prochaine génération. Une génération est la population à un instant donné. Plusieurs
critères de sélection ont été rapportés dans la littérature dont les plus courants sont le
tirage à la roulette [Holland, 1975] et la sélection par rang [Baker, 1987]. Dans la première,
la probabilité de sélectionner un individu dépend de sa performance, alors que dans la
deuxième, la probabilité de sélection dépend du rang (classement) de l’individu dans la
population, triée en fonction des performances des individus, et non directement de sa
performance.
C.5 Opérateurs de variation
Les opérateurs de variation créent de nouveaux individus à partir des anciens. Ils sont
divisés en deux : l’opérateur unaire (mutation) et l’opérateur binaire (recombinaison).
C.5.1 Mutation
La mutation modifie les gènes d’un génotype afin de produire un enfant (mutant modifié).
Ces gènes sont mutés avec une probabilité pm. La mutation évite la convergence prématurée
de l’algorithme. Parmi les types de mutation pour un codage à valeurs réelles on distingue
deux types de mutation :
– Uniforme : qui remplace la valeur du gène choisi xi par une valeur aléatoire xi tiré
d’une distribution uniforme sur l’intervalle possible de ce gène [Li,Ui] où Li et Ui sont
les limites inférieure et supérieure respectivement ;
– Non-uniforme : qui ajoute au gène choisi xi, une valeur aléatoire tirée d’une
distribution non uniforme, comme une distribution Gaussienne avec moyenne nulle
et écart type spécifiés par l’utilisateur. La probabilité de mutation non-uniforme se
rapproche de 0 au fur et à mesure que le nombre de générations augmente.
176 Annexe C
C.5.2 Recombinaison
La recombinaison combine les gènes de deux (ou plusieurs) parents pour en obtenir un
(ou plusieurs) enfants. Ainsi, les enfants héritent de certaines caractéristiques de leurs parents.
La recombinaison est appliquée avec une probabilité pc. Trois types de recombinaisons
existent pour un codage à valeurs réelles :
– Arithmétique : les enfants (E1 et E2) sont créés à partir des combinaisons linéaires
des parents (x et y) :
E1 = αx + (1 − α)y
E2 = (1 − α)x + αy
(C.1)
où α est choisi uniformément dans l’intervalle [0,1].
– Simple : l’enfant 1 (E1) correspond aux premiers k gènes du parent 1 (x) et le reste
est la moyenne arithmétique des deux parents :
E1 = x1, . . . , xk, αyk+1 + (1 − α)xk+1, . . . , αyn + (1 − α)xn (C.2)
où α est choisi uniformément dans l’intervalle [0,1], n est la taille du génotype et k
est le point de recombinaison choisi et suit une loi uniforme sur l’intervalle [1,n − 1].
Pour l’enfant 2, les parents sont renversés :
E2 = y1, . . . , yk, αxk+1 + (1 − α)yk+1, . . . , αxn + (1 − α)yn . (C.3)
– Heuristique : on utilise les valeurs de performance des deux parents pour créer les
enfants :
E1 = BP + α(BP − WP)
E2 = BP
(C.4)
où α suit une distribution uniformément dans l’intervalle [0,1] et où BP est le parent
qui a une performance plus grande que le parent WP.
C.6 Mécanisme de sélection des survivants
La sélection des survivants permet de former une nouvelle population à partir des
individus (parents et enfants) de la génération courante. Elle est similaire à la sélection des
parents mais est utilisée dans une autre étape du cycle évolutionnaire, c’est-à-dire, après la
création des enfants. Ainsi, le rôle de la sélection des survivants est de réduire le nombre
d’individus de µ parents et de λ enfants à λ individus pour la prochaine génération. À la
différence de la sélection des parents, qui est stochastique, la sélection des survivants est
C.6. Mécanisme de sélection des survivants 177
déterministe. Deux méthodes sont souvent utilisées : l’une basée sur la performance qui
consiste à garder les individus plus performants et l’autre basée sur l’âge des individus.
178 Bibliographie
Bibliographie
Baker, J. (1987). Reducing bias and inefficiency in the selection algorithm. In Proceedings
of the Second International Conference on Genetic Algorithms on Genetic algorithms and
their application, pages 14–21. L. Erlbaum Associates Inc.
Eiben, A. and Smith, J. (2003). Introduction to evolutionary computing. Springer Verlag.
Holland, J. (1975). Adaptation in natural and artificial system : an introduction with
application to biology, control and artificial intelligence. Ann Arbor, University of
Michigan Press.
Annexe D
L’algorithme de Viterbi
L’algorithme de Viterbi fait sa première apparition dans la littérature de codage dans
un document écrit par AJ VITERBI en 1967 [Viterbi, 1967]. Cet algorithme choisit les
états qui sont individuellement le plus probables afin de trouver la séquence d’états la plus
probable associée à la séquence observée. L’algorithme comprend une étape de récursion
qui parcourt le signal et qui enregistre les états qui maximisent L(O1:T |λ) et une étape de
rétropropagation qui parcourt le signal en sens inverse, en partant de l’état pour laquelle la
vraisemblance à T est maximum et en tenant compte des états précédents enregistrés dans
l’étape de récursion.
Pour trouver la meilleure séquence d’état, S1:T = S1, . . . , ST , pour la séquence d’obser-
vation donnée, O1:T O1, . . . , OT , nous devons définir la quantité
δt(i) max
s1:t−1
P(s1, s2, . . . , st = i, o1:t|λ) (D.1)
qui représente le maximum de vraisemblance d’une trajectoire unique jusqu’au temps t, qui
prend en compte les premières t observations et s’arrête à l’état i. Par induction nous avons
δt+1(j) = max
i∈S
δt(i)aij bj(ot+1). (D.2)
Pour retrouver la séquence d’états, nous avons besoin de garder une trace de l’argument
qui maximise D.2, pour chaque t et j. Nous le faisons par l’intermédiaire du tableau Ψt(j).
La procédure complète pour trouver la meilleure séquence d’états peut maintenant être
déclarée comme suit :
179
180 Annexe D
– Initialisation :
δ1(i) = π(i)bi(o1), i ∈ S
Ψ1(i) = 0.
(D.3)
– Récursion :
δt(j) = max
i∈S
δt−1(i)aij bj(ot), 2 ≤ t ≤ T, j ∈ S
Ψt(j) = arg max
i∈S
δt−1(i)aij , 2 ≤ t ≤ T, j ∈ S
(D.4)
– Terminaison :
P∗
= max
i∈S
δT (i)
i∗
T = arg max
i∈S
δT (i) .
(D.5)
– Rétropropagation (chemin obtenu) :
i∗
t = Ψt+1(i∗
t+1), t = T − 1, T − 2, . . . , , 1. (D.6)
D.1 L’algorithme de Viterbi étendu aux MSMC
Définissons la quantité :
δt(i, d) max
s1:t−d
P(s1:t−d, St−d+1:t = i, o1:t|λ) (D.7)
qui représente le maximum de vraisemblance d’une trajectoire unique jusqu’au temps t, qui
prend en compte les premières t observations et s’arrête à l’état i de durée d. Par induction
nous avons :
δt+d(j, d) = max
i∈S{j},d ∈D
δt(i, d )aij pj(d)bj(ot+1:t+d). (D.8)
Nous utilisons le tableau Ψt(j, d) pour enregistrer la séquence d’états et ses durées qui
maximisent D.8. La procédure complète est la suivante :
– Initialisation :
δ1(i) = π(i)bi(o1), i ∈ S
Ψ1(i) = 0.
(D.9)
D.1. L’algorithme de Viterbi étendu aux MSMC 181
– Récursion :
δt(j, d) = max
i∈S{j},d ∈D
δt−d(i, d )aij pj(d)bj(ot−d+1:t), 2 ≤ t ≤ T, j ∈ S, d ∈ D
Ψt(j, d) = arg max
i∈S{j},d ∈D
δt−d(i, d )aij , 2 ≤ t ≤ T, j ∈ S, d ∈ D.
(D.10)
– Terminaison :
P∗
= max
i∈S,d∈D
δT (i, d)
(i∗
T , d∗
T ) = arg max
i∈S,d∈D
δT (i, d) .
(D.11)
– Rétropropagation (chemin obtenu) :
(i∗
t , d∗
t ) = Ψt+1(i∗
t+1, d∗
t+1), t = T − d∗
t , . . . , 1. (D.12)
182 Bibliographie
Bibliographie
Viterbi, A. (1967). Error bounds for convolutional codes and an asymptotically optimum
decoding algorithm. Information Theory, IEEE Transactions on, 13(2) :260–269.
Annexe E
Optimisation des paramètres τ, ∆QU
et ∆QNU, sur signaux réels
On reporte dans cette Annexe, les procédures et les résultats de l’optimisation des
paramètres τ (section E.1), ∆QU (section E.2) et ∆QNU (section E.3), sur des signaux réels,
utilisés dans le chapitre 5 (section 5.2.3). Ces paramètres ont été optimisés en utilisant les
procédures décrites dans le chapitre 4 (sections 4.4.4 et 4.4.5).
E.1 Détermination de τ optimal
Dans cette section, l’optimisation de τ pour les variables RR, Ramp et QRSd, est
présentée.
E.1.1 Optimisation de τ pour RR
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de τ pour la variable RR, sont montrés tableau E.1. On peut observer que la
meilleure performance est atteinte pour une valeur de τ = 0, 67 secondes. Cette performance
est meilleure que pour le cas univarié RR.
E.1.2 Optimisation de τ pour Ramp
Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs
de τ pour la variable Ramp, sont montrés tableau E.2. Si bien la meilleure performance se
produit pour τ = 0, 5 s, cette valeur ne représente aucune amélioration par rapport au cas
183
184 Annexe E
Tableau E.1 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RR pour différentes valeurs de τ.
τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
0,34 11 9 87,96 90,25 1, 51 ± 3, 88
0,45 12 10 89,28 92,01 1, 11 ± 3, 78
0,56 14 11 89,82 92,22 0, 88 ± 3, 79
0,67 15 12 90,38 92,23 0, 92 ± 3, 56
0,78 16 15 87,65 92,86 1, 39 ± 3, 91
univarié Ramp. Ce résultat était attendu car les modifications de l’amplitude de l’onde R ne
sont pas modulées par le système nerveux autonome, comme dans le cas de l’intervalle RR.
Tableau E.2 – Nombre d’états par MSMC et performance de détection en utilisant la
variable Ramp pour différentes valeurs de τ.
τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
0,25 8 6 41,18 90,61 7, 16 ± 0, 49
0,5 12 10 52,19 92,12 4, 4 ± 0, 2
0,75 8 8 46,70 90,03 5, 6 ± 3, 5
1 8 8 41,01 89,64 4, 74 ± 6, 85
E.1.3 Optimisation de τ pour QRSd
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de τ pour la variable QRSd, sont montrés tableau E.3. La meilleure performance
est obtenue pour τ = 0, 5 s, cependant, cette valeur représente une très faible amélioration
par rapport au cas univarié QRSd.
Tableau E.3 – Nombre d’états par MSMC et performance de détection en utilisant la
variable QRSd pour différentes valeurs de τ.
τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
0,25 8 6 65,73 69,23 0, 59 ± 5, 83
0,5 10 8 65,42 72,14 0, 28 ± 5, 56
0,75 10 8 63,06 75,09 0, 74 ± 5, 68
1 10 6 63,83 71,44 0, 79 ± 5, 68
E.2. Détermination de ∆QU optimal 185
E.2 Détermination de ∆QU optimal
Dans cette section, l’optimisation de ∆QU pour les variables RR, Ramp, QRSd, RR,
RR&Ramp et RR&QRSd, est présentée.
E.2.1 Optimisation de ∆QU pour RR
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de ∆QU, sont montrés tableau E.4. On peut observer que la meilleure performance
est atteinte pour une valeur de ∆QU = 1300. Cette performance est meilleure que pour le
cas sans quantification (RR).
Tableau E.4 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQU pour différentes valeurs de ∆QU.
∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
500 9 6 88,42 91,05 1, 20 ± 4, 1
1000 8 5 88,62 91,26 1, 33 ± 4, 06
1300 7 5 86,63 97,3 2, 33 ± 3, 15
1500 7 5 85,72 90,29 2, 00 ± 4, 20
E.2.2 Optimisation de ∆QU pour Ramp
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de ∆QU, sont montrés tableau E.5. La meilleure performance se produit pour
∆QU = 40, cependant, cette valeur représente une très faible amélioration par rapport au
cas sans quantification (Ramp).
Tableau E.5 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RampQU pour différentes valeurs de ∆QU.
∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
20 6 6 65,81 76,13 0, 24 ± 5, 74
40 6 5 66,24 76,89 0, 73 ± 5, 76
50 6 5 62,25 69,44 0, 87 ± 5, 85
186 Annexe E
E.2.3 Optimisation de ∆QU pour QRSd
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de ∆QU, sont montrés tableau E.6. Comme on peut le constater, aucune valeur ne
produit d’améliorations dans la détection par rapport au cas sans quantification (QRSd).
Tableau E.6 – Nombre d’états par MSMC et performance de détection en utilisant la
variable QRSdQU pour différentes valeurs de ∆QU.
∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
10 7 6 63,23 68,76 1, 08 ± 5, 84
50 6 6 61,27 66,95 1, 16 ± 6, 08
100 6 6 60,98 67,12 1, 31 ± 6, 09
E.2.4 Optimisation de ∆QU pour RR
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de ∆QU, sont montrés tableau E.7. Comme on peut le constater, aucune valeur ne
produit d’améliorations dans la détection par rapport au cas sans quantification RR.
Tableau E.7 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQU pour différentes valeurs de ∆QU.
∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
50 10 8 89,94 91,95 0, 93 ± 3, 64
100 10 8 89,35 92,57 1, 17 ± 3, 63
500 8 8 87,39 90,82 1, 77 ± 4, 15
E.2.5 Optimisation de ∆QU pour RR&Ramp
Pour ce test, les pas de quantification optimaux calculés pour chacune des variables
intégrées (RR et Ramp) ont été utilisés : ∆RR
QU = 1300 pour quantifier les séquences d’obser-
vation RR et ∆Ramp
QU = 40 pour quantifier les séquences d’observation Ramp. Les valeurs de
M1 et M2 ont été de 10 et 10 états, respectivement. Le tableau E.8 montre la performance
de détection pour ce cas bivarié et on peut observer qu’il n’y a pas d’améliorations dans la
détection par rapport au cas sans quantification RR&RAMP.
E.3. Détermination de ∆QNU optimal 187
Tableau E.8 – Performance de détection en utilisant la variable RR&RampQU.
∆RR
QU ∆Ramp
QU SEN (%) SPC (%) TRD (s)
1300 40 64,28 85,46 1, 51 ± 4, 71
E.2.6 Optimisation de ∆QU pour RR&QRSd
Pour ce test, les pas de quantification optimaux calculés pour chacune des variables
intégrées ont été utilisés : ∆RR
QU = 1300 pour quantifier les séquences d’observation RR et
sans quantification (∆QRSd
QU = 0) pour les séquences d’observation QRSd. Les valeurs de
M1 et M2 ont été de 8 et 8 états, respectivement. La performance de détection montrée
tableau E.9 indique une amélioration de la détection par rapport au cas non quantifié,
cependant, cette valeur n’est pas trop importante par rapport aux autres variables analysées.
Tableau E.9 – Performance de détection en utilisant la variable RR&QRSdQU.
∆RR
QU ∆QRSd
QU SEN (%) SPC (%) TRD (s)
1300 0 85,87 87,85 1, 06 ± 3, 87
E.3 Détermination de ∆QNU optimal
Dans cette section, l’optimisation de ∆QNU (δQNU) pour les variables RR, Ramp, QRSd,
RR, RR&Ramp et RR&QRSd, est présentée.
E.3.1 Optimisation de δQNU pour RR
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de δQNU, sont montrés tableau E.10. La meilleure performance de détection est
atteinte pour δQNU = 0, 05 et cette valeur est meilleure que dans le cas sans quantification
de la série RR. Pour des valeurs δQNU > 0, 05 il n’était pas possible de déterminer les
paramètres de λ1 car σνk
2
i → 0.
188 Annexe E
Tableau E.10 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQNU pour différentes valeurs de δQNU.
δQNU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
0,001 9 10 86,93 91,68 1, 77 ± 4, 32
0,005 7 9 89,47 92,33 1, 68 ± 3, 73
0,01 6 8 90,63 91,66 1, 91 ± 3, 57
0,05 5 6 89,95 93,90 1, 93 ± 3, 34
E.3.2 Optimisation de δQNU pour Ramp et QRSd
La quantification non uniforme des variables Ramp et QRSd a été réalisée, cependant
les résultats ne montrent pas d’amélioration, du fait que l’histogramme de ces variables
tend à être Gaussien. Par conséquent, les résultats ne sont pas montrés.
E.3.3 Optimisation de δQNU pour RR
Le nombre d’états des MSMC et les performances de détection, pour les différentes
valeurs de δQNU, sont montrés tableau E.11. La meilleure performance de détection est
atteinte pour δQNU = 0, 002 et cette valeur est meilleure que dans le cas sans quantification
RR.
Tableau E.11 – Nombre d’états par MSMC et performance de détection en utilisant la
variable RRQNU pour différentes valeurs de δQNU.
δQNU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s)
0,001 8 7 88,81 94,88 1, 99 ± 3, 34
0,002 6 6 90,80 92,26 1, 12 ± 3, 62
0,005 6 6 89,99 93,19 1, 33 ± 3, 45
0,01 6 6 88,64 94,01 2, 07 ± 3, 46
E.3.4 Optimisation de δQNU pour Ramp et QRSd
De même que pour le cas univarié Ramp et QRSd, les quantifications non uniformes des
variables Ramp et QRSd ne montrent pas d’amélioration de la détection et en conséquence,
les résultats ne sont pas montrés.
E.3. Détermination de ∆QNU optimal 189
E.3.5 Optimisation de δQNU pour RR&Ramp
Pour ce test, les pas de quantification optimaux calculés pour chacune des variables
intégrées ont été utilisés : δRR
QU = 0, 05 pour quantifier les séquences d’observation RR et
sans quantification (δRamp
QU = 0) pour les séquences d’observation Ramp. Les valeurs de M1
et M2 ont été de 10 et 8 états, respectivement. Le tableau E.12 montre la performance
de détection pour ce cas bivarié et on peut observer qu’il n’y pas d’amélioration dans la
détection par rapport au cas sans quantification RR&Ramp.
Tableau E.12 – Performance de détection en utilisant la variable RR&RampQNU.
δRR
QU δRamp
QU SEN (%) SPC (%) TRD (s)
0,05 0 69,02 85,03 2, 81 ± 5, 11
E.3.6 Optimisation de δQNU pour RR&QRSd
Pour ce test, les pas de quantification optimaux calculés pour chacune des variables
intégrées ont été utilisés : δRR
QU = 0, 05 pour quantifier les séquences d’observation RR et
sans quantification (δQRSd
QU = 0) pour les séquences d’observation QRSd. Les valeurs de
M1 et M2 ont été de 6 et 6 états, respectivement. La performance de détection montrée
tableau E.13 indique une amélioration de la détection par rapport au cas non quantifié,
cependant, cette valeur n’est pas importante par rapport aux autres variables analysées.
Tableau E.13 – Performance de détection en utilisant la variable RR&QRSdQNU.
∆RR
QU ∆QRSd
QU SEN (%) SPC (%) TRD (s)
0,05 0 82,62 92,16 1, 93 ± 4, 04
UNIVERSIDAD SIMÓN BOLÍVAR
DECANATO DE ESTUDIOS DE POSTGRADO
COORDINACIÓN DE POSTGRADO EN INGENIERÍA ELECTRÓNICA
DOCTORADO EN INGENIERÍA
DETECCIÓN MULTIVARIADA DE EPISODIOS DE APNEA-BRADICARDIA EN
EL NEONATO PREMATURO POR MODELOS SEMI-MARKOVIANOS
Por: Altuve Paredes Miguel Alfonso
Carnet No.: 03-83313
Tutores: Dr Guy Carrault y Dr Alfredo Hernández, Universidad de Rennes 1
Dr Julio Cruz, Universidad Simón Bolívar
08 de Julio de 2011
RESUMEN
La apnea-bradicardia en el neonato prematuro es definida como una pausa respiratoria asociada a
una disminución de la frecuencia cardiaca. Una detección precoz de los episodios de apnea-
bradicardia es de vital importancia para disminuir los riesgos asociados a esta problemática y
garantizar el buen desarrollo del neonato prematuro. En este trabajo se pretende detectar
precozmente la apnea-bradicardia analizando la dinámica de las series temporales extraídas del
electrocardiograma. Primeramente, una metodología novedosa basada en algoritmos evolutivos fue
propuesta para adaptar dos técnicas de análisis del electrocardiograma (detección de latidos y
segmentación del electrocardiograma) para funcionar en el electrocardiograma del neonato
prematuro. Una vez adaptados estos métodos, las series temporales que caracterizan la duración del
ciclo cardíaco, la amplitud de la onda R y la duración del complejo QRS fueron extraídas del
electrocardiograma y analizadas en cuatro intervalos de interés: reposo, antes, durante y después de
la apnea-bradicardia. Los resultados de este análisis revelaron modificaciones en la evolución
temporal de estas series temporales asociadas a la aparición de la bradicardia. Estos resultados nos
motivaron a realizar un detector de la dinámica de estas series temporales usando una metodología
basada en modelos semi-Markovianos. Con el fin de aumentar el rendimiento de detección, dos
proposiciones fueron presentadas, la primera basada en una cuantificación uniforme y no uniforme
de las series temporales, y la segunda basada en la inclusión de un retardo en las series temporales.
Estas modificaciones propuestas permitieron mejorar la detección de los episodios de apnea-
bradicardia en un 13% en sensibilidad y en un 7% en especificidad y permitieron disminuir en 3
segundos el tiempo de retardo en la detección. Estos resultados muestran claramente la importancia
de tomar en cuenta la dinámica de las series temporales y que con un pre-tratamiento adecuado se
puede obtener una ganancia significativa en el rendimiento del detector.
Palabras claves: algoritmos evolutivos, modelos semi-Markovianos ocultos, electrocardiograma,
apnea-bradicardia, neonato prematuro.
Résumé
Cette thèse a comme domaine applicatif la détection précoce des événements d’apnée-bradycardie (AB)
chez le prématuré. Après avoir situé l’importance sur le plan clinique de la détection des AB, une démarche
méthodologique est proposée. Elle s’appuie sur un processus de fouille de données qui inclut le nettoyage et
l’extraction de caractéristiques. Au chapitre 3, une méthode originale à base d’algorithmes évolutionnaires, pour
optimiser des seuils et fenêtres d’analyse, est proposée pour adapter les algorithmes de traitement du signal ECG
aux caractéristiques spécifiques du prématuré, très différentes de l’ECG de l’adulte. Au chapitre 4, une approche
semi-Markovienne est adaptée pour la modélisation des dynamiques et plusieurs améliorations sont proposées :
hétérogénéité des modèles, adaptation au traitement en ligne, optimisation de la gamme dynamique, extension de
l’observabilité. Au chapitre 5, ces propositions sont exploitées dans des expériences de classification et de détection
en ligne, tant sur signaux simulés que réels. Les résultats mettent bien en exergue l’intérêt de prendre en compte
la dynamique des signaux. Ils soulignent également qu’avec un prétraitement approprié tel que la quantifica-
tion des observations, l’introduction du retard entre observables, un gain notable en performance peut être observé.
Mots clés : analyse des données multidimensionnelles, algorithmes évolutionnaires, modèles semi-Markoviens
cachés, électrocardiogramme, apnée-bradycardie, nouveau-né prématuré.
Abstract
This dissertation studies the early detection of apnea-bradycardia (AB) events in preterm infants. After
defining the importance of AB detection from a clinical point of view, a methodological approach is proposed.
It relies on a data mining process that includes data cleansing and feature extraction. In chapter 3, a novel
method based on evolutionary algorithms, for optimizing the thresholds and the analysis windows, is proposed
to adapt the algorithms of the ECG signal to the specific characteristics of preterm infants, very different
from the ECG of adult. In Chapter 4, a semi-Markovian approach is adapted for modeling of dynamics and
several improvements are proposed : heterogeneous models, adaptation to online processing, optimization of
the dynamic range, and extension of observability. In chapter 5, results of classification and online detection
experiments, are reported on simulated and real signals. They clearly highlight the importance of considering the
dynamics of the signals. They also emphasize that with a suitable pre-treatment such as the quantification of ob-
servations and the introduction of delay between the observable, a significant gain in performance can be observed.
Keywords : multidimensional data analysis, evolutionary algorithms, hidden semi-Markov models, electro-
cardiogram, apnea-bradycardia, preterm infants.

these_altuve

  • 1.
    No d’ordre :4380 ANNÉE 2011 THÈSE / UNIVERSITÉ DE RENNES 1 sous le sceau de l’Université Européenne de Bretagne COTUTELLE / UNIVERSIDAD SIMÓN BOLÍVAR pour les grades de DOCTEUR DE L’UNIVERSITÉ DE RENNES 1 Mention : Traitement du signal et télécommunications Ecole doctorale MATISSE et DOCTOR EN INGENIERÍA DE LA UNIVERSIDAD SIMÓN BOLÍVAR Decanato de Estudios de Postgrado présentée par Miguel ALTUVE préparées à l’unité de recherche LTSI - INSERM U642 Laboratoire de Traitement du Signal et de l’Image UFR Structure et Propriétés de la Matière Grupo de Bioingeniería y Biofísica Aplicada Decanato de Investigación y Desarrollo Détection multivariée des épisodes d’apnée-bradycardie chez le prématuré par modèles semi-Markovien cachés Thèse soutenue à Rennes le 8 juillet 2011 devant le jury composé de : Jean-Marc BOUCHER Pr, Telecom Bretagne / rapporteur Jocelyne FAYN Ingénieur de Recherche INSERM, HDR, Lyon/ rapporteur Pablo LAGUNA Pr, Université de Saragosse / examinateur Patrick PLADYS Pr, Université de Rennes 1 / examinateur Gianfranco PASSARIELLO Pr, Université Simon Bolivar / examinateur Guy CARRAULT Pr, Université de Rennes 1 / co-directeur de thèse Alfredo HERNÁNDEZ CR INSERM, HDR, Université de Rennes 1 / co-directeur de thèse
  • 3.
  • 5.
    On me l’araconté et je l’ai oublié. Je l’ai vu et je l’ai compris. Je l’ai fait et je l’ai appris. Confucius
  • 7.
    Remerciements D’abord je tiensà remercier Dieu pour l’intelligence qu’il m’a accordée pour réaliser cette thèse. Je remercie ma femme Rosana pour avoir cru en moi, sa présence et sa patience ont été très précieuses durant cette longue aventure. Pour toutes ces raisons et plus encore, je lui dédie affectueusement cette thèse. Je remercie aussi ma famille, tout spécialement mes parents, frère et sœurs, pour leur amour et leur soutien inconditionnel à tout moment, même dans la distance. Je remercie également parents, frère et sœur de ma femme pour leur soutien. Je tiens à exprimer ma gratitude à mes directeurs de thèse, Messieurs Guy CARRAULT et Alfredo HERNÁNDEZ, pour tous leurs conseils scientifiques et leur sens critique tout au long de cette thèse, ainsi que pour les remarques constructives qu’ils ont su me donner lors de la rédaction de ce manuscrit et des articles scientifiques. Je compte sur vous pour la continuation de la colaboration GBBA-LTSI pour les années à venir. Un grand merci aux distingués membres du jury pour leurs commentaires constructifs et suggestions apportées à mes travaux de recherche. Je tiens à exprimer mes remerciements aux Professeurs Lotfi SENHADJI, directeur du LTSI et Jean-Louis COATRIEUX, directeur de recherche INSERM et initiateur de la collaboration GBBA-LTSI, de m’avoir accueilli chaleureusement au sein de leur laboratoire. Je remercie aussi le personnel administratif du LTSI, plus particulièrement Mesdames Patricia BERNABE, Soizic CHARPENTIER et Muriel DIOP, de m’avoir aidé à résoudre de nombreux problèmes administratifs. Je remercie les membres de l’équipe SEPIA du LTSI dont j’ai fait partie, pour les discussions au sujet de nombreux domaines en traitement du signal, et plus particulièrement les médecins de l’équipe, Messieurs Alain BEUCHÉE et Patrick PLADYS, dont les expertises dans le domaine pédiatrique étaient remarquables. Ils ont su m’apporter beaucoup d’idées pour résoudre les problèmes rencontrés et j’ai beaucoup apprécié leur avis sur les sujets cliniques. i
  • 8.
    ii Je reconnais deplus le soutien continu des doctorants, stagiaires et postdoctorants du LTSI au long de mes années de recherche. Je suis particulièrement reconnaissant envers Monsieur Jérôme DUMONT pour les discussions scientifiques au cours de ce travail qui, par ailleurs, représente une continuité des idées proposées dans sa thèse. J’ai pu également compter sur le soutien technique de Monsieur Julien FLEUREAU pour le temps qu’il a su me consacrer durant ma première année de thèse, en particulier en ce qui concerne la programmation. Je remercie énormément Monsieur David OJEDA pour m’avoir aidé en Linux, LATEX, à résoudre rapidement des problèmes en programation et fait découvrir d’autres logiciels qui m’ont facilité le travail au cours de ma thèse. Je lui suis très reconnaissant aussi pour son amitié et pour les activités sportives et sociales réalisées ensemble. Je remercie Malo GAUBERT, Nicolas CLADEL, Guillaume CAZOULAT, Marie-Paule GARCIA, Krzysztof JURCZUK, Bertrand SAUDREAU, Solenna BLANCHARD, Paul FROGERAIS, Antoine DEFONTAINE, Romain BILLOIS, Faten MINA, Clément HUNEAU, Lionil GIORGIS, Yuan WANG et Chufeng YANG, collègues du LTSI sur qui j’ai souvent pu compter pour discuter de différents sujets de recherche, mais aussi pour l’ambiance agréable au sein du laboratoire. En outre, je reconnais l’aide de mes collègues du GBBA. Je suis particulièrement reconnaissant envers le Professeur Gianfranco PASSARIELLO, cofondateur du GBBA et de la colaboration GBBA-LTSI, pour ses conseils très appreciés à tout moment et qui m’ont servi pour élargir mes horizons académiques et réussir dans plusieurs aspects de ma vie, tant étudiant que professionnel. Je remercie Monsieur Julio CRUZ, codirecteur vénézuélien de cette thèse qui représente une continuité de la sienne. Je le remercie énormément pour ses encouragements et ses idées apportées à mes travaux. Je remercie également le Professeur Sara WONG, directrice de mes travaux de recherche de master à la USB, coordinatrice du Doctorado en Ingeniería de l’USB, directrice du GBBA et responsable vénézuélienne du programme ECOS-NORD LTSI-GBBA, pour sa joie de vivre et sa confiance pendant mes recherches et qui pendant son année sabbatique au LTSI m’a soutenu et encouragé à continuer mes recherches et à réaliser des activités sportives. Merci au Professeur Fernando MORA, cofondateur du GBBA et de la collaboration GBBA-LTSI, pour son intérêt pour mes sujets de recherche et ceux du GBBA, à Alexandra La CRUZ, membre très important du GBBA, pour son aide pendant les premiers années à Rennes et au LTSI, à Ana Marian CHINEA qui pendant son séjour à Rennes a contribué à enrichir mes recherches sur la fusion de données et à Erika SEVERYN pour son aide désintéressée quant aux démarches administratives que je n’ai pas pu réaliser à l’USB. Je remercie également Guillermo VILLEGAS, Noel CASTRO, Mary DIAZ, Pedro MARCHENA et Yuber DELGADO, pour leur incroyable enthousiasme et leur amitié. Je tiens aussi à remercier les membres d’autres groupes de recherche de l’USB, tels que le GBRP et le GRETA et spécialement les Professeurs Ninoska VILORIA, Carlos GONZALEZ, Kleydis SUAREZ, Mónica HUERTA et Roger CLOTET, pour leurs conseils,
  • 9.
    iii leur soutien ainsique pour leur amitié. Les personnes de mon département de Technologie Industrielle méritent également un remerciement pour leur appui et leur autorisation pour réaliser cet important projet, plus particulièrement les membres du conseil du département et les secrétaires. Je pense aussi à Monsieur Ubaldo PADILLA qui m’a aidé à formaliser mes inscriptions à l’USB et à Madame Carolina RUMBOS qui m’a aidé à réaliser des démarches à l’USB et pour son amitié très précieuse. Pendant mes années à Rennes, j’ai pu compter sur l’amitié sincère et l’aide de nom- breuses personnes que j’ai rencontrées. Je pense particulièrement aux vénézuéliens Antonio BRAVO, Anabel CHATELLIER, Angel ESCALONA, Juan MANTILLA, Miguel CASTRO, Alexandra ALCEDO, Juan Andrés BALZAN, Juan Guillermo BALZAN, Argi MIRO, Mikael TORRES, Jeanlouis COLONNE, Gerardo DOMINGUEZ et Miguel VERA, mais aussi à Xavier NAVARRO, Joana MESQUITA, Michel LORRIAUX, Julián BETANCUR, Zulma SANDOVAL, Stephanie ORTEGA, Éloïse BILLOIS, Juan OSPINA et Marian LEE. Avec vous j’ai passé de très bons moments et j’espère vous revoir très bientôt. La rédaction de cette thèse ainsi que la présentation n’auraient été possibles sans la participation de mes directeurs de thèse ainsi des collègues Guylaine LE-JAN, Adrian CO- LOMBET, Joachim BEHAR, Raphael MARCZAK et Céline LECAVELIER des ETANGS- LEVALLOIS, pour avoir relu des parties de ce travail. Leurs commentaires et corrections sur les versions antérieures de ce livre de thèse ont été très judicieux. Sur le plan sportif, je remercie l’équipe de football du LTSI, mes entraineurs de natation Alain DEBOUCHE et Raphaël LE CAM, et Régis CHATELLIER pour les nombreuses courses à pieds en entrainement ou en compétition. Je tiens à remercier le Decanato de Estudios de Postgrado et la Dirección de Relaciones Internacionales de la Universidad Simón Bolívar, spécialement Mesdames Carmen CALEYA et Daniela TRULLAS, ainsi que l’école MATISSE de l’université de Rennes 1 d’avoir permis la réalisation de cette thèse en co-tutelle. Enfin, je tiens à remercier le programme Apoyo Institucional para Estudios de Postgrado de la Dirección de Desarrollo Profesoral de la Universidad Simón Bolivar, plus particuliè- rement Mesdames Mariela CURIEL et Ana Rivas, la convention de coopération entre la Fundación Gran Mariscal de Ayacucho (Fundayacucho) et l’Ambassade de France au Vene- zuela, spécialement Mesdames Julia MONTOYA, Michelle ELLNER et Judith SANTANA, Messieurs Stéphane FREYCHET, Jean-Marc LAFORET et Jesús Arnaldo PÉREZ, le LTSI et Madamme Karine ELIE du CROUS de Rennes. Grâce à leur soutien financier, ce travail de thèse ainsi que mon séjour en France ont été possibles. À vous tous, merci beaucoup !
  • 11.
    Table des matières Introduction1 1 Présentation du contexte clinique 7 1.1 Le nouveau-né prématuré . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2 Les apnées-bradycardies du nouveau-né prématuré . . . . . . . . . . . . . . 10 1.3 Les systèmes de monitoring automatisés . . . . . . . . . . . . . . . . . . . . 12 1.3.1 L’équipement dans l’USIN . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.2 Délais dans le cycle de surveillance . . . . . . . . . . . . . . . . . . . 14 1.4 Généralités du système cardiovasculaire . . . . . . . . . . . . . . . . . . . . 15 1.4.1 Le cœur et l’activité électrique cardiaque . . . . . . . . . . . . . . . . 15 1.4.2 Le système spécialisé d’excitation-conduction du cœur . . . . . . . . 18 1.5 L’électrocardiogramme du nouveau-né prématuré . . . . . . . . . . . . . . . 19 1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2 Position du problème et démarche proposée 29 2.1 Travaux antérieurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.1 Détection de bradycardies . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1.2 Système multi-agents de monitoring appliqué aux soins néonatals . . 35 2.1.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 Méthodologie proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.1 Base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.2 Extraction de caractéristiques . . . . . . . . . . . . . . . . . . . . . . 38 2.2.3 Prise de décision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.3 Méthodologie d’évaluation des performances de détection . . . . . . . . . . . 40 2.3.1 Courbe COR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3 Analyse multi-variée de l’ECG pour la détection et la caractérisation de l’apnée-bradycardie des nouveaux-nés prématurés 47 3.1 Segmentation des ondes : position du problème et bibliographie . . . . . . . 48 3.1.1 Algorithme basé sur la dérivée filtrée . . . . . . . . . . . . . . . . . . 48 3.1.2 Algorithme basé sur le filtrage adaptatif . . . . . . . . . . . . . . . . 49 v
  • 12.
    vi Table desmatières 3.1.3 Algorithme basé sur la modélisation physiologique . . . . . . . . . . 49 3.1.4 Algorithme basé sur le réalignement temporel . . . . . . . . . . . . . 49 3.1.5 Algorithme basé sur la modélisation Markovienne . . . . . . . . . . . 50 3.1.6 Algorithme basé sur la transformée en ondelettes . . . . . . . . . . . 50 3.2 Détection et segmentation automatique du QRS . . . . . . . . . . . . . . . . 51 3.2.1 Pré-traitement de l’ECG . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.2.2 Détection des battements . . . . . . . . . . . . . . . . . . . . . . . . 52 3.2.3 Extraction des battements . . . . . . . . . . . . . . . . . . . . . . . . 54 3.2.4 Segmentation des battements par ondelettes . . . . . . . . . . . . . . 55 3.3 Optimisation de la chaîne de segmentation d’ECG . . . . . . . . . . . . . . 58 3.3.1 Méthode proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.3.2 Optimisation des paramètres . . . . . . . . . . . . . . . . . . . . . . 62 3.4 Résultats de détection et de segmentation . . . . . . . . . . . . . . . . . . . 64 3.4.1 Performances du détecteur des battements . . . . . . . . . . . . . . . 64 3.4.2 Performances de la méthode de segmentation des QRS . . . . . . . . 65 3.5 Analyse du QRS pour la caractérisation de l’apnée-bradycardie . . . . . . . 67 3.5.1 Principe et objectif de l’étude . . . . . . . . . . . . . . . . . . . . . . 67 3.5.2 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4 Modélisation de la dynamique de séries temporelles multivariées 81 4.1 Position du problème et état de l’art . . . . . . . . . . . . . . . . . . . . . . 82 4.1.1 Positionnement du problème . . . . . . . . . . . . . . . . . . . . . . 82 4.1.2 Fouille de données temporelles multivariées . . . . . . . . . . . . . . 83 4.1.3 Caractérisation des dynamiques de séries temporelles . . . . . . . . . 86 4.2 Les modèles de Markov et semi-Markov cachés . . . . . . . . . . . . . . . . 88 4.2.1 Architecture des modèles . . . . . . . . . . . . . . . . . . . . . . . . 90 4.2.2 Estimation des paramètres des modèles . . . . . . . . . . . . . . . . 93 4.3 Rappel de la méthode proposée par DUMONT J. . . . . . . . . . . . . . . . 94 4.3.1 Les distributions des durées et d’observation . . . . . . . . . . . . . . 94 4.3.2 Méthodologie utilisée pour l’estimation des paramètres des MSMC . 95 4.3.3 Estimation du nombre d’états . . . . . . . . . . . . . . . . . . . . . . 97 4.3.4 Évaluation d’une séquence observée . . . . . . . . . . . . . . . . . . . 98 4.3.5 Un exemple de modélisation d’observations bivariées par MSMC . . 99 4.3.6 Classification/détection par MMC et par MSMC . . . . . . . . . . . 100 4.3.7 Synthèse sur les MSMC . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.4 Contributions de ce travail de thèse . . . . . . . . . . . . . . . . . . . . . . . 104 4.4.1 Évaluation du temps de retard à la détection (TRD) . . . . . . . . . 105 4.4.2 Exploration de l’hétérogénéité des modèles . . . . . . . . . . . . . . . 105 4.4.3 Adaptation au traitement en ligne . . . . . . . . . . . . . . . . . . . 105
  • 13.
    Table des matièresvii 4.4.4 Optimisation de la distribution d’états dans la gamme dynamique des séries observées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 4.4.5 Exploitation des retards physiologiques dans les séries observées . . . 108 4.4.6 Synthèse de la fouille de données appliquées dans cette thèse . . . . 110 4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5 Application des MSMC sur des signaux simulés et réels 119 5.1 Évaluation de la faisabilité des MSMC sur signal simulé . . . . . . . . . . . 120 5.1.1 Le modèle de FitzHugh-Nagumo pour la génération des séries synthé- tiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 5.1.2 Étude comparative de classification par MMC et MSMC . . . . . . . 124 5.1.3 Étude de la performance de classification en fonction du nombre d’états126 5.1.4 Étude de la performance de classification intégrant les améliorations proposées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.1.5 Détection en ligne d’évènements d’intérêt . . . . . . . . . . . . . . . 129 5.2 Évaluation des MSMC sur signaux réels . . . . . . . . . . . . . . . . . . . . 138 5.2.1 Méthode proposée pour l’annotation des instants de début de brady- cardie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.2.2 Classification des séries temporelles : « présence » ou « absence » d’apnée-bradycardie . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.2.3 Détection en ligne d’épisodes d’apnée-bradycardie . . . . . . . . . . . 147 5.2.4 Fusion des détecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 5.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Conclusions et perspectives 159 A Liste des travaux liés à ce travail 167 B La transformée en ondelettes pour la segmentation des battements 169 C Les algorithmes évolutionnaires 173 C.1 Représentation (définition des individus) . . . . . . . . . . . . . . . . . . . . 174 C.2 Fonction d’évaluation (fonction de coût) . . . . . . . . . . . . . . . . . . . . 174 C.3 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 C.4 Mécanisme de sélection des parents . . . . . . . . . . . . . . . . . . . . . . . 175 C.5 Opérateurs de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 C.5.1 Mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 C.5.2 Recombinaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 C.6 Mécanisme de sélection des survivants . . . . . . . . . . . . . . . . . . . . . 176 D L’algorithme de Viterbi 179 D.1 L’algorithme de Viterbi étendu aux MSMC . . . . . . . . . . . . . . . . . . 180
  • 14.
    viii Table desmatières E Optimisation des paramètres τ, ∆QU et ∆QNU, sur signaux réels 183 E.1 Détermination de τ optimal . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 E.1.1 Optimisation de τ pour RR . . . . . . . . . . . . . . . . . . . . . . . 183 E.1.2 Optimisation de τ pour Ramp . . . . . . . . . . . . . . . . . . . . . . 183 E.1.3 Optimisation de τ pour QRSd . . . . . . . . . . . . . . . . . . . . . . 184 E.2 Détermination de ∆QU optimal . . . . . . . . . . . . . . . . . . . . . . . . . 185 E.2.1 Optimisation de ∆QU pour RR . . . . . . . . . . . . . . . . . . . . . 185 E.2.2 Optimisation de ∆QU pour Ramp . . . . . . . . . . . . . . . . . . . . 185 E.2.3 Optimisation de ∆QU pour QRSd . . . . . . . . . . . . . . . . . . . . 186 E.2.4 Optimisation de ∆QU pour RR . . . . . . . . . . . . . . . . . . . . . 186 E.2.5 Optimisation de ∆QU pour RR&Ramp . . . . . . . . . . . . . . . . . 186 E.2.6 Optimisation de ∆QU pour RR&QRSd . . . . . . . . . . . . . . . . . 187 E.3 Détermination de ∆QNU optimal . . . . . . . . . . . . . . . . . . . . . . . . 187 E.3.1 Optimisation de δQNU pour RR . . . . . . . . . . . . . . . . . . . . . 187 E.3.2 Optimisation de δQNU pour Ramp et QRSd . . . . . . . . . . . . . . 188 E.3.3 Optimisation de δQNU pour RR . . . . . . . . . . . . . . . . . . . . . 188 E.3.4 Optimisation de δQNU pour Ramp et QRSd . . . . . . . . . . . . . 188 E.3.5 Optimisation de δQNU pour RR&Ramp . . . . . . . . . . . . . . . . 189 E.3.6 Optimisation de δQNU pour RR&QRSd . . . . . . . . . . . . . . . . 189
  • 15.
    Table des figures 1.1Image d’un prématuré. On peut y voir certains dispositifs de mesure (Reportés sur la figure). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2 Système de monitoring utilisé dans l’USIN de Rennes. . . . . . . . . . . . . 13 1.3 Cycle de surveillance d’un prématuré dans une USIN . . . . . . . . . . . . . 14 1.4 Structure anatomique du cœur. Image d’après [Guyton and Hall, 1956]. . . 16 1.5 Potentiel d’action des cellules cardiaques ventriculaires. . . . . . . . . . . . . 17 1.6 Système spécialisé de conduction du cœur. Image d’après [Guyton and Hall, 1956]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.7 Ondes, intervalles et segments dans l’ECG. . . . . . . . . . . . . . . . . . . 20 1.8 Exemples des ECG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1 Utilisation d’un seuil d’amplitude fixe pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection se fait lorsque RR(k) ≥ 600 ms, où k est l’indice temporel. . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.2 Utilisation d’un seuil d’amplitude et durée fixes pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 600 ms pendant 4 secondes, où k est l’indice temporel. . . . . . . . 32 2.3 Utilisation d’un seuil relatif pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 1, 33RRbase pendant 4 s, où k est l’indice temporel et RRbase est la valeur moyenne de la série RR calculée dans une fenêtre glissante de 20 secondes qui précède l’intervalle RR actuel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.4 Dispositifs utilisés dans le système INTEM. . . . . . . . . . . . . . . . . . . 36 2.5 Étapes du processus de détection des apnées-bradycardies proposées dans cette thèse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.6 Étape d’extraction des caractéristiques de la démarche proposée. . . . . . . 39 2.7 Étape de prise de décision de la démarche proposée. . . . . . . . . . . . . . 40 2.8 Méthodologie d’évaluation des performances de détection. La fenêtre wV P est centrée dans l’échantillon de détection analysé. . . . . . . . . . . . . . . 42 2.9 Exemples de courbes COR. Le cercle représente le point de détection parfaite, les étoiles représentent une détection avec une TFP = 0, 05 (5 %) et les carrés correspondent à la distance la plus courte au point (0,1). . . . . . . . 43 3.1 Étapes de la segmentation du signal ECG . . . . . . . . . . . . . . . . . . . 51 3.2 Représentation en bloc du processus de détection des battements. . . . . . . 53 ix
  • 16.
    x Table desfigures 3.3 Banc de filtres de la décomposition en ondelettes (sans décimation). G(z) et H(z) sont respectivement les filtres passe-haute et passe-bas. Wk 2 x[n] sont les sorties des filtres aux échelles 2k (k = 1, 2, . . . , 5) pour le battement x[n]. 56 3.4 Indicateurs à repérer pour l’algorithme de segmentation. . . . . . . . . . . . 58 3.5 Le problème d’optimisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.6 Optimisation par application des AE de manière séquentielle. . . . . . . . . 60 3.7 Méthodologie d’optimisation des paramètres des méthodes. Les annotations et les détections dépendent de la méthode à optimiser. La méthode est le détecteur des battements dans un premier essai et la segmentation du QRS après. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.8 Construction des différentes bases de données utilisées pour effectuer les processus d’adaptation et la phase d’évaluation. . . . . . . . . . . . . . . . . 63 3.9 Amplitude de l’onde R (Ramp) et durée du complexe QRS (QRSd) pour un battement synthétique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.10 De haut en bas respectivement, intervalles d’analyses de séries temporelles RR, QRSd et Ramp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.11 Boîtes à moustaches de la moyenne des séries par intervalle et de la différence de la moyenne des séries entre l’intervalle T1 et les autres intervalles, pour les séries temporelles : (a) RR, (b) Ramp et (c) QRSd. . . . . . . . . . . . . 72 3.12 Segment typique présentant de petites différences entre l’intervalle T1 et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles, alors que dans (d), les lignes verticales en pointillé représentent la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff). 73 3.13 Segment typique présentant de différences significatives entre l’intervalle T1 et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles, alors que dans (d), les lignes verticales en pointillé représentent la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff). 74 4.1 Exemples des séries temporelles extraites de l’ECG sur trois instants différents. Dans (a), (b) et (c) on observe les séries RR, RAMP et QRSd respectivement dans une période de repos. Dans (d) la série RR pressente un ralentissement du cœur qui produit des variations dans les séries RAMP (e) et QRSd (f). Dans (g), (h) et (i) on observe les séries RR, RAMP et QRSd respectivement en présence d’un épisode d’apnée-bradycardie dont le cercle correspond à la détection effectuée par la méthode classique (RR ≥ 600 ms pendant 4 s) et le losange représente le début de la bradycardie. . . . . . . . . . . . . . . . . 84 4.2 Étapes du processus de fouille de données et leur correspondance dans cette thèse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.3 Structure de base d’un modèle de Markov caché. . . . . . . . . . . . . . . . 88 4.4 Structure de base d’un modèle de semi-Markov caché. . . . . . . . . . . . . 89 4.5 Principe de fonctionnement d’un modèle Markovien caché. . . . . . . . . . . 92 4.6 Principe de fonctionnement d’un modèle semi-Markovien caché. . . . . . . . 92 4.7 Procédure utilisée pour l’apprentissage des MSMC à partir d’une base de données, d’après DUMONT [Dumont, 2008]. . . . . . . . . . . . . . . . . . . 97
  • 17.
    Table des figuresxi 4.8 Modélisation des séries bivariées issues d’un attracteur de Rössler par des MSMC. On observe dans (a) la projection dans le plan x&y d’un MSMC avec 14 états, dans (b) la projection dans le plan x&z d’un MSMC avec 10 états et dans (c) la projection dans le plan y&z d’un MSMC avec 12 états. . 99 4.9 Comparaison des MSMC chargés de modéliser des séries bivariées : Projection dans le plan x&z dans (a) pour les séries originaux, dans (b) pour 1000x&z et dans (c) pour (1000 + x)&z. . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.10 Méthodologie de classification utilisée en utilisant les MSMC. . . . . . . . . 102 4.11 Processus de détection en ligne d’apnée-bradycardie proposé dans cette thèse.107 4.12 Quantificateur (a) uniforme et (b) non uniforme. . . . . . . . . . . . . . . . 108 5.1 Exemple de séries temporelles issues du MFN pour différentes valeurs du paramètre a : (a) dynamique dans le plan bivariée v&r, (b) dynamique de la variable v et (c) dynamique de la variable r. On distingue bien les deux classes de séries temporelles générées. . . . . . . . . . . . . . . . . . . . . . . 122 5.2 Dynamiques des classes appartenant à la variable r à 5 dB. . . . . . . . . . 123 5.3 Exemple d’une réalisation de la variable r, générée avec a1 = 0, 58. . . . . . 124 5.4 TEG (%) en fonction du nombre d’états des MSMC pour la classification de trois classes issues de la variable r à 5 dB. . . . . . . . . . . . . . . . . . . . 127 5.5 Spectre des séries temporelles v et r. . . . . . . . . . . . . . . . . . . . . . . 130 5.6 Étapes du processus d’optimisation des paramètres. paramètre correspond aux valeurs de ∆QU, ∆QNU et τ et méthode correspond à quantification uniforme, quantification non uniforme et prise en compte de la version retardée des séquences, respectivement. . . . . . . . . . . . . . . . . . . . . . 131 5.7 Dans (a), séries temporelles v générées avec a1 et a2 et dans (b), agrandisse- ment de (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 5.8 Dans (a), courbes des log-vraisemblances Lk, k = {1, 2, 3}, des séries tempo- relles de la figure 5.7 et dans (b), agrandissement de (a). . . . . . . . . . . . 132 5.9 Différence des log-vraisemblances présentées dans la figure 5.8. . . . . . . . . 133 5.10 Séries mono-source bivariée v, générées avec a1 et avec a2, pour un RSB = 5 dB et une valeur de τ = 3, 75 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 5.11 Meilleures performances de détection de la perturbation produite avec a1, en utilisant MSMC. Dans (a) courbes COR et dans (b) courbes TRD en fonction de TFP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 5.12 Approximation de la série temporelle RR (représentée par des cercles) pendant un épisode de bradycardie, par une fonction sigmoïde (courbe rouge continue). La courbe noire pointillée correspond à la dérivée de la fonction sigmoïde et la ligne verticale correspond à l’annotation du début de bradycardie. . . . . 140 5.13 Exemples des séries RR que ne doivent pas être incluses dans le sous-ensemble LSC1. Dans (a) la FC présente un ralentissement avant le début de la bradycardie et dans (b) l’intervalle RR ne dépasse pas le seuil de 500 ms que plus de 20 s après l’annotation. . . . . . . . . . . . . . . . . . . . . . . . . . 141 5.14 Exemple d’une série RR avec un épisode de bradycardie. Les différents blocs segmentés et leur classe sont indiqués. . . . . . . . . . . . . . . . . . . . . . 141
  • 18.
    xii Table desfigures 5.15 Procédure pour la détermination de la taille de la séquence d’observation sur les signaux RR. RR correspond à la moyenne des 233 blocs de séries RR avec les épisodes d’apnée-bradycardies. . . . . . . . . . . . . . . . . . . . . . 142 5.16 Moyenne (ligne continue) et moyenne ± écart-type (lignes pointillées) de 7 premières secondes des séries RR en bradycardie. Dans (a) on observe la variation d’amplitude du premier échantillon tandis que dans (b), cette variation est réduite en supprimant aux séries la moyenne déterminée sur les 5 secondes qui précédent le début de la bradycardie. . . . . . . . . . . . . . 143 5.17 Boîte à moustache du premier échantillon des série RR en bradycardie : (a) RR non centrées et (b) RR centrées. . . . . . . . . . . . . . . . . . . . . . . 143 5.18 (a) Série RR avec deux épisodes de bradycardie, (b) log-vraisemblance des modèles : L1 (ligne segmentée) et L2 (ligne continue) et (c) différence entre les log-vraisemblance : L1 −L2. Dans (a) et (c) les lignes verticales correspondent aux annotations de début et fin de l’épisode de bradycardie. . . . . . . . . . 149 5.19 Performance de détection de l’apnée-bradycardie par MSMC, sans prendre en compte les modifications proposées. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. Le caractère « x » représente le point correspondant à la DCDP. . . . . . . . . . . . . . . . . . . . . . . . . 150 5.20 Performance de détection de l’apnée-bradycardie par MSMC. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. Le caractère « x » représente le point correspondant à la DCDP. . . . . . . . . 152 5.21 Courbe COR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 5.22 Performance de détection lors de la fusion des variables RRQNU, RRQNU et RR&QRSdQU. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 B.1 Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour les échelles 1 à 5 pour une fréquence d’échantillonnage de 250 Hz. . . . . . . . 170 B.2 Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour une fréquence d’échantillonnage de (a) 500 Hz et (b) 1000 Hz. . . . . . . . . . . 171 C.1 Principe de fonctionnement d’un algorithme évolutionnaire. . . . . . . . . . 174
  • 19.
    Liste des tableaux 1.1Valeurs normales de l’ECG pédiatrique par âge. . . . . . . . . . . . . . . . . 23 3.1 Paramètres de la méthode de détection des battements à optimiser. . . . . . 54 3.2 Paramètres de la méthode de segmentation des QRS à optimiser. . . . . . . 58 3.3 Valeurs des paramètres de la méthode de détection des battements avant (pour les adultes) et après (pour les nouveaux-nés prématurés) le processus d’optimisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.4 Performances du détecteur des battements avant et après le processus d’opti- misation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés pour l’ECG du prématuré. . . . . . . . . . . . . . . . . . . . . . . . . 65 3.5 Valeurs optimales des paramètres de la méthode de segmentation des QRS. 66 3.6 Exemple des fenêtres de recherche et des seuils utilisés dans la méthode de segmentation des QRS. Les paramètres de notre approche ont été déterminés en utilisant les paramètres optimaux (Tableau 3.5) pour un intervalle RR typique de 400 ms. Les autres approches correspondent aux paramètres utilisés par [Dumont et al., 2010] et [Smrdel and Jager, 2004]. . . . . . . . . 66 3.7 Performances de la segmentation des QRS, avant et après le processus d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés pour l’ECG du prématuré. . . . . . . . . . . . . . . . . . . 67 3.8 wµ et wσ des séries temporelles RR, Ramp et QRSd, pour tous les intervalles analysés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.9 µDA et σDA entre l’intervalle T1 et les autres intervalles, pour les séries temporelles RR, Ramp et QRSd. . . . . . . . . . . . . . . . . . . . . . . . . 71 3.10 tests d’hypothèse de Mann–Whitney U pour la moyenne des séries RR, Ramp et QRSd. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.1 Résumé des principaux paramètres et caractéristiques des MMC et MSMC. 92 4.2 Tableau de contingence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 5.1 Estimation du nombre d’états par MSMC pour différentes valeurs de RSB, pour modéliser la dynamique de la variable r. . . . . . . . . . . . . . . . . . 125 5.2 Tableau de contingence en utilisant les MSMC pour classer trois dynamiques observées dans la variable r à 5 dB. Chaque élément du tableau représente la somme des éléments correspondants sur les 10 répétitions. . . . . . . . . . 125 xiii
  • 20.
    xiv Liste destableaux 5.3 Comparaison des performances de classification entre les MMC et les MSMC pour la classifications des séquences d’observations issues de la variable r à 5 dB et pour 10 réalisations des étapes apprentissage/test. . . . . . . . . . . . 126 5.4 Estimation du nombre d’états par MSMC pour modéliser la dynamique des différents versions de la variable r avec un RSB = 5 dB. . . . . . . . . . . . 129 5.5 TEG pour classer trois dynamiques différents des variables r à 5 dB en utilisant des MSMC sur 10 réalisations. . . . . . . . . . . . . . . . . . . . . . 129 5.6 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de v. . . . . . . . . . . . . . . . . . . . . . . . 133 5.7 Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . . . . . . . . 134 5.8 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQU. . . . . . . . . . . . . . . . . . . . . . 134 5.9 Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . . . . . . . 134 5.10 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQNU. . . . . . . . . . . . . . . . . . . . . . 135 5.11 Estimation du nombre d’états par MSMC pour modéliser la dynamique de v pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . . . . . . . . 135 5.12 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de v. . . . . . . . . . . . . . . . . . . . . . . . 136 5.13 Estimation du nombre d’états par MSMC pour modéliser la dynamique de v pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . . . . . . . . 136 5.14 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQU. . . . . . . . . . . . . . . . . . . . . . 136 5.15 Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . . . . . . . 137 5.16 Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQNU. . . . . . . . . . . . . . . . . . . . . 137 5.17 Meilleures performances de détection de la perturbation produite avec a1, en utilisant des MSMC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 5.18 Valeurs optimales des paramètres ∆QU et δQNU. . . . . . . . . . . . . . . . . 144 5.19 Estimation du nombre d’états par MSMC pour modéliser les classes 1 et 2. 145 5.20 Performances de classification par MSMC en utilisant les signaux réels. . . . 146 5.21 Performance de détection de l’apnée-bradycardie par MSMC, sans prendre en compte les modifications proposées. . . . . . . . . . . . . . . . . . . . . . 150 5.22 Huit meilleures approches de détection de bradycardies par MSMC, en termes de performance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 5.23 Performance de détection des méthodes classique dans leur point opérationnel.151 5.24 Performance de détection lors de la fusion des variables RR, Ramp et QRSd. 154 5.25 Performance de détection lors de la fusion décentralisée des variables RRQNU, RRQNU et RR&QRSdQU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 B.1 Bande passante à 3 dB pour chaque échelle du filtre équivalente Qk(ejω) . . 170
  • 21.
    Liste des tableauxxv E.1 Nombre d’états par MSMC et performance de détection en utilisant la variable RR pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . . . 184 E.2 Nombre d’états par MSMC et performance de détection en utilisant la variable Ramp pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . 184 E.3 Nombre d’états par MSMC et performance de détection en utilisant la variable QRSd pour différentes valeurs de τ. . . . . . . . . . . . . . . . . . 184 E.4 Nombre d’états par MSMC et performance de détection en utilisant la variable RRQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . . 185 E.5 Nombre d’états par MSMC et performance de détection en utilisant la variable RampQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . 185 E.6 Nombre d’états par MSMC et performance de détection en utilisant la variable QRSdQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . 186 E.7 Nombre d’états par MSMC et performance de détection en utilisant la variable RRQU pour différentes valeurs de ∆QU. . . . . . . . . . . . . . . . 186 E.8 Performance de détection en utilisant la variable RR&RampQU. . . . . . . . 187 E.9 Performance de détection en utilisant la variable RR&QRSdQU. . . . . . . . 187 E.10 Nombre d’états par MSMC et performance de détection en utilisant la variable RRQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . . 188 E.11 Nombre d’états par MSMC et performance de détection en utilisant la variable RRQNU pour différentes valeurs de δQNU. . . . . . . . . . . . . . . 188 E.12 Performance de détection en utilisant la variable RR&RampQNU. . . . . . . 189 E.13 Performance de détection en utilisant la variable RR&QRSdQNU. . . . . . . 189
  • 23.
    Table des algorithmes 1Pseudo-code de la méthode de détection des battements. . . . . . . . . . . . 54 2 Pseudo-code de la méthode de segmentation des QRS. . . . . . . . . . . . . 59 3 Pseudo-code pour déterminer ∆QU optimal. . . . . . . . . . . . . . . . . . . 108 4 Pseudo-code de la méthode de quantification non uniforme proposée. . . . . 108 5 Pseudo-code pour déterminer ∆QNU optimal. . . . . . . . . . . . . . . . . . 109 xvii
  • 25.
    Liste des symboles δConstante pour la détermination du seuil adaptatif, au chapitre 3 δα,k Seuil pour détecter l’événement α (α ∈ {k}) γ Paramètres du détecteur à optimiser par courbes COR au chapitre 2 γQRSpost Seuil utilisé pour trouver des pentes importantes de l’onde S (équation 3.7) γQRSpre Seuil utilisé pour trouver des pentes significatives de l’onde Q (équation 3.6) λMMC Ensemble des paramètres du MMC λMSMC Ensemble des paramètres du MSMC R Ensemble des nombres réels Z Ensemble des entiers naturels v Matrice d’observation de la variable v intégrant la version originale de la séquence observée à l’instant t et la version retardée de la séquence observée à l’instant t − τ L Fonction de vraisemblance (équation 4.9) N Loi normale gaussienne U Loi uniforme continue µDA Moyenne de la différence absolue (équation 3.17) µDJ Moyenne du jitter de détection (équation 3.11) µd i Moyenne des gaussiennes pour représenter les temps de passage de l’état i µνk i Moyenne des gaussiennes pour représenter la distribution d’observation de l’état i πi Probabilité de l’état initial δQNU Seuil pour déterminer ∆QNU ∆QU Pas de quantification uniforme σDA Écart-type de la différence absolue (équation 3.18) σDJ Écart-type du jitter de détection (équation 3.12) Σνk i Matrice de covariance des centres des gaussiennes multivariées pour représenter la distribution d’observation de l’état i xix
  • 26.
    xx Liste dessymboles τ Délai µνk i Vecteur des centres des gaussiennes multivariées pour représenter la distribution d’observation de l’état i ∆QNU Pas de quantification non uniforme ξQRSoff Seuil utilisé pour la recherche de QRSoff (équation 3.9) ξQRSon Seuil utilisé pour la recherche de QRSon (équation 3.8) a Paramètre du MFN a1 a1 ∈ a ∼ U(0,58, 0,62) a2 a2 ∈ a ∼ U(0,78, 0,82) aij Élément de la matrice de transition Ann Annotation bi Probabilité d’observation de l’état i CF1 Fonction de coût pour AE1 CF2 Fonction de coût pour AE2 d Durée d’une état de la chaîne de Markov Det Détection fcHigh Fréquence de coupure du filtre passe-haut fcLow Fréquence de coupure du filtre passe-bas G(z) Filtre de détail H(z) Filtre d’approximation HISTO Taille du tampon circulaire I Valeur du courant d’excitation externe au MFN K Nombre d’évènements différents à détecter L Taille de la fenêtre pour déterminer la moyenne dans la procédure de détection en ligne M Nombre d’états des modèles nfirst Première pente significative nlast Dernière pente significative NP Nombre de pics pour déterminer sa valeur moyenne O Ensemble d’observations O1:T Séquence d’observation pi Probabilité de durée de l’état i Perr Probabilité d’erreur de détection (équation 3.10) r Variable de récupération (variable lente) du MFN T Taille de la séquence d’observation multivariée, au chapitre 5
  • 27.
    Liste des symbolesxxi TIso Taille de la fenêtre où la forme d’onde est la plus plate pour déterminer ISOp TMWI Taille de la fenêtre glissante de l’intégrateur TPQ Taille de la fenêtre de recherche temporelle pour le ISOp THR Seuil adaptatif utilisé dans l’algorithme de détection des battements Ti Intervalle i pour analyser les séries du chapitre 3 TPeak Taille de la fenêtre pour détecter la crête maximale QRS TQlim Taille de la fenêtre temporelle utilisée pour trouver l’onde Q TR1 Taille de la fenêtre temporelle utilisée pour la recherche des ondes R avant le PF TR2 Taille de la fenêtre temporelle utilisée pour la recherche des ondes R après le PF TRefr Période de suppression réfractaire TRRlim Temps limite pour réinitialiser la détection des QRS TSlim Taille de la fenêtre temporelle utilisée pour rechercher les ondes S v Potentiel de membrane (variable rapide) du MFN wµ Moyenne pondérée (équation 3.15) wσ Écart-type pondéré (équation 3.16) Wn 2 Échelle n de la transformation en ondelettes wV P Taille de la fenêtre pour déterminer les VP σd i 2 Variance des gaussiennes pour représenter les temps de passage de l’état i σνk i 2 Variance des gaussiennes pour représenter la distribution d’observation de l’état i vQNU Variable v quantifiée non uniformément vQU Variable v quantifiée uniformément RR Matrice d’observation de la variable RR intégrant la version originale de la séquence observée à l’instant t et la version retardée de la séquence observée à l’instant t − τ c.f. Confer (se reporter à) i.e. id est (c’est-à-dire) A-V Auriculo-ventriculaire ACP Analyse en composante principale AE Algorithmes évolutionnaires AE1 AE pour optimiser les paramètres du détecteur des battements AE2 AE pour optimiser les paramètres de la méthode de segmentation des QRS BIC Critère d’information bayésien bpm Battements par minute
  • 28.
    xxii Liste dessymboles COR Caractéristiques opérationnelles du récepteur CPAP Continuous Positive Airway Pressure DB1 Sous-ensembles de données pour adapter la méthode de détection de battements DB1L Premier ensemble d’apprentissage utilisée pour AE1 DB1T Premier ensemble de test DB2 Sous-ensembles de données pour adapter la méthode de segmentation de battements DB2L Deuxième ensemble d’apprentissage utilisée pour AE2 DB2T Deuxième ensemble de test DCDP Distance la plus courte à la détection parfaite DTW Dynamic Time Warping ECG Électrocardiogramme EEG Électroencéphalogramme EM Espérance-maximisation FC Fréquence cardiaque FCbase Fréquence cardiaque de base FN Nombre de Faux Négatifs FP Nombre de Faux Positifs GBBA Groupe de Bioingénierie et Biophysique Appliquée HF High Frequency INTEM Système de monitoring intelligent développe au LTSI IRM Imagerie par résonance magnétique ISOp Position du niveau iso-électrique KISS Knowledge-based Interactive Signal monitoring System LF Low Frequency LSCk Sous-ensemble pour la classification de données réels, k = {1, 2} LSMFNk Sous-ensemble de données synthétiques k = {1, 2, 3} LTSI Laboratoire de Traitement du Signal et de l’Image MFN Modèle de FitzHugh-Nagumo (équation 5.1) MMC Modèle Markovien caché MSMC Modèle semi-Markovien caché MV Maximum de vraisemblance PA Potentiel d’action Pd Probabilité de détection
  • 29.
    Liste des symbolesxxiii PF Point fiducial Pfa Probabilité de fausse alarme PRA Période réfractaire absolue PRR Période réfractaire relative PTCA Angioplastie coronaire transluminale percutanée QRS Durée du complexe QRS QRSdQNU Quantification non uniforme de la variable QRSd QRSdQU Quantification uniforme de la variable QRSd QRSoff Fin du complexe QRS QRSon Début du complexe QRS Ramp Amplitude de l’onde R RampQNU Quantification non uniforme de la variable Ramp RampQU Quantification uniforme de la variable Ramp RNA Réseaux neuronaux artificiels RR Durée du cycle cardiaque RRbase Durée du cycle cardiaque de base RRQNU Quantification non uniforme de la variable RR RRQU Quantification uniforme de la variable RR RSB Rapport signal sur bruit SA Semaines d’aménorrhée SEN Sensibilité SEPIA Surveillance, Explication et Prévention des Ischémies et des Arythmies car- diaques SNA Système nerveux autonome SPC Spécificité SpO2 Saturation d’oxygène TECk Taux d’erreur par classe k (équation 4.27) TEG Taux d’erreur global (équation 4.26) TFP Taux de faux positif TRD Temps de retard à la détection TVP Taux de vrai positif USIC Unités de Soins Intensifs Coronarien USIN Unités de soins intensifs néonatals VFC Variabilité de la fréquence cardiaque VN Nombre de Vrais Négatifs VP Nombre de Vrais Positifs VPP Valeur prédictive positive
  • 31.
    Introduction Ce travail dethèse a été élaboré dans le cadre d’une co-tutelle entre deux laboratoires : – Le Groupe de Bioingénierie et Biophysique Appliquée (GBBA) de l’Université Simón Bolívar. Les activités de recherche de ce laboratoire sont centrées sur l’instrumentation biomédicale, le traitement des signaux biomédicaux, la visualisation et le traitement d’images médicales. – Le Laboratoire de Traitement du Signal et de l’Image (LTSI) de l’Université de Rennes 1, composé de quatre équipes. L’équipe SEPIA (Surveillance Explication et Prévention des Ischémies et des Arythmies) est celle qui a encadré cette thèse. L’activité de cette équipe est basée sur une approche multidisciplinaire qui combine le traitement du signal, la physiologie et la modélisation intégrative appliquée à l’étude du système cardiovasculaire. Le monitoring des signaux physiologiques est le centre de la coopération entre ces deux laboratoires et a été abordé dans le cadre du projet KISS (Knowledge-based Interactive Signal monitoring System) [Siregar et al., 1989], où des problèmes d’acquisition et de traitement des signaux [Passariello, 1991; Hernández et al., 1999], de caractérisation d’arythmies [Schleich, 1993; Thoraval, 1995], d’extraction et de représentation de connaissances profondes [Siregar et al., 1995; Hernández, 2000], d’architecture des systèmes liés au concept de monitoring intelligent dans les Unités de Soins Intensifs Coronarien (USIC) [Mora, 1991; Mabo et al., 1991], et plus récemment d’analyse de la dynamique des séries temporelles par fouille de données [Dumont, 2008] ont aussi été traités. Ce travail représente le prolongement de ces contributions. Son objectif principal est de prédire la survenue des apnée-bradycardies chez le nouveau-né prématuré en utilisant une méthodologie cherchant à exploiter la dynamique des séries temporelles multivariées, extraites de l’électrocardiogramme. La naissance prématurée de l’enfant arrive avant 37 semaines de gestation. Cette problématique est en augmentation constante dans la plupart des pays [Martin et al., 2009; Zeitlin, 2009]. Elle peut entraîner de nombreuses complications aux enfants en raison des dysfonctionnements des organes, qui ne sont pas complètement développés et aptes pour la vie extra-utérine. L’un des problèmes le plus fréquent est l’épisode d’apnée-bradycardie, 1
  • 32.
    2 Introduction dont larépétition influence de manière négative le développement de l’enfant [Pichler et al., 2003; Urlesberger et al., 1999; Janvier et al., 2004]. Par conséquent, les enfants prématurés sont surveillés en continu par un système de monitoring installé dans les unités des soins intensifs néonatals (USIN). Ce système permet de déterminer l’évolution de l’état de santé de l’enfant et, depuis sa mise en marche, la qualité, l’espérance de vie et le pronostic de vie des prématurés ont été considérablement améliorés et la mortalité a été réduite. En effet, les avancées technologiques en électronique, informatique et télécommunications ont conduit à l’élaboration de systèmes multivoies de monitoring néonatal de plus en plus performants. La plupart sont constitués de modules d’acquisition des données et d’une station centrale pour visualiser les signaux acquis en temps réel. Des alarmes sont produites lorsqu’une situation à risque est détectée, comme par exemple, une apnée-bradycardie. L’un des principaux signaux exploités dans ces systèmes est l’électrocardiogramme (ECG). L’ECG est un outil diagnostique qui mesure et enregistre l’activité électrique du cœur. Il reste aujourd’hui comme la technique la plus largement utilisée pour l’exploration de l’activité électrique cardiaque, puisqu’il s’agit d’une technique non invasive, simple, économique et sûre. Même si l’analyse de l’ECG a évolué au fil des années et que le développement des méthodes de traitement des signaux électrocardiographiques a amélioré la caractérisation et le diagnostic des maladies cardiovasculaires, l’ensemble des informations fournies par l’ECG ne sont pas encore totalement exploitées dans les processus de décision, notamment en monitoring en USIN. Deux points particuliers sont à nos yeux sous exploités dans les stations de monitoring néonatal : i) l’exploration multivariée des ondes et intervalles de l’ECG, afin de détecter précocement les épisodes d’apnée-bradycardie et ii) les méthodes d’analyse restent des méthodes de détection et sont très peu anticipatives (prédiction de l’évènement). Dans ce travail, une nouvelle méthodologie pour répondre aux deux problématiques précédentes est proposée. Elle est basée sur l’exploitation de la dynamique des séries temporelles multivariées extraites de l’ECG. Cette dynamique est analysée par l’usage des modèles semi-Markovien cachés (MSMC). Les MSMC sont des modèles stochastiques à nombre d’états M fini et dont l’émission d’observations (bi) de l’état i et la durée (pi) de l’état i sont représentées par une densité de probabilité. Un MSMC est similaire à un modèle de Markov caché (MMC) classique, mais la principale différence est que le processus non observé est semi-Markovien, dans le sens où un changement dans un état futur dépend à la fois de l’état caché actuel et du temps passé sur cet état. Les MMC et MSMC ont été appliqués dans le domaine du traitement du signal pendant plus de deux décennies, en particulier dans le contexte de la reconnaissance automatique de la parole. Toutefois, ils constituent également des outils souples, flexibles et robustes pour le traitement des séries temporelles univariées et multivariées, y compris dans les cas
  • 33.
    Introduction 3 d’observations discrètesou continues. L’intérêt pour la théorie et les applications de ces modèles est en pleine expansion à d’autres domaines, par exemple : différents types de reconnaissance (visages, parole, geste, écriture, signature), bioinformatique (analyse des séquences biologiques, analyse de l’ECG, classification de l’électroencéphalogramme), envi- ronnement (direction du vent, précipitations, tremblements de terre) et finances (rentabilité journalière). Le principal intérêt d’utiliser les MSMC dans le traitement de signaux biomédicaux est basé sur le fait que : i) ils peuvent représenter l’évolution temporelle d’une variable grâce au paramètre pi, ii) ils ne nécessitent pas de connaissances a priori sur les données à traiter et iii) le nombre d’états M est le seul hyper-paramètre à régler. Cette thèse est organisée comme suit : – Le premier chapitre détaille les concepts physiologiques du nouveau-né prématuré et ses complications, en particulier l’apnée-bradycardie. Le fondement d’électrocardiographie et l’ECG du nouveau-né prématuré y sont détaillés. – Le deuxième chapitre passe en revue les travaux qui ont déjà été proposés dans ce domaine. Les faiblesses y sont relevées. Ce chapitre se clôture par la présentation de la méthodologie proposée pour détecter les épisodes d’apnée-bradycardie. – Le troisième chapitre montre comment l’analyse multivariée de l’ECG est exploitée, afin de caractériser les épisodes d’apnée-bradycardie chez les prématurés. Pour l’extraction des caractéristiques de l’ECG, il est nécessaire de procéder à la segmentation des ondes qui forment l’ECG. Deux étapes sont proposées : la première, fondamentale, est l’adaptation des algorithmes de détection des battements et de segmentation développés pour l’adulte, au cas de l’ECG des nouveaux-nés prématurés. Un processus d’optimisation multi-objectif à base d’algorithmes évolutionnaires est proposé pour cette tâche. La seconde consiste en l’extraction des caractéristiques proprement dite. Une fois la chaîne de segmentation adaptée aux ECG des prématurés, les séries temporelles RR, d’amplitude des ondes R et de durée du complexe QRS sont extraites de 32 nouveaux-nés prématurés présentant des fréquents épisodes d’apnée-bradycardie. Ces séries sont analysées en quatre intervalles de temps : repos, avant, pendant et après les épisodes d’apnée-bradycardie, pour caractériser ces événements. – Le quatrième chapitre propose une courte revue bibliographique sur les stratégies permettant de classer et de détecter précocement des dynamiques, les modèles Marko- viens cachés et les modèles semi-Markoviens cachés sont alors introduits. Une méthode de modélisation de dynamiques par MSMC, développée dans notre laboratoire, est ensuite détaillée. Des améliorations sont proposées et constituent les principales contributions de ce chapitre. – Enfin, le cinquième chapitre détaille les résultats. L’approche est évaluée sur des signaux simulés et est ensuite appliquée sur des signaux réels. Après une propo- sition d’améliorations sur les observations dans l’étape d’apprentissage et de test,
  • 34.
    4 Introduction les résultatsmontrent que notre approche de détection des apnée-bradycardies par modèles semi-Markovien cachés permet d’améliorer la détection de ces épisodes, tout en présentant un temps de retard à la détection plus faible que les méthodes de détection classiques utilisées aujourd’hui dans les USIN. Une liste de publications associées à ce travail de thèse est présentée Annexe A.
  • 35.
    Bibliographie 5 Bibliographie Dumont, J.(2008). Fouille de dynamiques multivariées, application à des données temporelles en cardiologie. PhD thesis, Université de Rennes 1. Hernández, A. (2000). Fusion de signaux et de modèles pour la caractérisation d’arythmies cardiaques. PhD thesis, Université de Rennes 1. Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M. (1999). Multisensor fusion for atrial and ventricular activity detection in coronary care monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90. Janvier, A., Khairy, M., Kokkotis, A., Cormier, C., Messmer, D., and Barrington, K. J. (2004). Apnea is associated with neurodevelopmental impairment in very low birth weight infants. J Perinatol, 24(12) :763–8. Mabo, P., Pouillot, C., Kermarrec, A., Lelong, B., Lebreton, H., and Daubert, C. (1991). Lack of physiological adaptation of the atrioventricular interval to heart rate in patients chronically paced in the aair mode. Pacing Clin Electrophysiol, 14(12) :2133–42. Martin, J., Hamilton, B., Sutton, P., Ventura, S., Menacker, F., Kirmeyer, S., and Mathews, T. (2009). Births : Final data for 2006. Public Health Resources, page 65. Mora, F. (1991). Monitoring intelligent en unité de soins intensifs pour coronariens : connaissances et interfaces. PhD thesis, Université de Tours. Passariello, G. (1991). Monitoring intelligent en unité de soins intensifs pour coronariens : aspects traitement du signal. PhD thesis, Université de Tours. Pichler, G., Urlesberger, B., and Müller, W. (2003). Impact of bradycardia on cerebral oxygenation and cerebral blood volume during apnoea in preterm infants. Physiol Meas, 24(3) :671–80. Schleich, J. M. (1993). La caractérisation d’arythmies en unité de soins intensifs pour coronariens par approche de fusion de donnes multisources/multicapteurs. PhD thesis, Université de Tours. Siregar, P., Chahine, M., Lemoulec, F., and Le Beux, P. (1995). An interactive qualitative model in cardiology. Comput Biomed Res, 28(6) :443–78. Siregar, P., Coatrieux, J., and Le Beux, P. (1989). KISS : Knowledge based interactive signal monitoring system. In AIM A10006 -1.2.A-F-R-890717. Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de Markov cachés. PhD thesis, Université de Rennes 1. Urlesberger, B., Kaspirek, A., Pichler, G., and Müller, W. (1999). Apnoea of prematurity and changes in cerebral oxygenation and cerebral blood volume. Neuropediatrics, 30(1) :29–33. Zeitlin, J. (2009). Surveillance et évaluation de la santé périnatale en île-de-france à partir des certificats de santé. Bulletin épidémiologique hebdomadaire, (44-45).
  • 37.
    Chapitre 1 Présentation ducontexte clinique Ce premier chapitre a pour ambition de donner les bases physiologiques et techniques nécessaires à la compréhension du problème clinique abordé : la détection des apnées- bradycardies chez les nouveaux-nés prématurés. Les définitions liées à la prématurité et à l’apnée néonatale sont présentées dans les deux premières sections. Une attention particulière est portée sur les causes, conséquences et incidences d’une naissance prématurée et de l’apnée-bradycardie du prématuré. Ensuite, les systèmes de monitoring utilisés dans les unités de soins intensifs néonatals, leurs rôles et les principaux dispositifs de mesure sont introduits dans la troisième section. Le déroulement de la détection d’un épisode d’apnée- bradycardie est présenté ainsi que les délais observés dans le cycle de surveillance des nouveaux-nés prématurés. Les généralités du système cardiovasculaire sont présentées dans une quatrième section y compris la structure anatomique du cœur, l’activité électrique cardiaque et le système spécialisé d’excitation-conduction du cœur. Enfin, les principes de base d’électrocardiographie, ainsi que les particularités de l’électrocardiogramme du prématuré sont exposés pour conclure le chapitre. Cette section est, bien entendu, capitale pour la suite du mémoire puisqu’elle présente un état des lieux des pratiques cliniques, qui seront utilisées comme référence, ainsi que les principales motivations de l’ensemble de travaux proposés dans ce mémoire. 1.1 Le nouveau-né prématuré Biologiquement, le fœtus requiert un certain nombre de semaines dans l’utérus maternel pour que son organisme soit prêt à la vie extra-utérine. Si l’enfant naît avant d’avoir complété ce cycle, il est confronté à un mode de fonctionnement auquel il n’est pas préparé et à un environnement hostile avec les moyens dont il dispose. Une naissance prématurée est un risque inhérent à la vie et elle est définie comme toute naissance qui survient avant 37 semaines révolues d’aménorrhée, comptées à partir du premier jour des dernières règles. Plus de 12 % 7
  • 38.
    8 Chapitre 1 (plusde 500000) des bébés nés aux États-Unis chaque année sont prématurés [Martin et al., 2009] et près de 6 % (près de 55000) des naissances sont prématurées en France. Suivant le terme de la naissance, quatre niveaux de prématurité existent actuellement dans le contexte clinique : – la faible prématurité, caractérisée par une naissance entre 33 et 37 semaines d’aménorrhée (SA) ; – la grande prématurité, entre 28 et 32 SA ; – la très grande prématurité, de 25 à 27 SA ; – l’extrême prématurité, de moins de 24 SA. Les facteurs les plus déterminants dans la survie du nouveau-né prématuré sont sa maturité, exprimée par l’âge gestationnel et son poids de naissance. L’enfant né à 35 semaines reste, dans la majorité des cas, auprès de sa mère en maternité, alors que la survie de l’enfant de 24 semaines reste encore et toujours très difficile [Bloch et al., 2003]. La prématurité est la principale cause de morbidité et de mortalité néonatale. Elle est responsable d’environ 35 % des décès néonataux aux États-Unis [Mathews and MacDorman, 2008]. Le risque de décès est accru dans la première année de vie et la plupart se produisent dans le premier mois de vie. Près de 30 % des prématurés nés à 23 SA survivent ; on passe à 50 % pour des prématurés nés à 24 SA, à 75 % pour des prématurés nés à 25 SA, et à plus de 90 % pour des prématurés nés entre 27 et 28 SA. Il importe de souligner que ce taux de mortalité a diminué depuis la mise en place d’unités de soins intensifs néonatals (USIN) au début des années 1970. Ainsi, les avancées en médecine et en soins des prématurés ont amélioré leurs chances de survie en mettant le seuil de viabilité à 22 SA mais sans réduire la prédominance des naissances prématurées. En effet, le nombre d’enfants nés prématurément est en augmentation en France et dans le monde. Par exemple, en Ile-de-France, une étude récente a montré que le nombre de naissances prématurées a augmenté de 5,7 % à 6,3 % entre 2002 et 2007 [Zeitlin, 2009]. Les causes de l’augmentation des naissances prématurées ne sont pas toutes connues, même si l’on sait qu’environ 60 % des naissances prématurées sont provoqués pour des raisons médicales et les cas restant sont spontanés. Un âge plus tardif (plus de 35 ans) ou précoce (moins de 18 ans) et les grossesses multiples conduisent souvent à des accouchements prématurés. Des problèmes obstétriques tels que le col ouvert ou le décollement du placenta ; une maladie de la mère comme la listériose, le diabète ou l’hypertension, et un milieu social défavorisé contribuent également aux naissances prématurées [Bloch et al., 2003; Rosenberg et al., 2005; Goldenberg et al., 2008]. Plus l’enfant est prématuré, plus graves et fréquents sont les problèmes d’adaptation et son traitement est d’autant plus complexe. Les problèmes couramment rencontrés sont : – Respiratoires : syndrome de détresse respiratoire, maladie des membranes hyalines et dysplasie bronchopulmonaire,
  • 39.
    1.1. Le nouveau-néprématuré 9 – Neurologiques : apnée du prématuré, rétinopathie, infirmité motrice cérébrale et hémorragie cérébrale intraventriculaire, – Cardiovasculaires : persistance du canal artériel, – Infectieux : septicémie, pneumonie et infection urinaire, – Hématologiques : anémie, ictère et thrombopénie, – Métaboliques : hypoglycémie, hypocalcémie et hypothermie, – Digestifs : entérocolite nécrosante et résidus gastriques. L’une des complications les plus importantes est l’apnée du prématuré. Celle-ci est un thème d’investigation en vigueur et de nombreuses recherches ont été effectuées ces dernières années pour essayer d’expliquer les causes, les conséquences et identifier les meilleurs traitements [Poets et al., 1993; Perlman, 2001; Janvier et al., 2004; Finer et al., 2006; Naulaers et al., 2007; Abu-Shaweesh and Martin, 2008; Poets, 2010; Zhao et al., 2011]. S’y ajoutent des recherches technologiques en vue de détecter efficacement les épisodes d’apnées, tout en réduisant le nombre d’appareils mis au chevet du bébé [Pichardo et al., 2003; Pravisani et al., 2003; Cruz et al., 2006; Beuchée et al., 2007; Portet et al., 2007; Belal et al., 2011]. Certains problèmes liés à une naissance prématurée compromettent le pronostic à court terme et d’autres pèsent lourdement sur le pronostic à moyen et long terme comme le développement physique, psychologique ou comportemental. Les conséquences à long terme de la prématurité ne deviennent évidentes que lorsque l’enfant est d’âge scolaire : à l’âge de 5 ans, 12 % des grands prématurés présentent des déficiences intellectuelles (de modérées à sévères), 36 % présentent des troubles moteurs, sensoriels ou cognitifs (5 % sévères, 9 % modérés et 25 % mineurs) et 34 % ont besoin des soins spéciaux [Larroque et al., 2008]. À l’âge adulte, les risques de déficience médicale et sociale semblent augmenter avec la diminution de l’âge gestationnel à la naissance et, en absence de problèmes médicaux, le niveau scolaire atteint, les revenus et le succès familial diminuent avec le degré de prématurité [Moster et al., 2008]. Les prématurés sont pris en charge dans une USIN où ils sont maintenus dans une couveuse ou incubateur, qui reproduit les conditions de développement fœtal en contrôlant sa température, l’hygrométrie et en limitant l’exposition du nouveau-né à l’environnement extérieur (virus, bactéries, . . . ). Plus la naissance est prématurée, plus longue est la durée d’hospitalisation [Naulaers et al., 2007]. Un monitoring continu est effectué sur des paramètres vitaux comme la température, la respiration, la fonction cardiaque, l’oxygénation et l’activité cérébrale. Les thérapies peuvent inclure la nutrition par cathéters intraveineux, la supplémentation d’oxygène, la ventilation mécanique et les médicaments. Cependant, les USIN impliquent des coûts de santé importants et l’exposition du nouveau-né à différentes sources de stress environnemental (alarmes des moniteurs dans l’USIN, bruit ambiant, . . . ) [Perlman, 2001]. De plus, diverses études montrent l’importance de l’intégration dans le milieu familial pour le développement du nouveau-né. Généralement sont autorisés à quitter
  • 40.
    10 Chapitre 1 l’hôpitalles prématurés qui présentent une bonne thermorégulation, une alimentation orale parfaite et qui ne présentent pas d’apnée-bradycardies dans une période de 3 à 7 jours [Baird, 2004]. La persistance d’événements cardio-respiratoires peuvent retarder la sortie de l’enfant de l’hôpital [Eichenwald et al., 1997]. Dans ce cas, un monitoring cardio-respiratoire à domicile, jusqu’à 43-44 semaines d’âge postnatal, peut offrir une alternative à un séjour prolongé à l’hôpital [Darnall et al., 1997]. 1.2 Les apnées-bradycardies du nouveau-né prématuré L’apnée du prématuré se définit par une interruption prolongée du flux ventilatoire pendant plus de 15 à 20 secondes et témoigne d’une instabilité de la régulation du rythme respiratoire. Elle entraîne alors un ralentissement du rythme cardiaque (bradycardie), une cyanose, témoin de l’hypoxémie, hypoxie et acidose [Bloch et al., 2003]. La bradycardie est définie par une chute de la fréquence cardiaque (FC), au dessous de 100 battements par minute (bpm) ou d’au moins 33 % par rapport à une valeur moyenne, pendant 4 secondes ou plus [Poets et al., 1993]. La bradycardie se produit généralement dans les sept premières secondes de l’apnée et atteint la FC minimale autour de 13 secondes [Di Fiore et al., 2001; Dorostkar et al., 2005]. Les apnées doivent être différenciées de la respiration périodique du prématuré, où des bouffées ventilatoires, d’amplitude progressivement croissante puis décroissante, alternent avec de brèves interruptions qui ne présentent aucun caractère pathologique [Laugel et al., 2000]. La majorité des grands prématurés ont des apnées-bradycardies durant les premières semaines. Cependant, elles disparaissent progressivement au cours de la maturation et ont généralement disparu après 40 SA. D’après HOFSTETTER et al. [Hofstetter et al., 2008], 98 % des prématurés de 25 à 28 SA présentent des épisodes d’apnée et 90 % des épisodes de bradycardie ; à 36 SA, 67 % présentent toujours des épisodes d’apnée et seulement 17 % ont des épisodes de bradycardie. Ces constats laissent suggérer par certains auteurs que le système cardiovasculaire mûrit plus rapidement que le système respiratoire chez les très grands prématurés [Hofstetter et al., 2008]. De plus, 83 % des épisodes de bradycardies sont associés aux épisodes d’apnées [Poets et al., 1993]. Concernant la durée des apnées, 73 % ont une durée de 10-14 secondes, 17 % de 15-19 secondes et 10 % supérieure à 20 secondes [Hofstetter et al., 2008]. L’apnée peut être du type symptomatique si elle provient d’une pathologie (infection, anémie, hypoxie, hypoglycémie, hypothermie, etc.) ou idiopathique si elle est uniquement due à l’immaturité des mécanismes de contrôle de la respiration. En outre, basées sur la présence ou l’absence de mouvements respiratoires, l’apnée est classée dans trois catégories : – Centrale : se produisant en l’absence des mouvements respiratoires ; – Obstructive : se produisant en présence des mouvements respiratoires ;
  • 41.
    1.2. Les apnées-bradycardiesdu nouveau-né prématuré 11 – Mixte : contenant des éléments d’apnée centrale et obstructive. L’observation clinique de l’enfant ou le monitoring cardio-respiratoire continu permettent de détecter uniquement l’apnée centrale, contrairement à l’apnée obstructive, où seule la détection des phénomènes associés, comme la bradycardie et l’hypoxémie, permet de soupçonner sa survenue. Les apnées les plus longues et les plus fréquentes sont souvent mixtes (de 50 à 70 % des cas), les apnées courtes (moins de dix secondes) sont surtout de type central (de 10 à 25 % des cas) et les obstructives sont peu fréquentes (de 12 à 20 % des cas) [Laugel et al., 2000]. Les apnées courtes sont considérées comme non pathologiques car elles ne s’accompagnent habituellement pas de bradycardies ni d’hypoxémie. En revanche, celles qui dépassent les 20 secondes sont considérées comme graves car elles sont suivies par une chute de la saturation, puis de la bradycardie, résultant de l’hypoxémie et dont la profondeur est proportionnelle à la durée de l’apnée. Les apnées-bradycardies du prématuré sont des phénomènes qui reflètent une forme d’inadaptation à la vie extra-utérine. Elles sont liées à l’immaturité physiologique de plusieurs éléments du système respiratoire : centres neuronaux, chémorécepteurs centraux et périphériques, afférences et efférénces réflexes. Elles peuvent aussi être provoquées ou aggravées par l’association d’une infection, hypoxie ou pathologie intracrânienne. D’ailleurs, elles sont plus fréquentes lorsque la température de l’environnement est plus élevée [Tourneux et al., 2008] et lors de sommeils agités (majoritaire chez le prématuré). Même s’il n’existe pas de risque accru de mort subite du nourrisson par la persistance des apnées-bradycardies [Abu-Shaweesh and Martin, 2008], les apnées longues suivies des bradycardies profondes (inférieure à 80 bpm) produisent une chute du débit sanguin cérébrale, une baisse de la pression artérielle, une diminution de l’oxygénation cérébrale et une dépression de l’amplitude de l’électroencéphalogramme (EEG) [Pichler et al., 2003; Urlesberger et al., 1999]. De plus, elles entraînent des modifications de l’oxygénation tissulaire et de l’équilibre hémodynamique. La répétition de ces épisodes est associée à un moins bon devenir neuromoteur à trois ans [Janvier et al., 2004]. Les apnées-bradycardies demeurent un problème clinique préoccupant en néonatalogie, qui impose de nombreux défis dans les stratégies thérapeutiques à suivre. Les thérapies appropriées sont données en raison des mécanismes qui provoquent l’apparition de ces épisodes. Une stimulation cutanée permet, dans la plupart des cas, la rupture des épisodes d’apnée-bradycardie. Des médicaments (comme la théophylline ou la caféine), l’augmentation d’oxygène à l’aide d’une canule nasale, la respiration assistée par pression positive continue (CPAP, Continuous Positive Airway Pressure) et la ventilation mécanique peuvent aussi être employés pour traiter l’apnée-bradycardie, selon sa sévérité. La répétition d’épisodes d’apnée-bradycardie et les risques associés justifient le monitoring continu des fréquences respiratoires et cardiaques et le traitement pharmacologique. Cette surveillance cardio- respiratoire continue permet également d’évaluer l’efficacité de traitements mis en place et de détecter une éventuelle récidive des apnées-bradycardies après l’arrêt des traitements.
  • 42.
    12 Chapitre 1 1.3Les systèmes de monitoring automatisés La fragilité initiale des nouveaux-nés prématurés réclame, en plus d’une attention médicale et l’emploi de techniques adéquates pour maintenir et réguler leurs fonctions de bases, une surveillance continue dans une USIN pendant plusieurs semaines. Peu gênant pour l’enfant, les dispositifs automatisés de surveillance permettent au personnel soignant, d’un seul regard sur un écran, de vérifier les principales fonctions vitales du prématuré (température, fréquences cardiaque et respiratoire, pression artérielle, saturation en oxygène du sang, . . . ) et de prendre rapidement les mesures adaptées à tout instant : stimulation manuelle pour arrêter une apnée-bradycardie, oxygénation, ventilation au masque, voire intubation. Le système de monitoring fait partie de la routine dans les USIN et a contribué énormément à ce qu’un prématuré puisse survivre à un âge gestationnel de plus en plus jeune. Même si ces dispositifs ont progressé énormément en qualité et en fiabilité au cours de ces dernières années et représentent un progrès considérable en matière de sécurité, ils ne remplacent pas l’observation directe sur l’enfant. En effet, ces dispositifs ne sont pas dotés « d’intelligence » (interprétation d’une mesure parasitée qui déclenche une alarme) et présentent des limites (l’alarme ne se déclenchera pas en apnée obstructive si le nourrisson continue de faire l’effort respiratoire). Pour les alarmes, les moniteurs actuellement utilisables pour la surveillance des nouveaux-nés dans les USIN utilisent uniquement des seuils fixes basés sur des a priori, alors que des seuils adaptatifs et relatifs aux variables analysées ont montré des améliorations sur la détection [Cruz et al., 2006; Beuchée et al., 2007]. 1.3.1 L’équipement dans l’USIN Dans une USIN, l’enfant est raccordé à un moniteur qui comprend plusieurs modules d’acquisition des données physiologiques spécifiques et indépendants (i.e. température, électrocardiogramme, respiration, pressions artérielle, saturation d’oxygène (SpO2), acidité gastrique (pH), etc.). Ainsi, le système de monitoring est en général composé de différents éléments (voir figure 1.1 et figure 1.2) : – Un thermomètre qui mesure la température corporelle de l’enfant afin de la maintenir autour de 36,8 oC. Ce thermomètre est appliqué sur la peau du nouveau-né et est relié à un thermostat qui produit de l’air chaud dans la couveuse ; – Trois petites électrodes adhésives collées sur le thorax, abdomen, bras ou jambe qui mesurent la FC et la fréquence respiratoire. 100 et 180 bpm et 25 et 80 cycles par minutes correspondent en général aux valeurs minimales et maximales pour déclencher l’alarme ; – Un brassard gonflé à intervalles réguliers et enroulé autour du bras ou de la jambe, qui permet d’estimer la pression artérielle lorsque le brassard se dégonfle ;
  • 43.
    1.3. Les systèmesde monitoring automatisés 13 – Un capteur fixé à la main ou au pied qui surveille la saturation en oxygène dans le sang dont les seuils inférieur et supérieur d’alarme sont fixés autour de 8 % et 95 % de la valeur nominale ; – Un capteur chauffant attaché sur la peau qui détermine la pression du gaz carbo- nique dissout dans le sang. Les limites inférieure et supérieure sont 35 mmHg et 55 mmHg [Dageville, 2007]. Canule nasale Cathéter artériel Cathéter central périphérique Figure 1.1 – Image d’un prématuré. On peut y voir certains dispositifs de mesure (Reportés sur la figure). Infirmière Moniteur Couveuse Figure 1.2 – Système de monitoring utilisé dans l’USIN de Rennes. De plus, des échantillons de sang peuvent être prélevés à partir d’une veine ou d’une artère. L’imagerie par ultrasons ou par rayons X peut être utilisée pour examiner le cœur, les poumons et d’autres organes internes. D’autres dispositifs de monitoring fournissent des mesures complémentaires mais sont généralement limités à la recherche, telles que la pneumographie d’impédance, la pléthysmographie d’inductance respiratoire et le dioxyde de carbone de fin d’expiration [Atkinson and Fenton, 2009]. Après l’initialisation du système de monitoring, un processus itératif et continu d’ac- quisition des données, d’estimation de l’état de l’enfant, de détection et de validation des
  • 44.
    14 Chapitre 1 événementsà risque et d’application des actions thérapeutiques est mis en place (voir figure 1.3). Ainsi lorsqu’une apnée-bradycardie survient, un membre de l’équipe soignante averti par les alarmes se dirige à la chambre appropriée, se lave les mains et applique une stimulation tactile suffisamment douce pour ne pas être agressive pour l’enfant, telle que frictionner la peau au niveau de la plante du pied ou du thorax, jusqu’à arrêter l’épisode d’apnée-bradycardie. D’ailleurs, plusieurs alarmes peuvent s’activer au moment d’une apnée- bradycardie : l’alarme de respiration si les mouvements respiratoires s’arrêtent, l’alarme d’oxygénation si la quantité d’oxygène dans le sang diminue, ou l’alarme de FC en cas de bradycardie. Détection/ Validation Diagnostic Thérapie Acquisition Figure 1.3 – Cycle de surveillance d’un prématuré dans une USIN 1.3.2 Délais dans le cycle de surveillance Comme nous l’avons relevé, les apnées-bradycardies sont des événements très fréquents qui peuvent mettre l’enfant en danger vital immédiat en absence d’une intervention rapide et adaptée. Par conséquent, le temps entre le début et la fin de l’épisode joue un rôle important. Ce temps peut être décomposé en plusieurs états de duré différentes : i) le début de l’apnée, ii) le début de la bradycardie, iii) le temps nécessaire au diagnostic de l’apnée-bradycardie par le système de monitoring et l’émission de l’alarme sonore, iv) le temps pris par l’équipe soignante pour cesser son activité en cours (les soins d’un autre enfant, se laver les mains afin d’éviter tout risque de contamination, se rendre au chevet du bébé souffrant qui peut être situé dans une autre chambre), et enfin v) l’application de la thérapie (stimulation tactile douce parmi d’autres) jusqu’à l’arrêt l’épisode. Les délais actuellement observés en clinique restent longs pour les bébés en détresse. Plus le temps d’intervention est long plus il est difficile d’arrêter l’épisode d’apnée-bradycardie conduisant ainsi à des problèmes importants et à des conséquences qui peuvent être irréversibles. Le retard d’intervention moyen, mesuré depuis l’activation de l’alarme jusqu’à l’application de la thérapie a été estimé autour de 33 secondes, avec une durée moyenne de stimulation tactile de 13 secondes pour obtenir la résolution de l’événement d’apnée- bradycardie [Pichardo et al., 2003].
  • 45.
    1.4. Généralités dusystème cardiovasculaire 15 Les bénéfices attendus d’une détection précoce de l’épisode d’apnée-bradycardie sont : i) réduire l’ampleur et la durée de l’apnée-bradycardie, ii) diminuer le recours à des thérapies compliquées telles que les manœuvres de réanimation ou d’intubation, iii) limiter les risques et les complications associés à ces épisodes, et iv) raccourcir la durée d’hospitalisation dans l’USIN et le coût lié. 1.4 Généralités du système cardiovasculaire Le système cardiovasculaire est un système composé du cœur et des vaisseaux sanguins. Ce système assure un flux de sang continu aux organes et aux tissus cellulaires du corps pour leur fournir de l’oxygène et des nutriments, évacuer les produits métaboliques générés pendant leur activité et transporter les hormones produites par les glandes endocrines vers les récepteurs. 1.4.1 Le cœur et l’activité électrique cardiaque Le cœur est un organe musculaire situé dans la cavité thoracique qui fonctionne comme une pompe autonome, assurant la progression du sang à l’intérieur des vaisseaux. Il est constitué de quatre cavités contractiles (voir figure 1.4), deux supérieures : les oreillettes gauche et droite qui reçoivent le sang veineux et sont séparées par le septum interauriculaire et deux cavités inférieures : les ventricules gauche et droit, divisés par le septum interventri- culaire, qui assurent l’expulsion du sang respectivement dans la circulation pulmonaire et dans la circulation systémique. Les ventricules sont séparés des oreillettes au moyen des valves auriculo-ventriculaires, formées par des ailerons de tissu connectif. La valve tricuspide sépare l’oreillette et le ventricule droit et la valve mitrale sépare l’oreillette gauche du ventricule gauche. La fonction des valves auriculo-ventriculaires est d’éviter une réentrée du sang aux oreillettes une fois qu’il est arrivé aux ventricules tandis que les valves sigmoïdes (pulmonaire et aortique) évitent le retour du sang vers les ventricules, une fois expulsé vers l’artère pulmonaire et vers l’aorte. Les événements cardiaques qui se produisent depuis le début d’un battement du cœur au début du prochain sont appelés le cycle cardiaque. Le cycle cardiaque est constitué d’une période de relaxation appelé diastole, au cours de laquelle le cœur se remplit de sang, suivie d’une période de contraction appelée systole. La paroi du cœur est composée de muscles en trois couches : 1. Le péricarde est l’enveloppe extérieure du cœur et se compose d’une couche de cellules épithéliales et de tissu conjonctif ;
  • 46.
    16 Chapitre 1 Atriumdroit Atrium gauche Veine cave supérieure Aorte Artère pulmonaire Veine pulmonaire Valve mitrale Valve aortique Ventricule gauche Ventricule droit Veine cave inférieure Valve tricuspide Valve sigmoïde Poumons Figure 1.4 – Structure anatomique du cœur. Image d’après [Guyton and Hall, 1956]. 2. Le myocarde est la couche intermédiaire et se compose majoritairement de fibres contractiles ; 3. L’endocarde se trouve à l’intérieur et se compose d’une couche additionnelle de cellules épithéliales et de tissu conjonctif. Pour accomplir la fonction de pompe, le myocarde est constitué principalement de deux types de tissus : 1. Le tissu de conduction ou tissu nodal : Ce tissu est constitué de cellules présentant des propriétés spécialisées d’excitabilité, de conductibilité et d’automaticité. Ces propriétés permettent la génération régulière et spontanée des impulsions électriques et la conduction de ces impulsions d’une manière organisée au travers du myocarde, afin d’assurer une contraction adéquate et un pompage efficace ; 2. Le tissu myocardique contractile : Ce type de tissu est largement majoritaire et présente aussi des propriétés d’excitabilité et de conductibilité cellulaire. Cependant, à la différence du tissu nodal, il est constitué de cellules pourvues d’un grand nombre de fibres musculaires capables de se contracter. Chaque cellule cardiaque (nodale ou myocardique) est entourée et remplie avec une solution qui contient des ions. Les trois plus importants sont : le sodium (Na+), le potassium (K+) et le calcium (Ca2+). Au repos, l’intérieur de la membrane cellulaire est chargé négativement par rapport à l’extérieur, qui est pris comme référence. Cette différence de potentiel, ou potentiel de repos cellulaire, est voisin de −85 mV pour les cellules ventriculaires et dépend des concentrations ioniques dans les milieux intracellulaire et extracellulaire. Les processus actifs et passifs de mouvements des ions au travers des canaux ioniques, qui traversent la membrane cellulaire, et la propagation de ces ions, cellule à cellule, constituent les fondements de l’activité électrique cellulaire. Quand une impulsion
  • 47.
    1.4. Généralités dusystème cardiovasculaire 17 électrique d’amplitude suffisante arrive à une cellule excitable, l’intérieur de cette cellule devient rapidement positif par rapport à l’extérieur. Ce processus est connu comme la dépolarisation cellulaire. Le retour de la cellule cardiaque stimulée à son état de repos est appelé repolarisation cellulaire. L’enregistrement des différences de potentiel mesurées entre les milieux intracellulaire et extracellulaire, pendant les processus de dépolarisation et repolarisation d’une cellule, correspond au potentiel d’action (PA). Ce dernier est constitué de cinq phases (voir figure 1.5) : 1. La phase 0 ou de dépolarisation rapide : Après une excitation électrique au- dessus du seuil d’activation (ou potentiel liminaire) de la cellule au repos, les potentiels mesurés présentent une inversion rapide de polarité. Cette dépolarisation est générée par l’ouverture transmembranaire qui permet l’entrée passive de Na+ vers le milieu intracellulaire. 2. La phase 1 ou début de la repolarisation : Elle se caractérise par une repolari- sation rapide et de courte durée, due à l’inactivation des canaux Na+ et l’effusion de K+. 3. La phase 2 ou plateau : Pendant cette phase, la repolarisation continue mais à une vitesse très lente. Le plateau est principalement dû à l’ouverture des canaux calciques, qui permettent la diffusion lente et passive du Ca2+ vers l’intérieur de la cellule. 4. La phase 3 ou repolarisation rapide : Elle est caractérisée par une repolarisation majeure, produite par la fermeture des canaux ioniques spécifiques, qui emmène la cellule au potentiel de repos original. Il existe aussi, dans la dernière partie de la phase 3, une activation des canaux de potassium, qui permet l’expulsion active de ces ions, facilitant le retour à la négativité originale du potentiel transmembranaire. 5. La phase 4 : Elle correspond au potentiel de repos, où la cellule devient plus faci- lement excitable. Les caractéristiques de cette phase dépendent du type de cellule concernée. Amplitude(mV) Temps (s) Potentiel liminaire -85 20 PRA PRR 0 0,4 0,8 PRA PRR 0 1 2 3 4 0 1 2 3 Figure 1.5 – Potentiel d’action des cellules cardiaques ventriculaires. La propriété d’excitabilité cellulaire change pendant les différentes phases du PA. Pendant
  • 48.
    18 Chapitre 1 lesphases 0, 1, 2 et la première partie de la phase 3 (usuellement jusqu’aux alentours de −50 mV), une stimulation externe sera incapable de provoquer un nouveau PA. Cette période est appelée la période réfractaire absolue (PRA). La durée de la PRA dépend de la fréquence à laquelle la cellule est stimulée, plus longue pour des fréquences cardiaques plus basses et inversement pour des fréquences de stimulation plus importantes. La période réfractaire relative (PRR) est associée à la dernière partie de la phase 3 (souvent pour des potentiels inférieurs à −50 mV ). Pendant la PRR, une stimulation d’amplitude supérieure à la normale (supra-stimulus) peut provoquer un nouveau PA qui présentera une durée de la phase 0 rallongée en fonction de la prématurité de la stimulation. Ces deux processus d’adaptation de la durée de la PRA et de la phase 0 correspondent aux propriétés d’hystérésis de la fonction cellulaire. 1.4.2 Le système spécialisé d’excitation-conduction du cœur Le système spécialisé d’excitation-conduction comprend : le nœud sinusal, les voies spécialisées internodales, le nœud auriculo-ventriculaire (A-V), le faisceau de His, les branches droite et gauche et les fibres de Purkinje (voir figure 1.6). Les cellules associées à chacune de ces parties du système d’excitation-conduction présentent une pente de dépolarisation diastolique lente (phase 4) différente. Dans le cas physiologique normal, cette pente est plus prononcée sur le nœud sinusal. Ainsi, le nœud sinusal est appelé le pacemaker dominant du cœur. Nœud sinusal Voies spécialisées internodales Nœud A-V Branche droite Faisceau de His Branche gauche Fibres de Purkinje Figure 1.6 – Système spécialisé de conduction du cœur. Image d’après [Guyton and Hall, 1956]. L’activité électrique normale du cœur suit la séquence d’activation suivante : 1. Le nœud sinusal : L’activité électrique est générée spontanément dans le nœud sinusal. Il est situé dans la partie haute de la paroi intérieure de l’oreillette droite, au niveau où débouche la veine cave supérieure. L’impulsion cardiaque initiée dans
  • 49.
    1.5. L’électrocardiogramme dunouveau-né prématuré 19 le nœud sinusal est transmise aux deux oreillettes. Cette activation est facilitée au moyen des voies spécialisées internodales qui relient le nœud sinusal au nœud A-V. 2. Le nœud auriculo-ventriculaire : Il est situé en bas de l’oreillette droite et est constitué de cellules qui présentent une conduction électrique lente. L’activation électrique qui arrive au nœud A-V est physiologiquement ralentie (approximativement 100 ms) avant d’arriver au faisceau de His. Cette propriété physiologique du nœud A-V permet de protéger les ventricules d’un nombre excessif d’activations du nœud A-V et d’activations auriculaires et concède aux oreillettes un temps de vidange plus grand, ce qui optimise la contraction ventriculaire. 3. Le faisceau de His : Il est situé dans la partie haute du septum interventriculaire et ses fibres traversent le tissu connectif (non excitable) qui séparent électriquement les oreillettes des ventricules. Dans les cas normaux, le nœud A-V et le faisceau de His constituent la seule voie de propagation de l’activité électrique cardiaque entre les oreillettes et les ventricules. L’ensemble de ces deux structures est souvent appelé la jonction auriculo-ventriculaire. Le faisceau de His comprend un tronc initial qui se divise en deux branches, droite pour le ventricule droit et gauche pour le ventricule gauche. 4. Les fibres de Purkinje : Les branches du Faisceau de His finissent dans un réseau de fibres qui arrivent dans les parois ventriculaires. Les fibres de Purkinje terminent en anastomoses avec les fibres myocardiques musculaires, facilitant leur excitation. En l’absence de toute stimulation nerveuse ou humorale, le muscle cardiaque est capable de générer sa propre activité électrique, ce qui lui permet de se contracter de manière rythmique. Cette propriété constitue l’automatisme cardiaque, la fréquence cardiaque intrinsèque chez l’homme se situant aux environs de 100 à 120 bpm. 1.5 L’électrocardiogramme du nouveau-né prématuré La direction du flux et l’amplitude des courants électriques générées par les processus de dépolarisation et de repolarisation de l’ensemble des cellules myocardiques peuvent être détectées par des électrodes disposées sur la surface du thorax. Le signal électrique obtenu est appelé un électrocardiogramme (ECG). L’analyse de cette activité électrique s’est révélée comme une technique primordiale pour le diagnostic des maladies cardiovasculaires et constitue un outil fondamental dans le monitoring cardiaque. Les processus de dépolarisation et de repolarisation des structures myocardiques se présentent dans l’ECG comme une séquence de déflections ou d’ondes superposées sur une ligne de potentiel zéro, appelée ligne isoélectrique (voir figure 1.7). L’ordre et la morphologie de ces ondes dépendent d’une part de la structure anatomique d’initiation de l’impulsion
  • 50.
    20 Chapitre 1 électrique(i.e. le nœud sinusal, une structure jonctionelle, . . . ) et d’autre part de la séquence de conduction au travers du myocarde. P Q R S T Segment ST Intervalle PR Intervalle QT Complexe QRS Intervalle RR R Segment PR Figure 1.7 – Ondes, intervalles et segments dans l’ECG. En examinant un ECG, on reconnaît : – La dépolarisation auriculaire : Représentée dans l’ECG par l’onde P. Cette onde se caractérise au niveau spectral par une composante basse fréquence de faible énergie, qui limite souvent son observation dans plusieurs dérivations ECG, spécialement dans des conditions de bruit ; – La repolarisation auriculaire : Représentée par l’onde Ta et de direction opposée à celle de l’onde P. Généralement l’onde Ta n’est pas visible dans l’ECG car elle coïncide avec le complexe QRS d’amplitude plus importante ; – La dépolarisation ventriculaire : Représentée par la déflection de plus grande amplitude de l’ECG. le complexe QRS est constituée de trois ondes consécutives : les ondes Q, R et S, qui sont associées respectivement aux vecteurs moyens d’activations septale, ventriculaire et basale ; – La repolarisation ventriculaire : Reflétée par l’onde T. Outre les formes d’ondes, un battement cardiaque est aussi caractérisé par plusieurs segments et intervalles (voir figure 1.7) : – L’intervalle RR : Il sépare les sommets de deux ondes R consécutives qui définissent la FC instantanée ; – L’intervalle PR : Il est mesuré entre le début de l’onde P et le début du complexe QRS. Cet intervalle représente le temps de conduction de l’activité électrique des oreillettes aux ventricules ; – Le segment PR : C’est la période temporelle comprise entre la fin de l’onde P
  • 51.
    1.5. L’électrocardiogramme dunouveau-né prématuré 21 et le début du complexe QRS. Il représente le temps de transmission du front de dépolarisation par le nœud auriculo-ventriculaire ; – Le segment ST : Il est compris entre la fin du complexe QRS (ou point J) et le début de la phase ascendante de l’onde T. Ce segment correspond au temps pendant lequel l’ensemble des cellules myocardiques sont dépolarisées (phase de plateau) et donc, dans le cas normal, doit être isoélectrique ; – L’intervalle QT : Il représente le temps entre le début du complexe QRS et la fin de l’onde T. Il donne une indication de la longueur des phases de dépolarisation et de repolarisation ventriculaire (longueur moyenne d’un PA ventriculaire). L’intervalle QT varie en fonction de la FC. Par conséquent il est généralement corrigé (QTc), le plus souvent en utilisant la formule de BAZETT [Bazett, 1920] : QTc = QT/ √ RR (1.1) Une naissance prématurée est un bouleversement pour le système cardiovasculaire. En effet, chez le prématuré, les fermetures des shunts foramen ovale et du canal artériel peuvent ne pas être complètes, laissant une communication entre les circuits droit et gauche du cœur. Dans ce cas, une partie du débit sanguin dans l’aorte va retourner vers l’artère pulmonaire et, pour assumer la surcharge de débit engendrée par cette fuite, une augmentation du débit cardiaque doit se produire [Dageville, 2007]. Cependant, le myocarde du prématuré contient moins d’éléments contractiles et est plus compliant que celui de l’adulte. La réponse aux changements de précharge (mécanisme de Frank-Starling) reste donc fonctionnelle seulement dans une plage étroite de pression de fin de diastole du ventricule gauche [Kirkpatrick et al., 1976]. Pour satisfaire l’augmentation de la demande d’oxygène du corps du prématuré, la FC est doublée, mais les dépenses cardiaques engendrées sont deux fois supérieures à celles de l’adulte, dû en partie à cette contractilité réduite. Ainsi, la FC d’un prématuré est aux alentours de 150 bpm. Si l’électrocardiogramme de l’adulte a été très étudié tant sur l’analyse de la morphologie des ondes (P, QRS, T), des intervalles temporels (PR, QT) que des durées (P, QRS, T), ce qui a permis d’établir des normes avec l’âge, l’ECG du prématuré est moins connu. La FC très élevée, le faible épaisseur de la cage thoracique et le processus de dévelop- pement du système cardio-respiratoire et du myocarde chez les nouveaux-nés prématurés produisent des ECG très différents de ceux des adultes normaux. Les différences les plus remarquables sont : – Les intervalles (RR, PR et QT) et les durées des ondes (P, T et complexe QRS) sont plus courts ; – La taille du ventricule droit est plus épaisse que le ventricule gauche chez les nouveaux- nés tandis que le ventricule gauche est beaucoup plus épais chez les adultes. Cette prédominance du ventricule droit s’exprime dans l’ECG par une déviation axiale du
  • 52.
    22 Chapitre 1 complexeQRS vers la droite (entre 65o et 174o) [Costa et al., 1964; Park, 2007] ; – Les ondes R sont de plus grande amplitude dans la dérivation frontale aVR (voltage unipolaire augmentée sur le bras droit) et dans les dérivations précordiales V4 (5e espace intercostal gauche, sur la ligne médioclaviculaire), V1 (4e espace intercostal droit, bord droit du sternum) et V2 (4e espace intercostal gauche, bord gauche du sternum). – Les ondes S sont plus profondes dans la dérivation frontale I (mesure bipolaire entre bras droit et bras gauche) et dans les dérivations précordiales V5 (même horizontale que V4, ligne axillaire antérieure) et V6 (même horizontale que V4, ligne axillaire moyenne). – L’intervalle QTc est prolongé chez les prématurés [Costa et al., 1964]. Au cours des 6 premiers mois de vie, l’intervalle QTc est considéré comme normal à moins de 0,49 secondes. Après l’enfance, ce seuil est généralement de 0,44 secondes [Sharieff and Rao, 2006]. – Les modifications de l’onde T sur l’ECG ont tendance à être non spécifiques et sont souvent une source de controverses. On convient que les ondes T plates ou inversées sont normales. En fait, les ondes T dans les dérivations V1 à V3 sont généralement inversées après la première semaine de vie jusqu’à l’âge de 8 ans [Sharieff and Rao, 2006]. – L’onde P est de plus grande amplitude et plus pointue dans la dérivation frontale II (mesure bipolaire entre bras droit et jambe gauche) et la dérivation précordiale V1 [Costa et al., 1964]. La figure 1.8a présente un exemple d’ECG d’un adulte. Cet ECG correspond à une personne sédentaire, sans complication cardiaque, de sexe masculin et âgé de 20 ans. Sa FC est d’environ 82 bpm. De même, un exemple d’ECG d’un nouveau-né prématuré est montré figure 1.8b. Cet ECG correspond à celui d’un bébé de sexe masculin, de 32 semaines d’âge gestationnel et de 1575 grammes de poids. Il présentait plus d’une bradycardie par heure, n’avait pas d’infection systémique, pas de traitement médicamentaux à la caféine et n’avait pas besoin de respiration assistée par CPAP. L’examen de ces deux ECG montre explicitement ces différences, qui sont quantifiées et résumées dans le tableau 1.1 qui reporte les valeurs des ECG normaux pédiatriques observés chez les nouveaux-nés, nourrissons, enfants et adolescents [Sharieff and Rao, 2006]. Ce tableau présente la gamme des valeurs normales de la FC, l’axe du complexe QRS, la durée de l’intervalle PR et la durée du complexe QRS. Des changements rapides se produisent dans la première année de vie en raison de l’évolution de la circulation et de la physiologie cardiaque. Après l’enfance, les changements ultérieurs sont moins rapides jusqu’à la fin de l’adolescence et à l’âge adulte.
  • 53.
    1.6. Conclusion 23 00.5 1 1.5 2 2.5 3 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 Amplitude(mV) Temps (s) (a) ECG d’un adulte 0 0.5 1 1.5 2 2.5 3 −0.5 0 0.5 1 Amplitude(mV) Temps (s) (b) ECG d’un nouveau-né prématuré Figure 1.8 – Exemples des ECG. Tableau 1.1 – Valeurs normales de l’ECG pédiatrique par âge. Âge FC (bpm) Axe QRS (degré) Intervalle PR (s) Intervalle QRS (s) 1re semaine 90–160 60–180 0,08–0,15 0,03–0,08 1–3 semaines 100–180 45–160 0,08–0,15 0,03–0,08 1–2 mois 120–180 30–135 0,08–0,15 0,03–0,08 3–5 mois 105–185 0–135 0,08–0,15 0,03–0,08 6–11 mois 110–170 0–135 0,07–0,16 0,03–0,08 1–2 ans 90–165 0–110 0,08–0,16 0,03–0,08 3–4 ans 70–140 0–110 0,09–0,17 0,04–0,08 5–7 ans 65–140 0–110 0,09–0,17 0,04–0,08 8–11 ans 60–130 -15–110 0,09–0,17 0,04–0,09 12–15 ans 65–130 -15–110 0,09–0,18 0,04–0,09 >16 ans 50–120 -15–110 0,12–0,20 0,05–0,10 1.6 Conclusion Les apnées-bradycardies représentent une préoccupation quotidienne pour les soignants des unités des soins intensifs néonatals. Elles surviennent en effet très fréquemment chez les nouveaux-nés prématurés, avec une fréquence d’autant plus élevée que l’âge gestationnel est faible, témoignant d’une immaturité du système cardio-respiratoire. Elles mettent le nouveau-né en danger vital car l’oxygénation et la perfusion tissulaire sont compromises et imposent parfois des choix thérapeutiques difficiles. Elles sont susceptibles d’affecter le développement à long terme, prolonger la période d’hospitalisation et imposent parfois une télésurveillance à domicile.
  • 54.
    24 Chapitre 1 L’impossibilitéde ne prévenir ni les apnées-bradycardies, ni leurs conséquences, impose une surveillance cardio-respiratoire rigoureuse et continue qui permet une intervention rapide et adaptée à tout instant. La détection précoce de ces épisodes permettrait de réduire les risques associés, de favoriser le développement des nouveaux-nés prématurés, d’améliorer leur qualité de vie et de diminuer la durée d’hospitalisation. En effet, le traitement médical de première intention consiste en la stimulation douce et manuelle du bébé. Même si cette stimulation du nouveau-né au moment de l’apnée-bradycardie reste la méthode la plus efficace, l’expérience montre que pour les bébés en détresse, les délais d’interventions restent longs avec un retard d’intervention moyen (mesuré depuis l’activation de l’alarme jusqu’à l’application de la thérapie) autour de 33 secondes, et un temps de stimulation manuelle de 13 secondes pour terminer l’épisode apnéique [Pichardo et al., 2003]. Pour répondre à ce problème, des systèmes de stimulation vibrotactile, aussi sûrs et efficaces que la stimulation manuelle, ont été développés récemment [Pichardo et al., 2003; Beuchée et al., 2007]. Cependant, les délais d’interventions sont finalement peu réduits car le temps nécessaire au diagnostic de la bradycardie (10 secondes en moyenne après le début de l’apnée) n’est pas pris en compte. Une manière de réduire encore ce temps est de proposer un méthode de détection précoce des événements de bradycardie voire de prédire l’apparition de la bradycardie. Ces objectifs constituent le thème principal de recherche de ce mémoire de thèse et des solutions à base de modèles de Markov cachés seront proposées au chapitres 4 et 5. On a vu également que la compréhension des changements physiologiques cardiaques associés à l’âge et à la maturation ainsi que la capacité d’interpréter l’ECG (durée des segments et intervalles, déviations d’axes et morphologies des ondes) et sa relation avec l’âge, sont des outils très importants au moment de différencier les ECG normaux des ECG pathologiques. Le chapitre 3 permettra de répondre à cette problématique difficile.
  • 55.
    Bibliographie 25 Bibliographie Abu-Shaweesh, J.M. and Martin, R. J. (2008). Neonatal apnea : what’s new ? Pediatr Pulmonol, 43(10) :937–44. Atkinson, E. and Fenton, A. C. (2009). Management of apnoea and bradycardia in neonates. Paediatrics and Child Health, 19(12) :550–554. Baird, T. M. (2004). Clinical correlates, natural history and outcome of neonatal apnoea. Semin Neonatol, 9(3) :205–11. Bazett, H. (1920). An analysis of the time-relations of electrocardiograms. Heart, 7 :353–370. Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu- rity. Physiological Measurement, 32 :523. Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré. IRBM, 28(3-4) :124–130. Bloch, H., Lequien, P., and Provasi, J. (2003). L’enfant prématuré. Armand Colin. Costa, A. F., Faul, B. C., Ledbetter, M. K., and Oalmon, M. C. (1964). The electrocardio- gram of the premature infant. American Heart Journal, 67(1) :4–14. Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in Cardiology, volume 33, pages 473–476. Dageville, C. (2007). Le début de la vie d’un grand prématuré expliqué à ses parents. Erès. Darnall, R. A., Kattwinkel, J., Nattie, C., and Robinson, M. (1997). Margin of safety for discharge after apnea in preterm infants. Pediatrics, 100(5) :795–801. Di Fiore, J. M., Arko, M. K., Miller, M. J., Krauss, A., Betkerur, A., Zadell, A., Kenney, S. R., and Martin, R. J. (2001). Cardiorespiratory events in preterm infants referred for apnea monitoring studies. Pediatrics, 108(6) :1304–8. Dorostkar, P. C., Arko, M. K., Baird, T. M., Rodriguez, S., and Martin, R. J. (2005). Asystole and severe bradycardia in preterm infants. Biol Neonate, 88(4) :299–305. Eichenwald, E., Aina, A., and Stark, A. (1997). Apnea frequently persists beyond term gestation in infants delivered at 24 to 28 weeks. Pediatrics, 100(3) :354. Finer, N. N., Higgins, R., Kattwinkel, J., and Martin, R. J. (2006). Summary proceedings from the apnea-of-prematurity group. Pediatrics, 117(3 Pt 2) :S47–51. Goldenberg, R., Culhane, J., Iams, J., and Romero, R. (2008). Epidemiology and causes of preterm birth. The Lancet, 371(9606) :75–84. Guyton, A. and Hall, J. (1956). Textbook of medical physiology. Saunders, 11 edition. Hofstetter, A. O., Legnevall, L., Herlenius, E., and Katz-Salamon, M. (2008). Cardiorespira- tory development in extremely preterm infants : vulnerability to infection and persistence of events beyond term-equivalent age. Acta Paediatr, 97(3) :285–92.
  • 56.
    26 Bibliographie Janvier, A.,Khairy, M., Kokkotis, A., Cormier, C., Messmer, D., and Barrington, K. J. (2004). Apnea is associated with neurodevelopmental impairment in very low birth weight infants. J Perinatol, 24(12) :763–8. Kirkpatrick, S. E., Pitlick, P. T., Naliboff, J., and Friedman, W. F. (1976). Frank-starling re- lationship as an important determinant of fetal cardiac output. Am J Physiol, 231(2) :495– 500. Larroque, B., Ancel, P.-Y., Marret, S., Marchand, L., André, M., Arnaud, C., Pierrat, V., Rozé, J.-C., Messer, J., Thiriez, G., Burguet, A., Picaud, J.-C., Bréart, G., Kaminski, M., and group group group group, E. S. (2008). Neurodevelopmental disabilities and special care of 5-year-old children born before 33 weeks of gestation (the epipage study) : a longitudinal cohort study. Lancet, 371(9615) :813–20. Laugel, V., Belladdale, J., Escande, B., Messer, J., and Simeoni, U. (2000). Apnées du nouveau-né prématuré. Journal de Pédiatrie et de Puériculture, 13(2) :67–71. Martin, J., Hamilton, B., Sutton, P., Ventura, S., Menacker, F., Kirmeyer, S., and Mathews, T. (2009). Births : Final data for 2006. Public Health Resources, page 65. Mathews, T. J. and MacDorman, M. F. (2008). Infant mortality statistics from the 2005 period linked birth/infant death data set. Natl Vital Stat Rep, 57(2) :1–32. Moster, D., Lie, R. T., and Markestad, T. (2008). Long-term medical and social consequences of preterm birth. N Engl J Med, 359(3) :262–73. Naulaers, G., Daniels, H., Allegaert, K., Rayyan, M., Debeer, A., and Devlieger, H. (2007). Cardiorespiratory events recorded on home monitors : the effect of prematurity on later serious events. Acta Paediatr, 96(2) :195–8. Park, M. (2007). Pediatric cardiology for practitioners. Perlman, J. M. (2001). Neurobehavioral deficits in premature graduates of intensive care– potential medical and neonatal environmental risk factors. Pediatrics, 108(6) :1339–48. Pichardo, R., Adam, J. S., Rosow, E., Bronzino, J., and Eisenfeld, L. (2003). Vibrotactile stimulation system to treat apnea of prematurity. Biomed Instrum Technol, 37(1) :34–40. Pichler, G., Urlesberger, B., and Müller, W. (2003). Impact of bradycardia on cerebral oxygenation and cerebral blood volume during apnoea in preterm infants. Physiol Meas, 24(3) :671–80. Poets, C. (2010). Apnea of prematurity : What can observational studies tell us about pathophysiology ? Sleep Medicine, 11(7) :701–707. Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7. Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc, 2007 :3288–91. Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages 725–728. IEEE.
  • 57.
    Bibliographie 27 Rosenberg, T.,Garbers, S., Lipkind, H., and Chiasson, M. (2005). Maternal obesity and diabetes as risk factors for adverse pregnancy outcomes : differences among 4 racial/ethnic groups. American Journal of Public Health, 95(9) :1545. Sharieff, G. Q. and Rao, S. O. (2006). The pediatric ecg. Emergency Medicine Clinics of North America, 24(1) :195–208. Tourneux, P., Cardot, V., Museux, N., Chardon, K., Léké, A., Telliez, F., Libert, J.-P., and Bach, V. (2008). Influence of thermal drive on central sleep apnea in the preterm neonate. Sleep, 31(4) :549–56. Urlesberger, B., Kaspirek, A., Pichler, G., and Müller, W. (1999). Apnoea of prematurity and changes in cerebral oxygenation and cerebral blood volume. Neuropediatrics, 30(1) :29–33. Zeitlin, J. (2009). Surveillance et évaluation de la santé périnatale en île-de-france à partir des certificats de santé. Bulletin épidémiologique hebdomadaire, (44-45). Zhao, J., Gonzalez, F., and Mu, D. (2011). Apnea of prematurity : from cause to treatment. European journal of pediatrics, pages 1–9.
  • 59.
    Chapitre 2 Position duproblème et démarche proposée Comme mentionné dans le chapitre 1, les apnées-bradycardies sont un problème fré- quemment observé chez les nouveaux-nés prématurés. Leur durée, profondeur et répétition dépendent de plusieurs facteurs : l’âge gestationnel, le poids, la présence d’infection et aussi le délai entre le début de l’épisode et l’intervention par l’équipe soignante. Une haute fréquence de ces épisodes peut conduire à des complications à court terme et affecter le développement neurologique de l’enfant. C’est pourquoi, dans les USIN, les dispositifs de monitoring cardio-respiratoires sont utilisés pour surveiller l’enfant et détecter les épisodes d’apnée-bradycardie le plus précocement possible. Plusieurs définitions de bradycardie sont proposées dans la pratique clinique néonatale. Ces définitions sont toutes basées sur l’analyse de la FC de l’enfant ou la série chronologique RR 1, déterminée par le moniteur cardio-respiratoire. Généralement, deux paramètres sont utilisés pour détecter les bradycardies : un seuil δ et un paramètre de durée τ. Ainsi, une bradycardie est détectée lorsque l’intervalle RR dépasse δ pendant un temps τ. Ces paramètres sont souvent modifiés empiriquement en se basant sur des connaissances a priori, comme par exemple, les caractéristiques physiologiques de l’enfant (âge gestationnel, poids), les caractéristiques pathologiques (présence ou absence d’infection), l’historique des épisodes et l’évolution de l’enfant. Évidemment, la modification de ces paramètres a une conséquence directe sur la quantité de fausses détections (spécificité élevée), le nombre d’épisodes non détectés (sensibilité élevée) et le retard de la détection. La difficulté du problème, comme mentionné dans la conclusion du précèdent chapitre, réside dans le fait que ces temps de détection restent encore trop longs. L’objectif de ce chapitre est de proposer une méthode de détection présentant un compromis optimal 1. La durée du cycle cardiaque en secondes est : RR = 60/FC, où FC est donnée en bpm. 29
  • 60.
    30 Chapitre 2 entresensibilité, spécificité et retard à la détection. Dans la première section, une analyse des travaux antérieurs sur ce problème et, en particulier, ceux développés au sein de nos laboratoires : GBBA (Université Simón Bolívar, Caracas) et LTSI (Université de Rennes 1, Rennes) est présentée. Ensuite, la méthodologie proposée pour la détection d’événements et pour l’évaluation clinique des traitements proposés dans ce travail est détaillée et justifiée. Finalement, la méthodologie d’évaluation des performances de détection est exposée. 2.1 Travaux antérieurs L’équipe SEPIA (Surveillance, Explication et Prévention des Ischémies et des Arythmies cardiaques) du LTSI (Laboratoire de Traitement du Signal et de l’Image), travaille sur cette problématique depuis plusieurs années. Les travaux de l’équipe se concentrent principalement sur la modélisation du système nerveux autonome (SNA) et le monitoring des apnées- bradycardies du prématuré. Plus spécifiquement, l’équipe s’intéresse à étudier : – L’influence du SNA du nouveau-né prématuré sur la FC [Pladys et al., 2008; Beuchée, 2005]. Cette influence est déterminée en évaluant la variabilité de la fréquence cardiaque (VFC) par deux types de mesure : l’une dans le domaine temporel et l’autre dans le domaine spectral. – Le système cardio-respiratoire de l’agneau fœtal ou nouveau-né [Gaillot et al., 2005; Pladys et al., 2008; Patural et al., 2010] en collaboration avec le Québec (Sherbrooke et Montréal). En effet, en menant des études sur l’agneau fœtal, les chercheurs ont réussi à mieux comprendre le phénomène d’apnée-bradycardie des nouveaux-nés prématurés. – La relation entre les apnées-bradycardies et les infections [Beuchée et al., 2009], ainsi que sa relation avec les vaccins. – Le traitement de la bradycardie par stimulation kinesthésique après la détection des épisodes de bradycardies [Beuchée et al., 2007]. – La modélisation et la validation de modèles sur des données animales, pour mieux comprendre les mécanismes complexes du couplage cardio-respiratoire du nouveau- né [Le Rolle et al., 2008]. Une thèse est également en cours actuellement au laboratoire sur ce sujet. – L’EEG du prématuré de façon à quantifier les temps de sommeil calme, les effets des médicaments. – Un système de monitoring intégrant tous ces modules basés sur une architecture multi- agents [Cruz, 2007; Hernández et al., 2007a,b]. La partie détection de bradycardie est actuellement en évaluation dans le cadre d’un projet PHRC sur trois centres hospitaliers : Rennes, Nantes et Tours. Concernant la détection des apnées-bradycardies chez les nouveaux-nés prématurés, de nombreuses études ont été réalisées et sont sommairement présentées dans la section suivante.
  • 61.
    2.1. Travaux antérieurs31 2.1.1 Détection de bradycardies En pratique, dans les USIN la détection des bradycardies est réalisée en se basant sur les trois définitions suivantes : 1. Détection par seuil d’amplitude fixe : Ce principe consiste à détecter une bra- dycardie tout simplement quand l’intervalle RR instantané (RR(k) où k est l’indice temporel) dépasse un seuil prédéfini. Toutefois, plusieurs problèmes se posent avec cette méthode. Tout d’abord, en augmentant le seuil, le nombre des fausses détections sont diminuées au détriment du nombre d’épisodes de bradycardie non détectés et vice-versa. Par conséquent, c’est une méthode peu robuste, en raison du compromis entre les quantités des fausses détections et les quantités des non détections. De plus, un simple faux négatif du détecteur des battements entraînera une détection de bradycardie et il convient de souligner que les caractéristiques particulières de l’ECG des prématurés produisent plusieurs faux négatifs et faux positifs dans l’étape de détection des battements. En cas de détection, il existe d’emblée un retard, mesuré entre le début de l’épisode et l’instant de croisement du seuil, comme l’illustre la figure 2.1. Dans l’exemple montré dans cette figure, deux détections différentes de l’épisode sont obtenues avec ce détecteur. 0 20 40 60 80 100 120 200 300 400 500 600 700 800 900 1000 Bradycardie Détection 1 Seuil RR(ms) Temps (s) Détection 2 Retard1 Retard 2 Figure 2.1 – Utilisation d’un seuil d’amplitude fixe pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection se fait lorsque RR(k) ≥ 600 ms, où k est l’indice temporel. 2. Détection par seuil d’amplitude et durée fixe : Cette méthode est une amé- lioration de la méthode précédente et consiste à détecter une bradycardie lorsque l’intervalle RR(k) dépasse le seuil prédéfini pendant un temps également prédéfini, ces deux paramètres étant aussi fixés sur des a priori. Cette méthode est la plus utilisée par les systèmes de monitoring actuels et par les spécialistes. Elle permet de prendre en compte uniquement les bradycardies significatives et profondes. D’ailleurs,
  • 62.
    32 Chapitre 2 leparamètre temporel a plusieurs effets sur la détection. Un effet positif, puisqu’il permet la diminution du nombre de fausses détections comme par exemple celles dues aux faux négatifs du détecteur des battements, tout en gardant la même quantité de non détection de la méthode précédente. Cependant, cette méthode induit des retards plus importants à la détection. La figure 2.2 montre un exemple en utilisant cette méthode et permet d’apprécier (figure 2.1) l’augmentation du retard de la détection. 0 20 40 60 80 100 120 200 300 400 500 600 700 800 900 1000 Bradycardie Seuil RR(ms) Temps (s) Détection Retard 4 s Figure 2.2 – Utilisation d’un seuil d’amplitude et durée fixes pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 600 ms pendant 4 secondes, où k est l’indice temporel. 3. Détection par seuil d’amplitude relatif : Du fait que la durée du cycle cardiaque dépend en grande partie de l’âge gestationnel et que cette durée évolue au cours du temps, même pendant la journée, une nouvelle méthode a été proposée de manière à prendre en compte des changements dans l’intervalle RR par rapport au seuil qui change au cours du temps [Poets et al., 1993]. Dans cette méthode, une bradycardie est détectée lorsque l’intervalle RR instantané (RR(k)) dépasse le seuil relatif : un pourcentage de l’intervalle RR moyenné dans une fenêtre glissante (RRbase) et qui précède l’intervalle RR actuel. De plus, un paramètre temporel est utilisé afin de réduire la quantité de fausses détections. Le nombre des fausses détections et d’épisodes manqués ainsi que le retard de la détection sont ajustés en changeant : le pourcentage du seuil, la taille de la fenêtre pour déterminer la moyenne de l’intervalle RR et le temps passé au-dessus du seuil. Cette méthode est plus avantageuse que les méthodes précédentes. En effet, puisque le seuil est adaptatif, la détection est moins sensible aux changements de rythme basal du prématuré. En revanche, la taille de la fenêtre pour déterminer la moyenne modifie la dynamique du seuil (son taux de changement) et en conséquence : i) en cas de changement rapide de l’intervalle RR, la détection peut être réalisée plus précocement qu’en utilisant un seuil fixe mais, ii) en cas de changement lent, la détection peut être réalisée plus tardivement ou l’épisode peut être manqué.
  • 63.
    2.1. Travaux antérieurs33 La figure 2.3 montre un exemple de détection d’un épisode de bradycardie en utilisant un seuil relatif. Le seuil est fixé à 33 % de la moyenne des intervalles RR dans une fenêtre glissante de 20 secondes qui précèdent l’intervalle RR actuel. La détection est réalisée lorsque l’intervalle RR instantané dépasse le seuil relatif pendant au moins 4 secondes : RR(k) ≥ 1, 33RRbase. Les changements du seuil au cours du temps sont clairement observés. On constate aussi que l’instant de détection est plus précoce que ceux de l’exemple reporté sur la figure 2.2. 0 20 40 60 80 100 120 200 300 400 500 600 700 800 900 1000 1100 Temps (s) Seuil RR(ms) Détection 4 s Retard Bradycardie Figure 2.3 – Utilisation d’un seuil relatif pour détecter les bradycardies à partir des séries RR. Dans cet exemple, la détection est réalisée lorsque RR(k) ≥ 1, 33RRbase pendant 4 s, où k est l’indice temporel et RRbase est la valeur moyenne de la série RR calculée dans une fenêtre glissante de 20 secondes qui précède l’intervalle RR actuel. La simplicité de ces trois détecteurs et la diminution du nombre de fausses alarmes (spécificité élevée) ont permis de les voir acceptées facilement par les spécialistes. Cependant, ces méthodes sont peu robustes. Plusieurs bradycardies ne sont pas détectées ou que tardivement. Des améliorations ont donc été apportées. Une première approche sur la prédiction à court terme de l’épisode de bradycardie chez les nouveaux-nés prématurés, en utilisant la fouille de données, a été introduite par PRAVISANI et al. [Pravisani et al., 2003]. Des mesures linéaires et non linéaires de la VFC ont été extraites sur des périodes de 3 minutes précédant le début de la bradycardie jusqu’au début de l’épisode, en utilisant une fenêtre glissante de 20 secondes et un recouvrement de 15 secondes. Les mesures linéaires analysées correspondent à l’énergie dans les bandes de basse fréquence (LF, Low Frequency) et haute fréquence (HF, High Frequency) et le coefficient LF/HF [Task Force, 1996]. Les mesures non linéaires explorées correspondent aux mesures de l’entropie approximée et l’entropie spectrale [Rezek and Roberts, 1998]. L’évolution de ces paramètres a été étudiée par analyse en composante principale (ACP) et analyse hiérarchique ascendante [Ward, 1963]. Sur un ensemble de 13 épisodes appartenant à 5 nouveaux-nés prématurés, ils ont constaté une diminution du coefficient LF/HF avant le
  • 64.
    34 Chapitre 2 débutde la bradycardie et une diminution simultanée du composant LF, montrant ainsi une réduction de la modulation sympathique et une augmentation du tonus vagal. De plus, une diminution progressive de l’entropie approximée et de l’entropie spectrale a été observée, montrant ainsi que le système est de plus en plus régulier et prévisible avant la bradycardie. En outre, des profils d’évolution de la VFC en utilisant l’ACP ont été mis en évidence pour 10 épisodes mais il n’a pas été possible d’identifier une description unique des classes. Ces résultats montrent qu’aucun des paramètres étudiés étaient capables à lui seul de prédire la survenue d’une bradycardie. Cependant il semblait que chaque variable contribue à la prédiction de l’événement. Une autre étude consiste à utiliser la théorie des changements abrupts de valeur moyenne [Basseville and Nikiforov, 1993] pour proposer une nouvelle méthode de dé- tection des bradycardies [Beuchée et al., 2007]. La détection de changement de valeur moyenne est faite à partir du Cusum test [Basseville and Nikiforov, 1993] et consiste à confronter deux hypothèses composites : présence et absence de bradycardie à chaque instant. Cette méthode détecte avec une sensibilité de 96,84 %, une spécificité de 96,60 % et un retard à la détection de -2,85 battements (autour de 1,2 secondes) par rapport aux annotations manuelles d’un expert (test réalisé sur 1188 battements en bradycardie chez 40 nouveaux-nés prématurés) [Cruz et al., 2006]. La valeur négative du retard à la détection obtenue s’explique par le fait que l’annotation a été définie à l’instant de croisement du seuil de 600 ms et non pas au tout début de l’événement d’apnée-bradycardie. Une autre méthode, basée sur la fusion optimale de détecteurs, a permis d’améliorer la performance de la détection des bradycardies [Cruz et al., 2006]. Les algorithmes fusionnés correspondent aux méthodes de seuil et de durée fixe (RR(k) ≥ 600 ms pendant 4 s ou plus), de seuil relatif (RR(k) ≥ 1, 33RRbase pendant 4 s ou plus) et de détection par changements abrupts. La fusion optimale consiste à effectuer la somme pondérée des résultats de chaque détecteur. Les coefficients de pondération sont trouvés en utilisant un critère d’optimisation proposé par [Chair and Varshney, 1986]. Cet algorithme a obtenu une sensibilité de 97,67 %, une spécificité de 97,00 % et un retard à la détection de -2,22 battements (autour de 1 seconde) sur la même base de données. D’autres algorithmes ont été proposés dans la littérature. L’un d’entre eux utilise la méthode présentée par YU et al. [Yu et al., 2002] qui cherche un changement abrupt dans la valeur moyenne dans une fenêtre mobile pour détecter la bradycardie [Portet et al., 2007]. Une sensibilité de 90,20 %, une valeur prédictive positive de 61,30 % ainsi qu’un temps de retard médian de 8 secondes et d’écart-type de 35,3 secondes pour le début de la bradycardie, ont été reportés sur une base de données annotée. Une autre façon de détecter les bradycardies est d’appliquer une technique d’apprentissage automatique par arbre de décision. Dans [Portet et al., 2007], la méthode C4.5 [Quinlan, 1993] est utilisée pour apprendre l’arbre de décision dont les attributs sont : la valeur brute, la superficie, la pente linéaire, l’écart-type, l’amplitude minimale, l’amplitude maximale, la
  • 65.
    2.1. Travaux antérieurs35 dérivée maximale, la moyenne et la médiane de la série RR. Une fois appris, la sortie de l’arbre de décision est lissée par une fenêtre Blackman de 31 échantillons et les début et fin des épisodes sont cherchés par comparaison à un seuil. Une sensibilité de 78,20 %, une valeur prédictive positive de 68,70 %, un temps de retard médian de 7 secondes et un écart-type de 8,5 secondes, ont été obtenus. Récemment, une approche fondée sur l’intervalle RR, la fréquence respiratoire et la SpO2, extraites de 2426 heures d’enregistrement de 54 nouveaux-nés (44±7 heures) a été proposée pour la détection d’apnée du prématuré sur des segments préalablement choisis [Belal et al., 2011]. Trois approches, combinant détection et classification, ont été reportées et comparées. Les auteurs montrent alors qu’en exploitant les dérivées de l’intervalle RR, de la fréquence respiratoire et de la SpO2, initialement pré-traitées (un filtre médian et un filtre passe-bas sont appliqués sur les données) et une règle de fusion à base d’un ET logique, des performances très satisfaisantes (100 % de sensibilité et 96,19 % de spécificité) sont enregistrées sur une base de données pré-sélectionnées. Les résultats reportés ici, établis en parallèle à l’étude reportée dans ce mémoire de thèse, sont donc intéressants, confirment le bien-fondé de notre démarche mais appellent à quelques remarques : – la classification de l’évènement « présence » ou « absence » d’apnée du prématuré a été déterminée sur des segments prédéfinis et non pas en proposant d’effectuer la détection en ligne, – le temps de retard de la détection n’a pas été évalué, et comme précisé auparavant, est crucial pour notre étude, – la fréquence d’échantillonnage de 1 Hz apparaît à nos yeux trop basse pour l’analyse de la série RR, car il a été montré des composantes spectrales liées à la régulation du SNA dans les bandes LF de 0,02 à 0,2 Hz et HF de 0,2 à 1,5 Hz [Chatow et al., 1995; Beuchée, 2005], – une fusion de type ET augmente la sensibilité en détriment de la spécificité alors que des études antérieures ont montré que la fusion optimale pourrait être plus pertinente [Cruz et al., 2006]. 2.1.2 Système multi-agents de monitoring appliqué aux soins néonatals La thèse de CRUZ [Cruz, 2007], développée entre le Groupe de Bio-ingénierie et Biophysique appliquée (GBBA, en espagnol Grupo de Bioingeniería y Biofísica Aplicada) à Caracas au Vénézuela et le LTSI à Rennes, a proposé un système de monitoring intelligent (INTEM) basé sur une architecture de systèmes multi-agents. Ce système est composé de plusieurs agents intelligents qui interagissent selon certaines relations et avec un objectif. Ainsi, dans ces travaux, quatre agents sont utilisés pour accomplir les tâches classiques du processus de monitoring : acquisition, traitement, diagnostic et thérapie. Un agent différent est associé à chacune de ces étapes.
  • 66.
    36 Chapitre 2 Lesystème de monitoring est composé de plusieurs dispositifs (c.f. figure 2.4) : – Un dispositif d’acquisition de données qui acquiert un ECG de deux voies à une fréquence d’échantillonnage de 1 kHz. Ce dispositif est lié par signal radio-fréquence au dispositif qui délivre la stimulation et à celui qui capte la lumière du moniteur. De plus, il est aussi connecté par bluetooth à la station de monitoring. – Un dispositif qui délivre une stimulation vibrotactile au bébé. Il est composé d’un vibreur, tel que recommandé par [Lovell et al., 1999], développé par la société Audio- logical Engineering. Le vibreur est placé sur l’abdomen du prématuré et est activé chaque fois qu’une bradycardie survient. L’intensité de la stimulation vibrotactile peut être réglée manuellement, à l’aide des boutons, ou à partir de la station de monitoring. – Un ordinateur portable qui sert de station de monitoring et qui permet d’enregistrer l’ECG du prématuré et d’appliquer les traitements du signal en temps-réel. Sur l’écran sont affichés l’ECG, un battement moyen, la courbe de VFC, la FC, etc. – Un dispositif qui capte la lumière du moniteur installé dans l’USIN. Il est composé d’une diode photosensible collée devant l’écran du moniteur et qui capte la lumière lorsque ce moniteur détecte une apnée-bradycardie. La fonction de ce dispositif est de comparer les instants de détection des bradycardies du moniteur installé dans l’USIN et le système de monitoring développé au LTSI. Dispositif d'acquisition d'ECG Électrodes Dispositif qui délivre la stimulation vibrotactile Vibreur Station de monitorage Antenne Figure 2.4 – Dispositifs utilisés dans le système INTEM. Cette station de monitoring accueille l’ensemble d’algorithmes qui ont été développés, no- tamment des approches de fusion de données pour la détection multivoie des QRS [Hernández et al., 1999] et pour la détection d’épisodes d’apnée-bradycardies. L’architecture proposée et les méthodes d’activation du vibreur ont fait l’objet d’un dépôt de brevet [Hernández et al., 2007a,b].
  • 67.
    2.2. Méthodologie proposée37 2.1.3 Conclusion L’analyse de ce bref état de l’art montre qu’un certain nombre de résultats ont été obtenus au laboratoire dans cette thématique et que des avancées significatives ont été obtenues ces dernières années pour la détection robuste et précoce des épisodes d’apnée-bradycardie. Cependant, des améliorations peuvent encore être apportées. 1. Ces algorithmes ont tous été utilisés pour analyser l’intervalle RR alors que d’autres variables peuvent apporter de l’information supplémentaire (amplitude de l’onde R, intervalle QT). 2. Les seuils de décision sont souvent ajustés manuellement et empiriquement basés sur des a priori. Il serait souhaitable d’optimiser automatiquement les paramètres de ces méthodes de traitement. 3. Comme il a été montré, quelle que soit la méthode utilisée pour détecter les brady- cardies, l’étude de l’évolution des indicateurs se limite à leur tracé en fonction du temps et la décision finale (bradycardie présente ou absente) est simplement basée sur des fonctions de décision à simple seuil. Pour améliorer la détection, il apparaît donc important de prendre en considération l’évolution temporelle des indicateurs extraits et si possible leur évolution conjointe. L’objectif est donc de proposer une méthode qui exploite l’évolution temporelle de séries multivariées, afin d’améliorer la performance de la détection : sensibilité, spécificité et retard de la détection. 2.2 Méthodologie proposée Tel qu’évoqué dans la conclusion précédente, l’objectif est l’analyse de la dynamique des séries temporelles extraites de l’ECG pour détecter les épisodes d’apnée-bradycardie chez les nouveaux-nés prématurés. Ces séries peuvent être composées d’une seule variable (univariée) ou de plusieurs variables (multivariées). La figure 2.5 résume les principales étapes du travail réalisé. Les paragraphes suivants détaillent les blocs : base de données, extraction de caractéristiques et prise de décision. 2.2.1 Base de données En premier lieu, l’ECG des nouveaux-nés prématurés doit être acquis. Dans cette étude, les données sont obtenues à partir d’une cohorte de 32 nouveaux-nés prématurés hospitalisés dans les USIN à l’hôpital universitaire de Rennes entre juin 2003 et juin 2004. Ces enfants présentaient plus d’une bradycardie par heure. Les critères d’exclusion étaient
  • 68.
    38 Chapitre 2 ECG Personnelsoignant Intervention Extraction de caractéristiques Base de données Prise de décision Figure 2.5 – Étapes du processus de détection des apnées-bradycardies proposées dans cette thèse. les suivants : médicaments connus pour influencer le SNA à l’exception de la caféine, l’assistance respiratoire intra-trachéale, une lésion intra-cérébrale ou une malformation. Au moment de l’enregistrement, le poids de naissance médian était de 1235 g (1065, 1360), l’âge médian était de 31,2 semaines (29,7, 31,9) et l’âge post-natal était de 12,1 jours (6,7, 19,5). Six enfants présentaient une infection systémique, seize avaient une aide respiratoire de pression nasale avec ventilation spontanée en pression positive continue et dix-sept étaient traités avec de la caféine. Tous les enregistrements ont été acquis en utilisant le système Powerlab/Graphique v4.2 installé sur un ordinateur Pentium III. Ils se composaient d’un ECG acquis sur une voie pendant 1 heure à une fréquence d’échantillonnage de 400 Hz. Les enfants ont été placés dans des couveuses, positionnés sur le côté, enroulés dans un cocon. La lumière a été éteinte, les volets extérieurs baissés et la porte fermée afin d’obtenir une pièce calme et sans lumière vive [Beuchée, 2005]. 2.2.2 Extraction de caractéristiques L’objectif de cette étape est d’extraire les caractéristiques les plus importantes de l’ECG et de générer les séries temporelles utiles pour la détection des épisodes de bradycardie. Elle comporte plusieurs étapes, représentées dans la figure 2.6 : – Le pré-traitement de l’ECG : Cette étape de débruitage du signal ECG est composé d’un ensemble de filtres. – La détection des battements : Elle permet de repérer les battements cardiaques. Nous avons repris une version améliorée de l’algorithme de PAN et TOMPKINS [Pan and Tompkins, 1985; Cruz, 2007]. – La segmentation des battements : Elle permet d’identifier les instants de début
  • 69.
    2.2. Méthodologie proposée39 et de fin des ondes qui composent l’ECG. Nous avons utilisé l’algorithme développé dans notre laboratoire [Dumont, 2008] et qui emploie une approche temps-échelles par décomposition en ondelettes du signal ECG issue de la littérature [Martínez et al., 2004; Li et al., 1995]. – L’optimisation des méthodes par algorithmes évolutionnaires : Les méthodes reportées dans la littérature de détection et de segmentation des battements ne sont pas adaptées à l’ECG des prématurés. Une procédure d’optimisation des paramètres, basée sur des algorithmes évolutionnaires, permettra de résoudre ce problème multi-objectif et d’ajuster automatiquement les paramètres de ces méthodes. – L’extraction des séries temporelles : Une fois les méthodes de la chaîne de seg- mentation d’ECG adaptées aux ECG des prématurés, la prochaine étape comporte l’extraction des indicateurs les plus pertinents pour caractériser les épisodes d’apnée- bradycardie. Cette information correspond aux indicateurs utilisés par les cardiologues pour caractériser le cycle cardiaque comme les intervalles et amplitudes des ondes présentées (voir figure 1.7), ainsi que le rythme cardiaque. Cette étape permet de réduire la dimension des données et de conserver une information interprétable par les spécialistes. L’automatisation de cette étape permet un gain de temps ainsi qu’une meilleure répétabilité des analyses effectuées. Les séries temporelles retenues corres- pondent aux variables suivantes : intervalle RR, amplitudes de l’onde R et durées des QRS. Pré-traitement de l'ECG Segmentation des battements Détection des battements Oui NoOptimisation des méthodes par algorithmes évolutionnaires Paramètres des méthodes optimisés ? Extractions des séries temporelles Figure 2.6 – Étape d’extraction des caractéristiques de la démarche proposée. 2.2.3 Prise de décision L’objectif est ici d’émettre une décision sur la présence ou absence d’un épisode d’apnée- bradycardie, en exploitant les dynamiques des variables étudiées et non seulement leurs valeurs instantanées. Nous avons retenu une approche à base de modèles semi-Markoviens cachés (MSMC). Ce choix sera justifié plus en détail au chapitre 4 mais il nous apparaissaient évident que les MSMC étaient adaptés à la fois pour traiter la dynamique, prendre en compte plusieurs variables simultanément, et proposer un processus de décision entièrement basé sur la vraisemblance des modèles. Cette étape comporte les phases montrées figure 2.7 : – L’apprentissage des modèles MSMC : une fois les séries temporelles obtenues,
  • 70.
    40 Chapitre 2 desmodèles qui caractérisent la dynamique des variables dans chaque état physiopa- thologique sont créés. Un pré-traitement des séries est d’abord nécessaire afin de les rendre utilisables dans le contexte des MSMC. Ce pré-traitement consiste à unifor- miser la dynamique qui caractérise les épisodes de bradycardies tout en minimisant la variabilité intra-individus et inter-individus. Ainsi, l’information présente dans l’évolution temporelle des indicateurs est mise en évidence. Des MSMC sont créés et appris à partir des ensembles des séries multivariées. Cet apprentissage implique plusieurs sous-étapes, telles que le choix des séries à utiliser, le nombre d’états par modèle, l’initialisation des modèles, l’ajustement des paramètres afin de maximiser une vraisemblance, la taille des séries, etc. Cette étape est très importante car de petits changements dans une de ces sous-étapes impliquent des modifications impor- tantes dans les résultats obtenus, comme par exemple une mauvaise initialisation des paramètres du MSMC. – Le test de vraisemblance : une fois que les modèles sont créés, l’appartenance au modèle de nouvelles séries (vraisemblance) est déterminée. – La détection de la bradycardie : un rapport de vraisemblance au cours du temps est utilisé pour détecter les épisodes d’apnée-bradycardie. Une bradycardie sera détectée lorsque la vraisemblance d’un modèle est supérieure aux autres modèles testés. Cependant, afin d’éviter des fausses alarmes, un seuil sur les différences entre les log-vraisemblances est ajouté. Les détecteurs univariées et multivariées peuvent être utilisés, afin de prendre en compte la dynamique des indicateurs de manière individuelle (univariée) ou de manière conjointe (multivariée). – L’alarme : finalement, une fois l’épisode d’apnée-bradycardie détecté, une alarme va alerter l’équipe soignante qui se dirigera ensuite dans la chambre du prématuré afin d’appliquer la thérapie nécessaire. Test de vraisemblance Apprentissage des modèles MSMC Détection de la bradycardie Alarme Figure 2.7 – Étape de prise de décision de la démarche proposée. 2.3 Méthodologie d’évaluation des performances de détection Dans le domaine du traitement du signal et du monitoring, la performance d’un détecteur est déterminée principalement par trois critères : 1. La sensibilité (SEN) : qui est la capacité à détecter les évènements d’intérêt lorsque ces épisodes sont présents.
  • 71.
    2.3. Méthodologie d’évaluationdes performances de détection 41 2. La spécificité (SPC) : qui représente la capacité à refuser les évènements qui ne sont pas d’intérêt. 3. Le temps de retard à la détection (TRD) : qui exprime le temps écoulé entre le début de l’évènement d’intérêt et l’instant de la détection. Ainsi, dans notre cas spécifique de détection des bradycardies, la SEN mesure les évènements de bradycardie correctement détectés tandis que la SPC prend en compte les évènements sans bradycardie correctement refusés. Le temps de TRD est un critère très important car il est souhaitable de détecter les épisodes de bradycardies le plus rapidement possible. La SEN est exprimée par SEN = VP VP + FN (2.1) tandis que la SPC est donnée par SPC = VN VN + FP (2.2) où – VP (nombre de Vrais Positifs) est le nombre d’évènements de bradycardies détectées correctement par le détecteur, – VN (nombre de Vrais Négatifs) est le nombre d’évènements estimés correctement comme non bradycardies par le détecteur, – FP (nombre de Faux Positifs) représente le nombre d’évènements de bradycardies détectées incorrectement par le détecteur, ce paramètre est équivalent au nombre de fausses alarmes, – FN (nombre de Faux Négatifs) traduit le nombre d’évènements de bradycardie non détectées par le détecteur, ce paramètre est équivalent au nombre de non détections. La probabilité de détection (Pd) ou taux de vrai positif (TVP) est égale à la SEN. La probabilité de fausse alarme (Pfa) ou taux de faux positif (TFP) est égale à TFP = FP VN + FP = 1 − SPC (2.3) La valeur prédictive positive (VPP), différent à la SEN, est la proportion d’évènements de bradycardie correctement détectés et est définie par VPP = VP VP + FP (2.4) Pour notre application, un VP se produit lorsqu’une détection est entourée d’une annotation dans une fenêtre de taille wV P secondes, centrée sur l’annotation donnée. La figure 2.8 montre un exemple d’une série RR avec un épisode de bradycardie. L’annotation
  • 72.
    42 Chapitre 2 del’épisode par un spécialiste et la détection fournie par le détecteur y sont reportés. Les cas détectés et annotés comme bradycardie sont mis à un (1) et à zéro (0) sinon. On observe comment les indicateurs VP, VN, FP et FN sont déterminés à l’aide la fenêtre de recherche wV P . 0 20 40 60 80 100 120 140 160 180 400 500 600 700 800 900 1000 RR(ms) Temps (s) Début de la bradycardie Fin de la bradycardie 0 20 40 60 80 100 120 140 160 180 Annotation Temps (s) 0 1 0 20 40 60 80 100 120 140 160 180 Détection Temps (s) 0 1 FP TPTN FNTN TN TRD . . . Figure 2.8 – Méthodologie d’évaluation des performances de détection. La fenêtre wV P est centrée dans l’échantillon de détection analysé. 2.3.1 Courbe COR La tâche principale d’un bon détecteur est de maximiser la sensibilité ainsi que la spécificité tout en réduisant le retard à la détection. Pour accomplir cette tâche, les paramètres du détecteur (γ) sont souvent optimisés en utilisant des courbes caractéristiques opérationnelles du récepteur (COR). Ces courbes décrivent la TVP vs. TFP (ou Pd vs. Pfa) où chaque point de la courbe est obtenu en utilisant une valeur spécifique d’un paramètre du détecteur. C’est donc la modification d’un paramètre du détecteur qui permettra de construire une courbe COR. Par conséquent, il existera un réseau de courbes pour un
  • 73.
    2.3. Méthodologie d’évaluationdes performances de détection 43 ensemble de paramètres. Il s’agit donc d’un problème multi-paramètre à optimiser qui n’est pas simple à résoudre. La solution consiste souvent à modifier paramètre par paramètre et conserver pour chaque courbe COR associée à un paramètre, le paramètre optimal maximisant les performances. Une détection optimale donnerait un point dans le coin supérieur gauche de la courbe COR avec comme coordonnées (0,1), ce qui représente une sensibilité de 100 % (pas de FN) et une spécificité de 100 % (pas de FP). Le point (0,1) est aussi appelé une détection parfaite. Une détection aléatoire, telle qu’une décision par pile ou face, donnerait un point au long de la ligne diagonale (ligne de non-discrimination) de la courbe. La figure 2.9 montre trois exemples de courbes COR. Chaque point de la courbe COR correspond à un paramètre spécifique. On y a reporté le point de détection parfaite (0,1) et la ligne de non-discrimination. 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 TFP TVP Détection parfaite Figure 2.9 – Exemples de courbes COR. Le cercle représente le point de détection parfaite, les étoiles représentent une détection avec une TFP = 0, 05 (5 %) et les carrés correspondent à la distance la plus courte au point (0,1). Le paramètre optimal du détecteur est choisi en maximisant la probabilité de détection et en diminuant la quantité de fausses alarmes. Trois critères sont souvent employés pour cela : 1. Un critère consiste à maximiser l’aire sous la courbe COR, cependant, dans notre cas, parfois la courbe ne couvre pas la totalité de la plage TFP = {0, . . . , 1}, ce qui empêche une comparaison entre différents courbes COR. 2. Un autre critère consiste à fixer un point spécifique à atteindre dans la courbe, comme par exemple une TFP = 0, 02 (2 %) et à chercher la valeur la plus grande de TVP parmie les courbes COR analysées.
  • 74.
    44 Chapitre 2 3.Un dernier critère consiste à minimiser la distance entre la courbe COR et la détection parfaite, correspondant aux valeurs TVP = 1 et TFP = 0. Dans l’exemple montré figure 2.9, en considérant les trois critères exposés, le meilleur détecteur est celui associé à : 1. la courbe COR pointillée si on considère l’aire sous la courbe COR 2. la courbe COR pointillée si on fixe une TFP = 0, 05 (5 %) 3. la courbe COR continue si on considère la distance la plus courte à la détection parfaite. Nous avons choisi le dernier critère exposé car il permet de choisir le paramètre optimal γ sans a priori. La distance la plus courte à la détection parfaite (DCDP) est donnée par l’expression : DCDP(γ) = min γ (1 − TVP(γ))2 + TFP(γ)2 (2.5) 2.4 Conclusion Dans ce chapitre, les méthodes de détection d’épisodes d’apnée-bradycardie utilisées dans l’USIN ainsi que les travaux qui ont déjà été proposés dans ce domaine, ont été révisés. Parmi les faiblesses relevées, on souligne que les systèmes de monitoring actuels ne permettent pas d’analyser la dynamique des variables en cours d’acquisition et que la plupart des méthodes développées sont basées sur une analyse univariée (série temporelle RR). Cependant, une analyse de la dynamique des caractéristiques extraites de l’ECG semble appropriée pour améliorer la performance de détection. Une méthodologie pour la détection précoce d’épisodes d’apnée-bradycardie a été proposée dans ce chapitre, elle s’appuie sur la fouille de données multidimensionnelles. Elle est fondée sur quatre étapes principales : l’acquisition des données, l’extraction de caractéristiques (présentée au chapitre 3), la prise de décision pour l’analyse des dynamiques (présentée au chapitre 4) et l’alerte du personnel soignant en cas de détection d’apnée- bradycardie. Les performances de détection seront évaluées dans ce travail en analysant trois critères : la sensibilité (capacité à détecter les évènements), la spécificité (capacité à refuser les évènements) et le retard à la détection (temps écoulé entre le début de l’évènement et sa détection). L’objectif est de maximiser la sensibilité et la spécificité tout en réduisant le retard à la détection. Le chapitre 5 évaluera ces critères dans la détection d’événements d’intérêt, sur signaux synthétiques et réels.
  • 75.
    Bibliographie 45 Bibliographie Basseville, M.and Nikiforov, I. V. (1993). Detection of abrupt changes : theory and application. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu- rity. Physiological Measurement, 32 :523. Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona- talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1. Beuchée, A., Carrault, G., Bansard, J. Y., Boutaric, E., Bétrémieux, P., and Pladys, P. (2009). Uncorrelated randomness of the heart rate is associated with sepsis in sick premature infants. Neonatology, 96(2) :109–14. Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré. IRBM, 28(3-4) :124–130. Chair, Z. and Varshney, P. (1986). Optimal data fusion in multiple sensor detection systems. Aerospace and Electronic Systems, IEEE Transactions on, AES-22(1) :98–101. Chatow, U., Davidson, S., Reichman, B., and Akselrod, S. (1995). Development and maturation of the autonomic nervous system in premature and full-term infants using spectral analysis of heart rate fluctuations. Pediatric research, 37(3) :294. Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD thesis, Universidad Simón Bolívar. Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in Cardiology, volume 33, pages 473–476. Dumont, J. (2008). Fouille de dynamiques multivariées, application à des données temporelles en cardiologie. PhD thesis, Université de Rennes 1. Gaillot, T., Beuchée, A., Jaillard, S., Storme, L., Nuyt, A. M., Carré, F., and Pladys, P. (2005). Influence of sympathetic tone on heart rate during vagal stimulation and nitroprusside induced hypotension in ovine fetus. Auton Neurosci, 123(1-2) :19–25. Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M. (1999). Multisensor fusion for atrial and ventricular activity detection in coronary care monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90. Hernández, A., Cruz, J., and Carrault, G. (2007a). Dispositif de supervision et de stimulation destine à lutter contre l’apnée du sommeil. Pat Numb - WO2007EP55723 20070611. Hernández, A., Cruz, J., and Carrault, G. (2007b). Dispositif intégré auto-adaptatif de surveillance et de stimulation sur base de signaux physiologiques, par exemple sur base de fréquence cardiaque, procédé et programme d’ordinateur correspondants. Pat Numb - FR2908624.
  • 76.
    46 Bibliographie Le Rolle,V., Hernández, A., Carrault, G., Samson, N., and Praud, J. (2008). A model of ventilation used to interpret newborn lamb respiratory signals. In Engineering in Medicine and Biology Society, 2008. EMBS 2008. 30th Annual International Conference of the IEEE, pages 4945–4948. IEEE. Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet transforms. IEEE Trans Biomed Eng, 42(1) :21–8. Lovell, J. R., Eisenfeld, L., Rosow, E., Adam, J., Lapin, C., and Bronzino, J. D. (1999). Vibrotactile stimulation for treatment of neonatal apnea : a preliminary study. Conn Med, 63(6) :323–5. Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet- based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng, 51(4) :570–81. Pan, J. and Tompkins, W. J. (1985). A real-time QRS detection algorithm. IEEE Transac- tions on Biomedical Engineering, BME-32(3) :230–236. Patural, H., St-Hilaire, M., Pichot, V., Beuchée, A., Samson, N., Duvareille, C., and Praud, J.-P. (2010). Postnatal autonomic activity in the preterm lamb. Res Vet Sci. Pladys, P., Arsenault, J., Reix, P., Rouillard Lafond, J., Moreau-Bussière, F., and Praud, J. (2008). Influence of prematurity on postnatal maturation of heart rate and arterial pressure responses to hypoxia in lambs. Neonatology, 93(3) :197. Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7. Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc, 2007 :3288–91. Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages 725–728. IEEE. Quinlan, J. R. (1993). C4.5 : programs for machine learning. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA. Rezek, I. and Roberts, S. (1998). Stochastic complexity measures for physiological signal analysis. Biomedical Engineering, IEEE Transactions on, 45(9) :1186–1191. Task Force (1996). Heart rate variability : standards of measurement, physiological inter- pretation and clinical use. task force of the european society of cardiology and the north american society of pacing and electrophysiology. Circulation, 93(5) :1043–65. Ward, J. (1963). Hierarchical grouping to optimize an objective function. Journal of the American statistical association, 58(301) :236–244. Yu, J., Hunter, J., Reiter, E., and Sripada, S. (2002). Recognising visual patterns to communicate gas turbine time-series data. In Proceedings of ES2002, pages 105–118. Springer.
  • 77.
    Chapitre 3 Analyse multi-variéede l’ECG pour la détection et la caractérisation de l’apnée-bradycardie des nouveaux-nés prématurés L’objectif de ce chapitre est d’étudier le contenu d’information des caractéristiques extraites de l’ECG avant, pendant et après les épisodes d’apnée-bradycardie, avec le but de les intégrer dans une approche de détection précoce d’épisodes d’apnée-bradycardie. Afin d’atteindre cet objectif et d’extraire les caractéristiques d’intérêt, deux grandes étapes doivent être suivies ; d’une part, la détection précise de chaque battement et d’autre part, la segmentation de chaque complexe QRS. Pour la première étape, plusieurs algorithmes de détection des complexes QRS ont été proposés dans la littérature [Pan and Tompkins, 1985; Köhler et al., 2002; Chen et al., 2006; Arzeno et al., 2008]. Cependant, ces méthodes ont été développées pour l’ECG de l’adulte et, à notre connaissance, aucune d’entre elles n’ont été adaptées aux caractéristiques spécifiques de l’ECG du nouveau-né prématuré (FC supérieure à celles des adultes, durée du complexe QRS plus courte . . .). En ce qui concerne la deuxième étape, les méthodes basées sur une transformée en ondelettes pour la décomposition de l’ECG, suivie d’un ensemble de règles heuristiques pour segmenter les principales caractéristiques de chaque battement ont également été proposées dans la littérature [Li et al., 1995; Martínez et al., 2004; Dumont et al., 2010]. Encore une fois, à notre connaissance, ces méthodes sont spécifiques aux caractéristiques de l’ECG adulte. Par conséquent, les méthodes pour les deux étapes doivent être tout d’abord adaptées aux propriétés spécifiques de l’ECG du nouveau-né prématuré. Ces adaptations sont généralement effectuées manuellement, en modifiant les paramètres de chaque méthode. Toutefois, en raison du nombre important de paramètres utilisés dans les deux méthodes, 47
  • 78.
    48 Chapitre 3 cettedémarche n’est pas aisée. Dans ce chapitre, un processus d’optimisation proposé initialement dans [Hernández et al., 2002; Dumont et al., 2010] est adapté. Synthétiquement, on cherche à minimiser la probabilité d’erreur de détection et la moyenne et l’écart-type du jitter de détection, sur une base de données annotées, en optimisant les paramètres de la chaîne de traitement par un algorithme évolutionnaire. Une brève étude bibliographique des techniques de segmentation de l’ECG est présentée au début du chapitre suivi de la présentation en détail des techniques de détection et de segmentation utilisées dans ce mémoire. Cependant, comme les méthodes de détection des battements et de segmentation de l’ECG ne sont pas aptes à travailler sur les ECG des prématurés, une procédure d’optimisation est proposée et ensuite présentée. Enfin, une analyse du complexe QRS sous différentes conditions physiopathologiques est conduite, afin de caractériser les épisodes d’apnée-bradycardie chez les nouveaux-nés prématurés. Les résultats du chapitre sont divisés en trois parties : la performance du détecteur des battements optimisé, la performance de la segmentation du QRS optimisé et l’analyse statistique des séries temporelles extraites de l’ECG des prématurés. L’information extraite de ces détecteurs optimisés est analysée dans le chapitre suivant au moyen des modèles semi-Markovien cachés. 3.1 Segmentation des ondes : position du problème et biblio- graphie L’étape de segmentation de l’ECG consiste à identifier les instants de début, de fin et les extrema des ondes P, Q, R, S et T de chaque battement du signal. Les outils de segmentation automatique (ou semi-automatique) de l’ECG intègrent différentes étapes de transformation ou de modélisation de l’ECG. Les fondements des différentes méthodes issues de la littérature sont brièvement commentées dans cette section. 3.1.1 Algorithme basé sur la dérivée filtrée Cette méthode consiste à générer le signal dérivé filtré passe-bas du signal ECG [Laguna et al., 1994]. L’algorithme détecte les extrema du signal filtré à l’aide d’un seuil adaptatif et définit le pic de l’onde R comme le passage à zéro entre le maximum et le minimum du signal filtré dans une fenêtre temporelle prédéfinie. Ce principe est également utilisé pour définir les pics des ondes Q et S. Pour les ondes P et T, un deuxième filtrage passe-bas est employé et des fenêtres temporelles sont fixées afin de repérer les pentes significatives (une fenêtre relative à la FC est utilisée pour l’onde T). Les points de croisements par
  • 79.
    3.1. Segmentation desondes : position du problème et bibliographie 49 zéro des signaux dérivés-filtrés et des seuils relatifs aux amplitudes des pentes significatives sont employés pour définir les pics et les limites des ondes P et T. Cette méthode est une solution envisageable mais des remarques s’imposent : d’une part, l’algorithme comporte de nombreuses approches subjectives (les recherches des points fiduciaux sont basées sur des seuils plus ou moins approximatifs) et d’autre part, le filtre passe-bas utilisé coupe des fréquences significatives de l’onde T. 3.1.2 Algorithme basé sur le filtrage adaptatif Dans cette méthode, l’ECG est filtré par un filtre classique puis par un filtre adap- tatif [Soria-Olivas et al., 1998]. La méthode inclut une étape d’apprentissage qui permet l’estimation d’une constante d’adaptation introduite dans le filtre adaptatif. Les résultats obtenus sont satisfaisants mais la méthode ne peut être employée sans une pré-détection par un cardiologue. De plus, il est difficile de préciser les différences de performance avec une approche totalement automatique car les auteurs n’ont pas réalisé de tests sur des bases de données. 3.1.3 Algorithme basé sur la modélisation physiologique Cette méthode modélise des potentiels d’action à partir d’un modèle physiologique de la phase de repolarisation ventriculaire afin d’ajuster, puis de segmenter l’onde T de l’ECG [Vila et al., 2000]. Le modèle physiologique est constitué d’une somme de deux potentiels d’action. Les paramètres du modèle sont estimés par optimisation non linéaire de l’erreur quadratique moyenne entre le modèle et le signal (algorithme du type Gauss- Newton). L’onde T est segmentée en analysant les dérivées première et seconde de l’équation obtenue. Des améliorations de segmentation en comparaison avec l’algorithme basé sur la dérivée filtrée [Laguna et al., 1994] ont été reportées. Ainsi, cette approche devient intéressante en présence de bruit [Wong, 2004]. Une limitation de la méthode est qu’elle ne permet que la segmentation de l’onde T. 3.1.4 Algorithme basé sur le réalignement temporel Dans cette méthode, le battement à segmenter est comparé et ré-aligné avec une base de données de battements préalablement segmentés. Un réalignement temporel par programmation dynamique (DTW, Dynamic Time Warping) est utilisé et consiste à réaligner les points d’une série temporelle un à un, sur une autre série prise comme référence, de manière à minimiser une distance cumulée sur l’ensemble des points. La méthodologie à base de DTW peut être soit une approximation linéaire par morceaux [Vullings et al., 1997]
  • 80.
    50 Chapitre 3 ousoit une approximation constante adaptative par morceaux [Zifan et al., 2006]. Cette méthode est dépendante de l’ensemble des battements de référence et il est difficile de comparer tous les battements annotés au battement à traiter en temps réel. 3.1.5 Algorithme basé sur la modélisation Markovienne Les modèles Markoviens ont été d’abord appliqués pour la segmentation des complexes QRS en 1993 [Coast, 1993], puis pour la segmentation de l’ensemble des ondes [Thora- val, 1995]. Les premiers modèles ont intégré dans les états des informations de pentes, d’amplitudes ou de durées des ondes [Koski, 1996; Clavier and Boucher, 1996]. De plus, en exploitant les coefficients d’une décomposition en ondelettes, de bons résultats ont été obtenus [Hughes et al., 2003]. Les modèles de Markov sont particulièrement adaptés pour la décomposition de la séquence ECG. Cependant, leur application sur de grandes bases de données est peu fréquente. En effet, le choix des caractéristiques dont la dynamique doit être modélisée demeure un problème, ainsi que le grand nombre de données nécessaires à l’apprentissage. 3.1.6 Algorithme basé sur la transformée en ondelettes La transformée en ondelettes fait partie des méthodes d’analyse de signaux, dites temps-échelle, qui ont suppléé la transformée de Fourier pour l’analyse des signaux non stationnaires. La transformée en ondelettes décompose un signal f(t) en une somme pondérée de fonctions de bases qui sont des versions dilatées et translatées d’une fonction ψ appelée ondelette mère : f(t) = a∈Z k∈Z cakψ(sa t − k) (3.1) Pour un scalaire s fixé, tel que |s| < 1, le coefficient a contrôle l’échelle à laquelle le signal est analysé : si a est grand, les caractéristiques temporelles longues (i.e. les basses fréquences) sont analysées ; si a est faible les caractéristiques courtes (les hautes fréquences) sont analysées. Les ondes P et T ont des durées statistiquement similaires et occupent de ce fait, dans l’espace transformé, le même ensemble d’échelles d’analyse car les composantes fréquentielles de ces ondes se recouvrent totalement. Cependant, la durée des ondes P et T est très différent à la durée du complexe QRS et en conséquence l’ensemble d’échelles d’analyse du complexe QRS est différent. Une portion des composantes fréquentielles de ce dernier recouvre la totalité des composantes fréquentielles des ondes P et T. Les extrema locaux de la décomposition d’un niveau de résolution correspondent aux
  • 81.
    3.2. Détection etsegmentation automatique du QRS 51 plus fortes pentes présentes dans le signal ECG et aux passages par zéro des extrema locaux du signal ECG. La recherche des minima et maxima passe par la définition des fenêtres temporelles, limitant la zone de recherche, et par la définition de seuils, permettant uniquement la conservation des minima et maxima significatifs. La principale difficulté de cette méthode est liée à la définition de nombreux paramètres, les fenêtres temporelles et les seuils, qui sont ajustés empiriquement. Pour résoudre ce problème, une solution a été proposée [Dumont et al., 2010]. Il s’agit d’une chaîne de segmentation d’ECG dont les paramètres de la méthode de segmentation ont été optimisés par algorithmes évolutionnaires. 3.2 Détection et segmentation automatique du QRS Les paragraphes qui suivent ont pour volonté de présenter la chaine de traitement que nous avons développée. De manière générale, la segmentation automatique de l’ECG peut être décomposée en trois grandes étapes (montrées figure 3.1) et expliquées dans les sous-sections suivantes. Segmentation des battements Détection des battements Pré-traitement de l'ECG Extraction des battements Figure 3.1 – Étapes de la segmentation du signal ECG 3.2.1 Pré-traitement de l’ECG Cette étape consiste principalement à éliminer certains bruits qui perturbent le signal ECG tels que : – Les déviations de la ligne de base : Elles correspondent aux déviations de basses- fréquences de l’amplitude de l’ECG liées principalement aux mouvements du patient et à sa respiration. Plusieurs techniques ont été développées afin de soustraire la ligne de base de l’ECG : le filtrage adaptatif et les approximations par splines [Meyer and Keiser, 1977; Sörnmo, 1993; Jane et al., 1992]. Toutefois, pour résoudre ce problème particulier, nous avons choisi d’appliquer un algorithme à base de bancs de filtres multi- cadences [Shusterman et al., 2000]. Les étapes de filtrage et de sous-échantillonnage de cet algorithme permettent de réaliser un filtre dont la fréquence de coupure est bien maîtrisée, tout en évitant les déphasages et les temps de calcul plus longs qui seraient introduits par un filtre unique (mais d’ordre plus élevé). – L’interférence à 50/60 Hz : C’est un bruit qui provient de l’alimentation des appareils de mesure. Pour éliminer cette interférence, des méthodes basées sur des
  • 82.
    52 Chapitre 3 filtrespasse-bande ou des filtres adaptatifs sont utilisées [Levkov et al., 2005]. Dans ce mémoire, le filtrage adaptatif a été retenu car il permet de suivre les changements de phases et d’amplitudes de l’interférence [Ziarani and Konrad, 2002]. 3.2.2 Détection des battements La seconde étape est associée à la détection des complexes QRS de l’ECG. La dé- tection automatique des battements a connu depuis de nombreuses années de multiples développements. Une bibliographie est reportée dans [Köhler et al., 2002]. Nos avons utilisé un algorithme de détection des QRS en temps réel développé dans notre laboratoire [Cruz, 2007]. Cet algorithme est inspiré du travail de PAN et TOMP- KINS [Pan and Tompkins, 1985]. Il calcule la position d’un point, appelé point fiducial (PF), correspondant à la pente maximale, pour chaque complexe QRS détecté. Ce point se situe où la version filtrée passe-bande du signal ECG présente l’énergie la plus élevée. L’algorithme de détection des QRS adapté peut être représenté de façon synthétique comme l’illustre la figure 3.2. Les quatre premières étapes sont analogues à celles proposées par PAN et TOMPKINS [Pan and Tompkins, 1985], où premièrement le signal ECG (x[n]) est traité par un filtre passe-bande (cascade des filtres passe-bas et passe-haut) avec des fréquences de coupure fcLow et fcHigh pour produire xPB[n]. Deuxièmement, la sortie (xPB[n]) est dérivée (xD[n]) et troisièmement une quadration est appliquée au signal dérivé pour produire xQ[n] qui est ensuite intégré sur une fenêtre glissante de taille TMWI afin de produire xI[n]. Le signal ECG à traiter par le détecteur des battements est gardé dans un tampon circulaire de taille HISTO et le processus commence lorsque le tampon est rempli. La dernière étape de la chaîne de détection des QRS est basée sur des seuils qui sont continuellement ajustés par un ensemble de règles heuristiques, afin de suivre les changements du signal ECG. Cependant, au lieu d’utiliser deux ensembles de seuils, comme dans le travail de PAN et TOMPKINS [Pan and Tompkins, 1985], un seuil référé aux maxima du signal transformé xI[n], est utilisé. Le seuil adaptatif (THR) est calculé en utilisant l’équation 3.2, où δ est une constante, Speak est la moyenne des NP pics du signal supérieur à THR (Speak) et Npeak est la moyenne des NP pics du signal inférieur THR (Npeak). Speak et Npeak sont déterminés en utilisant les équations 3.3 et 3.4, respectivement. Les pics supérieurs à THR sont classés comme des complexes QRS (y[n]). THR = Npeak + δ(Speak − Npeak) (3.2)
  • 83.
    3.2. Détection etsegmentation automatique du QRS 53 Filtre passe-bande ECG Pics du QRS Filtre différenciateur Quadration Intégrateur Règles de décision Figure 3.2 – Représentation en bloc du processus de détection des battements. Speak = 1 NP NP i=1 Speaki (3.3) Npeak = 1 NP NP i=1 Npeaki (3.4) L’algorithme applique une période de suppression réfractaire (TRefr) et une fenêtre de recherche (TPeak) dans le signal filtré passe-bande (xPB[n]) pour la détection de crête maximale (PF). Si un QRS n’est pas trouvé pendant TRRlim, le seuil THR est réinitialisé et un nouveau processus de détection des QRS commence à partir du dernier QRS correctement détecté.
  • 84.
    54 Chapitre 3 Letableau 3.1 récapitule les paramètres du détecteur des battements à optimiser. Le pseudo-code de la méthode de détection des battements utilisée est montré dans l’algo- rithme 1. Tableau 3.1 – Paramètres de la méthode de détection des battements à optimiser. Paramètre Description fcLow Fréquence de coupure du filtre passe-bas fcHigh Fréquence de coupure du filtre passe-haut TMWI Taille de la fenêtre glissante de l’intégrateur NP Nombre de pics pour déterminer sa valeur moyenne δ Constante pour la détermination du seuil adaptatif TRefr Période de suppression réfractaire TPeak Taille de la fenêtre pour détecter la crête maximale QRS TRRlim Temps limite pour réinitialiser la détection des QRS Algorithme 1 Pseudo-code de la méthode de détection des battements. // Filtrage passe-bande Réaliser le filtrage passe-bande de x pour obtenir xP B // Différenciateur Calculer la dérivée de xP B pour obtenir xD // Quadration xQ[n] = xD[n]2 // Intégrateur Réaliser l’intégration de xQ dans une fenêtre glissante de taille TMW I afin d’obtenir xI // Initialisation de THR Pendant une période de TINI secondes (usuellement initialisé à 6 secondes), estimer xImax = max(xI) Détecter les pics > xImax/2 Utiliser ces pics comme les premiers QRS Initialiser les premiers NP Npeak pics à 0 Calculer THR selon l’équation 3.2 // Règles de décision Ignorer les pics qui sont détectés TRefr secondes après le dernier QRS Classifier le pic comme Speak s’il est plus grand que THR ou Npeak en cas contraire Actualiser la valeur de THR selon l’équation 3.2 Chercher la crête maximale du QRS dans xP B, TPeak seconds avant Speak Réinitialiser THR s’il n’y a pas eu de détection pendant TRRlim 3.2.3 Extraction des battements Chaque battement détecté est extrait de l’ECG et délimité dans une fenêtre temporelle autour du complexe QRS. Il est ensuite recalé sur des battements prototypes qui représentent des types de morphologies différentes. Les battements prototypes sont créés par la moyenne des battements les plus récents détectés dans un historique de 10 secondes. Seuls les battements qui présentent une corrélation croisée normalisée supérieure à 0,96 sont utilisés
  • 85.
    3.2. Détection etsegmentation automatique du QRS 55 pour mettre à jour les battements prototypes. Dans le cas contraire, le battement courant devient alors lui-même un prototype. 3.2.4 Segmentation des battements par ondelettes L’étape de segmentation automatique est la plus complexe. En effet, effectuer une délimitation précise des ondes est une tâche difficile pour plusieurs raisons : i) le signal ECG est non-stationnaire, ii) les battements peuvent présenter un rapport signal sur bruit (RSB) faible, iii) une grande variété de morphologies d’ondes existe, même parmi les sujets sains, iv) il n’y a pas de définition universelle sur les positions des bornes des ondes (en particulier pour les ondes Q et T), la variabilité portant sur la segmentation peut être élevée même entre cardiologues [Party, 1985] et v) les composantes spectrales des ondes se chevauchent. Compte-tenu de ces difficultés, une approche temps-fréquence a été retenue dans cette thèse pour segmenter les battements telle que l’algorithme basé sur la transformée en ondelettes initialement proposé par LI et al. [Li et al., 1995] et modifié récemment par DUMONT et al. [Dumont et al., 2010]. Dans l’algorithme de segmentation par ondelettes, chaque battement prototype actualisé est décomposé en cinq niveaux de détail, W1 2 à W5 2 , par une cascade de filtres (en octave) : des filtres de détail G(z) (passe-haut) et des filtres d’approximation H(z) (passe-bas). La délimitation précise des ondes est faite en utilisant des règles de décision basées sur l’amplitude du signal décomposé. Afin de favoriser la résolution temporelle dans les différentes échelles et l’invariance temporelle, la cascade de filtres est implémentée sans décimation (même fréquence d’échantillonnage dans toutes les échelles de décomposition) [Martínez et al., 2004]. La figure 3.3 montre les différentes étapes de la segmentation des battements par transformée en ondelettes. Pour ne pas alourdir la présentation, nous avons reporté la présentation de la transformée en ondelettes annexe B. En raison du contenu à haute fréquence des complexes QRS, seules la première et la deuxième échelle ont été analysées dans cette thèse. Dans la version initiale de l’algorithme, les échelles 3 à 5 sont utilisées pour la segmentation des ondes P et T [Dumont et al., 2010]. Dans ce travail les ECG de la base de données ne montrent pas ces ondes de façon claire et cette possibilité n’a donc pas été explorée. Plusieurs paramètres temporels et de seuils sont utilisés afin de trouver les limites des ondes. Les paramètres temporels sont : – TR1 et TR2, utilisés pour la recherche des ondes R avant et après le PF, – TQlim utilisé pour trouver l’onde Q, – TSlim utilisé pour rechercher les ondes S.
  • 86.
    56 Chapitre 3 Corrélationet Moyennage Règles de décision Règles de décision Détection: QRSon, Q, R, S et QRSoff Détection: Pon, P et Poff Ton, T et Toff Banc de filtres de la décomposition en ondelettes Battements templates Battements Figure 3.3 – Banc de filtres de la décomposition en ondelettes (sans décimation). G(z) et H(z) sont respectivement les filtres passe-haute et passe-bas. Wk 2 x[n] sont les sorties des filtres aux échelles 2k (k = 1, 2, . . . , 5) pour le battement x[n]. Pour faire face aux variations importantes de la FC observées chez les nouveaux-nés prématurés, une approche, proposée ici, est de définir les différents paramètres temporels comme des versions proportionnelles à l’intervalle RR : Ti = miRR (3.5) où i ∈ {R1, R2, Qlim, Slim}, et mi est le facteur d’échelle devant être optimisé. Les seuils liés aux amplitudes sur la deuxième échelle de la transformation en ondelettes (W2 2 ) sont également exprimés en tant que facteurs proportionnels comme suit : – Le seuil γQRSpre est utilisé pour trouver des pentes significatives de l’onde Q. Il est proportionnel à l’amplitude maximale de l’échelle 2 dans la fenêtre de recherche TQlim et est donné par : γQRSpre = mγQRSpre max(|W2 2 x[n]|) (3.6) où mγQRSpre est le facteur d’échelle à être optimisé et n ∈ TQlim – Le seuil γQRSpost est utilisé pour trouver des pentes importantes de l’onde S. Il est proportionnel à l’amplitude maximale de l’échelle 2 dans la fenêtre de recherche TSlim. Il est calculé en utilisant l’équation 3.7, où mγQRSpost est le facteur d’échelle
  • 87.
    3.2. Détection etsegmentation automatique du QRS 57 à être optimisé et n ∈ TSlim. γQRSpost = mγQRSpost max(|W2 2 x[n]|) (3.7) – Le seuil ξQRSon est utilisé pour la recherche du début du complexe QRS (QRSon). Il est lié à l’amplitude de la première pente importante dans W2 2 , et est calculé comme suit : ξQRSon = mξQRSonp W2 2 x[nfirst] ∀ W2 2 x[nfirst] > 0 mξQRSonn W2 2 x[nfirst] ∀ W2 2 x[nfirst] < 0 (3.8) où mξQRSonp et mξQRSonn sont les facteurs d’échelle à être optimisés et W2 2 x[nfirst] correspond à l’échelle 2 de la décomposition en ondelettes du signal x à la première pente significative (nfirst). – Le seuil ξQRSoff est utilisé pour la recherche de la fin du complexe QRS (QRSoff). Il est lié à l’amplitude de la dernière pente significative dans W2 2 , et est donné par : ξQRSoff = mξQRSoffp W2 2 x[nlast] ∀ W2 2 x[nlast] > 0 mξQRSoffn W2 2 x[nlast] ∀ W2 2 x[nlast] < 0 (3.9) où mξQRSoffp et mξQRSoffn sont les facteurs d’échelle à être optimisés et W2 2 x[nlast] correspond à l’échelle 2 de la décomposition en ondelettes du signal x à la dernière pente significative (nlast). Un test pour vérifier si les pics trouvés sont plus éloignés du niveau iso-électrique que le début ou la fin du complexe QRS a été effectué comme dans les travaux de DUMONT et al. [Dumont et al., 2010]. Par conséquent, la détection du niveau iso-électrique (ISOp) est une contrainte importante. SMRDEL et JAGER [Smrdel and Jager, 2004] définissent le ISOp comme la partie la plus plate dans l’intervalle PQ. Ce niveau iso-électrique est segmenté en définissant les paramètres temporels suivants : – TPQ : fenêtre de recherche temporelle pour le ISOp. – TIso : taille de la fenêtre où la forme d’onde est la plus plate. TPQ et TIso peuvent aussi être représentés comme une fonction de l’intervalle RR en utilisant l’équation 3.5. Le tableau 3.2 récapitule les paramètres de la méthode de segmentation des QRS à optimiser. Le pseudo-code de la méthode de segmentation des QRS est montré dans l’algorithme 2. La figure 3.4 résume les indicateurs temporels qui seront déterminés dans la segmentation. Pour plus de détails concernant l’algorithme de segmentation, nous invitons le lecteur à consulter les références [Martínez et al., 2004; Dumont et al., 2010].
  • 88.
    58 Chapitre 3 Tableau3.2 – Paramètres de la méthode de segmentation des QRS à optimiser. Paramètre Description Utilisation mR1 Constante de proportionnalité TR1 = mR1RR mR2 Constante de proportionnalité TR2 = mR2RR mQlim Constante de proportionnalité TQlim = mQlimRR mSlim Constante de proportionnalité TSlim = mSlimRR mγQRSpre Constante de proportionnalité γQRSpre = mγQRSpre max(|W2 2 x[n]|) mγQRSpost Constante de proportionnalité γQRSpost = mγQRSpost max(|W2 2 x[n]|) mξQRSonp Constante de proportionnalité ξQRSon = mξQRSonp W2 2 x[nfirst] mξQRSonn Constante de proportionnalité ξQRSon = mξQRSonn W2 2 x[nfirst] mξQRSoffp Constante de proportionnalité ξQRSoff = mξQRSoffp W2 2 x[nlast] mξQRSfofn Constante de proportionnalité ξQRSoff = mξQRSoffn W2 2 x[nlast] mPQ Constante de proportionnalité TPQ = mPQRR mISO Constante de proportionnalité TIso = mISORR Q R S QRSoffQRSon ISOp Figure 3.4 – Indicateurs à repérer pour l’algorithme de segmentation. 3.3 Optimisation de la chaîne de segmentation d’ECG Comme indiqué précédemment, les paramètres du processus de détection des battements et les paramètres de la méthode de segmentation des complexes QRS doivent être adaptés au traitement des signaux ECG acquis des nouveaux-nés prématurés, caractérisé par un faible RSB, une FC plus élevée et de fréquents épisodes de bradycardie. Dans le problème d’optimisation, le modèle est connu, ainsi que la réponse souhaitée (sortie). La tâche consiste à trouver les entrées qui conduisent à cette sortie [Eiben and Smith, 2003], comme l’illustre simplement la figure 3.5. Ainsi, dans le problème d’optimisation posé, l’objectif est de trouver une solution globalement satisfaisante de l’ensemble des paramètres (entrées) des méthodes de la chaîne de segmentation (modèle), afin que la segmentation automatique (sortie) ressemble aux annotations manuelles des cardiologues des ondes enregistrées dans une base de données (spécifiées). Cependant, des contraintes doivent être prises en compte dans le choix de la procédure
  • 89.
    3.3. Optimisation dela chaîne de segmentation d’ECG 59 Algorithme 2 Pseudo-code de la méthode de segmentation des QRS. Calculer les niveaux de décompositions W1 2 x[n] et W2 2 x[n] // Détection de l’onde R Calculer TR1 et TR2 selon l’équation 3.5 Définir une fenêtre de recherche sur W2 2 x[n] de TR1 secondes avant et TR2 secondes après le PF Calculer les deux plus grandes extrémités de signes opposés de cette fenêtre (npre et npost) centrés dans le PF L’onde R correspond au croisement par zéro entre ces deux extrémités sur W1 2 x[n] En cas de plusieurs croisements par zéro, utiliser celui associé à la plus grande amplitude de x[n] // Détection du ISOp Calculer TP Q et TIso selon l’équation 3.5 Définir une fenêtre de recherche sur x[n] de TP Q secondes avant l’onde R Le ISOp correspond à la partie la plus plate de taille TIso de cette fenêtre // Détection de l’onde Q Calculer TQlim selon l’équation 3.5 Calculer mγQRSpre selon l’équation 3.6 Définir une fenêtre de recherche sur W2 2 x[n] de TQlim secondes avant npre Calculer les maxima locaux de cette fenêtre supérieure à mγQRSpre Calculer les croisements par zéro entre ces maxima locaux sur W1 2 x[n]. L’onde Q est sélectionnée selon le signe et la séquence des maxima locaux // Détection du QRSon Calculer ξQRSon selon l’équation 3.8 Définir une fenêtre de recherche sur W2 2 x[n] de TQlim secondes avant npre Chercher le premier maximum local (nfirst) dans cette fenêtre Chercher le point où W2 2 x[n] est inférieur à ξQRSon : QRSon1 Calculer les minima locaux avant nfirst QRSon est le point le plus proche du complexe QRS entre QRSon1 et les minima trouvés // Détection de l’onde S Calculer TSlim selon l’équation 3.5 Définir une fenêtre de recherche sur W2 2 x[n] de TSlim secondes après npost Calculer les maxima locaux de cette fenêtre supérieure à mγQRSpost Calculer les croisements par zéro entre ces maxima locaux sur W1 2 x[n]. L’onde S est sélectionnée selon le signe et la séquence des maxima locaux // Détection du QRSoff Calculer ξQRSoff selon l’équation 3.9 Définir une fenêtre de recherche sur W2 2 x[n] de TSlim secondes après npost Chercher le dernier maximum local (nlast) dans cette fenêtre Chercher le point où W2 2 x[n] est inférieur à ξQRSoff : QRSoff1 Calculer les minima locaux après nlast QRSoff est le point le plus proche du complexe QRS entre QRSoff1 et les minima trouvés Modèle connu Entrée ? Sortie spécifié Figure 3.5 – Le problème d’optimisation. d’optimisation. Par exemple, la présence des multiples optima locaux de la fonction de coût peuvent conduire à des mauvais choix de paramètres. En outre, les algorithmes de la méthode de segmentation sont composés de différents paramètres (seuils, fenêtres temporelles, . . . ) et de fait, le critère évaluant les performances sera très certainement une fonction discontinue dans l’espace des paramètres. Ces contraintes ne sont pas compatibles avec l’utilisation
  • 90.
    60 Chapitre 3 desméthodes d’optimisation multivariées basées sur les gradients (méthodes de Gauss- Newton) ou des méthodes du simplex [Nelder and Mead, 1965], qui risquent de s’arrêter dans des minima locaux. D’un autre côté, les méthodes d’optimisation stochastique, telles que les algorithmes évolutionnaires (AE) [Eiben and Smith, 2003], dont la continuité de la fonction de coût ainsi que sa dérivée ne sont pas exigées, sont particulièrement bien adaptés pour ce type problème. Les AE, méthodes d’optimisation inspirées sur les théories de l’évolution et la sélection naturelle, ont d’ailleurs déjà été utilisés avec succès dans différentes applications biomédicales, pour estimer de larges ensembles de paramètres [Hernández et al., 2002; Herrero et al., 2008; Dumont et al., 2010]. Les fondements sur les AE sont reportés annexe C. 3.3.1 Méthode proposée Le problème d’adaptation peut être considéré comme la minimisation d’une fonction de coût en comparant les événements observés (annotations des ondes) et la sortie de l’algorithme (détection des ondes). Deux AE indépendants ont été appliqués de manière séquentielle : le premier, nommé AE1, permet d’optimiser les paramètres du détecteur des battements alors que le second, AE2, permet d’optimiser les paramètres de la méthode de segmentation des QRS. Un schéma explicatif est montré dans la figure 3.6. Un tel fractionnement est possible car la segmentation des QRS ne sera optimale que si le détecteur de battements est déjà optimisé. Détection de batements AE1 Base de données Segmentation des QRS AE2 Paramètres optimisés Base de données Figure 3.6 – Optimisation par application des AE de manière séquentielle. La figure 3.7 montre la méthodologie à suivre pour optimiser les paramètres à partir d’une base de données annotée appropriée et un AE. Les types d’annotations sont différents dans chaque méthodologie : des annotations du PF pour optimiser le détecteur des battements (AE1) et des annotations du ISOp et de la position du pic de l’onde R, du QRSon et du QRSoff pour optimiser la segmentation des QRS (AE2). L’AE minimise une fonction de coût qu’il convient de définir. Comme proposé par DUMONT et al. [Dumont et al., 2010], la fonction coût devant être minimisée par l’AE combine trois critères : 1. La probabilité d’erreur de détection (Perr) : Il s’agit d’une estimation quan- titative de la performance de la méthode. Elle est déterminée par l’équation 3.10,
  • 91.
    3.3. Optimisation dela chaîne de segmentation d’ECG 61 Figure 3.7 – Méthodologie d’optimisation des paramètres des méthodes. Les annotations et les détections dépendent de la méthode à optimiser. La méthode est le détecteur des battements dans un premier essai et la segmentation du QRS après. où SENi est la sensibilité (équation 2.1) et VPPi est la valeur prédictive positive (équation 2.4) de chaque caractéristique i ∈ {PF, onde R, QRSon, QRSoff, ISOp}. Perri = (1 − SENi)2 + (1 − VPPi)2 (3.10) 2. La moyenne du jitter de détection (µDJ) : Elle est calculée pour chaque ca- ractéristique i comme la moyenne, pour tous les segments disponibles (X), de la moyenne du jitter entre l’annotation (Ann) et la détection (Det) obtenus à partir de Y battements sur chaque segment, comme suit : µDJi = 1 X X x=1 Y y=1 Annx i (y) − Detx i (y) Nx (3.11) où Nx est le nombre de battements par segment. 3. L’écart-type du jitter de détection (σDJ) : Il est déterminé pour chaque ca- ractéristique i comme la moyenne de l’écart-type du jitter de détection de chaque segment (σx i ) : σDJi = X x=1 σx i X (3.12)
  • 92.
    62 Chapitre 3 Lesfonctions de coût (CF1 et CF2 pour AE1 et AE2) sont alors calculées comme suit : CF1 = PerrPF + µDJPF + σDJPF (3.13) CF2 = I i=1 Perri + µDJi + σDJi (3.14) où PF est le point fiducial et i ∈ {onde R, QRSon, QRSoff, ISOp}. 3.3.2 Optimisation des paramètres Dans AE1, servant à optimiser le détecteur des battements, les paramètres à optimiser ont été largement modifiés par rapport aux paramètres originaux montrés dans [Pan and Tompkins, 1985] pour créer la population initiale. Dans AE2, utilisé pour optimiser la méthode de segmentation des complexes QRS, les paramètres d’échelle liés à la fenêtre de recherche temporelle ont été définis à partir des positions extrêmes possibles et des connaissances physiologiques sur la durée de chaque onde, alors que les paramètres liés à l’échelle des seuils ont été largement modifiés par rapport à ceux proposés dans [Martínez et al., 2004; Dumont et al., 2010], pour créer la population initiale. La sélection par classement et les opérateurs génétiques standards des chromosomes à valeurs réelles (cross- over simple, arithmétique et heuristique, mutation multi-non uniforme et non uniforme) ont été utilisés dans les deux AE [Michalewicz, 1996]. Vingt paramètres ont été employés dans la méthodologie d’optimisation : huit à partir du détecteur des battements (tableau 3.1) et douze à partir de la méthode de segmentation automatique des complexes QRS (tableau 3.2). Les AE ont été appliqués pour 80 générations de 200 individus, avec une probabilité de croisement de 0,7 et une probabilité de mutation élevée pendant les premières générations et faible à la fin [Bäck and Schütz, 1996]. Une comparaison des performances avant et après optimisation des paramètres dans les deux méthodes a été réalisée par l’évaluation de SEN (équation 2.1), VPP (équation 2.4), µDJ (équation 3.11) et σDJ (équation 3.12) sur des ensembles de test. Pour résoudre ce problème d’optimisation, deux sous-ensembles de données (DB1 et DB2), constitués à partir de la base de données détaillée dans la section 2.2 page 37 ont été formés (c.f. figure 3.8) : 1. Le sous-ensemble DB1, appliqué pour adapter la méthode de détection des batte- ments de l’ECG du nouveau-né prématuré, est composé de 50 segments d’ECG, définis sur un support temporel de cinq minutes avant le début d’un épisode de bradycardie jusqu’à deux minutes après la fin, et ne contenant qu’un seul épisode de bradycardie pendant toute cette période. Ce sous-ensemble est composé de segments d’ECG d’un ou plusieurs patients. Seulement 27 patients de la base de données ont présenté au moins un épisode tel que décrit ci-dessus. DB1 est caractérisée par 51655 battements
  • 93.
    3.3. Optimisation dela chaîne de segmentation d’ECG 63 (autour de 1000 battements par segment ECG). Les positions de l’onde R ont été annotées pour chaque battement par un expert. 2. Le sous-ensemble DB2, appliqué pour adapter la méthode de segmentation des QRS de l’ECG du nouveau-né prématuré, est composé de 93 segments d’ECG, choisis au hasard à partir de la base de données complète et avec au moins un segment ECG par patient. Chaque segment d’ECG est composé d’une phase de repos, suivie d’un ou plusieurs épisodes de bradycardie. Ce fichier est composé de 4464 battements (48 battements par segment). Les positions de l’onde R, du QRSon, du QRSoff et du ISOp ont été annotées pour chaque battement par un expert. Obtenir ces annotations battement à battement est une tâche difficile, particulièrement en présence de bruit. Des annotations précises ont pu être obtenues uniquement pour les 93 segments d’ECG sélectionnés. Dans tous les cas, les événements de bradycardie ont été détectés et annotés par l’analyse de l’intervalle RR. Un épisode de bradycardie est défini comme une augmentation de l’intervalle RR sur un seuil fixé à 600 ms, pendant une durée de quatre secondes ou plus [Poets et al., 1993]. Les moniteurs néonataux sont en général basés sur cette méthode de détection simple. Enregistrements d'ECG - 32 nouveau-nés prématurés - Apnée-bradycardie récurrent DB1L - 25 segments d'ECG - 50 battements par segment DB2: - Permet d'adapter la méthode de segmentation du QRS - 93 segments d'ECG contenant episodes de repos et de bradycardie - 48 battements par segment - Annotation: position du ISOp, QRSon, QRSoff et onde R. DB1: - Permet d'adapter la méthode de détection des battements - 50 segments d'ECG - 1 bradycardie par segment - segments d'ECG > 7 minutes - Annotation: position des ondes R DB2L - 47 segments d'ECG DB2T - 46 segments d'ECG DB1T - La totalité du DB1 Figure 3.8 – Construction des différentes bases de données utilisées pour effectuer les processus d’adaptation et la phase d’évaluation. Deux ensembles d’apprentissage et deux ensembles de test ont été construits pour réaliser l’optimisation (voir Figure 3.8) : – Le premier ensemble d’apprentissage (DB1L) est composé de 25 segments d’ECG à partir de DB1 (la moitié des segments d’ECG de DB1). Cette base de données est utilisée pour AE1. – Le deuxième ensemble d’apprentissage (DB2L) constitué à partir de DB2, contient 47 segments d’ECG choisis au hasard. Cette base de données est utilisée pour AE2.
  • 94.
    64 Chapitre 3 –Le premier ensemble de test (DB1T), utilisé pour tester les paramètres optimaux trouvés pour le détecteur de battement, est composé de l’ensemble DB1. – Le deuxième ensemble de test (DB2T) basé sur DB2 contient les 46 autres segments d’ECG. Cette base de données est utilisée pour tester les paramètres optimaux du processus de segmentation des QRS. Plusieurs morphologies de complexes QRS sont présentes dans ces quatre ensembles de données. La comparaison entre les annotations et les détections a été réalisée dans une fenêtre temporelle de 10 ms. 3.4 Résultats de détection et de segmentation Les résultats sont présentés en deux parties : i) l’évaluation de la détection des battements avec les paramètres optimaux obtenus par AE1 et ii) l’évaluation de la méthode de segmentation des complexes QRS avec les paramètres optimaux obtenus par AE2. Par simplicité, le signal ECG a été sur-échantillonné à 500 Hz, afin de s’accorder avec la fréquence d’échantillonnage du détecteur des battements et la méthode de segmentation des QRS. 3.4.1 Performances du détecteur des battements Les valeurs des paramètres du détecteur de battements avant et après la méthode d’optimisation sont présentées dans le tableau 3.3. Ces valeurs ont été déterminées en utilisant AE1 sur DB1L et ont été choisis comme les valeurs moyennes, pour cinq réalisations différentes de l’AE, des meilleurs individus de la dernière génération. Comparativement à ceux utilisés chez les adultes [Pan and Tompkins, 1985], les paramètres optimaux montrent une augmentation des fréquences de coupure du filtre passe-bas et du filtre passe-haut, qui indiquent évidemment que le complexe QRS des nouveaux-nés prématurés est généralement plus fin, avec un contenu fréquentiel plus élevé que les QRS des adultes. En outre, on observe une diminution de la taille de la fenêtre glissante de l’intégrateur, qui peut aussi s’expliquer par la teneur plus élevée en fréquence du complexe QRS des prématurés. Ces paramètres ont été utilisés pour évaluer la performance de la méthode de détection des QRS sur DB1T. Le tableau 3.4 montre les performances de la méthode de détection en utilisant DB1T, avant (avec les paramètres réglés pour l’ECG d’adulte) et après (avec les paramètres réglés pour l’ECG du prématuré) le processus d’optimisation. La SEN et la VPP ont été obtenues en utilisant une fenêtre de recherche de 10 ms. Ce tableau montre clairement une amélioration dans la détection du PF.
  • 95.
    3.4. Résultats dedétection et de segmentation 65 Tableau 3.3 – Valeurs des paramètres de la méthode de détection des battements avant (pour les adultes) et après (pour les nouveaux-nés prématurés) le processus d’optimisation. Paramètre Avant Après Unité fcLow 15 20,71 Hz fcHigh 5 9,49 Hz TMWI 150 78,41 ms NP 5 7 Battements δ 0,31 0,1485 TRefr 200 233,54 ms TPeak 20 30,75 ms TRRlim 1500 1959,46 ms Tableau 3.4 – Performances du détecteur des battements avant et après le processus d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés pour l’ECG du prématuré. Indicateur SEN (%) VPP (%) µDJ (ms) σDJ (ms) Avant Après Avant Après Avant Après Avant Après PF 91,20 97,74 92,22 98,03 3,51 1,18 15,60 10,23 3.4.2 Performances de la méthode de segmentation des QRS Le tableau 3.5 montre les paramètres optimaux de la méthode de segmentation des QRS par ondelettes, en utilisant AE2 sur DB2L. Un exemple des valeurs de paramètres optimaux, déterminé pour un intervalle RR typique de 400 ms, est illustré dans le tableau 3.6. Une comparaison entre notre approche et les travaux de DUMONT et al. [Dumont et al., 2010], ainsi que ceux de SMRDEL et JAGER [Smrdel and Jager, 2004] est également reportée dans ce tableau. On observe une réduction de toutes les fenêtres de recherche et une augmentation du seuil utilisé pour trouver les ondes Q (γQRSpre), du seuil lié à l’amplitude de la première pente négative significative pour trouver le QRSon (ξQRSonn) et du seuil lié à l’amplitude de la dernière pente négative significative pour trouver le QRSoff (ξQRSoffn). On peut également observer une diminution du seuil de détection des ondes S (γQRSpost), du seuil lié à l’amplitude de la première pente positive significative pour trouver le QRSon (ξQRSonp) et du seuil lié à l’amplitude de la dernière pente positive significative pour trouver le QRSoff (ξQRSoffp). Le tableau 3.7 montre les performances de la méthode de segmentation des QRS basée sur les ondelettes, en utilisant les paramètres optimaux sur DB2T, avant et après le processus d’optimisation. Ce tableau montre une amélioration dans la détection du QRSon, QRSoff
  • 96.
    66 Chapitre 3 Tableau3.5 – Valeurs optimales des paramètres de la méthode de segmentation des QRS. Paramètre Valeur mR1 0,1211 mR2 0,0990 mQlim 0,1030 mSlim 0,1170 mγQRSpre 0,1241 mγQRSpost 0,0909 mξQRSonp 0,0486 mξQRSonn 0,0800 mξQRSoffp 0,1635 mξQRSoffn 0,6995 mPQ 0,1192 mISO 0,0149 Tableau 3.6 – Exemple des fenêtres de recherche et des seuils utilisés dans la méthode de segmentation des QRS. Les paramètres de notre approche ont été déterminés en utilisant les paramètres optimaux (Tableau 3.5) pour un intervalle RR typique de 400 ms. Les autres approches correspondent aux paramètres utilisés par [Dumont et al., 2010] et [Smrdel and Jager, 2004]. Paramètre Approche proposée Autres approches TR1 48,44 ms 118† ms TR2 39,60 ms 111† ms TQlim 40,12 ms 88† ms TSlim 46,80 ms 154† ms mγQRSpre 0,1241 0,09† mγQRSpost 0,0909 0,11† mξQRSonp 0,0486 0,07† mξQRSonn 0,0800 0,07† mξQRSoffp 0,1635 0,21† mξQRSoffn 0,6995 0,23† TPQ 47,68 ms 108‡ ms TISO 5,96 ms 20‡ ms † [Dumont et al., 2010] ‡ [Smrdel and Jager, 2004] et du ISOp. Cependant, pour trouver l’onde R, la SEN reste identique avant et après le processus d’optimisation. Concernant le calcul de la VPP pour ces indicateurs, FP serait toujours égal à 0 dans la fenêtre de recherche car ces indicateurs sont toujours présents. Ceci conduirait à une VPP = 100 %.
  • 97.
    3.5. Analyse duQRS pour la caractérisation de l’apnée-bradycardie 67 Tableau 3.7 – Performances de la segmentation des QRS, avant et après le processus d’optimisation. Avant : paramètres réglés pour l’ECG d’adulte, Après : paramètres réglés pour l’ECG du prématuré. Indicateur SEN (%) µDJ (ms) σDJ (ms) Avant Après Avant Après Avant Après Onde R 98,46 98,46 1,39 1,69 1,44 0,66 QRSon 40,33 90,21 43,48 3,07 11,61 1,27 QRSoff 77,07 80,24 7,81 4,49 5,64 2,64 ISOp 0 80,61 48,88 4,29 2,61 2,29 Les performances obtenues après le processus d’optimisation sont comparables à celles rapportées par ailleurs dans la littérature en utilisant des paramètres et des bases de données d’ECG standard d’adultes [Dumont et al., 2010; Martínez et al., 2004; Pan and Tompkins, 1985]. 3.5 Analyse du QRS pour la caractérisation de l’apnée-bradycardie 3.5.1 Principe et objectif de l’étude Une fois le complexe QRS détecté et segmenté, des nouvelles séries temporelles peuvent être construites à partir des indicateurs tels que les amplitudes des ondes et la durée des intervalles et segments de l’ECG. Dans ce travail les séries temporelles de la durée du cycle cardiaque (RR), l’amplitude de l’onde R (Ramp) et la durée du complexe QRS (QRSd) ont été déterminées et analysées pour chaque segment d’ECG de DB1. La série RR est déterminée classiquement comme la différence successive des instants de détection des ondes R de l’ECG. L’amplitude de l’onde R est déterminée comme la différence entre le pic de l’onde R et le ISOp. La durée du complexe QRS est calculée comme la différence entre la fin et le début du QRS (QRSoff − QRSon). La figure 3.9 montre la façon de déterminer Ramp et QRSd pour un battement synthétique. Les séries correspondantes aux amplitudes des ondes Q et S peuvent être analysées que dans certains cas. Ces ondes sont en effet de très faible amplitude et parfois absentes de l’ECG acquis. Quatre intervalles ont été utilisés pour analyser chaque série, comme illustré dans la figure 3.10 : – L’intervalle T1 défini dès le début de chaque segment d’ECG de DB1 (5 minutes avant la bradycardie) jusqu’à la deuxième minute. Cet intervalle contient les FC au repos (sans aucune perturbation liée à un événement d’apnée-bradycardie).
  • 98.
    68 Chapitre 3 P Q R S T QRSd Ramp Figure3.9 – Amplitude de l’onde R (Ramp) et durée du complexe QRS (QRSd) pour un battement synthétique. – L’intervalle T2 correspond au temps écoulé entre la troisième et la cinquième minute. Dans cet intervalle, il n’y a pas d’événement bradycardie, mais l’épisode d’apnée a déjà commencé (repéré sur la trace de respiration). – L’intervalle T3 défini lors de l’événement de bradycardie. Les épisodes d’apnée et bradycardie sont présents. – L’intervalle T4 défini entre la fin de la bradycardie et la fin du segment d’ECG. Dans cet intervalle, de manière générale, la FC revient à sa valeur de repos. Les séries Ramp ont été normalisées en les divisant par la valeur la plus élevée dans l’intervalle T1. Une comparaison entre l’intervalle T1 (considéré comme référence) et les autres intervalles (T2, T3 et T4) a été effectuée afin de trouver des variations importantes à l’aide de plusieurs critères : – La moyenne pondérée (wµ) : Calculée avec l’équation 3.15 où TS ∈ {RR, Ramp, QRSd}, Ti ∈ {T1, T2, T3, T4}, µTSx Ti est la moyenne de la moyenne de chaque enregistrement x et Nx est le nombre de battements par enregistrement. wµTi = X x=1 NxµTSx Ti X x=1 Nx (3.15) – L’écart-type pondéré (wσ) : Calculé pour chaque série temporelle TS et pour chaque intervalle Ti avec : wσTi = X x=1 NxσTSx Ti X x=1 Nx (3.16) où σTSx Ti est la moyenne de l’écart-type de chaque enregistrement x. – La moyenne de la différence absolue (µDA) : Calculée pour chaque série tem-
  • 99.
    3.5. Analyse duQRS pour la caractérisation de l’apnée-bradycardie 69 0 200 400 600 800 1000 400 600 800 1000 1200 1400 0 200 400 600 800 1000 40 60 80 100 120 140 0 200 400 600 800 1000 0.7 0.8 0.9 1 1.1 RR(ms)QRSd(ms)Ramp Échantillons Échantillons Échantillons T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 Repos Avant bradycardie Bradycardie Après bradycardie Figure 3.10 – De haut en bas respectivement, intervalles d’analyses de séries temporelles RR, QRSd et Ramp. porelle TS avec : µDAT1−Ti = X=Xi x1=xi=1 |µTSx1 T1 − µTSxi Ti| X (3.17) où µTSx1 T1 est la moyenne de l’intervalle T1, µTSxi Ti est la moyenne des autres intervalles (i = {2, 3, 4}) et X est le nombre d’enregistrements. – L’écart-type de la différence absolue (σDA) : Calculé pour chaque série tempo- relle TS avec : σDAT1−Ti = X=Xi x1=xi=1 |σTSx1 T1 − σTSxi Ti| X (3.18) où σTSx1 T1 est la moyenne de la différence absolue de l’écart-type de l’intervalle T1, σTSxi Ti est la moyenne de la différence absolue de l’écart-type des autres intervalles (i = {2, 3, 4}). Le test d’hypothèse de Mann–Whitney U a été utilisé pour analyser les variations entre les intervalles, où une valeur de p < 0, 05 est considérée comme significative.
  • 100.
    70 Chapitre 3 3.5.2Résultats Les séries temporelles représentant RR, Ramp et QRSd ont été extraites des 50 segments d’ECG de vingt-sept nouveaux-nés prématurés avec un épisode de bradycardie par segment. Ces caractéristiques sont particulièrement intéressantes car une étude récente réalisée chez l’adulte souffrant d’apnée obstructive du sommeil indique que les changements de la pression intra-thoracique lors de l’épisode apnée obstructive du sommeil peuvent se traduire par des changements dans les ondes de l’ECG [Penzel et al., 2006]. Une augmentation de la durée du cycle cardiaque en présence de bradycardie peut élargir la durée de la dépolarisation des ventricules correspondant à la durée du complexe QRS. Le tableau 3.8 montre les valeurs de wµ et de wσ des séries temporelles RR, Ramp et QRSd pour tous les intervalles analysés. Les résultats pour les séries RR et QRSd montrent les valeurs les plus élevées pour l’intervalle T3 (cas de bradycardie), suivie par l’intervalle T2 et les valeurs les plus faibles pour le T1. En ce qui concerne Ramp, la valeur le plus basse de wµ est obtenue pour T3 (ainsi que la valeur la plus élevée pour wσ). Une diminution est observée dans wµ de T1 à T3 ainsi qu’une augmentation de wσ de T1 à T3. La valeur le plus grande de wµ est obtenue dans le dernier intervalle. Tableau 3.8 – wµ et wσ des séries temporelles RR, Ramp et QRSd, pour tous les intervalles analysés. Série temporelle T1 T2 T3 T4 wµ wσ wµ wσ wµ wσ wµ wσ RR (ms) 407,90 14,60 414,58 28,43 712,01 147,94 413,89 19,72 Ramp 0,8233 0,0605 0,8187 0,0638 0,8155 0,0754 0,8293 0,0661 QRSd (ms) 61,03 5,887 61,58 6,22 66,35 15,06 61,43 7,08 Les valeurs de µDA et de σDA sont indiquées dans le tableau 3.9. Ces valeurs sont calculées entre l’intervalle T1 et les autres intervalles, pour les séries temporelles RR, Ramp et QRSd. Pour toutes les séries temporelles, des valeurs élevées de µDA et de σDA sont obtenues entre T1 et T3. Les résultats des tests d’hypothèse de Mann–Whitney U sont présentés dans le ta- bleau 3.10, calculé pour la moyenne des séries RR, Ramp et QRSd, entre les intervalles analysés. Comme prévu, des différences significatives entre les intervalles T1 et T3 sont observées pour les séries temporelles RR. En ce qui concerne la différence moyenne entre l’intervalle T1 et les autres intervalles, des différences significatives ont été observées pour toutes les séries temporelles lors de la comparaison T1 − T2 vs. T1 − T3 et T1 − T3 vs. T1 − T4.
  • 101.
    3.5. Analyse duQRS pour la caractérisation de l’apnée-bradycardie 71 Tableau 3.9 – µDA et σDA entre l’intervalle T1 et les autres intervalles, pour les séries temporelles RR, Ramp et QRSd. Série temporelle T1 − T2 T1 − T3 T1 − T4 µDA σDA µDA σDA µDA σDA RR (ms) 11,26 15,31 285,06 123,24 13,93 8,76 Ramp 0,0442 0,0192 0,0966 0,0388 0,0585 0,0238 QRSd (ms) 2,02 1,66 10,67 9,38 2,57 2,17 Tableau 3.10 – tests d’hypothèse de Mann–Whitney U pour la moyenne des séries RR, Ramp et QRSd. Intervalle p(RR) p(Ramp) p(QRSd) T1 vs. T2 0,2931 0,7174 0,8713 T1 vs. T3 <0,0001† 0,6075 0,1044 T1 vs. T4 0,2655 0,4061 0,6816 T1 − T2 vs. T1 − T3 <0,0001† 0,0002† <0,0001† T1 − T2 vs. T1 − T4 <0,3092 0,0973 0,5602 T1 − T3 vs. T1 − T4 <0,0001† 0,0231† <0,0001† † Statistiquement significatif La figure 3.11 montre les boîtes à moustache de la moyenne par intervalle des 50 séries RR, Ramp et QRSd et la différence de la moyenne entre l’intervalle T1 et les autres intervalles pour les mêmes séries temporelles. On montre que la plus grande différence dans la moyenne est obtenue entre les intervalles T1 et T3 pour toutes les séries. La figure 3.12 montre un segment typique présentant de faibles différences entre l’in- tervalle T1 et les autres intervalles. La figure 3.13 montre un segment typique avec des différences significatives entre l’intervalle T1 et les autres intervalles. Les changements dans Ramp sont clairement observés dans les figures 3.12c et 3.13c, liés à l’épisode de bradycardie montré dans les séries RR (figures 3.12a et 3.13a). En outre, il est observé dans les figures 3.12d et 3.13d des erreurs dans le processus de segmentation automatique du QRS où le QRSon et QRSoff ne sont pas toujours bien détectés. Ceci est également observé dans les figures 3.12b et 3.13b où la série QRSd montre plusieurs artefacts.
  • 102.
    72 Chapitre 3 T1T2 T3 T4 400 500 600 700 800 900 Values T1−T2 T1−T3 T1−T4 0 100 200 300 400 500 Values (a) T1 T2 T3 T4 0.2 0.4 0.6 0.8 1 1.2 Values T1−T2 T1−T3 T1−T4 0 0.1 0.2 0.3 0.4 Values (b) T1 T2 T3 T4 40 60 80 100 120 Values T1−T2 T1−T3 T1−T4 0 20 40 60 Values (c) Figure 3.11 – Boîtes à moustaches de la moyenne des séries par intervalle et de la différence de la moyenne des séries entre l’intervalle T1 et les autres intervalles, pour les séries temporelles : (a) RR, (b) Ramp et (c) QRSd.
  • 103.
    3.5. Analyse duQRS pour la caractérisation de l’apnée-bradycardie 73 0 200 400 600 800 1000 200 300 400 500 600 700 800 900 1000 RRinterval(ms) T1 T2 T4T3 (a) 0 200 400 600 800 1000 50 60 70 80 90 100 110 120 130 QRSduration(ms) (b) 0 200 400 600 800 1000 0.5 0.6 0.7 0.8 0.9 1 1.1 NormalizedR−waveamplitude(V) (c) 1.079 1.08 1.081 1.082 1.083 −2 −1 0 1 2 3 4 ECGamplitude(V) x10 5 x10 5 (d) Figure 3.12 – Segment typique présentant de petites différences entre l’intervalle T1 et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles, alors que dans (d), les lignes verticales en pointillé représentent la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff).
  • 104.
    74 Chapitre 3 0200 400 600 800 400 500 600 700 800 900 1000 RRinterval(ms) T2T1 T3 T4 (a) 0 200 400 600 800 40 50 60 70 80 90 100 110 120 QRSduration(ms) (b) 0 200 400 600 800 0.2 0.4 0.6 0.8 1 NormalizedR−waveamplitude(V) (c) 1.088 1.089 1.09 1.091 1.092 −4 −2 0 2 4 6 ECGamplitude(V) x10 5 x10 -4 (d) Figure 3.13 – Segment typique présentant de différences significatives entre l’intervalle T1 et les autres intervalles. En (a)-(c), les lignes verticales en pointillé délimitent les intervalles, alors que dans (d), les lignes verticales en pointillé représentent la segmentation automatique du QRS (QRSon, pic de l’onde R et QRSoff).
  • 105.
    3.6. Conclusions 75 3.6Conclusions Ce chapitre était centré sur la détection et la segmentation optimales de l’activité électrique ventriculaire du nouveau-né prématuré. Les difficultés liées au RSB, aux situations variables, à la difficulté d’observer certaines ondes et surtout aux très grandes modifications de l’ECG du prématuré par rapport à l’ECG de l’adulte ont nécessité de repenser totalement l’analyse de l’ECG du nouveau-né. Dans ce contexte, notre approche a été d’exploiter des algorithmes récemment mis au point au laboratoire et de les adapter à l’ECG très différent du prématuré et de nous limiter à la détection et la segmentation du complexe QRS. Afin d’adapter ces algorithmes de détection et de segmentation aux propriétés spécifiques de l’ECG des nouveaux-nés prématurés, une méthodologie d’optimisation basée sur deux AE indépendants a donc été proposée pour optimiser les 8 paramètres du détecteur et les 12 paramètres de la méthode de segmentation. La probabilité d’erreur de détection, la moyenne et l’écart-type du jitter de la détection ont été combinées pour construire la fonction de coût à minimiser par chaque AE. Deux ensembles d’apprentissage distincts ont été utilisés pour chaque AE. Les paramètres optimaux ont montré une amélioration de la performance de la détection des battements et de la segmentation automatique du complexe QRS, sur les enregistrements d’ECG acquis à partir de 32 nouveaux-nés prématurés. Sur deux ensembles de test, les paramètres optimaux estimés augmentent la sensibilité et la valeur prédictive positive du point fiducial, des débuts et des fins du complexe QRS et du niveau iso-électrique. En outre, une réduction de la moyenne et de l’écart-type du jitter de la détection a été obtenue pour le point fiducial, le début et la fin du complexe QRS et le niveau iso-électrique. Même si les paramètres optimaux de la méthode de segmentation basée sur les ondelettes ne modifient pas la performance de la détection de l’onde R, l’écart-type du jitter de la détection a été diminué. En contre partie, le biais expérimental à la détection a légèrement augmenté. Malgré les performances supérieures obtenues après l’application du processus d’op- timisation pour la détection du début et de la fin des complexes QRS, la méthode de segmentation doit être encore améliorée. La difficulté de la segmentation du complexe QRS dans ce contexte peut être observée, en particulier dans la figure 3.12d, où le début du QRS est parfois placé plus proche de la fin de l’onde P et la fin du QRS est placée plus ou moins loin de l’onde S en fonction de la morphologie du segment ST. En effet, la faible fréquence d’échantillonnage d’origine, les changements fréquents de l’axe électrique cardiaque, les changements dans le segment PR et le faible RSB de ces signaux ECG rendent très difficile l’obtention robuste des instants du début et de fin du complexe QRS. Une analyse combinée de l’ECG multi-voies devrait permettre d’améliorer ce point. L’analyse des séries temporelles de la durée du cycle cardiaque (RR), de l’amplitude de l’onde R (Ramp) et des durées des complexes QRS (QRSd) ont été réalisées sur 50 segments
  • 106.
    76 Chapitre 3 d’ECGde 27 nouveaux-nés prématurés. Lorsque les valeurs de repos sont utilisés comme référence (pendant T1), les tests d’hypothèse de Mann–Whitney U pour la moyenne de chaque série temporelle ont montré des variations significatives (p < 0, 05) entre les intervalles précédant la bradycardie et au cours de la bradycardie (T1−T2 vs. T1−T3). Des variations significatives ont été aussi obtenus entre l’épisode de bradycardie et la période de repos qui le suit (T1 − T3 vs T1 − T4). Ces résultats ont été obtenus pour toutes les séries temporelles analysées. Les principales contributions des travaux présentés dans ce chapitre ont été : i) la proposition de méthodes de détection et de segmentation de l’activité électrique ventriculaire, spécifiques au nouveau-né prématuré et ii) l’observation des modifications de l’amplitude de l’onde R et de la durée du complexe QRS, associée à la survenue des épisodes d’apnée- bradycardie. Ces travaux ont été publiés dans un article de journal international [Altuve et al., 2011] et dans une conférence internationale [Altuve et al., 2009]. Les résultats de ce chapitre montrent les bénéfices potentiels d’une approche multidimensionnelle pour la détection précoce et la caractérisation des apnée-bradycardies. D’autre part, l’analyse de différences montre explicitement des distinctions entre la phase stable du bébé et la phase d’apnée- bradycardie. Ceci suggère non pas d’analyser les valeurs instantanées mais plutôt de prendre en compte les dynamiques de ces séries. L’objet du prochain chapitre est de proposer une méthodologie adaptée à cette problématique.
  • 107.
    Bibliographie 77 Bibliographie Altuve, M.,Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009). Analysis of the QRS complex for apnea-bradycardia characterization in preterm infants. In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual International Conference of the IEEE, pages 946–949. IEEE. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011). Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in preterm infants. International Journal of Biomedical Engineering and Technology, 5(2/3) :247–265. Arzeno, N., Deng, Z., and Poon, C. (2008). Analysis of first-derivative based qrs detection algorithms. Biomedical Engineering, IEEE Transactions on, 55(2) :478–484. Bäck, T. and Schütz, M. (1996). Intelligent mutation rate control in canonical genetic algorithms. In Ras, Z. W. and Michalewicz, M., editors, ISMIS, volume 1079 of Lecture Notes in Computer Science, pages 158–167. Springer. Chen, S., Chen, H., and Chan, H. (2006). A real-time qrs detection method based on moving-averaging incorporating with wavelet denoising. Computer methods and programs in biomedicine, 82(3) :187–195. Clavier, L. and Boucher, J. (1996). Segmentation of electrocardiograms using a Hidden Markov Model. In Proceedings of the 18th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, 1996. Bridging Disciplines for Biomedicine, pages 1409–1410. Coast, D. (1993). Segmentation of high-resolution ECGs using hidden Markov models. In 1993 IEEE International Conference on Acoustics, Speech, and Signal Processing, 1993. ICASSP-93., volume 1. Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD thesis, Universidad Simón Bolívar. Dumont, J., Hernández, A. I., and Carrault, G. (2010). Improving ecg beats delineation with an evolutionary optimization process. IEEE Trans Biomed Eng, 57(3) :607–15. Eiben, A. and Smith, J. (2003). Introduction to evolutionary computing. Springer Verlag. Hernández, A. I., Carrault, G., Mora, F., and Bardou, A. (2002). Model-based interpretation of cardiac beats by evolutionary algorithms : signal and model interaction. Artificial Intelligence in Medicine, 26(3) :211–235. Herrero, J., Blasco, X., Martínez, M., Ramos, C., and Sanchis, J. (2008). Non-linear robust identification using evolutionary algorithms : : Application to a biomedical process. Engineering Applications of Artificial Intelligence, 21(8) :1397–1408. Hughes, N., Tarassenko, L., and Roberts, S. (2003). Markov models for automated ECG interval analysis. Advances in Neural Information Processing Systems, 16. Jane, R., Laguna, P., Thakor, N., and Caminal, P. (1992). Adaptive baseline wander removal in the ECG : Comparative analysis with cubic spline technique. Computers in Cardiology, pages 143–143.
  • 108.
    78 Bibliographie Köhler, B.-U.,Hennig, C., and Orglmeister, R. (2002). The principles of software qrs detection. IEEE Eng Med Biol Mag, 21(1) :42–57. Koski, A. (1996). Modelling ECG signals with hidden Markov models. Artificial Intelligence in Medicine, 8(5) :453–471. Laguna, P., Jané, R., and Caminal, P. (1994). Automatic detection of wave boundaries in multilead ecg signals : Validation with the cse database. Computers and Biomedical Research, 27(1) :45–60. Levkov, C., Mihov, G., Ivanov, R., Daskalov, I., Christov, I., and Dotsinsky, I. (2005). Removal of power-line interference from the ecg : a review of the subtraction procedure. Biomed Eng Online, 4 :50. Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet transforms. IEEE Trans Biomed Eng, 42(1) :21–8. Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet- based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng, 51(4) :570–81. Meyer, C. and Keiser, H. (1977). Electrocardiogram baseline noise estimation and removal using cubic splines and state-space computation techniques. Computers and Biomedical Research, 10(5) :459–470. Michalewicz, Z. (1996). Genetic algorithms+ data structures. Springer. Nelder, J. and Mead, R. (1965). A simplex method for function minimization. The computer journal, 7(4) :308. Pan, J. and Tompkins, W. J. (1985). A real-time QRS detection algorithm. IEEE Transac- tions on Biomedical Engineering, BME-32(3) :230–236. Party, T. C. W. (1985). Recommendations for measurement standards in quantitative electrocardiography. Eur Heart J, 6(10) :815–25. Penzel, T., Nottrott, M., Canisius, S., Greulich, T., Becker, H. F., and Vogelmeier, C. (2006). P428 ecg morphology changes improves detection of obstructive sleep apnea. Sleep Medicine, 7(Supplement 2) :S101–S102. Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7. Shusterman, V., Shah, S. I., Beigel, A., and Anderson, K. P. (2000). Enhancing the precision of ecg baseline correction : selective filtering and removal of residual error. Comput Biomed Res, 33(2) :144–60. Smrdel, A. and Jager, F. (2004). Automated detection of transient st-segment episodes in 24 h electrocardiograms. Med Biol Eng Comput, 42(3) :303–11. Soria-Olivas, E., Martinez-Sober, M., Calpe-Maravilla, J., Guerrero-Martinez, J., Chorro- Gasco, J., and Espi-Lopez, J. (1998). Application of adaptive signal processing for determining the limits of P and T waves in an ECG. IEEE Transactions on Biomedical Engineering, 45(8) :1077–1080.
  • 109.
    Bibliographie 79 Sörnmo, L.(1993). Time-varying digital filtering of ecg baseline wander. Med Biol Eng Comput, 31(5) :503–8. Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de Markov cachés. PhD thesis, Université de Rennes 1. Vila, J., Gang, Y., Presedo, J., Fernández-Delgado, M., Barro, S., and Malik, M. (2000). A new approach for TU complex characterization. IEEE Transactions on Biomedical Engineering, 47(6) :764–772. Vullings, H., Verhaegen, M., and Verbruggen, H. (1997). ECG segmentation using time- warping. In Advances in Intelligent Data Analysis. Reasoning about Data : Second International Symposium, IDA-97, London, UK, August 1997. Proceedings, page 275. Springer. Wong, S. (2004). Segmentation de l’intervalle RT et description par analyse factorielle de la variabilité de la fréquence cardiaque et de la repolarisation ventriculaire. PhD thesis, Université de Rennes 1. Ziarani, A. K. and Konrad, A. (2002). A nonlinear adaptive method of elimination of power line interference in ecg signals. IEEE Trans Biomed Eng, 49(6) :540–7. Zifan, A., Saberi, S., Moradi, M., and Towhidkhah, F. (2006). Automated ECG Segmentation Using Piecewise Derivative Dynamic Time Warping. International Journal of Biological and Medical Sciences, 1(3).
  • 111.
    Chapitre 4 Modélisation dela dynamique de séries temporelles multivariées Le chapitre précédent a clairement mis en évidence que l’analyse de la dynamique d’indicateurs physiologiques était essentielle pour la caractérisation des épisodes d’apnée- bradycardie chez les prématurés. Il a aussi montré que les méthodes de détection disponibles actuellement n’exploitent pas cette dynamique. L’objet de ce chapitre est donc de répondre à la problématique de la prise en compte de cette dynamique dans la détection d’événements cardio-respiratoires. Il concerne également l’extraction de nouvelles informations contenues dans de grands volumes de données physiologiques qui présente encore des difficultés d’ordre méthodologique et technique, en particulier dans le contexte biomédical. La position du problème d’un point de vue de la fouille de données temporelles et multidimensionnelles est donc présentée dans un premier paragraphe pour la caractérisation des indicateurs extraits de l’ECG. Les modélisations stochastiques, comme les modèles de Markov cachés et les modèles semi-Markoviens cachés, ont été choisies comme approches méthodologiques pour réaliser cette fouille de données. Ce choix est justifié dans le premier paragraphe. Les modèles de Markov et de semi-Markov cachés sont ensuite définis, en particulier leurs architectures, les procédures utilisées pour l’estimation des paramètres et l’utilisation des distributions gaussiennes pour définir le temps passé dans les états et les probabilités d’émission d’observations. Une méthodologie proposée, dans notre laboratoire, pour l’initialisation des paramètres des modèles est détaillée ainsi que la détermination du nombre d’états par modèle et l’évaluation de la vraisemblance qu’une séquence d’observation soit générée pour un modèle. L’utilisation des modèles Markoviens cachés et de modèles semi-Markoviens cachés, sur des études conduites antérieurement au laboratoire, pour les tâches de classification et de détection sur des situations cliniques réelles est montrée. L’analyse des résultats nous a conduit à proposer des modifications qui sont finalement 81
  • 112.
    82 Chapitre 4 présentées.Ces modifications, qui constituent les principales contributions de ce chapitre, concernent notamment l’utilisation des lois uniforme et non uniforme pour quantifier les séries temporelles et la prise en compte des versions retardées de la série temporelle. La première cherche à augmenter le rapport signal sur bruit et à optimiser le vecteur d’observation par état. La deuxième cherche à incrémenter l’observabilité du système tout en conservant le même nombre de sources. Une méthodologie empirique est enfin proposée pour rechercher les valeurs optimales des paramètres des modèles. 4.1 Position du problème et état de l’art 4.1.1 Positionnement du problème La détection des épisodes d’apnée-bradycardie est basée sur le fait que l’apnée du prématuré entraîne souvent, quelques secondes après, un ralentissement de la FC et une chute de la SpO2. Si l’apnée est souvent observée chez les nouveaux-nés prématurés, elle n’est considérée pathologique que lorsqu’elle s’accompagne d’une bradycardie ou d’une désaturation d’oxygène. La détection de l’apnée-bradycardie du prématuré a été largement étudiée depuis quelques années. Cependant, la plupart ces travaux exploitent une seule caractéristique extraite de l’ECG : la durée du cycle cardiaque sous forme d’une série temporelle appelée RR. Parmi les travaux dédiés à détecter les épisodes d’apnée-bradycardie on peut citer notamment ceux de : – POETS [Poets et al., 1993] qui suggère l’utilisation d’un seuil relatif à l’amplitude de la série RR, – PRAVISANI et al [Pravisani et al., 2003] qui analysent les mesures linéaires et non linéaires de la VFC par ACP et par analyse hiérarchique ascendante, – CRUZ et al [Cruz et al., 2006], PORTET et al [Portet et al., 2007], et BELAL et al [Belal et al., 2011] qui utilisent la technique des changements abrupts de valeur moyenne, – CRUZ et al [Cruz et al., 2006] qui réalisent une fusion optimale des détecteurs d’apnée-bradycardie reportés dans la littérature, – PORTET et al [Portet et al., 2007] qui exploitent diverses caractéristiques de la série RR (superficie, pente, amplitudes minimale et maximale, dérivée, moyenne, etc.) par arbres de décision, – BELAL et al [Belal et al., 2011] qui utilisent les séries RR, fréquence respiratoire et SpO2 pour détecter l’apnée du prématuré par des techniques comme la somme cumulée, la corrélation et la dérivée. Tel qu’il a été montré dans le chapitre précèdent, certaines caractéristiques extraites de l’ECG, comme par exemple l’amplitude de l’onde R, la durée du complexe QRS et l’intervalle RR, contiennent des informations pertinentes qui peuvent être prises en compte dans une
  • 113.
    4.1. Position duproblème et état de l’art 83 démarche de détection précoce de l’apnée-bradycardie. De plus, l’examen de ces séries renseigne sur les différents systèmes physiologiques impliqués dans cette pathologie (système nerveux autonome, respiratoire, circulatoire, etc.) et leur interaction avec l’environnement. Comme déjà mentionné, l’intérêt principal de ce travail de thèse est de développer une technique de détection des épisodes d’apnée-bradycardie robuste, efficace et applicable en temps-réel, basée exclusivement sur des indicateurs extraits du signal ECG. Cette approche pourrait, à terme, être intégrée dans un dispositif communicant, facile à appliquer sur les nouveaux-nés, avec un encombrement minimal (seul l’ECG serait acquis). Ce travail se place donc dans le domaine de la détection précoce d’événements dans un contexte bruité et non-stationnaire, où l’extraction des connaissances nécessaires pour optimiser la détection doit être réalisée à partir de bases de données cliniques multivariées. 4.1.2 Fouille de données temporelles multivariées La fouille de données désigne le processus d’extraction de nouvelles informations non- triviales et utiles (connaissances) à partir de grandes quantités de données, par l’utilisation des méthodes issues de la statistique et de l’intelligence artificielle. Les méthodes de fouille de données ont été appliquées sur des contextes variés, comme la prédiction, la classification, le clustering, la recherche par contenu ou encore la visualisation et la détection d’anomalies [Witten and Frank, 2005]. Quelques travaux ont été plus précisément consacrés à l’analyse de séries temporelles [Povinelli, 2001; Kantardzic and Press, 2003; Mörchen, 2006; Laxman and Sastry, 2006]. Ces méthodes de fouille de données peuvent être appliquées, dans le domaine biomédical, pour identifier l’information utile contenue dans des larges bases de données cliniques ou biologiques, afin d’en extraire des connaissances qui pourront être exploitées dans une finalité diagnostique ou thérapeutique. Dans ce travail de thèse, des méthodes de fouille de données temporelles et multivariées sont proposées et appliquées dans le contexte de la détection d’événements physiopatho- logiques. La figure 4.1 illustre ce problème d’extraction des connaissances à partir des caractéristiques extraites de l’ECG. Trois exemples des séries RR, RAMP et QRSd y sont reportés dans différents états physiopathologiques du nouveau-né prématuré : au repos (en haut), en présence d’un ralentissement de la FC non pathologique (au milieu) et en présence d’une bradycardie profonde (en bas). Sur les figures 4.1g, 4.1h et 4.1i, le début de la bradycardie est indiqué par un losange et la détection effectuée par le système de monitoring installé dans l’USIN est représentée par un cercle. Il apparaît clairement qu’une analyse classique (basée uniquement sur les amplitudes instantanées de ces séries) ne serait pas efficace. On observe également la complexité des séries à traiter. Les tendances cachées à repérer peuvent être observées dans une ou plusieurs variables à la fois (cas uni et multivarié respectivement), en même temps ou avec des différences significatives de phase. L’analyse de l’évolution temporelle (dynamique) de ces variables n’est pas souvent prise en compte,
  • 114.
    84 Chapitre 4 dûen partie à la complexité des méthodes à utiliser. Cependant, il est évident que ces dynamiques apportent des nouvelles connaissances pour la caractérisation de la pathologie. La problématique principale à laquelle nous sommes confrontés dans ce travail est donc d’identifier et de caractériser des dynamiques spécifiques, permettant de détecter le plus précocement possible les événements pathologiques (i.e. une détection proche du losange dans les Figures 4.1g, 4.1h et 4.1i). 0 20 40 60 80 100 120 300 350 400 450 500 550 600 650 700 750 RR(ms) Temps (s) (a) 0 20 40 60 80 100 120 0.5 0.6 0.7 0.8 0.9 1 1.1 RAMP Temps (s) (b) 0 20 40 60 80 100 120 40 42 44 46 48 50 52 54 56 58 60 QRSd(ms) Temps (s) (c) 0 20 40 60 80 100 120 300 350 400 450 500 550 600 650 700 750 RR(ms) Temps (s) (d) 0 20 40 60 80 100 120 0.5 0.6 0.7 0.8 0.9 1 1.1 RAMP Temps (s) (e) 0 20 40 60 80 100 120 40 42 44 46 48 50 52 54 56 58 60 QRSd(ms) Temps (s) (f) 0 20 40 60 80 100 120 300 350 400 450 500 550 600 650 700 750 RR(ms) Temps (s) (g) 0 20 40 60 80 100 120 0.5 0.6 0.7 0.8 0.9 1 1.1 RAMP Temps (s) (h) 0 20 40 60 80 100 120 40 42 44 46 48 50 52 54 56 58 60 QRSd(ms) Temps (s) (i) Figure 4.1 – Exemples des séries temporelles extraites de l’ECG sur trois instants différents. Dans (a), (b) et (c) on observe les séries RR, RAMP et QRSd respectivement dans une période de repos. Dans (d) la série RR pressente un ralentissement du cœur qui produit des variations dans les séries RAMP (e) et QRSd (f). Dans (g), (h) et (i) on observe les séries RR, RAMP et QRSd respectivement en présence d’un épisode d’apnée-bradycardie dont le cercle correspond à la détection effectuée par la méthode classique (RR ≥ 600 ms pendant 4 s) et le losange représente le début de la bradycardie. La démarche générale choisie dans cette deuxième partie de la thèse, pour la détection d’événements d’apnée-bradycardie, est basée sur le cadre de la fouille de données temporelles
  • 115.
    4.1. Position duproblème et état de l’art 85 et multivariées. Cette démarche est classiquement représentée par le diagramme reporté figure 4.2 et détaillée comme suit : Base de données Sélection Pré-traitement Transformation Outils de fouille Évaluation Connaissances Nouveaux-nés prématurés Section 2.2.1 Signaux ECG Nettoyage, extraction de caracteristiques Chapitre 3 Caractérisation des dynamiques multivariées Section 4.1.3 Application de la fouille de données Section 4.3.6 et 4.4 Validation et vérification des résultats Section 2.3 Figure 4.2 – Étapes du processus de fouille de données et leur correspondance dans cette thèse. 1. Sélection. Des signaux ECG bruts ont été acquis dans l’USIN de Rennes, sur des nouveaux-nés prématurés présentant des épisodes d’apnées-bradycardie fréquents. L’étape de sélection consiste à choisir les segments d’ECG exploitables en termes de rapport signal sur bruit et en fonction des pathologies et des types d’événement observés dans chaque enregistrement. L’interaction avec les pédiatres a été capitale dans cette étape. Des annotations des épisodes d’apnée-bradycardie ont été effectuées par les spécialistes et ont servi de point de repère des évènements à détecter et dans la mise au point et validation des méthodes de détection développées. 2. Pré-traitement. Il consiste à nettoyer au mieux le signal ECG, puis à en extraire l’information utile pour caractériser les épisodes d’apnée-bradycardie. Cette informa- tion correspond aux indicateurs utilisés par les cardiologues pour caractériser le cycle cardiaque (notamment les intervalles et amplitudes des ondes présentées figure 1.7) ainsi que le rythme cardiaque instantané. Cette étape d’extraction est fondamentale car elle permet de réduire la dimension des données (par rapport aux signaux bruts) et de conserver une information interprétable par les spécialistes. Le troisième chapitre
  • 116.
    86 Chapitre 4 dece mémoire a été dédié à cette étape de nettoyage/extraction. L’une des difficultés rencontrées est le choix de seuils de décisions optimaux et ce chapitre a montré une méthode d’optimisation des seuils basée sur des algorithmes évolutionnaires. 3. Transformation. A l’issu de l’étape d’extraction de caractéristiques on dispose de N séries temporelles multivariées de différentes tailles Tn : n ∈ {1, 2, . . . , N}, constituées d’une succession de vecteurs d’observations : O = {o1 1:T1 , o2 1:T2 , . . . , oN 1:TN } (4.1) où on 1:T1 est le ne vecteur d’observation et o1:T = o1, o2, . . . , oT est la séquence d’ob- servation multivariée de taille T qui regroupe les M variables x à chaque instant t et définies dans RM : ot =       x1 t x2 t ... xM t       (4.2) L’objectif à ce stade est de proposer une transformation permettant de caractériser la dynamique de l’ensemble d’observations O, en fonction des états physiopathologiques à classer ou à détecter. La section 4.1.3 décrit les différentes approches existantes dans la littérature et indique le type de méthode privilégiée dans ce travail de thèse. 4. Outils de fouille. Dans cette étape on définit les méthodes utilisées pour extraire l’information utile à partir des bases de données disponibles, en exploitant les trans- formations définies dans l’étape précédente. Les sections 4.3.6 et 4.4 présentent les outils méthodologiques proposés pour cette étape. 5. Évaluation. L’application des étapes précédentes va produire une série de résultats de détection de l’évènement d’intérêt, en conséquence, dans cette étape, on choisit l’outil de fouille qui apporte la meilleure solution à notre problème, c’est-à-dire, celui qui donne la meilleure performance de détection. Cette performance est évaluée en fonction des valeurs de sensibilité, spécificité et retard à la détection et c’est la distance la plus courte à la détection parfaite qui permettra de choisir le meilleur outil de fouille appliqué (c.f. section 2.3). Le reste de ce chapitre présente les méthodes adaptées à chacune des étapes décrites précédemment. 4.1.3 Caractérisation des dynamiques de séries temporelles L’analyse et la caractérisation des dynamiques de séries temporelles est un vaste domaine de recherche qui continue à se développer depuis son apparition dans les années 80. On
  • 117.
    4.1. Position duproblème et état de l’art 87 relève notamment des applications en traitement du signal, comme par exemple dans le domaine de reconnaissance de la parole [Chibelushi et al., 2002; Beritelli et al., 2006; Dufour et al., 2009], la bioinformatique [Mittag et al., 2010; Csizmok et al., 2008; Givaty and Levy, 2009], la climatologie [Maseng and Bakken, 1981; Kusiak et al., 2009; Fan et al., 2009], etc. Cette caractérisation de dynamiques est fréquemment décomposée en deux problèmes distincts [Mörchen, 2006] : 1. L’estimation de mesures de similarité, basée sur la forme ou sur les caractéristiques in- trinsèques du signal. Les méthodes basées sur la forme nécessitent peu de connaissances a priori et sont bien adaptées aux problèmes de classification, mais la résolution de problèmes de prédiction et de prise en compte de données multivariées à dynamiques hétérogènes n’est pas directe. Les méthodes basées sur les caractéristiques nécessitent plus de connaissances a priori sur les données (sélection des caractéristiques infor- matives). La définition d’une distance dans l’espace des caractéristiques n’est pas évidente, qui plus est, dans le cas de données temporelles multivariées. 2. Les approches à base de modèles. Elles permettent, pour la plupart, la prise en compte de séries temporelles multidimensionnelles et de différentes tailles. L’introduction de connaissances a priori peut être réalisée à plusieurs niveaux de détail, en fonction de l’application visée. Cette approche permet également de mesurer l’adéquation d’un individu à un modèle donné (tâche de classification) ou de réaliser des prédictions, par simulation. Cependant, elle est, en général, plus difficile à mettre en œuvre et est particulièrement dépendante de la quantité et de la qualité des données utilisées dans la période d’apprentissage ou de validation du modèle. L’analyse des paragraphes précédents a orienté notre choix vers les approches à base de modèles de type « boîte noire ». Ce choix se justifie par le fait que, dans notre problème de caractérisation des dynamiques des séries temporelles extraites de l’ECG, i) les connaissances a priori directement exploitables sont limitées, ii) plusieurs variables peuvent contenir de l’information utile et ces variables doivent être traitées de manière conjointe (multivariée) et iii) les dynamiques des différentes variables étudiées sont hétérogènes, car elles sont la conséquence de processus physiologiques fonctionnant avec des constantes de temps très différentes. De plus, les approches à base de modèles permettent d’aborder l’étape de prédiction et les paramètres identifiés (même dans le cas des modèles à « boîte noire »), peuvent être utilisés pour mieux comprendre les phénomènes physiologiques observés. Plusieurs méthodes ont été proposées dans la littérature pour la modélisation des dynamiques des séries temporelles multivariées : – les modèles dans les espaces de phases reconstruits [Suzuki et al., 2003; Kong et al., 2009; Garcia and Almeida, 2006], – les filtres de Kalman [Kalman et al., 1960; Houtekamer and Mitchell, 2001; Fahrmeir, 1992], – les réseaux bayésiens dynamiques [Murphy, 2002; Zweig and Russell, 1998], – les réseaux de neurones artificiels [Raman and Sunilkumar, 1995; Bishop, 1995],
  • 118.
    88 Chapitre 4 –les modèles de Markov cachés [Rabiner, 1989], – les modèles semi-Markovien cachés [Ferguson, 1980; Yu, 2010]. Des travaux de doctorat récents effectués dans notre laboratoire (thèse de DUMONT J. [Dumont, 2008]) ont été dédiés à l’étude et à la comparaison de ces principales méthodes de modélisation des dynamiques sur des séries temporelles issues du domaine biomédical, dans un cadre d’analyse de données physiologiques temporelles et multivariées. Les résultats de ce travail ont montré que les modèles Markoviens cachés (MMC) et les modèles semi-Markoviens cachés (MSMC) présentent un certain nombre de propriétés qui les rendent particulièrement adaptés à la modélisation des dynamiques de séries temporelles en cardiologie. Dans les sections suivantes, un rappel de la théorie des modèles de Markov et semi- Markov cachés est présenté. L’approche méthodologique proposée dans les travaux de DUMONT [Dumont, 2008; Dumont et al., 2008, 2009b,a] est ensuite décrite brièvement. Enfin, des améliorations proposées dans le présent travail aux méthodes existantes sont détaillées. 4.2 Les modèles de Markov et semi-Markov cachés Dans cette section, une brève introduction aux MMC et MSMC et leurs propriétés de base est présentée. Pour en savoir plus, on invite le lecteur à se reporter aux travaux de EPHRAIM et MERHAV [Ephraim and Merhav, 2002] ou MACDONALD et ZUCCHINI [MacDonald and Zucchini, 1997] pour les MMC et KULKARNI [Kulkarni, 2010] ou YU [Yu, 2010] pour les MSMC. Un MMC est un processus doublement stochastique où le processus stochastique sous- jacent est une chaîne de Markov d’états finis et à temps discret. La séquence d’états n’est pas observable (d’où le terme « caché ») et influence un autre processus stochastique qui produit une séquence d’observations. La structure de base des MMC est illustrée dans la figure 4.3. S2S1 S3 O1 O2 O3 Observations Chaîne de Markov (non observée) Figure 4.3 – Structure de base d’un modèle de Markov caché.
  • 119.
    4.2. Les modèlesde Markov et semi-Markov cachés 89 Introduits par BAUM et PETRIE [Baum and Petrie, 1966], les MMC ont été appliqués dans un grand nombre de domaines comme : – la biologie [Churchill, 1992; Pedersen and Hein, 2003; Munshaw and Kepler, 2010], – la reconnaissance de la parole [Rabiner, 1989], – le traitement de l’image [Yamato et al., 1992], – la reconnaissance de texte [Chen et al., 1994]. Cependant, en raison d’une probabilité non nulle d’auto-transition d’un état, la durée d’un état MMC suit une distribution géométrique. Cela rend les MMC inadaptés dans certaines applications, telles que la reconnaissance des gènes humains dans l’ADN [Burge and Karlin, 1997] ou la modélisation des séries chronologiques financières [Bulla and Bulla, 2006]. Pour résoudre ce problème, FERGUSON [Ferguson, 1980] a proposé un modèle qui permet des distributions de temps de séjours arbitraires pour le processus caché. Comme le processus caché devient semi-Markovien, ce modèle est appelé un modèle semi-Markovien 1 caché (également connu sous le nom de MMC de durée variable ou MMC de durée explicite). FERGUSON a considéré les MSMC comme une approche alternative aux MMC pour la modélisation de la parole, car ces derniers n’étaient pas assez souples pour décrire le temps passé dans un état donné. Après ce travail pionnier, plusieurs problèmes liés aux MSMC ont été étudiés par différents auteurs, par exemple, LEVINSON [Levinson, 1986], GUEDON [Guédon, 2003], SANSOM et THOMSON [Sansom and Thomson, 2001], YU et KOBAYASHI [Yu and Kobayashi, 2003], BULLA [Bulla, 2006]. La structure de base des MSMC est illustrée figure 4.4. Différentes hypothèses ont été considérées dans la littérature pour la distribution des observations, ainsi que pour la représentation du temps passé dans un état. Pour cette dernière, trois types de modélisation sont principalement utilisés : par une famille paramétrique de distributions continues [Levinson, 1986], par une famille des distributions exponentielles [Mitchell and Jamieson, 1993] ou par la loi binomiale négative [Durbin, 1998]. S2S1 S3 Observations Chaîne de Markov (non observée) O1 On On+1 On+m On+m+1 On+m+h Figure 4.4 – Structure de base d’un modèle de semi-Markov caché. 1. Un processus semi-Markovien a la propriété suivante : la probabilité de passer d’un état caché i vers un autre j dépend uniquement du temps passé depuis l’entrée en l’état actuel i. Au contraire, la propriété d’un processus Markovien suppose que la probabilité de changer d’état dépend uniquement de l’état actuel.
  • 120.
    90 Chapitre 4 Mêmesi le domaine d’application le plus commun des MSMC est la reconnaissance de la parole [Ferguson, 1980], ces modèles ont été appliqués avec succès dans des nombreux autres domaines : – l’électrocardiographie [Thoraval, 1995; Dumont, 2008], – la reconnaissance de textes [Kundu et al., 1997; Weinman et al., 2009], – la reconnaissance des gènes humains dans l’ADN [Burge and Karlin, 1997; Aydin et al., 2006], – l’analyse des modes de ramification et de floraison des plantes [Guédon et al., 2001], – l’analyse des données pluviométriques [Sansom and Thomson, 2001], – la modélisation des séries chronologiques financières [Bulla and Bulla, 2006]. L’application des MMC et des MSMC dans ces différents domaines est principalement due à leur polyvalence et leur résolubilité mathématique, car ils sont caractérisés par les propriétés suivantes [MacDonald and Zucchini, 1997] : – Disponibilité de tous les moments : moyenne, variance, autocorrélations. – L’évaluation d’une séquence d’observation est facile à calculer, son calcul est linéaire dans le nombre d’observations et de nombreux algorithmes existent. – Les distributions marginales, souvent représentées par des lois des probabilités géo- métriques, gaussiennes, etc., peuvent être déterminées aisémment et les observations manquantes peuvent être manipulés avec un effort mineur, du fait des lois des proba- bilités utilisées. – Les distributions conditionnelles P(Y = y|X = x) sont disponibles, grâce au processus doublement stochastique et à l’architecture des modèles, l’identification des valeurs aberrantes est possible car des probabilités très faibles seront obtenues pour ces valeurs et les distributions prévues peuvent être calculées. 4.2.1 Architecture des modèles Soit S = {1, . . . , M} l’ensemble d’états d’une chaîne de Markov. La séquence d’états est désignée par S1:T S1, . . . , ST , où St ∈ S est l’état à l’instant t. Une réalisation de S1:T est dénotée comme s1:T . La séquence d’observation est souvent notée par O1:T O1, . . . , OT , où Ot ∈ V est l’observation à l’instant t et V = {ν1, ν2, . . . , νK} est l’ensemble de valeurs observables. Dans les MMC, une observation est produite dans chaque état i car les états n’ont pas une durée. Par exemple, pour la séquence d’observation o1:T , la séquence d’états Markoviens sous-jacente est s1:T = i1, i1, i1, i2, . . . , in où n m=1 sm = T et i1, i2, . . . , in ∈ S. Par opposition, dans les MSMC, chaque état i a une durée d variable, qui est associée au nombre d’observations produites lorsqu’on reste dans l’état. La durée des états est une variable aléatoire et prend une valeur entière dans l’ensemble D = {1, 2, . . . , D}. Par
  • 121.
    4.2. Les modèlesde Markov et semi-Markov cachés 91 exemple, pour la séquence d’observation o1:T , la séquence d’états semi-Markovien sous- jacente est s1:T = i1, i2, . . . , in et la séquence de durées des états est d1:T = d1, d2, . . . , dn, où n m=1 dm = T, i1, i2, . . . , in ∈ S et d1, d2, . . . , dn ∈ D. La probabilité de transition entre les états de i → j, ∀i = j, est définie par : aij P(St+1 = j|St = i), (4.3) avec j∈S{i} aij = 1 et la probabilité d’auto-transition aii = 0 pour les MMC et aii = 0 pour les MSMC, où i, j ∈ S. Dans les MSMC, la durée d’occupation d’un état est indépendante de la durée de l’état antérieur et n’est conditionnée que sur l’état actuel. Par conséquent, la probabilité de durée de l’état dans les MSMC est notée par : pi(d) P(St+d−1 = i|St = i) (4.4) Comme mentionné auparavant, les MMC n’ont pas une probabilité de durée définie. La probabilité d’émission d’observations de l’état i est définie par : bi(νk) P(ot = νk|St = i), (4.5) avec νk bi(νk) = 1 et la probabilité de l’état initial sera définie par : πi P(S1 = i), (4.6) avec i πi = 1. Donc, l’ensemble des paramètres λMMC du MMC est défini par : λMMC {aij, bi(νk), πi}. (4.7) et l’ensemble des paramètres λMSMC du MSMC est défini par : λMSMC {aij, bi(νk), πi, pi(d)} (4.8) Le tableau 4.1 résume les principaux paramètres et caractéristiques des MMC et MSMC et synthétise la notation utilisée dans ce manuscrit. Un exemple d’un MMC, est représenté dans la figure 4.5. Le premier état i1 est choisi selon la probabilité π1. Dans l’état i1 l’observation o1 est produite selon la probabilité d’émission d’observation bi1 (o1). Il transite (reste) vers l’état i1 d’après la probabilité de
  • 122.
    92 Chapitre 4 Tableau4.1 – Résumé des principaux paramètres et caractéristiques des MMC et MSMC. Paramètre Symbole MMC MSMC Élément de la matrice de transition aij j∈S{i} aij = 1 aii = 0 Probabilité d’observation bi(νk) νk bi(νk) = 1 νk bi(νk) = 1 Probabilité de durée pi(d) Non définie Explicite† Probabilité de l’état initial πi i πi = 1 i πi = 1 † Détaillée section 4.3.1 transition a11 et produit l’observation o2 selon la probabilité bi1 (o2). Ensuite, il transite vers i2 d’après a12 et produit o3 selon bi2 (o3). Ensuite, il transite vers i2, . . . , in jusqu’à ce que la dernière observation soit produite. Figure 4.5 – Principe de fonctionnement d’un modèle Markovien caché. Un exemple d’un MSMC, inspiré de YU [Yu, 2010], est représenté dans la figure 4.6. Le premier état i1 est choisi selon la probabilité π1. Le processus reste pendant une du- rée d1 = 2 dans l’état i1 et deux observations sont donc produites dans cet intervalle de temps o1, o2 , suivant les probabilités d’émission d’observations bi1 (o1), bi1 (o2) . Il transite vers l’état i2 d’après la probabilité de transition a12 où il va rester d = 3 unités de temps et produire trois observations o3, o4, o5 selon les probabilités d’émission d’observa- tions bi2 (o3), bi2 (o4), bi2 (o5) . Ensuite, il transite vers i3, . . . , in jusqu’à ce que la dernière observation soit produite. Figure 4.6 – Principe de fonctionnement d’un modèle semi-Markovien caché.
  • 123.
    4.2. Les modèlesde Markov et semi-Markov cachés 93 Dans notre problème de modélisation de la dynamique des séries temporelles extraites de l’ECG, le temps passé dans un état peut être d’une importance capitale, ou du moins, tout aussi important que les transitions entre états : il est notamment possible que certains états se distinguent par des temps de passage très courts et d’autres par des temps de passage beaucoup plus élevés. À partir des figures 4.5 et 4.6, on peut constater plusieurs avantages des MSMC par rapport aux MMC, qui les rendent particulièrement adaptés à notre application : – Dans les MMC la probabilité de rester dans un même état n’est pas explicite et elle suit une loi géométrique pi(d) = ad ii(1 − aii) qui est une représentation irréaliste de la durée des séquences d’observations analysées, car elle suppose que les temps de passage courts sont plus probables que les temps de passage longs. – Les MSMC re-définissent de manière plus explicite le temps passé dans chaque état par des distributions paramétriques qui leur sont spécialement affectées. Cette représentation est plus adaptée à notre application où des lois Gaussiennes sont souvent observées. – Le temps passé dans un état dans les MSMC est un paramètre appris comme les autres paramètres. – Dans les MMC le temps passé dans un état est une variable discrète tandis que dans les MSMC le temps passé dans un état peut être représenté par une variable continue avec des valeurs µ ± σ. 4.2.2 Estimation des paramètres des modèles Les paramètres des MMC et MSMC sont généralement estimés en utilisant la méthode du maximum de vraisemblance (MV). L’ensemble des paramètres λ (λMSMC et λMMC) sont obtenus à partir des observations O1:T . λ est estimé, puis re-estimé de sorte que la fonction de vraisemblance L(λ; O1:T ) = P(O1:T |λ) (4.9) augmente et converge vers sa valeur maximale, où P(O1:T |λ) est la probabilité que la séquence observée O1:T soit générée par le modèle avec l’ensemble de paramètres λ. Les deux approches les plus courantes pour estimer les paramètres d’un MMC sont l’algorithme espérance-maximisation (EM) [Dempster et al., 1977] et la maximisation directe numérique de la vraisemblance [Campillo and Le Gland, 1989]. Cependant, l’algorithme EM est la méthode préférée en raison de sa plus grande stabilité [Bulla and Bulla, 2006]. L’algorithme EM cherche à trouver le MV par l’application itérative de deux étapes : – Étape 1 « Espérance » (E) : détermine l’espérance de la log-vraisemblance selon les données observées O1:T et les paramètres courants λ(t) : Q(λ|λ(t) ) = E [log L(λ; O1:T )] (4.10)
  • 124.
    94 Chapitre 4 –Étape 2 « Maximisation » (M) : trouve les paramètres qui maximisent cette quantité : λ(t+1) = arg max λ Q(λ|λ(t) ) (4.11) Pour l’estimation des paramètres λ, l’algorithme forward-backward [Levinson, 1986] et l’algorithme de Viterbi [Forney Jr, 1973] sont souvent employés. Ces deux algorithmes sont issus d’une approche itérative EM. L’algorithme forward-backward considère l’ensemble des observations pour déterminer L(λ; O1:T ) tandis que la méthode de Viterbi ne prend en compte que le chemin optimal. Évidemment, les résultats obtenus de ces algorithmes de type EM dépendent fortement du choix des valeurs initiales. Une solution possible, proposée par DUMONT [Dumont, 2008] permet l’initialisation des paramètres à partir d’un enchaînement des modèles constitués par : i) un partitionnement de données par l’algorithme K-means, ii) un modèle de mélanges de gaussiennes, iii) un MMC et finalement iv) un MSMC. Cette méthode d’initialisation, ainsi que l’approche méthodologique globale proposée par DUMONT, seront détaillées dans la section suivante. 4.3 Rappel de la méthode proposée par DUMONT J. La thèse de DUMONT J. [Dumont, 2008] s’est concentrée sur la modélisation des dynamiques des séries temporelles en cardiologie par MSMC. Pendant ces travaux, une méthode basée sur des MSMC à densité d’observation continue a été proposée pour la classification, le clustering et la représentation des données physiologiques temporelles et multivariées. Cette méthode a été évaluée sur des données réelles dans la détection d’événements ischémiques et la caractérisation de la réponse autonomique des patients souffrant d’un syndrome de Brugada. D’un point de vue clinique, l’ensemble des résultats obtenus montre l’importance de l’analyse de la dynamique des séries temporelles dans la distinction d’états physiopathologiques de l’individu. Dans cette section, les principales contributions des travaux de DUMONT sont présentées brièvement, car ils sont à la base des propositions réalisées dans le présent travail de thèse. 4.3.1 Les distributions des durées et d’observation La distribution des durées des états des MSMC (pi(d)) peut être paramétrique ou non paramétrique. De même, la distribution des observations des MSMC et des MMC (bi(νk)) peut être paramétrique ou non paramétrique, discrète ou continue et dépendante ou indépendante des durées de l’état, selon le cas. La distribution des observations peut également être définie par un mélange de distributions. Une discussion plus approfondie sur
  • 125.
    4.3. Rappel dela méthode proposée par DUMONT J. 95 les différentes distributions de durées et des observations peut être trouvée dans YU [Yu, 2010]. Dans l’approche proposée par DUMONT, la distribution des durées des états pi(d) et la distribution d’observation bi(νk) sont modélisées par une densité de probabilité gaussienne de type : f(x; µ, σ2 ) = 1 σ √ 2π e−1 2 (x−µ σ ) 2 (4.12) pour le cas univarié où x correspond aux données associées aux durées des états et aux données associées aux observations et µ et σ2 définissent respectivement la moyenne et la variance de x. Pour le cas multivarié, elle est définie comme : f(x; µ, Σ) = 1 (2π)n/2|Σ|1/2 e− 1 2(x−µ)TΣ−1(x−µ) (4.13) où x correspond aux données associées aux observations multivariées, n est le nombre de dimensions, µ est le vecteur de moyennes de x (µ ∈ Rn), Σ est la matrice de covariance semi- définie positive de x (Σ ∈ Rn×n), l’exposant T est la transposée et |Σ| est le déterminant de Σ. Cette expression se réduit à la densité de probabilité gaussienne univariée (équation 4.12) si Σ est un scalaire (matrice 1 × 1). On utilise la nomenclature f(x) ∼ N(µ, σ2) (où f(x) ∼ N(µ, Σ)) pour représenter cette densité de probabilité gaussienne. Ainsi, d’une part, pour représenter les temps de passage pi(d) ∼ N(µd i , σd i 2 ), où les scalaires µd i et σd i 2 définissent respectivement la moyenne et la variance des gaussiennes assignées à chaque état i, et d’autre part, pour représenter la probabilité d’observation bi(νk) ∼ N(µνk i , σνk i 2 ), où les scalaires µνk i et σνk i 2 définissent respectivement la moyenne et la variance des gaussiennes assignées à chaque état i. Dans le cas multivarié, la distribution d’observation est représentée par une densité de probabilité gaussienne multidimensionnelle bi(νk) ∼ N(µνk i , Σνk i ), où µνk i est le vecteur des centres des gaussiennes multivariées de chaque état et Σνk i sa matrice de covariance. 4.3.2 Méthodologie utilisée pour l’estimation des paramètres des MSMC L’algorithme de Viterbi [Forney Jr, 1973] a été choisi pour l’estimation des paramètres car i) c’est l’algorithme le plus populaire de programmation dynamique pour l’estimation du MV de la séquence des états d’un MMC, ii) il converge plus rapidement vers un maximum local, iii) il est moins sensible aux problèmes de stabilité numérique (par exemple lorsque les vraisemblances observées bj(νk) deviennent très petites) et iv) il est aisément transposable aux MSMC. Par ailleurs, les paramètres du modèle seront estimés avec le plus grand nombre de séries temporelles possibles, limitant ainsi le risque de tomber dans des minima locaux erronés. Pour ne pas alourdir la présentation, nous avons reporté Annexe D la présentation de l’algorithme de Viterbi. Au cours de l’étape de rétropropagation de l’algorithme de Viterbi, plusieurs variables
  • 126.
    96 Chapitre 4 sontenregistrées pour permettre la mise à jour des paramètres du modèle dans l’étape de maximisation de l’algorithme EM. Dans le cas des MMC, ces variables enregistrées sont les suivantes : – ηi : Nombre de passages dans l’état i, – ξi : Somme des initialisations dans l’état i, – ζij : Somme des transitions de l’état i à l’état j, Elles permettent la mise à jour de l’ensemble des paramètres λMMC : πi = ξi j ξj , aij = ζij j=i ζij , µνk i = t ωt i(Ot) t ωt i , Σνk i = t ωt i(OtOT t ) t ωt i − µνk i (µνk i )T , (4.14) où l’exposant T signifie la transposée et ωt i(Ot) est égal à 1 lorsque le chemin optimal se trouve dans l’état i à l’instant t, et à zéro sinon. Dans le cas des MSMC, les variables enregistrées sont les mêmes que pour le cas des MMC plus une variable qui caractérise la durée des états et qui correspond à la somme des durées dans l’état i (ϑi). Ainsi, la mise à jour de l’ensemble des paramètres λMSMC est semblable au cas MMC sauf pour les probabilités de transition et de durée des états où on utilise les règles suivantes : aij = ζij j=i ζij , µd i = ϑi ηi , σd i 2 = ϑ2 i ηi − (µd i )2 . (4.15) Initialisation de l’ensemble de paramètres des modèles L’initialisation de l’ensemble de paramètres du MSMC a été réalisée à partir des paramètres d’un MMC. Cela est justifié par le fait que l’apprentissage des paramètres des MSMC est sensible à son initialisation. Cette méthodologie est présentée figure 4.7, elle met en jeux différents éléments : – Une base de données d’apprentissage, qui comporte plusieurs séquences d’observations O1:T pour ajuster les paramètres des modèles en maximisant L(λ; O1:T ) (équation 4.9).
  • 127.
    4.3. Rappel dela méthode proposée par DUMONT J. 97 – Un algorithme k-means pour initialiser les centres des gaussiennes (ˇµi) d’un modèle de mélanges de gaussiennes (MMG). Le centre de chaque gaussienne correspond au barycentre de chaque état dans l’espace d’observation. – Une procédure EM permet d’estimer les centres (˜µi) et covariances (˜Σi) du MMG. – Un algorithme de Viterbi pour l’estimation des paramètres d’un MMC équivalent : probabilité de transition (ˆaij), probabilité d’état initial (ˆπi) et les centres (ˆµi) et covariances (ˆΣi) de la probabilité d’émission des observations. Les paramètres ˆaij et ˆπi sont initialisés avec une probabilité uniforme et ˜µi et ˜Σi sont utilisées comme valeurs initiaux de ˆµi et de ˆΣi. – Un MMC équivalent pour initialiser les paramètres du MSMC. Les chemins le plus plau- sibles (déterminées sur les séquences d’observations) et le temps passé dans chaque état du MMC sont utilisés pour l’initialisation des moyennes (µd i ) et variances (σd i 2 ) des pro- babilités de temps de séjour des états. Finalement, l’algorithme de Viterbi, étendu aux MSMC, est utilisé pour l’estimation de λMSMC = {aij, bi(µνk i , Σνk i ), πi, pi(µd i , σd i 2 )}. Base de données d'apprentissage k-means Modèle de mélanges gaussiens Espérance-Maximisation Modèle de Markov caché Algorithme de Viterbi Modèle de semi-Markov caché Algorithme de Viterbi modifié Figure 4.7 – Procédure utilisée pour l’apprentissage des MSMC à partir d’une base de données, d’après DUMONT [Dumont, 2008]. 4.3.3 Estimation du nombre d’états Le nombre d’états cachés M est généralement supposé connu dans le cadre de certaines applications. Toutefois, dans notre contexte, le nombre d’états est inconnu dans la pratique et doit être estimé. Créer des modèles avec un nombre approprié d’états n’est pas un problème trivial : un modèle avec trop d’états va sur-apprendre les observations, tandis qu’un modèle avec trop peu d’états va décrire mal les observations qui lui sont affectées.
  • 128.
    98 Chapitre 4 Lecritère d’information bayésien (BIC) [Schwarz, 1978], largement utilisé pour estimer M dans le contexte de fouille de données [Katz, 1981; Li et al., 2002; Dumont et al., 2009b], a été retenu dans ces travaux. Le BIC ne nécessite pas de connaissances a priori et favorise les modèles plus simples par rapport aux modèles plus complexes [Schwarz, 1978]. Le nombre d’états est donc estimé en utilisant : ˆM = arg max M log L λ(M); O1:T − f(M) log I 2 (4.16) où I est le nombre de séquences d’observations et f(M) est le nombre de paramètres du mo- dèle en fonction du nombre d’états M. En utilisant des distributions des durées et d’observa- tions gaussiennes, f(M) = M(1+2M +M2) pour le cas MMC et f(M) = M(3 + 2M + M2) pour le cas MSMC. 4.3.4 Évaluation d’une séquence observée Notre objectif pour les applications ciblées sera de reconnaître plusieurs dynamiques différentes. Ce problème n’est rien d’autre qu’un problème de classification. L’intérêt est que les MMC et MSMC offrent un cadre théorique direct pour répondre à cette problématique. Cette tâche consiste à déterminer la probabilité d’une séquence de sortie particulière, compte tenu des paramètres du modèle. Ce problème peut être traité efficacement en utilisant l’algorithme de Viterbi (Annexe D). Pour le cas MMC, ceci revient à choisir : P(O1:T |λMMC ) = max j∈S δT (j) = max j∈S max i∈S δT−1(i)aij bj(oT ) (4.17) où δt(i), définie par l’équation 4.18, représente le maximum de vraisemblance d’une trajec- toire unique jusqu’au temps t, qui prend en compte les premières t observations et s’arrête à l’état i. δt(i) max s1:t−1 P(s1, s2, . . . , st = i, o1:t|λ) (4.18) Pour le cas de MSMC, on utilise : P(O1:T |λMSMC ) = max j∈S,d∈D δT (j, d) = max j∈S,d∈D max i∈S{j},d ∈D δT−d(i, d )aij pj(d)bj(oT−d+1:T ) (4.19) où δt(i, d), définie par l’équation 4.20, représente le maximum de vraisemblance d’une trajectoire unique jusqu’au temps t, qui prend en compte les premières t observations et
  • 129.
    4.3. Rappel dela méthode proposée par DUMONT J. 99 s’arrête à l’état i de durée d. δt(i, d) max s1:t−d P(s1:t−d, St−d+1:t = i, o1:t|λ) (4.20) 4.3.5 Un exemple de modélisation d’observations bivariées par MSMC Un exemple de modélisation d’observations bivariées est présenté dans cette section en utilisant les MSMC. L’objectif est de montrer leur aptitude à prendre en compte des dynamiques complexes. Le système de Rössler (équation 4.21) a été utilisé pour générer des séries bivariées : x&y = [ x y ], x&z = [ x z ] et y&z = [ y z ]. Un bruit blanc gaussien a été ajouté aux séries afin d’obtenir un rapport signal sur bruit (RSB) de 15 dB. L’équation 4.16 a été utilisée pour déterminer le nombre d’états optimal de chaque MSMC. dx dt = −y − z dy dt = x + ay dz dt = b + z(x − c) (4.21) La figure 4.8 montre les caractéristiques des MSMC chargés de modéliser les observations. Dans ces figures, les ellipses noires décrivent chaque état (centre) et leurs matrices de covariance (axes de l’ellipse), les chiffres correspondent au temps moyen passé dans chaque état et les flèches d’épaisseurs variables représentent les coefficients de la matrice de transition. −6 −4 −2 0 2 4 6 8 −8 −6 −4 −2 0 2 4 6 4.25 3.8583 8.8667 3.38 2.745 3.1733 8.1667 7.325 4.5333 2.8649 6.425 7.5667 5.2167 2.9267 (a) −6 −4 −2 0 2 4 6 8 −1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5833 3.0056 5 5 25.2167 3.8662 5.51365.5136 4.0111 3 5.0067 (b) −6 −4 −2 0 2 4 6 −1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 3.8114 8.5944 7 3 2.98612.9861 11.0056 4 8.2533 3 3.0133 86 (c) Figure 4.8 – Modélisation des séries bivariées issues d’un attracteur de Rössler par des MSMC. On observe dans (a) la projection dans le plan x&y d’un MSMC avec 14 états, dans (b) la projection dans le plan x&z d’un MSMC avec 10 états et dans (c) la projection dans le plan y&z d’un MSMC avec 12 états. L’invariance des paramètres des MSMC à la multiplication et à l’addition d’une des
  • 130.
    100 Chapitre 4 variablespar une quantité fixe a été aussi testée. L’objectif de ce test est d’étudier le comportement des paramètres lorsque i) une des variables montre des variations d’amplitude importantes (cas de la multiplication) et ii) une des variables présente une composante continue et est de fait translatée par rapport à la variable d’origine (cas de l’addition). Ce test est important car, dans notre application réelle, les variables ne se trouvent pas dans le même niveau d’amplitude. Les séquences d’observations bivariées x&z à 15 dB ont été donc modifiées afin de produire les séquences d’observation 1000x&z = [ 1000x z ] et (1000 + x)&z = [ 1000+x z ]. Trois MSMC sont chargés de modéliser les observations x&z, 1000x&z et (1000+x)&z. Le nombre d’états des MSMC a été fixé à 10 états. On observe figure 4.9 que les caractéristiques des trois MSMC sont quasi identiques. On a constaté que le fait de multiplier une variable a plus d’effets sur les paramètres du MSMC que le fait d’ajouter une composante continue aux séries. Cependant, ces petites différences sont minimes et sont dues à une initialisation différente de chaque MSMC. Cet exemple montre clairement l’aptitude des MSMC à prendre en compte seulement les dynamiques des séries analysées et non pas leurs valeurs instantanées. −8 −6 −4 −2 0 2 4 6 8 −2 −1 0 1 2 3 4 5 6 7 8 666666666 12.2612.2612.2612.2612.2612.2612.2612.2612.26 19.2219.2219.2219.2219.2219.2219.2219.2219.22 999999999 5.20375.20375.20375.20375.20375.20375.20375.20375.2037 5.00675.00675.00675.00675.00675.00675.00675.00675.0067 9.93339.93339.93339.93339.93339.93339.93339.93339.9333 4.99334.99334.99334.99334.99334.99334.99334.99334.9933444444444 4.00674.00674.00674.00674.00674.00674.00674.00674.0067 (a) −8000 −6000 −4000 −2000 0 2000 4000 6000 8000 −2 −1 0 1 2 3 4 5 6 7 8 4.44674.44674.44674.44674.44674.44674.44674.44674.4467 555555555 8.73038.73038.73038.73038.73038.73038.73038.73038.7303 3.99333.99333.99333.99333.99333.99333.99333.99333.9933 5.52595.52595.52595.52595.52595.52595.52595.52595.5259 19.844619.844619.844619.844619.844619.844619.844619.844619.8446 333333333 8.89868.89868.89868.89868.89868.89868.89868.89868.8986 6.00676.00676.00676.00676.00676.00676.00676.00676.0067 131313131313131313 (b) 992 994 996 998 1000 1002 1004 1006 1008 −2 −1 0 1 2 3 4 5 6 7 8 19.013319.013319.013319.013319.013319.013319.013319.013319.0133 666666666 10.653310.653310.653310.653310.653310.653310.653310.653310.6533 10.683310.683310.683310.683310.683310.683310.683310.683310.6833 5.99335.99335.99335.99335.99335.99335.99335.99335.9933 4.77044.77044.77044.77044.77044.77044.77044.77044.7704 666666666 444444444 999999999 4.00674.00674.00674.00674.00674.00674.00674.00674.0067 (c) Figure 4.9 – Comparaison des MSMC chargés de modéliser des séries bivariées : Projection dans le plan x&z dans (a) pour les séries originaux, dans (b) pour 1000x&z et dans (c) pour (1000 + x)&z. 4.3.6 Classification/détection par MMC et par MSMC Les MMC et MSMC peuvent être utilisés pour classer/détecter des évènements d’intérêt en analysant la vraisemblance. Pour cette approche, K modèles sont utilisés pour représenter K dynamiques différentes de l’ensemble d’observations analysé (univarié ou multivarié). L’hypothèse sous-jacente étant que ces différentes dynamiques sont associées à des états ou événements physiopathologiques distincts, qui doivent être discriminés. Les séquences d’observations contenant les K dynamiques sont extraites des séries temporelles. Ces dernières sont réduites par rapport à l’écart type mesuré sur des enregistrements de référence, afin d’analyser les différents indicateurs extraits avec le même poids. De plus,
  • 131.
    4.3. Rappel dela méthode proposée par DUMONT J. 101 pour chaque série temporelle, la médiane sur les L premières secondes, est soustraite et ce sont les variations par rapport à cette référence qui sont conservées. Les K modèles ne partageant pas nécessairement le même nombre d’états Mk, ∀ k ∈ {1, 2, . . . , K}, ceux ci sont déterminés par l’intermédiaire de l’équation 4.16. Une phase d’apprentissage est d’abord appliquée à chaque modèle, afin d’estimer chaque λk à partir des séquences d’observations, fournis dans un ensemble d’apprentissage. Pendant cette phase, λk est initialisé selon la méthodologie détaillée dans la section 4.3.2 page 96 et l’algorithme de Viterbi est ensuite appliqué pour obtenir la valeur finale de λk, par l’étape EM. L’apprentissage est atteint lorsque la log-vraisemblance Lk = log P(O1:T |λk ) (4.22) converge vers une valeur maximale, où P(O1:T |λk) est la probabilité que la séquence d’observation O1:T soit généré par le modèle avec des paramètres λk. Une fois la phase d’apprentissage terminée, les K modèles sont appliqués dans une phase de vérification à un ensemble de séquences d’observations, fournis dans un ensemble de test. Cette étape consiste à déterminer la probabilité qu’une séquence observée O1:T soit générée par un modèle avec paramètres λk (équation 4.17 et équation 4.19). Dans le cas de classification, la séquence observée est attribuée au modèle le plus vraisemblable, parmi les K modèles concurrents : kwin = arg max k∈K Lk = arg max k∈K log P(O1:T |λk ) (4.23) Un pourcentage d’individus de la classe à modéliser est utilisé dans l’étape d’apprentis- sage et le reste des individus est utilisé dans l’étape de test. De plus, le nombre d’individus dans chaque classe doit être le même pour éviter des résultats biaisés. La figure 4.10 montre la méthodologie suivie pour la classification des observations à partir du maximum de vraisemblance en utilisant les MSMC. Dans cette exemple, 20 % des individus de chaque classe sont utilisés pour l’estimation des paramètres des modèles MSMC et, une fois estimés les paramètres de tous les modèles, l’étape de test utilise 80 % des observations restantes dans chaque classe. Dans le cas de détection, la log-vraisemblance pour l’instant t et le modèle k, Lk t = log P(Ot−T+1:t|λk ) (4.24) est déterminée en utilisant une fenêtre glissante de longueur T. La détection de l’événement
  • 132.
    102 Chapitre 4 Basededonnées Classe1 Classe 2 Classe. . . 20 % Apprentissage 20 % 20 % MSMC 1 80 % Test MSMC 2 MSMC 80 % 80 % . . . . . . MSMC 1 MSMC 2 MSMC Figure 4.10 – Méthodologie de classification utilisée en utilisant les MSMC. α (α ∈ {k}) est finalement effectuée lorsque l’équation suivante est vérifiée : Lα t − Lk t > δα,k ∀ k ∈ {1, 2, . . . , K} − {α} (4.25) où δα,k sont des seuils fixés qui doivent être optimisés. À la différence du cas de classification, dans l’approche de détection le nombre d’états du modèle caractérisant l’évènement à détecter est déterminé en utilisant l’équation 4.16, tandis que l’autre modèle hérite du nombre d’états de ce modèle. Ceci permet de différencier les séries en priorité en fonction de leurs dynamiques et non en fonction de leurs amplitudes. Évaluation des performances de classification L’évaluation des performances de classification est effectuée à travers des tableaux de contingences. Un tableau de contingence se construit en mettant sur les lignes les données de référence et sur les colonnes la classification, telle que montré tableau 4.2. Le taux d’erreur global (TEG) et le taux d’erreur par classe k (TECk) peuvent être déterminés en utilisant les équations 4.26 et 4.27.
  • 133.
    4.3. Rappel dela méthode proposée par DUMONT J. 103 TEG = 1 − K i=1 xii K i=1 K j=1 xij (4.26) TECk = 1 − xkk K i=1 xki (4.27) Tableau 4.2 – Tableau de contingence. Classification Classe 1 . . . Classe K Référence Classe 1 x11 . . . x1K ... ... ... ... Classe K xK1 . . . xKK Lorsqu’on se restreint à deux classes et on s’intéresse à détecter, par exemple, la classe 1 : SEN = 1 − TEC1 (4.28) et SPC = 1 − TEC2 (4.29) Résultats sur des signaux réels Cette méthode a été évaluée dans des situations cliniques réelles [Dumont, 2008]. Un clustering hiérarchique de type descendant avec une augmentation progressive du nombre de MSMC a été proposé pour : i) la classification d’épisodes ischémiques à partir d’enregistrements Holter, extraits de la base de données LTST [Jager et al., 2003] et ii) la classification de patients atteints du syndrome de Brugada, à partir d’ECG acquis lors d’une épreuve d’effort. Les taux d’erreur global (équation 4.26) sont respectivement de 29 % et de 24,5 % alors que les approches ne prenant pas en compte les dynamiques présentent des TEG de 46,7 % et 29,6 %, respectivement. L’approche a été aussi appliquée à la détection de l’ischémie myocardique sur la base de données STAFF3 [García et al., 1999], qui regroupe des enregistrements d’angioplastie coronaire transluminale percutanée (PTCA) où l’instant de début du processus ischémique est très précisément annoté. L’originalité de cette démarche repose sur l’analyse de la
  • 134.
    104 Chapitre 4 dynamiquedes séries temporelles extraites de l’ECG, alors que les méthodes traditionnelles sont fondées sur des règles de décision statique. Après l’extraction d’un vecteur de caracté- ristiques, à partir de signaux ECG de la base de données, la dynamique est caractérisée par un MSMC. Le détecteur utilise un « MSMC de référence » et un « MSMC ischémique » et puis compare la log-vraisemblance des séries temporelles aux MSMC. Les valeurs optimales de L et T ont été de 20 et 140 secondes respectivement. Les résultats obtenus montrent de très bonnes performances de détection : une sensibilité de 96 % et une spécificité de 80 % lorsque la série RT est utilisée (cas univarié) et une sensibilité de 94,7 % et une spécificité de 71,9 % lorsque les séries RT et Ramp sont analysées de manière conjointe (cas multivarié) [Dumont et al., 2009b,a]. 4.3.7 Synthèse sur les MSMC Cette approche basée sur des MSMC présente plusieurs avantages par rapport à d’autres méthodes de modélisation des dynamiques des séries temporelles : – Les MSMC représentent les dynamiques de manière simple et peuvent être comparés entre eux. – Ils sont bien adaptés au traitement multivarié et des versions rapides des algorithmes d’apprentissage des paramètres existent. – Ils offrent une représentation graphique de la dynamique grâce aux états. – Ils peuvent représenter l’évolution temporelle d’une série grâce aux paramètres pi(d). – Ils ne nécessitent pas de connaissances a priori sur les données à traiter. – M est le seul hyper-paramètre à régler. – Il est possible de donner une interprétation physiologique raisonnable aux états (« cachés ») de la chaîne de Markov. Une approche basée sur des réseaux neuronaux artificiels (RNA) pourrait être également capable de caractériser la dynamique de ces séries temporelles. Cependant, une interprétation physiologique du phénomène étudié et un contrôle de différents étapes du RNA serait plus difficile. D’ailleurs, les RNA ont été récemment appliqués par BELAL [Belal et al., 2011] et curieusement n’ont pas montré une amélioration de performance de détection/classification des épisodes d’apnée du prématuré par rapport à d’autres méthodes (somme pondérée, corrélation, dérivée). 4.4 Contributions de ce travail de thèse Même si les résultats obtenus dans les travaux de DUMONT [Dumont, 2008; Dumont et al., 2009a] ont été très satisfaisants sur les données cardiaques utilisées, plusieurs améliora- tions peuvent être envisagées dans la méthode de détection proposée. Dans notre application de détection précoce des épisodes d’apnée-bradycardie des nouveaux-nés prématurés, ces
  • 135.
    4.4. Contributions dece travail de thèse 105 améliorations visent à incrémenter les performances détection et à diminuer le temps de retard à la détection, en utilisant une approche multivariée des séries temporelles extraites de l’ECG. L’un des objectifs du présent travail de thèse a été donc de poursuivre les développe- ments de cette approche en s’intéressant plus particulièrement aux aspects décrits dans les paragraphes suivants. 4.4.1 Évaluation du temps de retard à la détection (TRD) L’évaluation du retard à la détection, défini comme le temps écoulé entre l’instant d’annotation et la détection de l’épisode, n’a pas été considérée dans les travaux précédents. Ce paramètre est fondamental pour évaluer la performance du détecteur en particulier dans le cadre d’une détection précoce en temps réel. En cas de détection, le TRD est déterminé dans la fenêtre de recherche des vrais positifs, centrée dans l’annotation donnée, tel que détaillé dans la section 2.3. 4.4.2 Exploration de l’hétérogénéité des modèles Dans la méthode de détection proposée par DUMONT [Dumont et al., 2009b,a], les K modèles utilisés pour caractériser les K dynamiques de la séquence d’observation partagent le même nombre d’états (M1 = M2 = . . . = MK), même si il a été déterminé à l’aide du critère BIC (équation 4.16). Toutefois, l’hétérogénéité des modèles pourrait aussi améliorer les performances car, chaque modèle explore des dynamiques différentes et, par conséquent, peut nécessiter un nombre d’états différent. 4.4.3 Adaptation au traitement en ligne Afin de pouvoir l’appliquer sur un système de monitoring des nouveaux-nés prématurés, la méthode de détection développée doit être adaptée au traitement en ligne. En effet, l’implémentation proposée dans DUMONT [Dumont et al., 2009b,a] est restreinte au traitement par blocs et n’est pas adaptée à notre cas. Les pré-traitements des observations exposés dans la section précédente (section 4.3.6), tels que la normalisation des séries et la soustraction de la médiane dans les L premiers secondes de chaque série, ne sont pas retenus. En effet, la méthode de normalisation des séquences d’observations proposée par DU- MONT [Dumont et al., 2009a] risque de produire de valeurs trop faibles de Σνk i , conduisant à des problèmes numériques lors de l’étape d’apprentissage. Dans le présent travail, et vu
  • 136.
    106 Chapitre 4 lapropriété d’invariance à la multiplication de l’approche proposée (section 4.3.5), nous multiplions les séquences d’observations par une quantité importante et arbitraire, pour palier ce problème. De plus, afin d’incrémenter la vraisemblance d’un état en particulier pour qu’il soit le premier état (π1) de la séquence d’états de la chaîne de Markov et de favoriser un chemin en particulier dans l’algorithme de Viterbi, la variabilité d’amplitude du premier échantillon des observations (O1) doit être minimisée. Une procédure récursive à été proposée pour centrer les séquences d’observation, où la moyenne est déterminée dans une fenêtre de taille L : ˆO1:T = Ot−T+1:t − 1 L t−T m=t−T−L+1 Om (4.30) où ˆO1:T est maintenant l’observation à prendre en compte par le modèle. Dans ce cas, la log-vraisemblance pour instant t et le modèle k est maintenant déterminée par : Lk t = log P( ˆO1:T |λk ) (4.31) et la détection est déterminée en utilisant l’équation 4.25. Dans le cas particulier de la série RR, cette moyenne est déterminée jusqu’au moment où RR(t) ≥ 600 et son calcul est repris lorsque la détection de l’épisode d’apnée-bradycardie est terminée. La figure 4.11 résume la méthode de détection en ligne d’apnée-bradycardie proposée dans cette thèse, en utilisant une fenêtre glissante d’observation. On y a reporté la série RR comme série temporelle à caractériser. 4.4.4 Optimisation de la distribution d’états dans la gamme dynamique des séries observées Les MMC et MSMC peuvent être appliqués directement sur les séries extraites, mais dans notre cas, ces séries sont le résultat d’une étape de segmentation automatique d’ECG qui peut induire des erreurs. Il était donc intéressant d’évaluer l’intérêt d’une quantification des observations, comme étape préalable du processus d’estimation des paramètres des modèles. Cette quantification permet de réduire la variabilité du signal, d’augmenter le RSB et de garder uniquement les dynamiques le plus importantes présentes dans le signal. De plus, comme les MMC et MSMC ont un nombre fini d’états représentant la gamme dynamique de l’amplitude du signal, la quantification permet de faciliter l’affectation des observations aux états dans l’étape de récursion de l’algorithme de Viterbi. La quantification des séries permet la représentation d’un signal continu par des valeurs discrètes. Ces valeurs discrètes sont séparées par un intervalle appelé pas de quantification et symbolisé ∆. Deux méthodes de quantification ont été évaluées dans cette thèse :
  • 137.
    4.4. Contributions dece travail de thèse 107 0 20 40 60 80 100 120 140 160 180 400 500 600 700 800 900 1000 RR(ms) Temps (s) Soustraction de moyenne Test Apprentissage Modèles Observations Classe 1 Classe k Détection Figure 4.11 – Processus de détection en ligne d’apnée-bradycardie proposé dans cette thèse. 1. La loi uniforme avec un pas de quantification de taille constante ∆QU, tel que montré figure 4.12a. L’objectif est de trouver un compromis dans la taille du pas de quantification qui permet d’augmenter la performance de détection : un pas de quantification très faible (∆QU → 0) produit une séquence d’observation qui n’est pas quantifiée tandis qu’un pas de quantification très grand (∆QU → ∞) élimine l’intérêt d’utiliser une probabilité d’observation gaussienne étant donné que seulement un état suffirait pour représenter la gamme de l’amplitude du signal et le calcul de bj(νk) (ou bj(νk)) ne serait pas possible parce que σνk 1 2 → 0 (ou Σνk 1 → 0). Afin d’obtenir ∆QU optimal pour chaque variable, la procédure décrite dans l’algorithme 3 a été proposée. Dans ce manuscrit, les variables notées avec l’indice QU ont été quantifiées avec la méthode uniforme, comme par exemple pour la variable RRQU. 2. La loi non uniforme avec des pas de quantification de taille variable ∆QNU qui dépendent de la distribution du signal, tel que montré figure 4.12b. Le vecteur ∆QNU est déterminé en comparant la somme cumulée des valeurs de l’histogramme normalisé avec un seuil δQNU, tel que montré dans algorithme 4. Les K classes de la variable à quantifier sont concaténées en employant le même nombre d’échantillons par classe,
  • 138.
    108 Chapitre 4 afinde ne pas biaiser la taille du pas de quantification. Afin d’obtenir un ∆QNU optimal pour chaque variable, la procédure décrite dans l’algorithme 5 a été proposée. Les variables notées avec l’indice QNU ont été quantifiées avec la méthode non uniforme, comme par exemple pour la variable RRQNU. Algorithme 3 Pseudo-code pour déterminer ∆QU optimal. 1: Initialiser ∆QU basé sur un a priori : la médiane de la valeur absolue de la dérivée de la séquence d’observation µ1/2(|dx dt |) 2: Estimer Mk en utilisant l’équation 4.16 3: Estimer λk 4: Réaliser la détection 5: Déterminer DCDP selon l’équation 2.5 6: Modifier la valeur de ∆QU 7: Répéter 2-6 jusqu’à obtenir la valeur de DCDP la plus faible −4000 −3000 −2000 −1000 0 1000 2000 −3500 −3000 −2500 −2000 −1500 −1000 −500 0 500 1000 1500 Sortie Entrée (a) −4000 −3500 −3000 −2500 −2000 −1500 −1000 −500 0 500 1000 −3500 −3000 −2500 −2000 −1500 −1000 −500 0 500 1000 Entrée Sortie (b) Figure 4.12 – Quantificateur (a) uniforme et (b) non uniforme. Algorithme 4 Pseudo-code de la méthode de quantification non uniforme proposée. Construire le vecteur x comme la concaténation des classes de la variable à quantifier en employant le même nombre d’échantillons par classe Calculer y = hist(x) l’histogramme normalisé de la variable x Définir le seuil δQNU k = 1 j = 1 pour i = 1 to length(y) faire si i m=k ym > δQNU alors ∆QNUj = yi − yk k = i fin si fin pour 4.4.5 Exploitation des retards physiologiques dans les séries observées Nous explorons ici la possibilité d’augmenter l’observabilité du système tout en conservant le même nombre de sources. Des séries bivariées mono-sources ont été donc construites en
  • 139.
    4.4. Contributions dece travail de thèse 109 Algorithme 5 Pseudo-code pour déterminer ∆QNU optimal. 1: Initialiser δQNU 2: Estimer Mk en utilisant l’équation 4.16 3: Estimer λk 4: Réaliser la détection 5: Déterminer DCDP selon l’équation2.5 6: Modifier la valeur de δQNU 7: Répéter 2-6 jusqu’à obtenir la valeur de DCDP plus petite intégrant la version retardée de la série univariée. En ce sens, une matrice d’observation est construite, en intégrant la version originale de la séquence observée à l’instant t et la version retardée de la séquence observée à l’instant t − τ, où τ est un délai prédéfini. Cette matrice d’observation peut être représentée comme suit : O = Ot−T+1:t Ot−τ−T+1:t−τ (4.32) Dans le cas de la série RR, l’application d’un tel retard présente également une résonance physiologique puisque l’on sait que l’intervalle RR à un instant t dépend des précédents par des mécanismes de régulation autonomique qui ont, principalement, deux dynamiques différentes pour les systèmes sympathique (plus lent) et parasympathique (plus rapide). Ces matrices d’observation seront représentées en gras dans le présent document, tel que RR. Recherche du retard τ optimal Pour la série RR, la recherche d’une valeur a priori de τ nous conduit à l’analyse spectrale de la VFC. À partir d’études expérimentales, le spectre de fréquences de la VFC est divisée principalement en quatre bandes de fréquence choisies pour sa pertinence physiologique [Task Force, 1996]. Dans le cas des nouveaux-nés prématurés, deux bandes de fréquence nous intéressent : – L’énergie du signal dans les basses fréquences (LF) de 0,02 à 0,2 Hz est expliquée à la fois par un phénomène de résonance dans la boucle liée au délai de la réponse vasculaire à la modulation adrénergique, par une rythmicité endogène centrale de l’activité sympathique et par l’activité du tonus parasympathique [Chatow et al., 1995; Beuchée, 2005]. – L’énergie du signal dans les hautes fréquence (HF) de 0,2 à 1,5 Hz est associée à l’arythmie sinusale respiratoire (oscillation de la durée de l’intervalle RR corrélée à la fréquence respiratoire), mais aussi à l’activité parasympathique (action du nerf vague sur le cœur) [Chatow et al., 1995; Beuchée, 2005]. La différence entre les deux pics (LF et HF) est d’environ 0,9 Hz, ce qui correspond à une demi-période de 0,556 secondes. Par conséquent, la valeur optimale de τ sera recherchée
  • 140.
    110 Chapitre 4 autourde cette valeur, dans un ensemble prédéfini de valeurs : τ = {0,34, 0,45, 0,56, 0,67, 0,78} Pour les autres séries (Ramp et QRSd), il n’existe pas d’a priori pour déterminer la valeur de τ. Par conséquent, les valeurs candidats de τ seront choisis empiriquement dans l’ensemble des valeurs suivantes : τ = {0,25, 0,5, 0,75, 1} Finalement, pour chaque valeur de τ et pour chaque variable étudiée, Mk sera déterminé (équation 4.16), λk sera estimé et la détection sera effectuée. τ optimal correspond donc à la valeur qui minimise la DCDP. 4.4.6 Synthèse de la fouille de données appliquées dans cette thèse Pour la caractérisation des séries temporelles multivariées par modèles semi-Markovien cachés, deux approches seront étudiées : la première, basée sur la classification des séquences d’observation à partir du maximum de vraisemblance et la deuxième, fondée sur une approche de détection en ligne d’un évènement d’intérêt à partir de la comparaison des log-vraisemblances des séries temporelles. Dans la démarche de classification, les procédures peuvent être décomposées en quatre grandes parties : 1. la construction des ensembles d’apprentissage et de test, contenant des séquences d’observation de taille T secondes et associées à K évènements différents à classer (K classes), 2. l’apprentissage de K modèles à partir des séquences d’observation fournies dans l’ensemble d’apprentissage, 3. l’évaluation (test) de l’appartenance aux K modèles de nouvelles séquences d’observa- tion, fournies dans l’ensemble de test et 4. l’évaluation des performances de classification. À partir d’une base de données contenant les séquences d’observations de K classes, 20 % des séquences d’observations sont attribuées à l’ensemble d’apprentissage et 80 % des séquences d’observations sont assignées à l’ensemble de test. Dans l’étape d’apprentissage, l’ensemble de paramètres des modèles λk, k ∈ {1, 2, . . . , K} sont estimés à partir des séquences d’observation en utilisant l’algorithme de Viterbi et le nombre d’états par modèle Mk est déterminé par intermédiaire du critère BIC (équation 4.16). Dans l’étape de test, les séquences d’observations sont attribuées au modèle k le plus vraisemblable selon
  • 141.
    4.5. Conclusion 111 l’équation4.23. L’expérience apprentissage/test est répétée 10 fois avec différents tirages, afin d’obtenir des résultats indépendants du tirage effectué, en conséquence, une procédure de Monte Carlo est appliquée pour sélectionner les données de l’apprentissage et du test. Finalement, les performances de classification sont évaluées à partir du taux d’erreur global (TEG équation 4.26) et du taux d’erreur par classe k (TECk équation 4.27). De même que pour la classification, la démarche de détection en ligne, peut être décomposée en six grandes parties : 1. la construction de l’ensemble d’apprentissage, contenant des séquences d’observation de taille T secondes et associées à K évènements différents à détecter, 2. l’apprentissage de K modèles à partir des séquences d’observation fournies dans l’ensemble d’apprentissage, 3. la construction de l’ensemble de test, contenant de séries temporelles de tailles différentes et dont les K évènements différents à détecter peuvent être présents, à des instants de temps différents, ou peuvent être absents, 4. l’application (test) des K modèles aux séries temporelles, fournies dans l’ensemble de test, pour déterminer les log-vraisemblances, 5. la détection de l’évènement en ligne selon le rapport de vraisemblance et 6. l’évaluation des performances de détection. L’étape d’apprentissage est identique à celle montrée pour la classification. L’étape de test consiste à calculer log-vraisemblance pour l’instant t et le modèle k (Lk t = log P(Ot−T+1:t|λk)) dans une fenêtre glissante de longueur T. La détection de l’événement α (α ∈ {k}) est réali- sée à partir de Lα t − Lk t > δα,k, ∀ k ∈ {1, 2, . . . , K} − {α}. Finalement, Les performances de détection sont évaluées par courbes COR en analysant la sensibilité (équation 2.1), la spécificité (équation 2.2) et le temps de retard à la détection (TRD, section 2.3). 4.5 Conclusion Les fondements de la fouille de données temporelles et multidimensionnelles dans le contexte biomédical ont été abordés dans ce chapitre pour la caractérisation des séries temporelles multivariées extraites de l’ECG. Les différentes étapes du processus de fouille de données temporelles multivariées suivies dans cette thèse ont été présentées. Une analyse des travaux initiés dans notre laboratoire nous a conduit à l’utilisation d’une approche basée sur les modèles Markoviens cachés et les modèles semi-Markoviens cachés. Ces modèles ont été décrits de façon détaillée dans ce chapitre, en particulier l’architecture, l’estimation des paramètres, l’utilisation d’une loi gaussienne pour représenter la durée des états et la probabilité d’émission d’observations, le choix du nombre d’états à utiliser et l’évaluation des séquences d’observations par les modèles. La méthodologie d’initialisation de paramètres
  • 142.
    112 Chapitre 4 desmodèles à partir d’une procédure de K-means et d’un modèle de mélange de gaussiennes a été aussi abordée. Pour le calcul des vraisemblances, l’algorithme de Viterbi a été retenu tant pour le cas Markovien que pour le cas semi-Markovien. Les différences entre les modèles Markoviens cachés et les modèles semi-Markoviens cachés ont été soulignées pour la caractérisation des séries temporelles dont la dynamique contient de l’information. Ces différences concernent plus particulièrement la définition de la loi du temps passé dans les états de la chaîne de Markov (une loi géométrique dans le cas Markovien et, dans cette thèse, une loi gaussienne dans le cas semi-Markovien). Pour notre application, il a été précisé le principal avantage d’appliquer des modèles semi-Markoviens cachés : leur capacité à représenter explicitement l’évolution temporelle d’une série dans un paramètre. Un exemple de modélisation de séries temporelles bivariées synthétiques, issues du système de Rössler, a montré l’adéquation des modèles semi-Markovien cachés à tenir compte de l’évolution temporelle des variables analysées et non pas leurs valeurs instantanées. Des procédures de classification des séquences d’observation et de détection en ligne d’un évènement d’intérêt, par modèles Markoviens et semi-Markoviens cachés, ont été décrites. La méthode de classification est basé sur l’affectation des séquences d’observation multivariées à des modèles à partir du maximum de vraisemblance. La détection en ligne est fondée sur les différences des log-vraisemblances des séquences d’observations construites estimées sur une fenêtre glissante. Ces procédures de classification et de détection ont été déjà appliquées pour la classification de patients atteints du syndrome de Brugada et pour la détection de l’ischémie myocardique. Dans ce chapitre, nous avons proposé des modifications dans le but d’améliorer les performances de classification et de favoriser une détection précoce d’épisodes d’apnée-bradycardie chez les prématurés. Ces améliorations concernent i) la quantification uniforme et non uniforme des séquences d’observations afin d’optimiser la distribution du vecteur d’observation par état et ii) la prise en compte des versions retardées du signal observé pour augmenter l’observabilité du système exploité. Ces améliorations correspondent aux principales contributions méthodologiques de ce chapitre. Dans le chapitre suivant, des tests en simulation viendront compléter les résultats préliminaires montrés dans ce chapitre et le choix entre les MMC et MSMC sera d’abord abordée sur des signaux synthétiques issus du modèle de FitzHugh-Nagumo. Ensuite, la classification et la détection proposées seront appliquées sur ces signaux synthétiques afin d’optimiser les différentes étapes. Finalement, la classification et la détection précoce d’épisodes d’apnée-bradycardie sera détaillée sur la base de données présentée au chapitre 3.
  • 143.
    Bibliographie 113 Bibliographie Aydin, Z.,Altunbasak, Y., and Borodovsky, M. (2006). Protein secondary structure prediction for a single-sequence using hidden semi-Markov models. BMC bioinformatics, 7(1) :178. Baum, L. E. and Petrie, T. (1966). Statistical inference for probabilistic functions of finite-state Markov chains. Annals of Mathematical Statistics, 37(6) :1554–1563. Belal, S., Emmerson, A., and Beatty, P. (2011). Automatic detection of apnoea of prematu- rity. Physiological Measurement, 32 :523. Beritelli, F., Casale, S., Russo, A., and Serrano, S. (2006). A speech recognition system based on dynamic characterization of background noise. In Signal Processing and Information Technology, 2006 IEEE International Symposium on, pages 914–919. IEEE. Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona- talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1. Bishop, C. (1995). Neural networks for pattern recognition. Oxford university press. Bulla, J. (2006). Application of hidden Markov models and hidden semi-Markov models to financial time series. PhD thesis, Niedersächsische Staats-und Universitätsbibliothek Göttingen. Bulla, J. and Bulla, I. (2006). Stylized facts of financial time series and hidden semi-Markov models. Computational statistics & data analysis, 51(4) :2192–2209. Burge, C. and Karlin, S. (1997). Prediction of complete gene structures in human genomic DNA1. Journal of molecular biology, 268(1) :78–94. Campillo, F. and Le Gland, F. (1989). Mle for partially observed diffusions : direct maximization vs. the em algorithm. Stochastic Processes and their Applications, 33(2) :245– 274. Chatow, U., Davidson, S., Reichman, B., and Akselrod, S. (1995). Development and maturation of the autonomic nervous system in premature and full-term infants using spectral analysis of heart rate fluctuations. Pediatric research, 37(3) :294. Chen, M., Kundu, A., and Zhou, J. (1994). Off-line handwritten word recognition using a hidden Markov model type stochastic network. IEEE Transactions on Pattern Analysis and Machine Intelligence, pages 481–496. Chibelushi, C., Deravi, F., and Mason, J. (2002). A review of speech-based bimodal recognition. Multimedia, IEEE Transactions on, 4(1) :23–37. Churchill, G. A. (1992). Hidden markov chains and the analysis of genome structure. Computers & Chemistry, 16(2) :107–115. Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in Cardiology, volume 33, pages 473–476.
  • 144.
    114 Bibliographie Csizmok, V.,Felli, I., Tompa, P., Banci, L., and Bertini, I. (2008). Structural and dynamic characterization of intrinsically disordered human securin by NMR spectroscopy. Journal of the American Chemical Society, 130(50) :16873–16879. Dempster, A., Laird, N., Rubin, D., et al. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society. Series B (Methodological), 39(1) :1–38. Dufour, R., Esteve, Y., Deléglise, P., and Béchet, F. (2009). Local and global models for spontaneous speech segment detection and characterization. In Automatic Speech Recognition & Understanding, 2009. ASRU 2009. IEEE Workshop on, pages 558–561. IEEE. Dumont, J. (2008). Fouille de dynamiques multivariées, application à des données temporelles en cardiologie. PhD thesis, Université de Rennes 1. Dumont, J., Carrault, G., Gomis, P., Wagner, G., and Hernández, A. (2009a). Detection of myocardial ischemia with hidden Semi-Markovian models. In Computers in Cardiology, 2009, pages 121–124. IEEE. Dumont, J., Hernández, A., Gomis, P., and Carrault, G. (2009b). Classification de séries temporelles par modèles markoviens cachés, application à l’ischémie myocardique. In XXII Colloque GRETSI. Dumont, J., Hernández, A. I., Fleureau, J., and Carrault, G. (2008). Modelling temporal evolution of cardiac electrophysiological features using hidden semi-markov models. Conf Proc IEEE Eng Med Biol Soc, 2008 :165–8. Durbin, R. (1998). Biological sequence analysis : Probabilistic models of proteins and nucleic acids. Cambridge Univ Pr. Ephraim, Y. and Merhav, N. (2002). Hidden markov processes. Information Theory, IEEE Transactions on, 48(6) :1518–1569. Fahrmeir, L. (1992). Posterior mode estimation by extended Kalman filtering for multivariate dynamic generalized linear models. Journal of the American Statistical Association, 87(418) :501–509. Fan, W., Ma, J., and Zhu, H. (2009). A thunderstorm forecast model based on weighted SVM and data field. In 2009 Sixth International Conference on Fuzzy Systems and Knowledge Discovery, pages 160–164. IEEE. Ferguson, J. (1980). Variable duration models for speech. In Proceedings of the Symposium on the Application of hidden Markov models to Text and Speech, volume 1, pages 143–179. Forney Jr, G. (1973). The viterbi algorithm. Proceedings of the IEEE, 61(3) :268–278. García, J., Wagner, G., Sörnmo, L., Lander, P., and Laguna, P. (1999). Identification of the occluded artery in patients with myocardial ischemia induced by prolonged percutaneous transluminal coronary angioplasty using traditional vs transformed ecg-based indexes. Computers and Biomedical Research, 32(5) :470–482. Garcia, S. and Almeida, J. (2006). Multivariate phase space reconstruction by nearest neighbor embedding with different time delays. Arxiv preprint nlin/0609029.
  • 145.
    Bibliographie 115 Givaty, O.and Levy, Y. (2009). Protein sliding along DNA : dynamics and structural characterization. Journal of molecular biology, 385(4) :1087–1097. Guédon, Y. (2003). Estimating hidden semi-markov chains from discrete sequences. Journal of Computational and Graphical Statistics, 12(3) :604–639. Guédon, Y., Barthélémy, D., Caraglio, Y., and Costes, E. (2001). Pattern analysis in branching and axillary flowering sequences. Journal of Theoretical Biology, 212(4) :481– 520. Houtekamer, P. and Mitchell, H. (2001). A sequential ensemble Kalman filter for atmospheric data assimilation. Monthly Weather Review, 129(2) :123–137. Jager, F., Taddei, A., Moody, G., Emdin, M., Antolič, G., Dorn, R., Smrdel, A., Marchesi, C., and Mark, R. (2003). Long-term ST database : a reference for the development and evaluation of automated ischaemia detectors and for the study of the dynamics of myocardial ischaemia. Medical and Biological Engineering and Computing, 41(2) :172–182. Kalman, R. et al. (1960). A new approach to linear filtering and prediction problems. Journal of basic Engineering, 82(1) :35–45. Kantardzic, M. and Press, I. (2003). Data mining : concepts, models, methods, and algorithms. Wiley-Interscience. Katz, R. (1981). On some criteria for estimating the order of a Markov chain. Technometrics, 23(3) :243–249. Kong, L., Yang, C., Wang, Y., and Gui, W. (2009). Generic phase space reconstruction method of multivariate time series. In Control and Decision Conference, 2009. CCDC’09. Chinese, pages 3752–3755. IEEE. Kulkarni, V. (2010). Modeling and analysis of stochastic systems. CRC Press. Kundu, A., He, Y., and Chen, M.-Y. (1997). Efficient utilization of variable duration information in hmm based hwr systems. In ICIP (3), pages 304–307. Kusiak, A., Zheng, H., and Song, Z. (2009). Wind farm power prediction : a data-mining approach. Wind Energy, 12(3) :275–293. Laxman, S. and Sastry, P. (2006). A survey of temporal data mining. Sadhana, 31(2) :173– 198. Levinson, S. (1986). Continuously variable duration hidden Markov models for automatic speech recognition. Computer Speech & Language, 1(1) :29–45. Li, C., Biswas, G., Dale, M., and Dale, P. (2002). Matryoshka : A HMM based temporal data clustering methodology for modeling system dynamics. Intelligent Data Analysis, 6(3) :281–308. MacDonald, I. and Zucchini, W. (1997). Hidden Markov and other models for discrete-valued time series, volume 70. Chapman & Hall/CRC. Maseng, T. and Bakken, P. (1981). A stochastic dynamic model of rain attenuation. Communications, IEEE Transactions on, 29(5) :660–669.
  • 146.
    116 Bibliographie Mitchell, C.and Jamieson, L. (1993). Modeling duration in a hidden Markov model with the exponential family. In Proc. ICASSP, pages 331–334. Citeseer. Mittag, T., Kay, L., and Forman-Kay, J. (2010). Protein dynamics and conformational disorder in molecular recognition. Journal of Molecular Recognition, 23(2) :105–116. Mörchen, F. (2006). Time series knowledge mining. PhD thesis, Philipps-Universität Marburg. Munshaw, S. and Kepler, T. (2010). SoDA 2 : a Hidden Markov Model approach for identification of immunoglobulin rearrangements. Bioinformatics, 26(7) :867. Murphy, K. (2002). Dynamic bayesian networks : representation, inference and learning. PhD thesis, Citeseer. Pedersen, J. S. and Hein, J. (2003). Gene finding with a hidden markov model of genome structure and evolution. Bioinformatics, 19(2) :219–227. Poets, C. F., Stebbens, V. A., Samuels, M. P., and Southall, D. P. (1993). The relationship between bradycardia, apnea, and hypoxemia in preterm infants. Pediatr Res, 34(2) :144–7. Portet, F., Gao, F., Hunter, J., and Sripada, S. (2007). Evaluation of on-line bradycardia boundary detectors from neonatal clinical data. Conf Proc IEEE Eng Med Biol Soc, 2007 :3288–91. Povinelli, R. (2001). Identifying temporal patterns for characterization and prediction of financial time series events. Temporal, Spatial, and Spatio-Temporal Data Mining, pages 46–61. Pravisani, G., Beuchee, A., Mainardi, L., and Carrault, G. (2003). Short term prediction of severe bradycardia in premature newborns. In Computers in Cardiology, 2003, pages 725–728. IEEE. Rabiner, L. R. (1989). A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE, 77(2) :257–286. Raman, H. and Sunilkumar, N. (1995). Multivariate modelling of water resources time series using artificial neural networks. Hydrological Sciences Journal/Journal des Sciences Hydrologiques, 40(2) :145–164. Sansom, J. and Thomson, P. (2001). Fitting hidden semi-Markov models to breakpoint rainfall data. Journal of Applied Probability, 38 :142–157. Schwarz, G. (1978). Estimating the dimension of a model. The annals of statistics, 6(2) :461–464. Suzuki, T., Ikeguchi, T., and Suzuki, M. (2003). Multivariable nonlinear analysis of foreign exchange rates. Physica A Statistical Mechanics and its Applications, 323 :591–600. Task Force (1996). Heart rate variability : standards of measurement, physiological inter- pretation and clinical use. task force of the european society of cardiology and the north american society of pacing and electrophysiology. Circulation, 93(5) :1043–65. Thoraval, L. (1995). Analyse statistique de signaux électrocardiographiques par modèles de Markov cachés. PhD thesis, Université de Rennes 1.
  • 147.
    Bibliographie 117 Weinman, J.,Learned-Miller, E., and Hanson, A. (2009). A discriminative semi-Markov model for robust scene text recognition. In Pattern Recognition, 2008. ICPR 2008. 19th International Conference on, pages 1–5. IEEE. Witten, I. and Frank, E. (2005). Data Mining : Practical machine learning tools and techniques. Morgan Kaufmann Pub. Yamato, J., Ohya, J., and Ishii, K. (1992). Recognizing human action in time-sequential images using hidden Markov model. In Proc. Comp. Vis. and Pattern Rec, pages 379–385. Yu, S.-Z. (2010). Hidden semi-markov models. Artificial Intelligence, 174(2) :215–243. Yu, S.-Z. and Kobayashi, H. (2003). An efficient forward-backward algorithm for an explicit-duration hidden markov model. Signal Processing Letters, IEEE, 10(1) :11–14. Zweig, G. and Russell, S. (1998). Speech recognition with dynamic Bayesian networks. In Proceedings of the National Conference on Artificial Intelligence, pages 173–180. John Wiley & Sons LTD.
  • 149.
    Chapitre 5 Application desMSMC sur des signaux simulés et réels Nous avons déjà justifié et expliqué tout au long de ce mémoire l’intérêt de prendre en compte les dynamiques des séries temporelles dans le cadre de la détection d’événements physiopathologiques. C’est ainsi que finalement dans ce chapitre, les résultats de classification et de détection, exploitant les dynamiques temporelles des observations multivariées par des MMC et par des MSMC, sont présentés. Dans ce chapitre, la classification correspond à l’identification de séquences d’observations qui contiennent ou pas un événement d’intérêt. Une procédure hors-ligne (en batch) est utilisée pour cette tâche de classification et l’instant précis de l’arrivée de l’événement n’est pas estimé. La détection est réalisée à partir d’une procédure récursive spécifique et a comme but l’estimation de l’instant précis des événements d’intérêt. Les améliorations proposées dans le chapitre 4, comme la quantification des observations et la prise en compte de versions retardées des observations, sont ici appliquées sur des signaux simulés et sur des signaux réels. Les travaux sur signal simulé sont présentés dans la section 5.1 et ont comme objectif de montrer la faisabilité de notre approche et d’optimiser la structure des MMC ou MSMC pour l’analyse de la dynamique de variables. Le modèle de FitzHugh-Nagumo [Fitzhugh, 1961] a été utilisé pour générer des signaux simulés bivariés, qui ont été ensuite contaminés avec plusieurs niveaux de bruit. Ce modèle est particulièrement adapté à notre problème car ses deux variables d’état présentent des dynamiques hétérogènes (variables d’état lente et rapide du modèle) et ces dynamiques peuvent être modifiées par l’ajustement d’un paramètre. La section 5.2 présente l’application des méthodes proposées sur des séries temporelles multivariées réelles. Elles correspondent aux caractéristiques extraites de l’ECG de nouveaux- nés prématurés (RR, Ramp et QRSd), tel que décrit dans le chapitre 3 de ce manuscrit. 119
  • 150.
    120 Chapitre 5 Deuxapproches sont proposées et évaluées pour i) la classification de segments de séries multivariées en fonction de la présence ou absence d’un événement d’apnée-bradycardie et ii) la détection en ligne de ces événements. Les performances de classification sont évaluées à partir des tableaux de contingence, par le calcul du taux d’erreur global et du taux d’erreur par classe. Dans le cas de la détection en ligne, la performance est en plus analysée par la détermination des valeurs de sensibilité et spécificité. Les performances de détection en ligne sont évaluées à partir de courbes COR, en fonction des valeurs de sensibilité, spécificité et temps de retard à la détection. Un effort particulier est réalisé ici pour optimiser les paramètres du MSMC et pour trouver la combinaison optimale d’observables à inclure en fonction de leur complémentarité. Les résultats obtenus de l’approche proposée sont comparés aux techniques classiques de détection d’apnée-bradycardie utilisées aujourd’hui en USIN. Enfin, une procédure de fusion décentralisée est détaillée et appliquée sur les meilleurs résultats de détection. 5.1 Évaluation de la faisabilité des MSMC sur signal simulé Dans cette section, nous allons procéder à la validation de la faisabilité des approches proposées au chapitre 4 sur des signaux synthétiques, avant d’étendre leur application aux signaux réels. La procédure de génération des signaux synthétiques bruités, avec le modèle de FitzHugh-Nagumo, est décrite dans la section 5.1.1. Des séries temporelles bivariées, avec deux dynamiques légèrement différentes, peuvent être produites avec ce modèle, à partir de la modification d’un de ces paramètres. De plus, une procédure de réduction d’amplitude a été appliquée aux séries temporelles synthétisées, afin de créer des observables très difficilement différentiables à partir de la seule analyse de leurs valeurs instantanées. Les processus de classification et de détection dans ce type de signaux sont particulièrement difficiles et doivent exploiter la dynamique des variables. Une fois les signaux simulés, les quatre expériences suivantes ont été réalisées : 1. Comparaison entre les MMC et les MSMC (section 5.1.2) : L’objectif est ici d’évaluer l’aptitude de ces modèles à classer des observations en fonction de leurs dynamiques. Les résultats obtenus ayant confirmé la supériorité des MSMC, les expériences suivantes ont été donc exécutées en utilisant ce type de modèle. 2. Étude de la performance de classification pour différentes valeurs du nombre d’états des MSMC (section 5.1.3) : La finalité de cette expérience est d’analyser l’impact de M dans les valeurs de TEG, car, tel que reporté au chapitre 4, une trop grande valeur de M présente un risque de sur-apprentissage, tandis qu’une valeur trop faible peut conduire à une mauvaise représentation des observations. 3. Classification des séquences d’observations basée uniquement sur la dynamique des observables (section 5.1.4) : Dans cette expérience, les modifications proposées dans
  • 151.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 121 le chapitre 4 (quantification et prise en compte de la version retardée des séries temporelles) sont appliquées. L’objectif est ici de mesurer l’impact de la quantification, uniforme et non uniforme, des observations et l’influence de la prise en compte des données précédentes dans le processus de décision. 4. Détection d’un évènement d’intérêt basée uniquement sur la dynamique des observables (section 5.1.5). L’intérêt est ici d’évaluer l’impact des modifications proposées dans les valeurs de sensibilité, spécificité et retard à la détection, sur des signaux simulés dont la dynamique est finement modifiée à partir des paramètres du modèle FitzHugh- Nagumo. 5.1.1 Le modèle de FitzHugh-Nagumo pour la génération des séries syn- thétiques Les expériences d’évaluation de l’approche proposée ont été conduites sur des séries temporelles générées par un modèle de FitzHugh-Nagumo [Fitzhugh, 1961]. Le modèle de FitzHugh-Nagumo (MFN) est un modèle générique, constitué de deux variables, qui est utilisé pour décrire un système excitable (comme par exemple une cellule myocardique) à partir des équations suivantes : dv dt = 3(v − 1 3 v3 + r + I) dr dt = − 1 3 (v − a + 0.8r) (5.1) où v est le potentiel de membrane (variable rapide), r est la variable de récupération (variable lente), I est la valeur du courant d’excitation externe et a est un paramètre qui peut changer l’état de repos et la dynamique du système. Dans le MFN, les variables v et r sont fréquemment initialisées à une valeur de « repos » (point fixe) et une perturbation est appliquée au moyen de la variable I pour déclencher une excursion dans l’espace des phases des variables v et r, avant de retourner à leurs valeurs de repos. L’algorithme de Runge-Kutta d’ordre 4 [Jameson et al., 1981], avec un pas d’intégration variable, a été utilisé pour simuler des séries temporelles r et v, avec deux dynamiques différentes, en fonction de la valeur du paramètre a, qui a été modifié selon une distribution uniforme dans l’intervalle : a1 ∼ U(0,58, 0,62) a2 ∼ U(0,78, 0,82) (5.2) La figure 5.1a illustre un diagramme de phases (r en abscisses et v en ordonnées) et les figures 5.1b et 5.1c montrent des exemples des séries temporelles v et r respectivement, pour
  • 152.
    122 Chapitre 5 plusieursvaleurs du paramètre a. On distingue bien les deux classes de séries temporelles générées (avec a1 et a2). −200 0 200 400 600 800 1000 −1000 −800 −600 −400 −200 0 200 400 0.58 0.6 0.62 0.78 0.8 0.82 Générées avec Générées avec (a) 290 295 300 305 310 315 320 −1000 −800 −600 −400 −200 0 200 400 Générées avec Temps (s) 0,58 0,6 0,62 0,78 0,8 0,82 Générées avec Valeurs de (b) 290 295 300 305 310 315 320 0 200 400 600 800 1000 0.58 0.6 0.62 0.78 0.8 0.82 Temps (s) Générées avec Générées avec (c) Figure 5.1 – Exemple de séries temporelles issues du MFN pour différentes valeurs du paramètre a : (a) dynamique dans le plan bivariée v&r, (b) dynamique de la variable v et (c) dynamique de la variable r. On distingue bien les deux classes de séries temporelles générées. En utilisant ce modèle, deux bases de données ont été construites : la première, utilisée dans les expériences de classification, est composée des séquences d’observations de 10 s avec trois dynamiques différentes (perturbation avec a1, perturbation avec a2 et sans perturbation). La seconde base a été créée pour conduire les procédures de détection en ligne et est composée des séries temporelles de 400 s avec deux dynamiques présentes dans chaque série (une période sans perturbation suivie d’une période avec une excursion produite pour la perturbation associée à a1 ou à a2 et suivie d’une dernière période sans perturbation). Ces deux bases de données sont présentées en détail dans les sections suivantes.
  • 153.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 123 Base de données synthétiques pour la classification Dans le cas de classification, trois sous-ensembles ont été construits pour effectuer les étapes d’apprentissage et test des MMC et des MSMC : – LSMFN1 : comprenant 400 séquences d’observations r, v et v&r au « repos » (sans perturbation) dont la moitié des séquences ont été générées aléatoirement avec a1 et l’autre moitié avec a2. – LSMFN2 : regroupant 200 séquences d’observations r, v et v&r générées avec a1 et en présence d’une perturbation de valeur constante I = −0.2. Ces séquences ont été choisies de sorte que le début de la perturbation I correspond au début de la séquence. I = 0.2 a été maintenu pendant 5 secondes et après I = 0 jusqu’à la 10me seconde. – LSMFN3 : représentée par 200 séquences d’observations r, v et v&r générées de la même manière que LSMFN2 mais en utilisant a2. Chaque sous-ensemble représente une classe à différencier. L’amplitude des séquences synthétisées a été réduite en la divisant par la valeur absolue maximale trouvée dans LSMFN2 et LSMFN3. Ensuite, les séquences d’observations ont été multipliées par 1000 pour éviter que Σνk i → 0 (c.f. section 4.4.3). Finalement, un bruit blanc gaussien a été ajouté aux observations afin d’obtenir différentes valeurs de RSB : 5, 10, 15, 20 dB. La figure 5.2 représente un exemple des trois types de dynamiques (trois classes) à classer en utilisant la variable r avec un RSB de 5 dB. On peut observer la similitude des séries dans les classes LSMFN2 et LSMFN3, ce qui rend la tâche de classification particulièrement difficile. 0 1 2 3 4 5 6 7 8 9 10 −200 0 200 400 600 800 1000 1200 LSMFN1 LSMFN2 LSMFN3 Temps (s) Figure 5.2 – Dynamiques des classes appartenant à la variable r à 5 dB.
  • 154.
    124 Chapitre 5 Basede données synthétiques pour la détection Dans le cas de détection, l’apprentissage des K modèles est effectué en utilisant 20 % des séquences d’observation de chaque sous-ensemble LSMFNk, k in{1, 2, 3}, présentés dans la section précédente. Le sous-ensemble de test est constitué par 400 séries temporelles r, v et v&r, de taille 400 secondes chacune, générées avec le MFN (équation 5.1). Une perturbation de valeur constante (I = −0.2) est introduite dans l’intervalle [300,305] (5 secondes de durée). Deux dynamiques différentes ont été générées en modifiant le paramètre a selon l’équation 5.2 : a1 et a2. Parmi les 400 séries temporelles, 200 ont été générées avec a1 et 200 avec a2. L’amplitude des séries temporelles a été réduite en la divisant par sa valeur absolue maximale. Ensuite, les séries temporelles ont été multipliées par 1000 pour éviter que σνk 2 i → 0 et un bruit blanc gaussien a été ajouté aux séries temporelles afin d’obtenir différentes valeurs de RSB : 5, 10, 15, 20 dB. La figure 5.3 montre un exemple de la dynamique de la série temporelle r (sans contamination) pour une valeur de a = 0, 58. 0 50 100 150 200 250 300 350 400 −200 0 200 400 600 800 1000 Temps (s) Début de la stimulation 10 s Figure 5.3 – Exemple d’une réalisation de la variable r, générée avec a1 = 0, 58. 5.1.2 Étude comparative de classification par MMC et MSMC L’objectif de cette étude est de comparer les performances des MMC et des MSMC dans la classification de séquences d’observations univariées présentant des valeurs d’amplitudes égales, mais des dynamiques légèrement différentes. Apprentissage des modèles Des séries temporelles univariées r des sous-ensembles LSMFNk, k ∈ {1, 2, 3}, ont été utilisées. K = 3 MMC et K = 3 MSMC ont été crées pour apprendre la dynamique de
  • 155.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 125 chaque classe. C’est à dire, pour modéliser LSMFNk, un MMC avec paramètres λMMCk et un MSMC avec paramètres λMSMCk ont donc été créés. Le nombre d’états par modèle a été déterminé avec l’équation 4.16 seulement pour le MSMC, puis MMMCk = MMSMCk . Le tableau 5.1 liste le nombre d’états des MSMC pour différentes valeurs de RSB. On peut constater que i) MMSMC1 < MMSMC2,3 pour tous les niveaux de RSB, car la gamme dynamique des séquences d’observations dans LSMFN1 est plus étroite que celles dans LSMFN2 et LSMFN3, ii) MMSMCk diminue au fur et à mesure que le RSB augmente, car la gamme dynamique du signal se réduit lorsque RSB augmente et iii) MMSMC2 = MMSMC3 car, comme prévu et dû au processus de réduction d’amplitude, les dynamiques des classes LSMFN2 et LSMFN3 sont comparables. Tableau 5.1 – Estimation du nombre d’états par MSMC pour différentes valeurs de RSB, pour modéliser la dynamique de la variable r. RSB (dB) MMSMC1 (États) MMSMC2 (États) MMSMC3 (États) 5 7 12 12 10 7 12 12 15 7 10 10 20 6 9 9 Test des modèles et évaluation des performances de classification Des tableaux de contingence ont été construits, afin de déterminer TEG (équation 4.26) et TECk (équation 4.27). Le tableau 5.2 montre un exemple d’un tableau de contingence. Pour cet exemple, TEG = 8, 58 %, TEC1 = 0 %, TEC2 = 17, 88 % et TEC3 = 7, 88 %. Tableau 5.2 – Tableau de contingence en utilisant les MSMC pour classer trois dynamiques observées dans la variable r à 5 dB. Chaque élément du tableau représente la somme des éléments correspondants sur les 10 répétitions. Classification LSMFN1 LSMFN2 LSMFN3 Référence LSMFN1 1600 0 0 LSMFN2 0 1314 286 LSMFN3 0 126 1474 Nous avons observé que, indépendamment de la valeur du RSB, les valeurs de TEG et de TECk sont plus faibles en utilisant des MSMC qu’avec des MMC. Le tableau 5.3 montre les performances de classification des séquences d’observations issues de la variable r à 5 dB de RSB, en utilisant les MMC et les MSMC. En outre, et comme attendu, le TEG diminue
  • 156.
    126 Chapitre 5 quandle RSB augmente. À titre d’exemple, en utilisant les MSMC, le TEG est de 8, 58 %, 7, 27 %, 6, 82 % et 5, 14 % à 5, 10, 15 et 20 dB, respectivement. À partir des tableaux 5.2 et 5.3, on peut noter que la classe LSMFN2 est la plus difficile à classifier et que la portion des séquences d’observations de LSMFN2, attribuées à LSMFN3, est plus grande que la portion des séquences d’observations de LSMFN3 attribuées à LSMFN2. Tableau 5.3 – Comparaison des performances de classification entre les MMC et les MSMC pour la classifications des séquences d’observations issues de la variable r à 5 dB et pour 10 réalisations des étapes apprentissage/test. Modèle TEG (%) TEC1 (%) TEC2 (%) TEC3 (%) MMC 52,22 71,12 35,81 49,21 MSMC 8,58 0 17,88 7,88 Ce manque de potentiel d’un MMC pour modéliser ces séquences d’observations et permettre sa classification peut être expliqué par le fait que les états sont caractérisés par des temps de passage longs et des nombreuses observations sont produites au sein d’un même état. Une loi géométrique, caractérisée par des temps de passage très courts est donc une représentation irréaliste du temps passé dans chaque état. Une loi Gaussienne (utilisée dans le MSMC), avec des valeurs µ ± σ, représente mieux le temps passé dans les états dans ces séquences d’observations. Une solution possible pour améliorer la performance des MMC est d’augmenter si- gnificativement le nombre d’états. Cependant, on risque de tomber dans des problèmes surapprentissage (overfitting) ou d’avoir des états trop fins, avec des faibles probabilités d’observation (Σνk i → 0) conduisant à des problèmes de stabilité numérique. De plus, la charge de calcul d’un tel modèle serait inutilement élevée. Les performances supérieures obtenues avec les MSMC reflètent l’exploitation des propriétés de dépendance temporelle des séquences d’observations et seront donc les seuls modèles utilisés dans le reste du document pour caractériser les séries temporelles uni ou multivariées. 5.1.3 Étude de la performance de classification en fonction du nombre d’états Cette étude permet d’observer l’évolution du TEG de classification pour différentes valeurs de M. Seule la classification réalisée par MSMC a été étudiée car, dans le paragraphe précèdent, les MSMC ont montré des meilleures performances de classification par rapport aux MMC.
  • 157.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 127 Apprentissage des modèles Les séquences d’observations correspondent à la variable r des classes LSMFNk, k = {1, 2, 3}, avec un RSB = 5 dB. k = 3 MSMC ont été créés pour apprendre la dynamique de LSMFNk. M1 = 7 a été estimé par le critère BIC et nous avons fait varier M2 et M3 de 2 à 12. Résultats de classification La figure 5.4 montre le TEG en fonction de M2 et M3, pour la classification des classes LSMFNk, k = {1, 2, 3}, issues de la variable r avec un RSB = 5 dB. L’examen de la courbe reportée montre que les meilleures performances ont été obtenues pour un nombre d’états similaires pour M2 et M3. On observe que lorsque le nombre d’états est très différent, les performances se dégradent : M2 = M3 = 7 états, TEG = 1, 04 % ; M2 = 2 états, M3 = 12 états, TEG = 33 %. Cela peut être expliqué par le fait que les dynamiques des observables dans les classes LSMFN2 et LSMFN3 sont très proches et, en cas d’hétérogénéité trop importante entre les valeurs de M2 et M3, c’est le modèle le plus complexe qui proposera la plus haute vraisemblance à la fois pour les classes LSMFN2 et LSMFN3. Le modèle le plus simple n’étant pas capable de reproduire la dynamique observée. 0 2 4 6 8 10 12 0 2 4 6 8 10 12 0 5 10 15 20 25 30 35 Erreurglobale(%) M2 M3 Figure 5.4 – TEG (%) en fonction du nombre d’états des MSMC pour la classification de trois classes issues de la variable r à 5 dB. Ces résultats illustrent aussi que, le seul hyper-paramètre des MSMC à ajuster, c’est-à- dire, le nombre d’états du modèle M, est une variable qui affecte sensiblement la performance de classification et doit être estimé de la meilleure manière possible. De plus, cette estimation doit être réalisée de façon spécifique à chaque MSMC à utiliser, en fonction de la complexité
  • 158.
    128 Chapitre 5 desdynamiques que chaque modèle devra reproduire. Dans notre cas, le critère BIC est utilisé pour calculer cet hyper-paramètre, en évaluant l’équation 4.16. 5.1.4 Étude de la performance de classification intégrant les améliora- tions proposées Dans cette section, le TEG de classification est analysé lorsque les améliorations proposées au chapitre 4, telles que la quantification des séquences d’observations et la version retardée de la série univariée, sont prises en compte. Apprentissage des modèles Les séquences d’observations correspondent à la variable r des classes LSMFNk, k = {1, 2, 3} avec un RSB = 5 dB. Les séquences d’observations ont été quantifiées de manière uniforme rQU (∆QU = 50) et de manière non uniforme rQNU (δQNU = 0, 001). La version retardée des séquences d’observations a été aussi considérée avec une valeur de τ = 1 s : r = rt−T+1:t rt−τ−T+1:t−τ (5.3) De plus, la quantification de r a été considérée : rQU (∆QU = 50) et rQNU (δQNU = 0, 001). Les valeurs de ∆QU, δQNU et τ ont été choisies de manière empirique. Leurs valeurs optimales seront déterminées pour la détection en ligne. Pour chaque variable étudiée r, rQU, rQNU, r, rQU et rQNU, appartenant aux classes LSMFNk, k = 3 MSMC ont été crées avec paramètres λk. Les résultats de l’estimation de Mk sont montrés tableau 5.4. On peut constater que la quantification uniforme permet de réduire le nombre d’états des modèles λ1, λ2 et λ3 d’une manière similaire car la gamme dynamique de l’amplitude des séquences d’observations se réduit uniformément dans tous les cas. Cependant, la quantification non uniforme permet de réduire seulement le nombre d’états des modèles λ2 et λ3 chargé de modéliser les observations qui présentent une gamme dynamique plus importante et une distribution non gaussienne. Résultats de classification Le tableau 5.5 montre les valeurs de TEG pour les variables analysées. L’analyse de ce tableau montre que : 1. La quantification uniforme de la variable r permet de diminuer le taux d’erreur par rapport au cas non quantifié car la variabilité des séquences d’observations est réduite
  • 159.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 129 Tableau 5.4 – Estimation du nombre d’états par MSMC pour modéliser la dynamique des différents versions de la variable r avec un RSB = 5 dB. Variable M1 (États) M2 (États) M3 (États) r 7 12 12 rQU 5 7 7 rQNU 7 10 10 r 5 14 14 rQU 4 11 11 rQNU 5 11 11 uniformément dans toutes les classes et les dynamiques les plus significatives des séquences d’observation sont mises en évidence. Tout cela favorise la différentiation des classes que se ressemblent (LSMFN2 et LSMFN3) et facilite l’affectation des observations aux états dans l’étape de récursion de l’algorithme de Viterbi ; 2. La quantification non uniforme de la variable r améliore encore les performances de classification par rapport aux cas non quantifié et quantifié uniformément. Ceci est dû au fait que, avec la quantification non uniforme utilisée, la variabilité des séquences d’observations est réduite seulement dans les portions où les données sont moins fréquentes ; 3. La prise en compte de la version retardée de la séquence d’observation et la séquence d’observation elle même accroît les performances de classification, car l’observabilité du système est augmentée et l’information provenant de la variable rapide (v) (c.f section 5.1.1) est synchronisée avec celle de la variable lente (r). Tableau 5.5 – TEG pour classer trois dynamiques différents des variables r à 5 dB en utilisant des MSMC sur 10 réalisations. Variable TEG (%) r 8,58 rQU 7,04 rQNU 6,98 r 0 rQU 0 rQNU 0 5.1.5 Détection en ligne d’évènements d’intérêt Dans cette section, la détection en ligne de la perturbation I est réalisée en utilisant l’approche basée sur des MSMC proposée au chapitre 4. Cette expérience est particulièrement
  • 160.
    130 Chapitre 5 intéressantepuisqu’une détection basée sur un simple seuil serait incapable de détecter et distinguer la perturbation produite avec a1 de celle produite avec a2 (en partie à cause de la phase de réduction d’amplitude). La détection de la stimulation générée avec a2 n’est pas analysée car elle n’apporte pas d’informations supplémentaires pour notre objectif de validation. Comme de très bons résultats de classification ont été obtenus en utilisant la variable lente du MFN et afin de compliquer les tâches de détection en ligne, seulement la variable rapide (v) sera utilisée dans cette section. Apprentissage des modèles Les séquences d’observations correspondent à la variable v des classes LSMFNk, k = {1, 2, 3} avec un RSB = 5 dB. Elles ont été quantifiées de manière uniforme vQU et de manière non uniforme vQNU. Le ∆QU optimal a été déterminé en utilisant l’algorithme 3 et le ∆QNU optimal a été déterminé en utilisant l’algorithme 5. La version retardée des séquences d’observations v a été également considérée. Pour la recherche du τ optimal, nous nous sommes basés sur l’analyse spectrale des variables v et r, car l’une influence l’autre. La différence en fréquence entre les pics observés dans le spectre de fréquence des séries temporelles v et r (voir figure 5.5) est de 0,08 Hz, ce qui correspond à une demi-période de 6,25 secondes. À partir de cette valeur, cinq valeurs différentes de τ ont été générées : τ = {3,75, 5, 6,25, 7,5, 8,75} (5.4) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 v r Fréquence (Hz) Energienormalisée Figure 5.5 – Spectre des séries temporelles v et r. Ensuite, pour chaque τ, Mk a été déterminé, λk a été estimé et la détection a été
  • 161.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 131 effectuée. La valeur optimale de τ correspond donc à celle qui donne la valeur la plus faible de DCDP (équation 2.5). De plus, une fois déterminé le τ optimal, les versions quantifiées de v (vQU et vQNU) ont été utilisées et les ∆QU et ∆QNU optimaux ont été déterminés. La figure 5.6 résumé les étapes du processus d’optimisation des paramètres ∆QU, ∆QNU et τ utilisés dans cette thèse. Initialiser paramètre Appliquer méthode aux données Base de données d'apprentissage Classe 1 Classe k Estimer et Base de données de test Calculer Choisir la valeur du paramètre qui donne la plus faible DCDP Détecter Calculer DCDP Changer la valeur du paramètre Figure 5.6 – Étapes du processus d’optimisation des paramètres. paramètre correspond aux valeurs de ∆QU, ∆QNU et τ et méthode correspond à quantification uniforme, quantification non uniforme et prise en compte de la version retardée des séquences, respectivement. Pour chaque variable étudiée v, vQU, vQNU, v, vQU et vQNU, appartenant aux classes LSDMFNk, k = 3 MSMC ont été créés avec paramètres λk. Résultats de la détection de la perturbation générée avec a1 Les séries temporelles univariées utilisées dans cette expérience correspondent à la variable v avec un RSB = 5 dB, de l’ensemble de « test » décrit dans la section 5.1.1. Une fenêtre glissante de taille T = 10 secondes a été retenue pour obtenir la séquence d’observation et calculer les log-vraisemblances Lk. Deux seuils (δ2,1 et δ2,3) ont été utilisés pour détecter la perturbation générée avec a1, en appliquant l’équation 4.25. La figure 5.7 montre deux séries temporelles v, l’une générée avec a1 et l’autre générée avec a2, pour un
  • 162.
    132 Chapitre 5 RSB= 5 dB. Les instants de début et fin de l’évènement d’intérêt à détecter y sont reportés. On peut observer la difficulté du problème : détecter la perturbation et la différencier avec celle générée avec a1 et celle générée avec a2. 0 50 100 150 200 250 300 350 400 450 −1200 −1000 −800 −600 −400 −200 0 200 400 Temps (s) v généré avec a1 généré avec a2 (a) 280 285 290 295 300 305 310 315 320 325 330 −1200 −1000 −800 −600 −400 −200 0 200 400 généré avec a1 généré avec a2 Temps (s) v Début annotation Fin annotation (b) Figure 5.7 – Dans (a), séries temporelles v générées avec a1 et a2 et dans (b), agrandissement de (a). Pour caractériser la variable v, les nombres d’états par MSMC selon le critère de BIC ont été de : M1 = 6 états et M2 = M3 = 10 états. Les courbes de log-vraisemblance Lk correspondant aux séries temporelles de la figure 5.7 sont montrées figure 5.8. On observe comment les courbes de log-vraisemblance évoluent au cours du temps pour indiquer l’état (« repos » ou « perturbation ») dans lequel on se trouve à l’instant t. 0 50 100 150 200 250 300 350 400 450 −30 −25 −20 −15 −10 −5 0 Temps (s) Log-vraisemblance (a) 280 285 290 295 300 305 310 315 320 325 330 −30 −25 −20 −15 −10 −5 Temps (s) Log-vraisemblance Début annotation Fin annotation (b) Figure 5.8 – Dans (a), courbes des log-vraisemblances Lk, k = {1, 2, 3}, des séries temporelles de la figure 5.7 et dans (b), agrandissement de (a). La différence des log-vraisemblances (L2 − L1 et L2 − L3) sont montrées figure 5.9. Les deux seuils L2 − L1 > δ2,1 et L2 − L3 > δ2,3 sont ajustés afin de maximiser la sensibilité et la spécificité (DCDP équation 2.5).
  • 163.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 133 280 285 290 295 300 305 310 315 320 325 330 −5 0 5 10 15 20 Différencedeslog-vraisemblance Temps (s) Début annotation Fin annotation Figure 5.9 – Différence des log-vraisemblances présentées dans la figure 5.8. Le tableau 5.6 montre les résultats de détection de la perturbation générée avec a1 en utilisant les MSMC. Cette valeur correspond aux valeurs des seuils δ2,1 et δ2,3, qui donnent le point sur la courbe COR le plus proche de la détection parfaite (DCDP, équation 2.5). Tableau 5.6 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de v. Variable SEN (%) SPC (%) TRD (s) v 89,29 97,98 2, 09 ± 0, 07 Détermination de ∆QU optimal Le nombre d’états pour chaque MSMC, pour les différentes valeurs de ∆QU, est montré tableau 5.7. On peut constater que Mk diminue lorsque que la taille du pas de quantification uniforme augmente, telle que montré dans la démarche de classification de la section précédente (section 5.1.4). Le tableau 5.8 montre les performances de détection de la perturbation générée avec a1, en utilisant les MSMC pour apprendre la dynamique de la variable vQU pour différentes valeurs de ∆QU. Dans ce tableau, la valeur optimale obtenue par estimation de la DCDP est ∆QU = 25. Ces résultats montrent à nouveau l’intérêt de l’étape de quantification. Détermination de ∆QNU optimal Le nombre d’états par MSMC pour les différentes valeurs de δQNU, est montré tableau 5.9. On peut observer que M2 et M3 diminuent plus que M1 au fur et à mesure que δQNU augmente, pour les raisons détaillées pour la variable r dans la section précédente (section 5.1.4). Le tableau 5.10 montre les performances de détection de la perturbation générée avec a1, en utilisant les MSMC pour apprendre la dynamique de la variable vQNU pour différentes valeurs de δQNU. Dans ce tableau, la valeur optimale qui donne la DCDP la plus faible est δQNU = 0, 003.
  • 164.
    134 Chapitre 5 Tableau5.7 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQU pour différentes valeurs de ∆QU. ∆QU M1 (États) M2 (États) M3 (États) 10 5 7 7 15 4 7 7 20 4 6 6 25 3 6 6 30 3 6 6 40 3 6 6 Tableau 5.8 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQU. ∆QU SEN (%) SPC (%) TRD (s) 10 89,25 98,08 1, 80 ± 0, 24 15 91,13 97,39 1, 60 ± 0, 06 20 92,12 97,97 1, 61 ± 0, 08 25 93,26 97,85 1, 41 ± 0, 24 30 88,18 98,15 2, 08 ± 0, 09 40 88,08 98,16 2, 09 ± 0, 06 Tableau 5.9 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQNU pour différentes valeurs de δQNU. δQNU M1 (États) M2 (États) M3 (États) 0,0001 6 7 7 0,001 5 6 6 0,002 5 6 6 0,003 4 5 5 0,005 4 4 4 0,01 4 4 4 Détermination de τ optimal La figure 5.10 montre un exemple de deux séries mono- source bivariées v, générées avec a1 et avec a2, pour un RSB = 5 dB et une valeur de τ = 3, 75 s. On peut observer les différentes trajectoires produites par les deux séries. Le nombre d’états par MSMC, pour les différentes valeurs de τ, est montré tableau 5.11. On peut observer que, pour différentes valeurs de τ, M2 et M3 sont différents tandis que M1 reste identique. Les valeurs de performance de détection en utilisant la variable v pour différentes valeurs de τ sont montrées tableau 5.12. On peut observer que la meilleure
  • 165.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 135 Tableau 5.10 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQNU. δQNU SEN (%) SPC (%) TRD (s) 0,0001 90,16 95,76 1, 77 ± 0, 23 0,001 91,13 97,39 1, 69 ± 0, 19 0,002 90,66 98,33 1, 60 ± 0, 06 0,003 92,14 96,19 0, 16 ± 3, 12 0,005 89,34 95,63 0, 09 ± 2, 85 0,01 88,65 96,64 0, 44 ± 2, 53 −1200 −1000 −800 −600 −400 −200 0 200 400 −1200 −1000 −800 −600 −400 −200 0 200 400 généré avec a1 généré avec a2 Figure 5.10 – Séries mono-source bivariée v, générées avec a1 et avec a2, pour un RSB = 5 dB et une valeur de τ = 3, 75 s. performance est atteinte pour une valeur de τ = 5 secondes. Tableau 5.11 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de v pour différentes valeurs de τ. τ M1 (États) M2 (États) M3 (États) 3,75 5 12 12 5 5 12 12 6,25 5 13 13 7,5 5 10 10 8,75 5 9 9
  • 166.
    136 Chapitre 5 Tableau5.12 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de v. τ (s) SEN (%) SPC (%) TRD (s) 3,75 85,93 97,89 2, 89 ± 0, 07 5 90,25 97,61 1, 73 ± 1, 40 6,25 89,68 95,72 1, 09 ± 2, 87 7,5 85,85 97,27 2, 93 ± 0, 47 8,75 89,36 94,10 1, 2 ± 2, 90 Détermination de ∆QU optimal Une fois τ = 5 s optimal trouvé, nous allons procéder à réaliser la quantification de v : vQU. Le nombre d’états par MSMC, pour les différentes valeur de ∆QU, est montré tableau 5.13. Les valeurs de performance de détection en utilisant la variable vQU pour différentes valeurs de ∆QU sont montrées tableau 5.14. La quantification uniforme de la variable v ne produit pas d’amélioration de la performance de détection par rapport au cas non quantifié. Tableau 5.13 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de v pour différentes valeurs de τ. ∆QU M1 (États) M2 (États) M3 (États) 5 5 8 8 10 4 7 7 15 3 6 6 20 3 6 6 Tableau 5.14 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQU. ∆QU (s) SEN (%) SPC (%) TRD (s) 5 90,06 96,68 2, 07 ± 0, 29 10 89,66 97,28 2, 08 ± 0, 89 15 79,24 94,71 0, 21 ± 3, 39 20 62,89 97,19 7, 40 ± 1, 19 Détermination de ∆QNU optimal Finalement, la quantification non uniforme de v (vQNU) est réalisée pour la valeur optimale de τ = 5 s. Le nombre d’états par MSMC, pour les différentes valeur de δQNU, est montré tableau 5.15. Les valeurs de performance de détection en utilisant la variable vQNU pour différentes valeurs de δQNU sont montrées
  • 167.
    5.1. Évaluation dela faisabilité des MSMC sur signal simulé 137 tableau 5.16. Encore une fois, la quantification non uniforme de la variable v ne produit pas d’amélioration de la performance de détection par rapport au cas non quantifié. Tableau 5.15 – Estimation du nombre d’états par MSMC pour modéliser la dynamique de vQNU pour différentes valeurs de δQNU. δQNU M1 (États) M2 (États) M3 (États) 0,0001 5 8 8 0,001 4 7 7 0,005 3 6 6 0,01 3 6 6 Tableau 5.16 – Performance de détection de la perturbation avec a1, en utilisant des MSMC pour apprendre la dynamique de vQNU. δQNU (s) SEN (%) SPC (%) TRD (s) 0,0001 90,00 97,64 2, 1 ± 0, 05 0,001 89,98 96,99 2, 1 ± 0, 07 0,005 89,19 97,97 1, 5 ± 2, 14 0,01 90,31 93,56 −0, 8 ± 3, 98 Synthèse des résultats de détection Les meilleurs résultats de détection obtenus sont reportés tableau 5.17, ainsi que dans les figures 5.11a, qui montre les courbes COR, et 5.11b, qui présente les retards moyens de détection. Dans ces figures, le point qui donne la valeur la plus faible de DCDP (valeurs optimales de δ2,3 et δ2,1) est représenté par le caractère « x », pour chaque courbe. Ces courbes sont construites en modifiant la valeur du seuil δ2,3, tout en conservant la valeur du seuil δ2,1 qui délivre la plus faible DCDP. Tableau 5.17 – Meilleures performances de détection de la perturbation produite avec a1, en utilisant des MSMC. Variable (s) Observation SEN (%) SPC (%) TRD (s) v 89,29 97,98 2, 09 ± 0, 07 vQU ∆QU = 25 93,26 97,85 1, 41 ± 0, 24 vQNU δQNU = 0, 003 92,14 96,19 0, 16 ± 3, 12 v τ = 5 s 90,25 97,61 1, 73 ± 1, 40
  • 168.
    138 Chapitre 5 00.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.8 0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 TFP TVP (a) 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0 1 2 3 4 5 6 7 TFP TRD(s) (b) Figure 5.11 – Meilleures performances de détection de la perturbation produite avec a1, en utilisant MSMC. Dans (a) courbes COR et dans (b) courbes TRD en fonction de TFP. On peut observer dans le tableau 5.17 et dans les figures 5.11a et 5.11b, que la perfor- mance de détection est améliorée lorsque l’étape de quantification est utilisée. La meilleure performance de détection a été obtenue quand la quantification uniforme est appliquée à la variable v (vQU), suivie du cas de quantification non uniforme (vQNU). Ces résultats confirment donc l’intérêt de l’approche de détection par MSMC proposée, et mesurent l’impact de l’étape de quantification et de la prise en compte de la version retardée sur les performances de détection, dans un cas de détection très difficile. 5.2 Évaluation des MSMC sur signaux réels L’analyse précédente sur signaux simulés a confirmé que l’approche par MSMC proposée apparaît comme une méthode appropriée pour le problème posé dans ce travail de thèse. De plus, l’apport de la quantification et de l’intégration d’une version retardée des observations ont pu être mesurés. Cette section présente des résultats de l’application de la méthode sur des signaux réels. Les séries temporelles à caractériser sont décrites dans la prochaine sous-section. Cette dernière présente l’information qui va être prise en compte par les MSMC. La deuxième sous-section montre la classification des épisodes d’apnée-bradycardie et la troisième détaille les résultats de détection en ligne. Finalement, la fusion de détecteurs est appliquée aux meilleurs détecteurs trouvés, dans la section 5.2.4.
  • 169.
    5.2. Évaluation desMSMC sur signaux réels 139 5.2.1 Méthode proposée pour l’annotation des instants de début de bra- dycardie Les séries RR, Ramp et QRSd ont été extraites de l’ECG de 32 nouveau-nés prématurés présentant des épisodes fréquents d’apnée-bradycardie, en appliquant la méthode proposée dans le Chapitre 3. Pour mémoire, et en cas d’une lecture indépendante de ce chapitre, ceci consiste à : i) détecter les battements cardiaques à partir des signaux ECG bruts, ii) segmenter chaque battement détecté par un algorithme basé sur les ondelettes et iii) former les séries temporelles RR (différences successives des ondes R), Ramp (différences entre le pic de l’onde R et le niveau isoélectrique) et QRSd (différence entre la fin et le début du complexe QRS) pour chaque individu de la base de données. Les séries ainsi obtenues ont été uniformément sur-échantillonnées à une fréquence de 10 Hz, afin d’avoir une résolution temporelle suffisante pour l’application des MSMC. De plus, la série Ramp a été réduite, en la divisant par la valeur absolue maximale trouvée dans les deux premières minutes. Dans cette étude, les bradycardies ont été annotées manuellement avec l’aide d’un clinicien. De plus, une procédure d’ajustement de courbe a été proposée pour situer, avec la meilleure reproductibilité possible, le début de la bradycardie. Une fonction sigmoïde (équation 5.5) est utilisée pour approcher la série temporelle RR aux alentours de l’instant de début de la bradycardie : f(t) = A + B 1 + e t−C D (5.5) Le début de la bradycardie correspond au premier point où la dérivée de la fonction sigmoïde est supérieure à 1. Un exemple d’approximation de la série temporelle RR est montré figure 5.12. On y a reporté le point qui correspond à l’annotation du début de la bradycardie. Au total, 148 ensembles de séries temporelles (26, 25 ± 11, 37 minutes) de la base de données de 32 nouveau-nés prématurés (constitués chacun des séries RR, Ramp et QRSd) ont été utilisés et 233 épisodes de bradycardies ont été annotés avec une durée des bradycardies de 21, 48 ± 16, 07 secondes. 5.2.2 Classification des séries temporelles : « présence » ou « absence » d’apnée-bradycardie Comme il a été présenté en introduction de ce chapitre, la tâche de classification correspond à l’identification de séquences d’observations qui contiennent ou pas un événement d’intérêt, tandis que la détection en ligne cherche à estimer l’instant d’apparition de ces événements par une approche récursive. Il est important de préciser qu’il ne s’agit pas ici
  • 170.
    140 Chapitre 5 05 10 15 2 4 6 8 10 12 14 16 0 5 10 15 350 400 450 500 550 600 650 700 750 800 Temps (s) RR(ms) DérivéeRRinterpolée RR RR interpolée Dérivée RR interpolée Figure 5.12 – Approximation de la série temporelle RR (représentée par des cercles) pendant un épisode de bradycardie, par une fonction sigmoïde (courbe rouge continue). La courbe noire pointillée correspond à la dérivée de la fonction sigmoïde et la ligne verticale correspond à l’annotation du début de bradycardie. de classifier les différents types d’épisode d’apnée-bradycardie comme par exemple, des épisodes appartenant aux types centrale, obstructive ou mixte. Les observations Les 148 séries temporelles décrites précédemment ont été segmentées en blocs de 7 secondes. Ceci a produit un nombre total de 29667 blocs. Ces blocs ont été regroupés en deux sous-ensembles : 1. le sous-ensemble LSC1 ou classe 1, composé de 146 blocs présentant une bradycardie et choisis parmi les 233 épisodes de bradycardie annotés. Chaque bloc dans cette classe est défini à partir du début de la bradycardie et avec une durée T = 7 secondes. Le critère d’inclusion d’un bloc dans cette classe était que : i) avant le début de la bradycardie la FC doit être sans ralentissement ni accélération, en conséquence, dès t = 10 secondes avant le début de la bradycardie jusqu’au début de la bradycardie |FC(t) − FCbase| < ±10 %, où FCbase est la FC de base mesurée dans une fenêtre glissante de 5 minutes et ii) durant les premières 5 secondes de la bradycardie, l’intervalle RR doit dépasser les points critiques RR ≥ 500 ms ou RR ≥ 33%RRbase où RRbase = 60/FCbase. La figure 5.13 montre deux cas typiques qui ne doivent pas être inclus dans sous-ensemble LSC1. Dans la figure 5.13a, on observe le cas où, avant le début de la bradycardie, la FC présente un ralentissement et dans la figure 5.13b on observe le cas où l’intervalle RR ne dépasse pas le seuil de 500 ms qu’après 20 s dès l’annotation.
  • 171.
    5.2. Évaluation desMSMC sur signaux réels 141 2. le sous-ensemble LSC2 ou classe 2, constitué de 1500 blocs choisis aléatoirement parmi les segments de séries temporelles au repos. Ils ont également une durée de 7 secondes. 320 340 360 380 400 420 350 400 450 500 550 600 650 700 750 800 850 Débutdelabradycadie Findelabradycadie 10 s 10% (a) 1380 1400 1420 1440 1460 1480 1500 1520 400 500 600 700 800 900 RR(ms) Temps (s) 7 s Débutdelabradycadie Findelabradycadie Seuil (b) Figure 5.13 – Exemples des séries RR que ne doivent pas être incluses dans le sous-ensemble LSC1. Dans (a) la FC présente un ralentissement avant le début de la bradycardie et dans (b) l’intervalle RR ne dépasse pas le seuil de 500 ms que plus de 20 s après l’annotation. A titre d’exemple, la figure 5.14 montre une série RR avec un épisode de bradycardie significative. On y a reporté l’analyse par bloc des séries et la classe affectée à chaque bloc. 0 20 40 60 80 100 120 140 160 180 400 500 600 700 800 900 1000 RR(ms) Temps (s) Fin de la bradycardie Bradycardie significative Classe 1 7 s Classe 2 7 s Classe 2 7 s Classe 2 7 s Classe 2 7 s Figure 5.14 – Exemple d’une série RR avec un épisode de bradycardie. Les différents blocs segmentés et leur classe sont indiqués. La durée des segments (7 secondes) à classer correspond au temps mesuré entre le début de la bradycardie et le plus grand ralentissement de la FC observée en bradycardie sur la moyenne spatiale des 233 blocs de séries RR (RR) tel que montré figure 5.15 et calculée avec l’équation 5.6, où j ∈ {Deb, Deb + 1, . . . , Fin − 1, Fin}, Deb et Fin correspondent aux instants de début et de fin des épisodes d’apnée-bradycardie. RR(j) = 1 233 233 i=1 RRi(j) (5.6)
  • 172.
    142 Chapitre 5 05 10 15 300 400 500 600 700 800 0 5 10 15 300 400 500 600 700 800 Temps (s) Temps (s) 0 5 10 15 350 400 450 500 550 600 650 700 0 5 10 15 400 450 500 550 600 650 Temps (s) Temps (s) DébutannotationDébutannotationDébutannotationDébutannotation Valeur maximale 7 s Figure 5.15 – Procédure pour la détermination de la taille de la séquence d’observation sur les signaux RR. RR correspond à la moyenne des 233 blocs de séries RR avec les épisodes d’apnée-bradycardies. De plus, afin de réduire la variabilité d’amplitude du premier échantillon des séries temporelles, celles-ci ont été centrées de la façon décrite au chapitre 4 (équation 4.30) où la moyenne, déterminée dans les L = 5 secondes qui précèdent le début de chaque segment, a été enlevée aux séquences d’observation.
  • 173.
    5.2. Évaluation desMSMC sur signaux réels 143 La figure 5.16 montre les 7 premières secondes de la série temporelle RR moyennée (RR) et son écart type. On observe sur la figure 5.16a une variabilité importante dans l’amplitude du premier échantillon de la série temporelle. Cette variabilité est évidemment réduite en centrant les séries avec la procédure décrite (figure 5.16b). Une boîte à moustache du premier échantillon de chaque série est montrée figure 5.17 pour renforcer cette justification. 0 1 2 3 4 5 6 7 350 400 450 500 550 600 650 700 750 800 Temps (s) (a) 0 1 2 3 4 5 6 7 −50 0 50 100 150 200 250 300 350 400 Temps (s) (b) Figure 5.16 – Moyenne (ligne continue) et moyenne ± écart-type (lignes pointillées) de 7 premières secondes des séries RR en bradycardie. Dans (a) on observe la variation d’amplitude du premier échantillon tandis que dans (b), cette variation est réduite en supprimant aux séries la moyenne déterminée sur les 5 secondes qui précédent le début de la bradycardie. 350 400 450 500 550 (a) −40 −20 0 20 40 60 80 100 120 (b) Figure 5.17 – Boîte à moustache du premier échantillon des série RR en bradycardie : (a) RR non centrées et (b) RR centrées. Finalement, les séquences d’observations des classes 1 et 2 ont été multipliées arbitraire- ment par 1000 afin d’éviter que Σνk i → 0.
  • 174.
    144 Chapitre 5 Applicationde l’approche proposée dans le présent travail Les améliorations proposées dans le chapitre 4, telles que la quantification des séquences d’observations et la prise en compte de la version retardée de la série temporelle univariée, sont appliquées aux variables des classes 1 et 2 : – pour le cas RR : RRQU, RRQNU, RR, RRQU et RRQNU, – pour le cas Ramp : RampQU, RampQNU, Ramp, RampQU et RampQNU, – pour le cas QRSd : QRSdQU, QRSdQNU, QRSd, QRSdQU et QRSdQNU. Les valeurs de τ, ∆QU et δQNU utilisées dans cette section, correspondent aux valeurs optimales déterminées pour la détection en ligne (section 5.2.3 et Annexe E). Les valeurs de τ sont : τ = 0, 67 s pour la variables RR et τ = 0, 5 s pour les variables Ramp et QRSd. Le valeurs de ∆QU et δQNU sont montrées tableau 5.18. Tableau 5.18 – Valeurs optimales des paramètres ∆QU et δQNU. Variable ∆QU δQNU RR 1300 0,05 Ramp 20 0,001 QRSd 10 0,001 RR 50 0,002 Ramp 20 0,001 QRSd 10 0,001 Apprentissage des MSMC Pour chaque variable, K = 2 MSMC ont été créés pour apprendre la dynamique observée dans les évènements « présence » et « absence » d’apnée-bradycardie des classes 1 et 2 : i) un MSMC avec paramètres λ1 pour modéliser les segments avec bradycardies (classe 1) et ii) un MSMC avec paramètres λ2 pour modéliser les segments en repos (classe 2). Le nombre d’états des MSMC (M1 et M2) ont été estimés en utilisant l’équation 4.16. 20 % des séquences d’observations de chaque classe ont été utilisées pour l’estimation des paramètres et 80 % pour évaluer l’appartenance des séquences d’observations aux modèles selon l’équation 4.23. Une procédure de Monte Carlo est appliquée pour sélectionner les données de l’apprentissage et du test. Les résultats de l’estimation de Mk, k = 1, 2, est montré tableau 5.19. On peut constater que : i) dans le cas des variables RR et RR, M1 et M2 diminuent lorsque la quantification uniforme est appliquée, mais M1 diminue plus que M2 lorsque la quantification non uniforme est appliquée, ii) dans le cas des variables Ramp, Ramp, QRSd et QRSd, M1 et M2 diminuent de manière semblable lorsque les quantifications uniforme ou non uniforme sont
  • 175.
    5.2. Évaluation desMSMC sur signaux réels 145 appliquées. Cela est expliquée par le fait que l’histogramme des séries temporelles RR est moins gaussien que pour les séries temporelles Ramp et QRSd. Tableau 5.19 – Estimation du nombre d’états par MSMC pour modéliser les classes 1 et 2. Variable M1 (États) M2 (États) RR 13 11 RRQU 7 5 RRQNU 5 6 RR 15 12 RRQU 13 8 RRQNU 6 6 Ramp 8 7 RampQU 6 5 RampQNU 7 6 Ramp 12 10 RampQU 8 8 RampQNU 8 8 QRSd 7 7 QRSdQU 7 6 QRSdQNU 7 7 QRSd 10 8 QRSdQU 9 8 QRSdQNU 9 8 RR&Ramp 13 11 RR&RampQU 10 8 RR&RampQNU 4 6 RR&QRSd 8 8 RR&QRSdQU 8 8 RR&QRSdQNU 6 6 Performance de classification L’expérience apprentissage/test a été répétée 10 fois afin d’obtenir des résultats indé- pendants du tirage effectué. Le tableau 5.20 montre les performances de classification obtenues. On peut constater que : i) dans le cas de la variable RR, la quantification non uniforme et la prise en compte d’une version retardée de l’observation permettent d’améliorer la classification (TEG=1,37 % pour RR vs TEG=0,68 % pour RRQNU), ii) dans le cas des variables Ramp et QRSd, les
  • 176.
    146 Chapitre 5 performancesde classification ne sont pas satisfaisantes et la quantification des séquences d’observation ne permet pas d’améliorer le TEG et iii) lorsque les séquences d’observa- tion sont analysées de manière conjointe, les performances de classification s’améliorent (TEG=1,37 % pour RR et TEG=36,68 % pour Ramp vs TEG=1,06 % pour RR&Ramp). Tableau 5.20 – Performances de classification par MSMC en utilisant les signaux réels. Variable TEG (%) SEN (%) SPC (%) RR 1,37 99,91 97,36 RRQU 1,30 99,80 97,61 RRQNU 1,24 99,41 98,12 RR 0,94 98,72 99,41 RRQU 0,85 98,55 99,75 RRQNU 0,68 99,49 99,15 Ramp 36,68 58,55 68,10 RampQU 36,29 50,26 77,16 RampQNU 37,41 39,14 86,04 Ramp 36,19 44,79 82,83 RampQU 33,07 55,3 78,55 RampQNU 35,89 47,36 80,86 QRSd 40,00 42,48 77,53 QRSdQU 37,60 56,42 68,38 QRSdQNU 40,38 28,64 90,6 QRSd 40,08 37,61 82,23 QRSdQU 39,82 60,26 60,09 QRSdQNU 39,48 52,48 68,55 RR&Ramp 1,06 98,98 98,89 RR&RampQU 0,64 99,58 99,15 RR&RampQNU 0,72 100 98,57 RR&QRSd 0,94 99,75 98,38 RR&QRSdQU 0,64 99,75 98,98 RR&QRSdQNU 0,71 100 98,59 Sur la base de données à notre disposition, les résultats montrent qu’une analyse multivariée et multi-source (intégrant plusieurs observables associées à des phénomènes physiologiques différents, comme le RR&RampQU) présente les meilleures performances de classification. Les améliorations que nous avons proposées prennent particulièrement leur sens lorsque l’observabilité est réduite, par exemple dans les cas mono-source (i.e. seule la série RR est disponible), les performances atteintes rejoignent alors celles du cas multivarié. Les très faibles performances trouvées dans le cas des indicateurs Ramp et QRSd peuvent
  • 177.
    5.2. Évaluation desMSMC sur signaux réels 147 être expliquées par le fait que nous avons choisi l’annotation du début de la bradycardie (telle que décrite dans la section 5.2.1) comme point initial des séquences d’observation, annotation réalisée par l’analyse des séries RR. Cependant, l’information utile peut être présente sur d’autres séries avant cette annotation. Enfin, la recherche de l’instant optimal où l’information se trouve est une tâche difficile qui peut être exécutée à partir d’une méthodologie basée sur des algorithmes évolutionnaires, comme proposé au chapitre 3. Cette démarche est placée comme une perspective de cette thèse. 5.2.3 Détection en ligne d’épisodes d’apnée-bradycardie Les contraintes de notre cahier des charges consistent à réaliser la détection en ligne des épisodes d’apnée-bradycardies. Cette détection est réalisée en utilisant l’approche basée sur des MSMC proposée au chapitre 4. Apprentissage Les séquences d’observation utilisées dans la phase d’apprentissage des MSMC corres- pondent au 20% des séquences d’observations, tirées aléatoirement à partir des éléments présents dans les classes 1 et 2, décrites préalablement (section 5.2.2 page 140) : cas univariée RR, Ramp, QRSd et cas bivariée RR&Ramp, RR&QRSd et Ramp&QRSd. La version retardée des séquences d’observations a été également considérée : RR, Ramp et QRSd. Pour chaque variable, les valeurs optimales de τ ont été déterminées comme proposé dans le chapitre 4. Les séquences d’observations ont été quantifiées de manière uniforme TSQU et de manière non uniforme TSQNU, où TS ∈ {RR, RR, Ramp, Ramp, QRSd, QRSd, RR&Ramp, RR&QRSd}. Pour chaque variable, les valeurs optimales de ∆QU et ∆QNU ont été déterminées en utilisant les algorithmes 3 et 5, respectivement. Enfin, pour chaque variable analysée, appartenant aux classes 1 et 2, k = 2 MSMC ont été crées : un MSMC avec paramètres λ1 modélise la dynamique de la bradycardie (classe 1) et un autre MSMC avec paramètres λ2 modélise les périodes de repos (classe 2). Pour l’estimation de λk, 20 % des données de la classe 1 et 20 % des données de la classe 2 ont été sélectionnées de manière aléatoire. Le nombre d’états de chaque modèle M1 et M2 ont été déterminés en utilisant le critère BIC (équation 4.16).
  • 178.
    148 Chapitre 5 Méthodede détection en ligne La détection en ligne de l’évènement apnée-bradycardie est effectuée sur la totalité des 148 séries temporelles disponibles, présentant un total de 233 épisodes de bradycardie. Comme détaillé au chapitre 4, la détection en ligne est basée sur l’analyse des log-vraisemblances de chaque MSMC (équation 4.31). Une fenêtre glissante de taille T = 7 secondes a été retenue pour obtenir la séquence d’observation Ot−T+1:t et calculer les log-vraisemblances L1 t et L2 t . Par conséquent, seulement un seuil de détection est utilisé δ1,2 (équation 4.25). La moyenne, déterminée dans une fenêtre de taille L = 5 secondes, a été enlevée aux séquences d’observations avant d’être traitées par chaque MSMC (équation 4.30). La fenêtre de longueur T est glissée par des sauts de 1 seconde (10 échantillons). La figure 5.18 montre un exemple d’une telle détection en ligne, basée sur le calcul de vraisemblance, en utilisant la variable RR. Deux épisodes de bradycardies y sont reportés (figure 5.18a). Les courbes de log-vraisemblances (L1 et L2) évoluent au cours du temps et, au moment de la bradycardie, L1 augmente et L2 diminue (figure 5.18b). On profite de ce comportement pour calculer la différence des log-vraisemblances L1 − L2 (figure 5.18c) et comparer cette différence au seuil δ1,2 pour détecter ces épisodes. On y a reporté aussi les annotations de début et de fin de chaque épisode de bradycardie (lignes verticales pointillés figures 5.18a et 5.18b). La performance de détection a été évaluée par l’estimation de SEN (équation 2.1), SPC (équation 2.2) et TRD pour différentes valeurs des seuils de détection, et analysée par deux types de courbes COR : la première courbe représente classiquement la Pd vs. Pfa et la seconde représente le TRD vs. Pfa. Les résultats de détection ont été évalués également en termes de la DCDP (équation 2.5). Les valeurs de VP, VN, FP et FN ont été déterminées pour chaque échantillon en comparant les détections obtenues avec les annotations disponibles. Un VP se produit lorsqu’une détection est entourée d’une annotation dans une fenêtre de 20 secondes, centrée à l’annotation donnée. Même si cette fenêtre semble particulièrement large, nous avons justifié ce choix par le fait que nous évaluons également le TRD comme un marqueur important pour la sélection de la méthode de détection optimale et que les algorithmes proposés sont censés améliorer la détection précoce des événements d’apnée-bradycardie. Résultats sans prendre en compte les améliorations proposées Le tableau 5.21 montre les résultats de détection de l’apnée-bradycardie pour les cas univariés RR, Ramp et QRSd et pour les cas bivariées RR&Ramp, RR&Ramp et Ramp&QRSd. La figure 5.19 montre les trois meilleures performances de détection de ce tableau. Les méthodes classiques de détection de bradycardie (seuil fixe et seuil relatif) sont également montrées comme référence dans le tableau 5.21 et la figure 5.19. Les valeurs
  • 179.
    5.2. Évaluation desMSMC sur signaux réels 149 300 400 500 600 700 800 900 350 400 450 500 550 600 650 700 750 800 850 900 Temps (s) RR(ms) (a) 300 400 500 600 700 800 900 −140 −120 −100 −80 −60 −40 −20 0 Temps (s) log-vraisemblance (b) 300 400 500 600 700 800 900 −100 −80 −60 −40 −20 0 20 40 60 80 Temps (s) Différencedeslog-vraisemblances (c) Figure 5.18 – (a) Série RR avec deux épisodes de bradycardie, (b) log-vraisemblance des modèles : L1 (ligne segmentée) et L2 (ligne continue) et (c) différence entre les log- vraisemblance : L1 − L2. Dans (a) et (c) les lignes verticales correspondent aux annotations de début et fin de l’épisode de bradycardie. du tableau correspondent aux valeurs des seuils δ2,1 et δ2,3 optimaux au sens du DCDP (équation 2.5) et qui sont représentés par le caractère « x » dans la figure 5.19, pour chaque courbe. Pour chaque variable, le nombre d’états des MSMC est le même que celui reporté tableau 5.19. Dans le tableau 5.21 et la figure 5.19, on peut observer que : i) la modélisation des dynamiques des séries temporelles RR par MSMC améliore la performance de détection par rapport aux méthodes de détection classiques (détection par seuil fixe ou par seuil relatif) mais la détection se produit avec un retard plus important, ii) la modélisation par MSMC des dynamiques des séries temporelles univariées Ramp et QRSd ne produisent pas d’amélioration de la détection, iii) lorsque la dynamique des variables RR et Ramp et RR et QRSd sont prises en compte de manière conjointe, les performances de détection s’améliorent et le temps de détection se réduit par rapport aux versions univariées des séries
  • 180.
    150 Chapitre 5 Tableau5.21 – Performance de détection de l’apnée-bradycardie par MSMC, sans prendre en compte les modifications proposées. Variable SEN (%) SPC (%) TRD (s) RR 74,20 92,77 6, 37 ± 7, 83 Ramp 63,64 76,28 6, 67 ± 15, 05 QRSd 66,43 66,51 6, 94 ± 13, 44 RR&Ramp 80,46 91,28 5, 24 ± 5, 09 RR&QRSd 81,22 88,23 4, 73 ± 5, 57 Seuil fixe 77,11 79,31 4, 63 ± 5, 04 Seuil relatif 73,35 87,36 4, 16 ± 8, 79 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 TFP TVP Seuil fixe Seuil relatif (a) 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 2 3 4 5 6 7 8 9 10 TFP TRD(s) Seuil fixe Seuil relatif (b) Figure 5.19 – Performance de détection de l’apnée-bradycardie par MSMC, sans prendre en compte les modifications proposées. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. Le caractère « x » représente le point correspondant à la DCDP. considérées. Résultats en utilisant les améliorations proposées Comme décrit dans la section précédente sur signaux synthétiques, les approches de classification et de détection par MSMC sont sensibles aux paramètres τ, ∆QU et ∆QNU, ainsi qu’au nombre d’états M. L’optimisation de ces paramètres a été également abordée sur les signaux réels, en utilisant la même approche que pour les signaux simulés. Les résultats détaillés de chaque étape de l’optimisation sont présentés en Annexe E, afin d’alléger la lecture de cette section. Tous les résultats montrés dans le reste de ce chapitre ont été donc obtenus en utilisant les paramètres optimaux pour chaque type de modèle utilisé. Le tableau 5.22 résume les 8 meilleures approches MSMC en termes de performance
  • 181.
    5.2. Évaluation desMSMC sur signaux réels 151 de détection et les paramètres optimaux estimés pour chaque approche. La figure 5.20 montre les courbes COR associées à trois approches proposées dans ce tableau, et deux approches classiques de la littérature, en indiquant dans chaque cas le point de détection optimal en termes de la DCDP (caractère « x » sur les courbes). Les détections classiques de bradycardie sont également montrées comme référence. On peut repérer, que la prise en compte des dynamiques des séries temporelles extraites de l’ECG améliore les performances de détection des épisodes d’apnée-bradycardie par rapport aux détecteurs classiques. De plus, la quantification non uniforme des séries RR et de sa version retardée se montrent comme les meilleures techniques. Même si nous n’avons pas réussi à prédire la survenue de l’évènement apnée-bradycardie, les sept premiers résultats montrés dans ce tableau indiquent que notre approche détecte, en moyenne, plus précocement que les méthodes de détection classiques. Tableau 5.22 – Huit meilleures approches de détection de bradycardies par MSMC, en termes de performance. Variable Paramètres optimaux SEN (%) SPC (%) TRD (s) RRQNU δQNU = 0, 05 89,88 94,67 1, 93 ± 3, 34 RRQNU τ = 0, 67, δQNU = 0, 002 90,80 92,26 1, 12 ± 3, 62 RR τ = 0, 67 90,38 92,23 0, 92 ± 3, 56 RRQU τ = 0, 67, ∆QU = 50 89,94 91,95 0, 93 ± 3, 64 RRQU ∆QU = 1300 86,63 97,3 2, 33 ± 3, 15 RR&QRSdQU ∆RR QU = 1300, ∆QRSd QU = 0 85,87 87,85 1, 06 ± 3, 87 RR&QRSdQNU δRR QNU = 0, 05, δQRSd QNU = 0 82,62 92,16 1, 93 ± 4, 04 RR&Ramp - 80,46 91,28 5, 24 ± 5, 09 Seuil fixe - 77,11 79,31 4, 63 ± 5, 04 Seuil relatif - 73,35 87,36 4, 16 ± 8, 79 Si l’on utilise les règles de détection classiques : pour le détecteur de seuil fixe RR ≥ 600 ms pendant 4 secondes et pour le détecteur de seuil relatif RR ≥ 33%RRbase ms pendant 4 secondes, on obtient les résultats montrés tableau 5.23. On peut observer dans ce tableau que les détecteurs classiques présentent une excellente spécificité mais une mauvaise sensibilité, de plus, le retard à la détection est important. Avec les MSMC, on augmente la sensibilité au détriment de la spécificité et on réduit par 10 le retard à la détection. Tableau 5.23 – Performance de détection des méthodes classique dans leur point opérationnel. Variable Sensibilité (%) Spécificité (%) TRD (s) Seuil fixe 32,67 100 10, 74 ± 11, 22 Seuil relatif 32,60 100 8, 61 ± 4, 85
  • 182.
    152 Chapitre 5 00.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 Seuil fixe Seuil relatif TFP TVP (a) 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 −2 −1 0 1 2 3 4 5 6 7 8 TFPTRD(s) Seuil fixe Seuil relatif (b) Figure 5.20 – Performance de détection de l’apnée-bradycardie par MSMC. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. Le caractère « x » représente le point correspondant à la DCDP. D’autres travaux au laboratoire se sont intéressés à réduire le temps de retard à la détection. C’est le cas de l’approche proposée par CRUZ [Cruz et al., 2006] qui effectue la fusion optimale de trois détecteurs (détecteur fixe, détecteur relatif et détecteur par changements abrupts sur la moyenne), par une méthode de fusion décentralisée [Hernández et al., 1999]. Cette approche montre des valeurs de sensibilité et de spécificité de 97,67 % et 97,00 % respectivement et une réduction de la détection à 2,22 battements (autour de 1 seconde) sur une base de données de 1188 épisodes de bradycardie de 40 individus. Il faut signaler que le début de l’annotation des évènements dans ce travail correspond au croisement de la série RR par 600 ms et dans notre cas le début de l’annotation a été placée au point où la dérivée de la fonction sigmoïde qu’approche la série RR est supérieure à 1. De plus, la base de données et les procédures d’annotations ne sont pas identiques. Il n’en reste pas moins, que cette étape de fusion a démontré son utilité, en particulier pour améliorer la spécificité de la méthode de détection des ruptures [Cruz et al., 2006]. Dans ce sens, l’étape finale d’évaluation de notre détecteur a été donc d’adapter la méthode de fusion utilisée dans [Hernández et al., 1999; Cruz et al., 2006] et d’évaluer son intégration avec la méthode par MSMC proposée dans cette thèse. 5.2.4 Fusion des détecteurs Deux architectures de fusion de données sont souvent employées dans la littérature dans le cadre de la détection d’événements : une architecture centralisée, où un modèle est utilisé pour apprendre la dynamique de plusieurs variables de manière conjointe, et une architecture décentralisée, où différents modèles sont utilisés pour analyser la dynamique de chaque variable et chaque modèle produit une décision locale qui est combinée avec les
  • 183.
    5.2. Évaluation desMSMC sur signaux réels 153 décisions des autres détecteurs. Dans cette thèse, lorsque les MSMC ont été appliqués pour modéliser la dynamique de plusieurs variables physiologiques de manière conjointe, on a réalisé une fusion centralisée. Ce type de fusion a montré, dans les sections précédentes, la possibilité d’améliorer les performances de détection par rapport au cas univariée : les valeurs SEN = 74, 20% et SPC = 92, 77% pour RR et SEN = 63, 64% et SPC = 76, 28% pour Ramp passent à SEN = 80, 46% et SPC = 91, 28% pour RR&Ramp. Cependant, la performance de détection obtenue par ce moyen n’a pas été la meilleure performance reportée. L’objectif de cette section est donc de combiner, d’une manière décentralisée, la décision de chaque détecteur afin d’améliorer les performances de détection, tout en minimisant le temps de retard à la détection. En effet, les détecteurs de bradycardie basés sur des MSMC, montrés dans la section précédente, analysent différentes variables et différentes dynamiques temporelles et, en conséquence, ils sont basés sur des hypothèses des réponses physiologiques différentes. Ces détecteurs peuvent être considérés comme complémentaires entre eux, ce qui nous motive à réaliser une fusion des décisions. Différentes règles de fusion peuvent être utilisées pour combiner les décisions locales de chaque détecteur. Les règles de fusion les plus simples consistent en l’application d’opérateurs logiques ET (fusion ET) ou OU (fusion OU) aux décisions des détecteurs locaux. Il y a aussi des règles plus complexes comme la fusion VOTE où la décision finale est basée sur la décision des k des n détecteurs individuels. Des règles de fusion optimale (fusion OPTIMALE), ont également été proposées, souvent basées sur la moyenne pondérée des décisions individuelles en offrant un poids plus important aux détecteurs les plus performants [Chair and Varshney, 1986]. Dans la méthode de fusion proposée par CHAIR et VARSHNEY [Chair and Varshney, 1986], les coefficients de pondération peuvent être optimisés à partir de courbes COR [Hernández et al., 1999]. Fusion des détections obtenues pour RR, Ramp et QRSd Premièrement, la fusion décentralisée OU, ET, VOTE et OPTIMALE est réalisée pour les trois variables : RR, RAMP et QRSd. Les résultats sont montrés tableau 5.24 et la figure 5.21 montre les courbes COR. On peut constater une amélioration des performances de détection en utilisant la fusion OPTIMALE, cependant, celle-ci reste en dessous des meilleurs résultats reportés dans la section précédente. Fusion des trois détecteurs par MSMC Les règles de fusion OU, ET, VOTE et OPTIMALE vont maintenant être appliquées à trois détecteurs de la section précédente : RRQNU, RRQNU et RR&QRSdQU. Les résultats
  • 184.
    154 Chapitre 5 Tableau5.24 – Performance de détection lors de la fusion des variables RR, Ramp et QRSd. Règle Sensibilité (%) Spécificité (%) TRD (s) RR 74,19 92,80 4, 63 ± 4, 20 RAMP 63,62 76,35 0, 59 ± 5, 56 QRSd 63,58 70,25 0, 32 ± 5, 51 ET 25,26 99,19 4, 16 ± 4, 29 OU 93,34 52,10 −0, 39 ± 5, 69 VOTE 67,98 87,85 0, 90 ± 5, 50 OPTIMALE 82,79 84,27 1, 13 ± 5, 42 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 OPTIM RR RAMP QRSd FPR TPR Figure 5.21 – Courbe COR. de la fusion, ainsi que les MSMC présentant les meilleurs résultats sont montrés tableau 5.25. La figure 5.22 montre les courbes COR de ces détecteurs. On peut constater une légère amélioration des performances de détection en utilisant la fusion OPTIMALE. Même si l’amélioration apportée par la fusion décentralisée reste faible, ce résultat est intéressant car il nous indique qu’il existe une information complémentaire entre les décisions locales prises par l’analyse des séries RR (avec et sans l’introduction des versions retardées) et de la durée du QRS, le tout basé sur une quantification non-uniforme. Le fait que la version centralisée de cette fusion fournisse des performances plus faibles milite en faveur d’une nouvelle structure des MSMC dans le cas multivarié, basée sur des modèles couplés (c.f. Conclusion Générale et Perspectives).
  • 185.
    5.3. Conclusion 155 Tableau5.25 – Performance de détection lors de la fusion décentralisée des variables RRQNU, RRQNU et RR&QRSdQU. Méthode / Règle de fusion Sensibilité (%) Spécificité (%) TRD (s) RRQNU 89,88 94,67 1, 93 ± 3, 34 RRQNU 90,80 92,26 1, 12 ± 3, 62 RR&QRSdQU 85,87 87,85 1, 06 ± 3, 87 ET 78,67 96,71 2, 17 ± 3, 40 OU 94,43 86,14 0, 6 ± 3, 88 VOTE 90,52 92,23 1, 49 ± 3, 52 OPTIMALE 93,01 91,29 1, 13 ± 3, 58 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 TFP TVP Fusion décentralisée (a) 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 −2 −1 0 1 2 3 4 5 6 7 8 TFP TRD(s) Fusion décentralisée (b) Figure 5.22 – Performance de détection lors de la fusion des variables RRQNU, RRQNU et RR&QRSdQU. Dans (a) courbes COR et dans (b) courbes TRD moyen en fonction de TFP. 5.3 Conclusion Dans ce chapitre, la caractérisation des séries temporelles multidimensionnelles et le difficile problème de l’exploitation de la dynamique des séries temporelles biomédicales, pour la détection précoce d’événements pathologiques, ont été adressés en utilisant l’approche basée sur des modèles semi-Markovien cachés, exposée au chapitre 4. Deux démarches, la classification et la détection en ligne, ont été évaluées en utilisant ces modèles sur des signaux synthétiques (générés avec le modèle de FitzHugh-Nagumo) et réels (séries RR, Ramp et QRSd, extraites de l’ECG de 32 nouveau-nés prématurés monitorés en USIN). La combinaison de différentes méthodes de prétraitement proposées au chapitre 4, telles que l’inclusion d’une étape de quantification des observations et la prise en compte des versions retardées des observations pour construire des séries multivariées à partir des séries
  • 186.
    156 Chapitre 5 univariées,ont été appliquées aux séries temporelles. Les différentes expériences conduites sur les signaux synthétiques ont permis d’évaluer la faisabilité de notre approche et d’optimiser la structure des modèles. Nous nous sommes placés dans le contexte où l’information sur l’amplitude seule est insuffisante et rend impossible l’utilisation des seuils pour réaliser la classification et la détection. La seule source d’information dans ce cas se trouve dans la dynamique des variables. Dans ce contexte, les modèles semi-Markovien cachés ont révélés être mieux adaptés que les modèles Markoviens cachés et ont donc été retenus dans le reste du chapitre. Les résultats obtenus dans les expériences de classification et de détection en ligne ont montré des améliorations lorsque les étapes de quantification des séries et d’intégration du retard dans les observations sont appliquées aux MSMC. Concernant les signaux réels, l’annotation d’événements d’apnée-bradycardie (réalisée par un spécialiste) a été finement ajustée par une procédure d’approximation de courbes, où une fonction sigmoïde est utilisée pour approcher la série RR aux alentours de l’instant de début de la bradycardie. Nous avons conscience que des nombreux tests ont été effectués, ce qui ne facilite pas la lecture des performances. Le tableau 5.25 représente la synthèse des meilleurs modèles proposés. Les performances de classification et de détection en ligne d’épisodes d’apnée-bradycardie, par modèles semi-Markoviens cachés, ont montré être plus élevées que les méthodes classiques, tout en minimisant les délais de détection (SEN=89,98 %, SPC=94,67 % et TRD=1,93±3,34 s en modélisant, par MSMC, la dynamique de la série RR quantifiée non uniformément vs SEN=73,35 %, SPC=87,96 % et TRD=4,16±8,79 s en utilisant un seuil relatif dans l’analyse instantanée de la série RR). L’utilité de la phase de quantification et de l’intégration des versions retardées des observations dans les modèles semi-Markoviens cachés a également été évaluée et a montré une amélioration des performances (en modélisant la dynamique de la série RR, on passe de SEN=74,20 %, SPC=92,77 % et TRD=6,37±7,83 s à SEN=90,38 %, SPC=92,33 % et TRD=0,92±3,56 s en intégrant sa version retardée et à SEN=89,98 %, SPC=94,67 % et TRD=1,93±3,34 s avec une quantification non uniformément). Finalement, la fusion décentralisée de trois détecteurs, basés sur des modèles semi-Markovien cachés, a permis une amélioration de la performance de détection d’épisodes d’apnée-bradycardie par rapport aux détecteurs individuels (on obtient des valeurs SEN=93,01 %, SPC=91,29 % et TRD=1,13±3,58 s par fusion optimale de détecteurs donnant des valeurs SEN={89,88, 90,80, 85,87} %, SPC={94,67, 92,26, 87,85} % et TRD={1,93±3,34, 1,12±3,62, 1,06±3,87} s). Ces résultats sont importants puisque la minimisation du temps d’intervention des infirmières est une priorité dans le domaine clinique qui nous concerne et la détection fiable et précoce des événements d’apnée-bradycardie est le premier élément à optimiser pour réduire ces temps d’intervention.
  • 187.
    Bibliographie 157 Bibliographie Chair, Z.and Varshney, P. (1986). Optimal data fusion in multiple sensor detection systems. Aerospace and Electronic Systems, IEEE Transactions on, AES-22(1) :98–101. Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in Cardiology, volume 33, pages 473–476. Fitzhugh, R. (1961). Impulses and physiological states in theoretical models of nerve membrane. Biophysical Journal, 1(6) :445–466. Hernández, A., Carrault, G., Mora, F., Thoraval, L., Passariello, G., and Schleich, J. M. (1999). Multisensor fusion for atrial and ventricular activity detection in coronary care monitoring. IEEE Trans Biomed Eng, 46(10) :1186–90. Jameson, A., Schmidt, W., Turkel, E., et al. (1981). Numerical solutions of the euler equations by finite volume methods using runge-kutta time-stepping schemes. AIAA paper, 81 :1259.
  • 189.
    Conclusions et perspectives Ladétection précoce de l’apnée-bradycardie chez les prématurés est un sujet de recherche majeure dans notre laboratoire depuis 10 ans. De nombreux travaux ont été développés au cours de ces derniers années dans le but de caractériser ces épisodes [Beuchée, 2005; Cruz et al., 2006; Beuchée et al., 2007; Cruz, 2007; Pladys et al., 2008b,a; Beuchée et al., 2009; Altuve et al., 2009, 2011]. Les épisodes d’apnée-bradycardie chez les nouveaux-nés prématurés mettent en danger sa vie et son avenir. Ces épisodes sont en partie la conséquence du développement partiel des organes et des mécanismes de régulation cardio-respiratoires chez le nouveau-né prématuré et justifient le monitoring continu en USIN avec des finalités diagnostiques et thérapeutiques. Actuellement, dans les unités des soins intensifs néonatals, la détection des épisodes d’apnée-bradycardie est réalisée en exploitant une seule variable extraite de l’électro- cardiogramme : la durée du cycle cardiaque. Cependant, d’autres variables extraites de l’électrocardiogramme peuvent être prises en compte dans une démarche de détection multi-variable. Cette démarche est compatible avec les exigences imposées dans ces unités des soins, où on limite au minimum nécessaire les instruments de mesure afin de favoriser le développement de l’enfant et de le préserver dans un milieu aussi tranquille que possible (approche de la NIDCAP [Als and Gibes, 1986]). L’objet de ce mémoire était donc de proposer des solutions pour répondre à ces exigences. Nous nous sommes en tout premier lieu intéressés à la segmentation de l’électrocar- diogramme du nouveau-né prématuré. Ceci consiste à délimiter les ondes qui composent chaque battement cardiaque. Plusieurs étapes sont nécessaires pour accomplir cette tâche : l’élimination des interférences du signal électrocardiographique, la détection, le moyen- nage et l’alignement des battements et, enfin, la segmentation des ondes proprement dite. Dans le passé, ces méthodes ont été développées pour l’électrocardiogramme d’adultes. Cependant, des différences remarquables entre l’électrocardiogramme de l’adulte et du prématuré existent. Par exemple, la fréquence cardiaque de base du prématuré est trois fois plus élevée, les ondes et intervalles sont plus courts et le complexe QRS est plus fin, donnant ainsi des contenus spectraux de plus hautes fréquences. Par conséquent, notre première contribution a été d’adapter les algorithmes de détection et de segmentation des 159
  • 190.
    160 Conclusion battements auxspécificités de l’ECG du nouveau-né prématuré. Une procédure basée sur les algorithmes évolutionnaires a été proposée pour ajuster 8 paramètres du détecteur et 12 de l’algorithme de segmentation. En outre, l’approche proposée intègre une adaptation continue des fenêtres d’exploration temporelle de l’algorithme de segmentation, en fonction de la fréquence cardiaque instantanée. Les performances mesurées après optimisation montrent une amélioration significative de la sensibilité et de la valeur prédictive positive à la détection des ondes et une réduction du jitter de la détection, pour les début et fin des ondes. Une fois ces méthodes adaptées, les séries temporelles du cycle cardiaque (RR), l’ampli- tude de l’onde R (Ramp) et de durée du QRS (QRSd) ont été constituées avant, pendant et après les épisodes d’apnée-bradycardie de 32 nouveaux-nés prématurés. Les résultats ont montré des différences significatives entre les intervalles précédant la bradycardie et au cours de la bradycardie et nous ont motivés à exploiter la dynamique de ces séries dans un processus de décision, afin de détecter le plus précocement possible la bradycardie. Une approche par modèles Markoviens cachés a alors été introduite. Les modèles de Markov cachés (MMC) et les modèles de semi-Markov cachés (MSMC) constituent des outils puissants pour modéliser des observations multi-variées et continues. Les MMC sont les plus populaires, cependant, la distribution géométrique des temps passés dans les états est une contrainte et les tests sur données simulées ont montré leurs limites. Les MSMC sont une généralisation des MMC où le temps passé dans un état peut suivre une loi Gaussienne (parmi d’autres). Les MSMC, plus puissants que les MMC pour la modélisation des signaux physiques, ont montré être plus aptes à modéliser les dynamiques, même si les méthodes d’estimation de paramètres sont plus complexes et qu’ils sont limités à une représentation stationnaire par morceaux des observations à modéliser. Cependant, ces modèles n’ont pas besoin de connaissance a priori sur les données pour l’estimation des paramètres et le nombre d’états reste le seul hyper-paramètre à ajuster. Après une comparaison entre modèles semi-Markovien cachés et modèles Markovien cachés, les tests effectués sur signaux simulés ont montré l’intérêt des approches semi- Markoviennes en classification et en détection de trajectoires, en faisant abstraction de l’amplitude des séries. Les caractéristiques majeures des modèles que nous avons développée peuvent être résumées de la manière suivante : – l’utilisation de lois de distributions gaussiennes pour la prise en compte de l’évolution temporelle des indicateurs extraits de l’électrocardiogramme. – la proposition d’une modélisation multi-variée, avec des modèles qui explorent des dynamiques différentes. Ceci implique d’adapter le nombre d’états pour chaque modèle. – l’introduction d’une étape de quantification pour accentuer les dynamiques des séries en faisant abstraction de l’amplitude. – l’extension de l’observabilité par la prise en compte des versions retardées des séries
  • 191.
    Conclusions et perspectives161 étudiées. – l’analyse multi-variée à base MSMC adaptée à la détection en temps réel. Une comparaison avec les méthodes de détections classiques utilisées dans les unités de soins intensifs néonataux a été également effectuée. Les valeurs de sensibilité, de spécificité et du temps du retard à la détection, étudiées par des courbes opérationnelles du récepteur, ont démontré que l’approche basée sur les modèles semi-Markovien est plus intéressante que les méthodes classiques. La quantification des séries a amélioré les performances, tant sur signaux simulés que sur signaux réels. En exploitant la dynamique des séries extraites de l’électrocardiogramme, la détection d’épisodes d’apnée-bradycardie a été améliorée et le temps de détection a été réduit par rapport aux détecteurs classiques, laissant espérer des temps d’intervention des personnels soignants plus brefs. Les perspectives de ce travail sont multiples et dirigées vers l’étude d’autres carac- téristiques provenant de l’ECG du nouveau-né prématuré, telles que l’intervalle PR, la morphologie de l’onde P et l’intervalle QT. Un travail antérieur développé dans notre labo- ratoire a montré une amélioration de la détection de l’onde P de l’ECG adulte [Hernández et al., 2000]. La méthodologie d’optimisation proposée dans ce document pourrait être appliquée afin d’adapter l’algorithme de détection des ondes P à l’ECG des nouveaux-nés prématurés. Nous pourrions alors focaliser notre étude sur la segmentation précise des ondes P en analysant l’activité auriculaire du nouveau-né prématuré en présence ou non d’apnée-bradycardie. Afin d’améliorer la segmentation de l’électrocardiogramme, réalisée ici en exploitant une seule voie, une approche de détection multi-voies pourrait être considérée. Deux approches sont à retenir : i) la centralisée qui produit une segmentation unique en exploitant l’information contenue dans chacune des voies et ii) la décentralisée dont la segmentation correspond à la meilleure segmentation (ou à la moyenne, la médiane) réalisée sur chaque voie. La détection multi-variée analysée dans ce mémoire peut être vue comme une approche par fusion centralisée, où les dynamiques sont exploitées de manière conjointe pour produire une détection unique. Une fusion décentralisée a été également mise en œuvre et évaluée. Même si théoriquement cette dernière approche doit produire des performances compa- rables ou inférieures à l’approche centralisée, elle a produit une légère augmentation des performances, tout en minimisant le retard à la détection. Ces résultats impliquent que l’approche centralisée par MSMC, telle que présentée dans ce travail de thèse, doit être encore améliorée. Nous pensons, en particulier, à la proposition d’architectures de MSMC couplés, plus complexes à mettre en œuvre, mais qui permettront de mieux reproduire les dynamiques de chaque variable indépendamment, tout en gardant une représentation multivariée par couplage entre les états de chaque modèle [Pieczynski, 2003; Derrode and Pieczynski, 2004].
  • 192.
    162 Conclusion Dans cemémoire, nous n’avons pas prêté d’attention à l’origine de l’apnée. Succinctement, les épisodes peuvent être classés en obstructifs, centraux et mixtes. En exploitant la théorie semi-Markovienne préconisée ici, trois modèles, pour explorer la dynamique de chaque classe d’apnée-bradycardie, pourraient être exploités pour identifier l’origine de l’apnée et ainsi délivrer une thérapie optimale. D’autres variables pourraient être aussi analysées par l’approche semi-markovienne. Par exemple, en analysant le temps passé entre les épisodes d’apnée-bradycardie on peut supposer que, lorsque un certain temps sans détection s’est écoulé, l’apparition d’un épisode devient plus probable. Cette approche pourrait permettre aussi de modéliser le temps entre épisodes à partir des types d’apnée-bradycardie possibles (centrale, obstructive ou mixte). Enfin, nous n’avons pas pris en compte dans ce travail les autres modalités monitorées telles que le flux respiratoire, les mouvements abdominaux, l’électromyogramme ou élec- troencéphalogramme, car nous souhaitions développer un système de détection qui exploite uniquement le signal électrocardiographique afin de réduire les appareils de mesures. Ces mesures pourraient très bien être exploitées dans une approche multi-variable de détection par modèles semi-Markovien. Enfin, l’approche par modèles de Markov cachés s’est enrichi aussi d’extensions apparues récemment dans la littérature et qui pourraient être envisagées dans un cadre de détection/classification des apnée-bradycardies. On peut citer : – L’utilisation des modèles de Markov couplés [Pieczynski, 2003; Derrode and Pieczynski, 2004]. Dans cette approche, les modèles de Markov cachés sont utilisés pour chaque variable et les états cachés au temps t pour chaque MMC sont conditionnés par les états au temps t−1 de tous les MMC connexes. Dans les modèles de modèles de Markov couplés, la markovianité du couple (processus caché, processus observé)=(X, Y ) est considérée directement. – L’usage des modèles de Markov triplet [Pieczynski and Desbouvries, 2005; Pieczynski, 2007]. Ces modèles permettent de traiter des observations non stationnaires, de généraliser les modèles semi-markoviens cachés, d’effectuer la fusion de Dempster- Shafer dans un cadre markovien et de mettre en place un filtrage optimal en présence de sauts. Dans les modèles de Markov triplets, on introduit un processus U auxiliaire qui sert d’outil de calcul du processus triplet markovien (processus caché, processus auxiliaire, processus observé)=(X, U, Y ). – L’emploi des arbres de Markov cachés [Crouse et al., 1998; He et al., 2008; Du- rand et al., 2004]. Ces modèles permettent d’intégrer l’information multi-résolutions temps/fréquence d’une décomposition en ondelettes. Ces modèles ont été conçus pour la modélisation de la loi des coefficients d’une transformée en ondelettes, lorsque ceux-ci sont non-gaussiens et non-indépendants. – L’utilisation des modèles hybrides MMC/réseaux de neurones artificiels (RNA) [Tren- tin and Gori, 2001; Hagen and Morris, 2005; Tóth and Kocsor, 2007; Garcia-Moral et al., 2011]. L’estimation des probabilités d’émission des états des MMC, habituelle- ment effectuée en utilisant des modèles de mélange gaussien, est substituée par des
  • 193.
    Conclusions et perspectives163 RNA. Toutefois, les exigences de calcul sont fortement augmentées en raison de la nécessité d’entraîner la RNA. – L’emploi des modèles de Markov cachés à effets mixtes [Altman, 2007; Delattre, 2010]. Ces modèles permettent la modélisation des multiples processus à la fois et l’incorporation de covariables et des effets aléatoires dans les modèles. Ils sont adaptés à l’analyse de données longitudinales recueillies lors d’essais cliniques. – L’usage des chaînes de Markov évidentielles [Fouque et al., 2000; Lanchantin and Pieczynski, 2005]. Ces modèles exploitent la théorie de l’évidence de Dempster-Shafer pour l’analyse de données temporelles. Comme on peut le voir, les perspectives tracées, sont autant de challenges à mener et s’inscrivent finalement dans un cadre théorique unique où les approches semi-Markoviennes jouent un rôle primordial étant donné leurs avantages : i) un hyper-paramètre à ajuster, ii) aucune connaissance a priori, iii) une capacité à modéliser des observations multi-variées et continues et iv) une représentation compacte de dynamiques.
  • 194.
    164 Bibliographie Bibliographie Als, H.and Gibes, R. (1986). Newborn Individualized Developmental Care and Assessment Program (NIDCAP). Training Guide. Dept of Psychiatry, Childrens Hospital, Boston, Mass, 1 :1–2. Altman, R. (2007). Mixed Hidden Markov Models. Journal of the American Statistical Association, 102(477) :201–210. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009). Analysis of the QRS complex for apnea-bradycardia characterization in preterm infants. In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual International Conference of the IEEE, pages 946–949. IEEE. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011). Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in preterm infants. International Journal of Biomedical Engineering and Technology, 5(2/3) :247–265. Beuchée, A. (2005). Intérêt de l’analyse de la variabilité du rythme cardiaque en néona- talogie. Comportement des systèmes de régulation cardiovasculaire dans le syndrome apnée/bradycardie du nouveau-né. PhD thesis, Université de Rennes 1. Beuchée, A., Carrault, G., Bansard, J. Y., Boutaric, E., Bétrémieux, P., and Pladys, P. (2009). Uncorrelated randomness of the heart rate is associated with sepsis in sick premature infants. Neonatology, 96(2) :109–14. Beuchée, A., Hernández, A., Pladys, P., and Carrault, G. (2007). Stimulateur kinesthésique automatisé asservi à la détection d’apnées-bradycardies chez le nouveau-né prématuré. IRBM, 28(3-4) :124–130. Crouse, M., Nowak, R., and Baraniuk, R. (1998). Wavelet-based statistical signal processing using hidden Markov models. Signal Processing, IEEE Transactions on, 46(4) :886–902. Cruz, J. (2007). sistema multiagentes de monitoreo aplicado a cuidados neonatales. PhD thesis, Universidad Simón Bolívar. Cruz, J., Hernández, A., Wong, S., Carrault, G., and Beuchée, A. (2006). Algorithm fusion for the early detection of apnea-bradycardia in preterm infants. In Computers in Cardiology, volume 33, pages 473–476. Delattre, M. (2010). Inference in Mixed Hidden Markov Models and Applications to Medical Studies. Journal de la Société Française de Statistique, 151(1) :90–105. Derrode, S. and Pieczynski, W. (2004). Signal and image segmentation using pairwise Markov chains. Signal Processing, IEEE Transactions on, 52(9) :2477–2489. Durand, J., Goncalves, P., and Guédon, Y. (2004). Computational methods for hidden Markov tree models-An application to wavelet trees. Signal Processing, IEEE Transactions on, 52(9) :2551–2560. Fouque, L., Appriou, A., and Pieczynski, W. (2000). An evidential Markovian model for data fusion and unsupervised image classification. In Information Fusion, 2000. FUSION 2000. Proceedings of the Third International Conference on, volume 1, pages TUB4–25. IEEE.
  • 195.
    Bibliographie 165 Garcia-Moral, A.,Solera-Urena, R., and Peláez-Moreno, C. (2011). Data Balancing for Efficient Training of Hybrid ANN/HMM Automatic Speech Recognition Systems. Audio, Speech, and Language Processing, IEEE Transactions on, 19(3) :468–481. Hagen, A. and Morris, A. (2005). Recent advances in the multi-stream HMM/ANN hybrid approach to noise robust ASR. Computer Speech & Language, 19(1) :3–30. He, Z., You, X., and Tang, Y. (2008). Writer identification of Chinese handwriting documents using hidden Markov tree model. Pattern Recognition, 41(4) :1295–1307. Hernández, A. I., Carrault, G., and Mora, F. (2000). Improvement of a P-wave detector by a bivariate classification stage. Transactions of the Institute of Measurement and Control, 22(3) :231–242. Lanchantin, P. and Pieczynski, W. (2005). Chaînes et arbres de Markov évidentiels avec applications à la segmentation des processus non stationnaires. traitement du signal, 22(1) :15–26. Pieczynski, W. (2003). Pairwise markov chains. IEEE Transactions on Pattern Analysis and Machine Intelligence, pages 634–639. Pieczynski, W. (2007). Multisensor triplet Markov chains and theory of evidence. Interna- tional Journal of Approximate Reasoning, 45(1) :1–16. Pieczynski, W. and Desbouvries, F. (2005). On triplet Markov chains. In International Symposium on Applied Stochastic Models and Data Analysis,(ASMDA 2005), Brest, France. Citeseer. Pladys, P., Arsenault, J., Reix, P., Rouillard Lafond, J., Moreau-Bussière, F., and Praud, J. (2008a). Influence of prematurity on postnatal maturation of heart rate and arterial pressure responses to hypoxia in lambs. Neonatology, 93(3) :197. Pladys, P., Beuchée, A., Hernández, A., and Carrault, G. (2008b). Variabilité du rythme cardiaque de l’enfant : principes et applications. Archives de Pédiatrie, 15(5) :611–613. Tóth, L. and Kocsor, A. (2007). A segment-based interpretation of HMM/ANN hybrids. Computer Speech & Language, 21(3) :562–578. Trentin, E. and Gori, M. (2001). A survey of hybrid ANN/HMM models for automatic speech recognition. Neurocomputing, 37(1-4) :91–126.
  • 197.
    Annexe A Liste destravaux liés à ce travail 1. Altuve, M., Carrault, G., Beuchée, A., Pladys, P., and Hernández. On-line apnea- bradycardia detection using hidden semi-Markov models. In Engineering in Medicine and Biology Society, 2011. EMBC 2011. Annual International Conference of the IEEE. Travail soumis, dans l’attente d’une réponse. 2. Altuve, M ; Hernández, A, Carrault, G. Une approche multivariée pour la détection d’épisodes d’apnée-bradycardie par modèles semi-Markoviens cachés. Colloque XXIIIe Gretsi, Bordeaux, 5-8 septembre 2011. Accepté pour présentation orale. 3. Hernández, A.I ; Dumont, J. ; Altuve, M ; Beuchée, A ; Carrault, G. Evolutionary optimization of ECG feature extraction methods : Applications to the monitoring of adult myocardial ischemia and neonatal apnea bradycardia events, pages 1-36, chapitre de livre dans : ECG Signal Processing, Classification and Interpretation : A Comprehensive Framework of Computational Intelligence. Adam Gacek and Witold Pedrycz (Editors). Springer-Verlag. Accepté pour publication. 4. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2011). Multivariate ecg analysis for apnoea-bradycardia detection and characterisation in preterm infants. International Journal of Biomedical Engineering and Technology, 5(2/3) :247–265. 5. Altuve, M., Carrault, G., Cruz, J., Beuchée, A., Pladys, P., and Hernández, A. (2009). Analysis of the QRS complex for apnea-bradycardia characterization in preterm infants. In Engineering in Medicine and Biology Society, 2009. EMBC 2009. Annual International Conference of the IEEE, pages 946–949. IEEE. 167
  • 199.
    Annexe B La transforméeen ondelettes pour la segmentation des battements Les filtres passe-haut (G(z)) et passe-bas (H(z)) de la figure 3.3 sont dérivés à partir d’une ondelette mère ψ(t) de type spline quadratique, dont la transformée de Fourier est : Ψ(Ω) = jΩ sin Ω 4 Ω 4 4 (B.1) Les réponses fréquentielles des filtres G(z) et H(z) sont données par l’équation B.2 tandis que ses réponses impulsionnelles sont données par l’équation B.3. G(ejω ) = 4jejω/2 sin ω 2 H(ejω ) = ejω/2 cos ω 2 3 (B.2) g[n] = 1 8 {δ[n + 2] + 3δ[n + 1] + 3δ[n] + δ[n − 1]} h[n] = 2{δ[n + 1] − δ[n]} (B.3) La réponse en fréquence du filtre équivalent Qk(ejω) pour l’échelle de décomposition k est donnée par B.4. Les réponses en fréquence d’amplitude des cinq premières échelles du filtre équivalent Qk(ejω) sont représentées dans la figure B.1 pour une fréquence d’échantillonnage de 250 Hz. Il est à noter que les fonctions de transfert montrent une caractéristique passe-bas dérivée. La bande passante à 3 dB pour chaque échelle est montrée dans le tableau B.1 [Li et al., 1995] 169
  • 200.
    170 Annexe B TableauB.1 – Bande passante à 3 dB pour chaque échelle du filtre équivalente Qk(ejω) Échelle Bande passante (Hz) k = 21 62.5 ∼ 125.0 k = 22 18 ∼ 58.5 k = 23 8 ∼ 27 k = 24 4 ∼ 13.5 k = 25 2 ∼ 6.5 Qk(ejω ) = G(ejω) k = 1 G(ej2k−1ω) k−2 l=0 H(ej2lω) k ≥ 2 (B.4) 0 20 40 60 80 100 120 0 0.5 1 1.5 2 2.5 3 3.5 4 Fréquence (Hz) |Q | k = 2 k = 3 k = 4 k = 5 k = 1 k Figure B.1 – Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour les échelles 1 à 5 pour une fréquence d’échantillonnage de 250 Hz. De plus, pour obtenir les filtres à d’autres fréquences d’échantillonnage, les réponses impulsionnelles du filtre équivalent à 250 Hz sont ré-échantillonnées [Martínez et al., 2004]. Les réponses en fréquence des filtres à 500 Hz et 1 kHz sont montrées figure B.2. Il peut être observé que les réponses en fréquence du banc de filtres adaptés constituent une bonne approximation des filtres d’origine.
  • 201.
    Bibliographie 171 0 50100 150 200 250 0 0.5 1 1.5 2 2.5 3 3.5 4 |Q |k Fréquence (Hz) (a) 0 50 100 150 200 250 300 350 400 450 500 0 0.5 1 1.5 2 2.5 3 3.5 4 Fréquence (Hz) |Q |k (b) Figure B.2 – Réponse en fréquence d’amplitude du filtre équivalente Qk(ejω) pour une fréquence d’échantillonnage de (a) 500 Hz et (b) 1000 Hz. Bibliographie Li, C., Zheng, C., and Tai, C. (1995). Detection of ecg characteristic points using wavelet transforms. IEEE Trans Biomed Eng, 42(1) :21–8. Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P., and Laguna, P. (2004). A wavelet- based ecg delineator : evaluation on standard databases. IEEE Trans Biomed Eng, 51(4) :570–81.
  • 203.
    Annexe C Les algorithmesévolutionnaires Les AE sont des méthodes de recherche stochastique qui s’inspirent des principes de la sélection naturelle Darwiniens du XIXe siècle et imitant la métaphore de l’évolution biologique naturelle. Le principe derrière les AE est le suivant [Eiben and Smith, 2003] : étant donnée une population d’individus dans un certain environnement qui a des ressources limitées, les rivalités entraînent une sélection naturelle (survie du plus fort) et donc, une augmentation de l’aptitude de la population. Un ensemble de candidats (des individus de la population) est choisi aléatoirement. Ensuite, une fonction de coût à maximiser est appliquée aux candidats comme une mesure d’aptitude et, sur les bases de ces valeurs, certains meilleurs candidats sont choisis pour semer la prochaine génération. Ceci est fait par l’application de la recombinaison et/ou de la mutation. D’un coté, la recombinaison est un opérateur qui est appliqué à deux ou plusieurs candidats sélectionnés (les soi-disant parents) produisant un ou plusieurs nouveaux candidats (les enfants), et de l’autre, la mutation est appliquée à un candidat et résulte en la création d’un nouveau. En résumé, l’exécution des opérations de recombinaison et de mutation des parents conduit à la création d’un ensemble de nouveaux candidats (la descendance) qui rivalisent ensuite avec les anciens, en fonction de leurs aptitudes et probablement en fonction de l’âge, pour une place dans la prochaine génération. Ce processus est réitéré jusqu’à ce qu’un candidat avec une qualité suffisante (une solution) soit trouvé ou qu’une limite de calcul précédemment fixée soit atteinte. La base des AE repose fondamentalement sur deux qualités : d’une part, les opérateurs de variation (recombinaison et mutation) qui créent la diversité dans la population et facilitant ainsi la nouveauté, et d’autre part, la sélection qui augmente la qualité moyenne des solutions dans la population. Un diagramme général d’un algorithme évolutionnaire, d’après EIBEN et SMITH [Eiben and Smith, 2003], est montré figure C.1. Les éléments les plus importants d’un AE sont donc : 173
  • 204.
    174 Annexe C Initialisation Terminaison Sélectiondes parents Sélection des survivants Recombinaison Mutation Population Parents Enfants Figure C.1 – Principe de fonctionnement d’un algorithme évolutionnaire. – la représentation (codage des individus) – la fonction d’évaluation (fonction de coût) – la population – le mécanisme de sélection des parents – les opérateurs de variation, recombinaison et mutation – le mécanisme de sélection des survivants Pour une application d’optimisation donnée, il est nécessaire de spécifier chacun de ces éléments et de définir une procédure d’initialisation et une condition de terminaison. C.1 Représentation (définition des individus) La représentation correspond au lien entre le contexte du problème original dans le « monde réel » et l’espace de solutions du problème dans le « monde AE ». Les objets qui forment une solution possible dans le contexte du problème original sont appelés phénotypes, alors que leur codage, c’est-à-dire, les individus au sein de l’AE, sont appelés génotypes. Un individu est un élément de l’espace de recherche. Plusieurs types de codages ont été proposés dans la littérature, comme le binaire, très utilisés à l’origine, et celui à valeurs réelles, utilisé plus fréquemment de nos jours. Ce dernier est notamment appliqué lorsque les valeurs à coder viennent d’une distribution à valeurs continues, comme dans le cas d’optimisation de la méthode de segmentation d’ECG présentée dans cette thèse. C.2 Fonction d’évaluation (fonction de coût) Le rôle de la fonction d’évaluation est de mesurer le degré d’adaptation de la population à son environnement. Il s’agit d’une fonction ou d’une procédure qui assignent une mesure de qualité aux génotypes. C’est d’ailleurs cette fonction que l’AE cherche à maximiser.
  • 205.
    C.3. Population 175 C.3Population L’objectif de la population est de garder des solutions possibles. Une population est constituée par un ensemble fini de génotypes, où de multiples copies d’un individu sont possibles. Cependant, il faut souligner que les individus ne changent pas ; c’est la population qui le fait. C.4 Mécanisme de sélection des parents Le résultat fourni par la fonction de coût va permettre de sélectionner les individus ayant la meilleure performance. Ainsi, les individus choisis vont devenir parents de la prochaine génération. Une génération est la population à un instant donné. Plusieurs critères de sélection ont été rapportés dans la littérature dont les plus courants sont le tirage à la roulette [Holland, 1975] et la sélection par rang [Baker, 1987]. Dans la première, la probabilité de sélectionner un individu dépend de sa performance, alors que dans la deuxième, la probabilité de sélection dépend du rang (classement) de l’individu dans la population, triée en fonction des performances des individus, et non directement de sa performance. C.5 Opérateurs de variation Les opérateurs de variation créent de nouveaux individus à partir des anciens. Ils sont divisés en deux : l’opérateur unaire (mutation) et l’opérateur binaire (recombinaison). C.5.1 Mutation La mutation modifie les gènes d’un génotype afin de produire un enfant (mutant modifié). Ces gènes sont mutés avec une probabilité pm. La mutation évite la convergence prématurée de l’algorithme. Parmi les types de mutation pour un codage à valeurs réelles on distingue deux types de mutation : – Uniforme : qui remplace la valeur du gène choisi xi par une valeur aléatoire xi tiré d’une distribution uniforme sur l’intervalle possible de ce gène [Li,Ui] où Li et Ui sont les limites inférieure et supérieure respectivement ; – Non-uniforme : qui ajoute au gène choisi xi, une valeur aléatoire tirée d’une distribution non uniforme, comme une distribution Gaussienne avec moyenne nulle et écart type spécifiés par l’utilisateur. La probabilité de mutation non-uniforme se rapproche de 0 au fur et à mesure que le nombre de générations augmente.
  • 206.
    176 Annexe C C.5.2Recombinaison La recombinaison combine les gènes de deux (ou plusieurs) parents pour en obtenir un (ou plusieurs) enfants. Ainsi, les enfants héritent de certaines caractéristiques de leurs parents. La recombinaison est appliquée avec une probabilité pc. Trois types de recombinaisons existent pour un codage à valeurs réelles : – Arithmétique : les enfants (E1 et E2) sont créés à partir des combinaisons linéaires des parents (x et y) : E1 = αx + (1 − α)y E2 = (1 − α)x + αy (C.1) où α est choisi uniformément dans l’intervalle [0,1]. – Simple : l’enfant 1 (E1) correspond aux premiers k gènes du parent 1 (x) et le reste est la moyenne arithmétique des deux parents : E1 = x1, . . . , xk, αyk+1 + (1 − α)xk+1, . . . , αyn + (1 − α)xn (C.2) où α est choisi uniformément dans l’intervalle [0,1], n est la taille du génotype et k est le point de recombinaison choisi et suit une loi uniforme sur l’intervalle [1,n − 1]. Pour l’enfant 2, les parents sont renversés : E2 = y1, . . . , yk, αxk+1 + (1 − α)yk+1, . . . , αxn + (1 − α)yn . (C.3) – Heuristique : on utilise les valeurs de performance des deux parents pour créer les enfants : E1 = BP + α(BP − WP) E2 = BP (C.4) où α suit une distribution uniformément dans l’intervalle [0,1] et où BP est le parent qui a une performance plus grande que le parent WP. C.6 Mécanisme de sélection des survivants La sélection des survivants permet de former une nouvelle population à partir des individus (parents et enfants) de la génération courante. Elle est similaire à la sélection des parents mais est utilisée dans une autre étape du cycle évolutionnaire, c’est-à-dire, après la création des enfants. Ainsi, le rôle de la sélection des survivants est de réduire le nombre d’individus de µ parents et de λ enfants à λ individus pour la prochaine génération. À la différence de la sélection des parents, qui est stochastique, la sélection des survivants est
  • 207.
    C.6. Mécanisme desélection des survivants 177 déterministe. Deux méthodes sont souvent utilisées : l’une basée sur la performance qui consiste à garder les individus plus performants et l’autre basée sur l’âge des individus.
  • 208.
    178 Bibliographie Bibliographie Baker, J.(1987). Reducing bias and inefficiency in the selection algorithm. In Proceedings of the Second International Conference on Genetic Algorithms on Genetic algorithms and their application, pages 14–21. L. Erlbaum Associates Inc. Eiben, A. and Smith, J. (2003). Introduction to evolutionary computing. Springer Verlag. Holland, J. (1975). Adaptation in natural and artificial system : an introduction with application to biology, control and artificial intelligence. Ann Arbor, University of Michigan Press.
  • 209.
    Annexe D L’algorithme deViterbi L’algorithme de Viterbi fait sa première apparition dans la littérature de codage dans un document écrit par AJ VITERBI en 1967 [Viterbi, 1967]. Cet algorithme choisit les états qui sont individuellement le plus probables afin de trouver la séquence d’états la plus probable associée à la séquence observée. L’algorithme comprend une étape de récursion qui parcourt le signal et qui enregistre les états qui maximisent L(O1:T |λ) et une étape de rétropropagation qui parcourt le signal en sens inverse, en partant de l’état pour laquelle la vraisemblance à T est maximum et en tenant compte des états précédents enregistrés dans l’étape de récursion. Pour trouver la meilleure séquence d’état, S1:T = S1, . . . , ST , pour la séquence d’obser- vation donnée, O1:T O1, . . . , OT , nous devons définir la quantité δt(i) max s1:t−1 P(s1, s2, . . . , st = i, o1:t|λ) (D.1) qui représente le maximum de vraisemblance d’une trajectoire unique jusqu’au temps t, qui prend en compte les premières t observations et s’arrête à l’état i. Par induction nous avons δt+1(j) = max i∈S δt(i)aij bj(ot+1). (D.2) Pour retrouver la séquence d’états, nous avons besoin de garder une trace de l’argument qui maximise D.2, pour chaque t et j. Nous le faisons par l’intermédiaire du tableau Ψt(j). La procédure complète pour trouver la meilleure séquence d’états peut maintenant être déclarée comme suit : 179
  • 210.
    180 Annexe D –Initialisation : δ1(i) = π(i)bi(o1), i ∈ S Ψ1(i) = 0. (D.3) – Récursion : δt(j) = max i∈S δt−1(i)aij bj(ot), 2 ≤ t ≤ T, j ∈ S Ψt(j) = arg max i∈S δt−1(i)aij , 2 ≤ t ≤ T, j ∈ S (D.4) – Terminaison : P∗ = max i∈S δT (i) i∗ T = arg max i∈S δT (i) . (D.5) – Rétropropagation (chemin obtenu) : i∗ t = Ψt+1(i∗ t+1), t = T − 1, T − 2, . . . , , 1. (D.6) D.1 L’algorithme de Viterbi étendu aux MSMC Définissons la quantité : δt(i, d) max s1:t−d P(s1:t−d, St−d+1:t = i, o1:t|λ) (D.7) qui représente le maximum de vraisemblance d’une trajectoire unique jusqu’au temps t, qui prend en compte les premières t observations et s’arrête à l’état i de durée d. Par induction nous avons : δt+d(j, d) = max i∈S{j},d ∈D δt(i, d )aij pj(d)bj(ot+1:t+d). (D.8) Nous utilisons le tableau Ψt(j, d) pour enregistrer la séquence d’états et ses durées qui maximisent D.8. La procédure complète est la suivante : – Initialisation : δ1(i) = π(i)bi(o1), i ∈ S Ψ1(i) = 0. (D.9)
  • 211.
    D.1. L’algorithme deViterbi étendu aux MSMC 181 – Récursion : δt(j, d) = max i∈S{j},d ∈D δt−d(i, d )aij pj(d)bj(ot−d+1:t), 2 ≤ t ≤ T, j ∈ S, d ∈ D Ψt(j, d) = arg max i∈S{j},d ∈D δt−d(i, d )aij , 2 ≤ t ≤ T, j ∈ S, d ∈ D. (D.10) – Terminaison : P∗ = max i∈S,d∈D δT (i, d) (i∗ T , d∗ T ) = arg max i∈S,d∈D δT (i, d) . (D.11) – Rétropropagation (chemin obtenu) : (i∗ t , d∗ t ) = Ψt+1(i∗ t+1, d∗ t+1), t = T − d∗ t , . . . , 1. (D.12)
  • 212.
    182 Bibliographie Bibliographie Viterbi, A.(1967). Error bounds for convolutional codes and an asymptotically optimum decoding algorithm. Information Theory, IEEE Transactions on, 13(2) :260–269.
  • 213.
    Annexe E Optimisation desparamètres τ, ∆QU et ∆QNU, sur signaux réels On reporte dans cette Annexe, les procédures et les résultats de l’optimisation des paramètres τ (section E.1), ∆QU (section E.2) et ∆QNU (section E.3), sur des signaux réels, utilisés dans le chapitre 5 (section 5.2.3). Ces paramètres ont été optimisés en utilisant les procédures décrites dans le chapitre 4 (sections 4.4.4 et 4.4.5). E.1 Détermination de τ optimal Dans cette section, l’optimisation de τ pour les variables RR, Ramp et QRSd, est présentée. E.1.1 Optimisation de τ pour RR Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de τ pour la variable RR, sont montrés tableau E.1. On peut observer que la meilleure performance est atteinte pour une valeur de τ = 0, 67 secondes. Cette performance est meilleure que pour le cas univarié RR. E.1.2 Optimisation de τ pour Ramp Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de τ pour la variable Ramp, sont montrés tableau E.2. Si bien la meilleure performance se produit pour τ = 0, 5 s, cette valeur ne représente aucune amélioration par rapport au cas 183
  • 214.
    184 Annexe E TableauE.1 – Nombre d’états par MSMC et performance de détection en utilisant la variable RR pour différentes valeurs de τ. τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 0,34 11 9 87,96 90,25 1, 51 ± 3, 88 0,45 12 10 89,28 92,01 1, 11 ± 3, 78 0,56 14 11 89,82 92,22 0, 88 ± 3, 79 0,67 15 12 90,38 92,23 0, 92 ± 3, 56 0,78 16 15 87,65 92,86 1, 39 ± 3, 91 univarié Ramp. Ce résultat était attendu car les modifications de l’amplitude de l’onde R ne sont pas modulées par le système nerveux autonome, comme dans le cas de l’intervalle RR. Tableau E.2 – Nombre d’états par MSMC et performance de détection en utilisant la variable Ramp pour différentes valeurs de τ. τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 0,25 8 6 41,18 90,61 7, 16 ± 0, 49 0,5 12 10 52,19 92,12 4, 4 ± 0, 2 0,75 8 8 46,70 90,03 5, 6 ± 3, 5 1 8 8 41,01 89,64 4, 74 ± 6, 85 E.1.3 Optimisation de τ pour QRSd Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de τ pour la variable QRSd, sont montrés tableau E.3. La meilleure performance est obtenue pour τ = 0, 5 s, cependant, cette valeur représente une très faible amélioration par rapport au cas univarié QRSd. Tableau E.3 – Nombre d’états par MSMC et performance de détection en utilisant la variable QRSd pour différentes valeurs de τ. τ (s) M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 0,25 8 6 65,73 69,23 0, 59 ± 5, 83 0,5 10 8 65,42 72,14 0, 28 ± 5, 56 0,75 10 8 63,06 75,09 0, 74 ± 5, 68 1 10 6 63,83 71,44 0, 79 ± 5, 68
  • 215.
    E.2. Détermination de∆QU optimal 185 E.2 Détermination de ∆QU optimal Dans cette section, l’optimisation de ∆QU pour les variables RR, Ramp, QRSd, RR, RR&Ramp et RR&QRSd, est présentée. E.2.1 Optimisation de ∆QU pour RR Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de ∆QU, sont montrés tableau E.4. On peut observer que la meilleure performance est atteinte pour une valeur de ∆QU = 1300. Cette performance est meilleure que pour le cas sans quantification (RR). Tableau E.4 – Nombre d’états par MSMC et performance de détection en utilisant la variable RRQU pour différentes valeurs de ∆QU. ∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 500 9 6 88,42 91,05 1, 20 ± 4, 1 1000 8 5 88,62 91,26 1, 33 ± 4, 06 1300 7 5 86,63 97,3 2, 33 ± 3, 15 1500 7 5 85,72 90,29 2, 00 ± 4, 20 E.2.2 Optimisation de ∆QU pour Ramp Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de ∆QU, sont montrés tableau E.5. La meilleure performance se produit pour ∆QU = 40, cependant, cette valeur représente une très faible amélioration par rapport au cas sans quantification (Ramp). Tableau E.5 – Nombre d’états par MSMC et performance de détection en utilisant la variable RampQU pour différentes valeurs de ∆QU. ∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 20 6 6 65,81 76,13 0, 24 ± 5, 74 40 6 5 66,24 76,89 0, 73 ± 5, 76 50 6 5 62,25 69,44 0, 87 ± 5, 85
  • 216.
    186 Annexe E E.2.3Optimisation de ∆QU pour QRSd Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de ∆QU, sont montrés tableau E.6. Comme on peut le constater, aucune valeur ne produit d’améliorations dans la détection par rapport au cas sans quantification (QRSd). Tableau E.6 – Nombre d’états par MSMC et performance de détection en utilisant la variable QRSdQU pour différentes valeurs de ∆QU. ∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 10 7 6 63,23 68,76 1, 08 ± 5, 84 50 6 6 61,27 66,95 1, 16 ± 6, 08 100 6 6 60,98 67,12 1, 31 ± 6, 09 E.2.4 Optimisation de ∆QU pour RR Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de ∆QU, sont montrés tableau E.7. Comme on peut le constater, aucune valeur ne produit d’améliorations dans la détection par rapport au cas sans quantification RR. Tableau E.7 – Nombre d’états par MSMC et performance de détection en utilisant la variable RRQU pour différentes valeurs de ∆QU. ∆QU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 50 10 8 89,94 91,95 0, 93 ± 3, 64 100 10 8 89,35 92,57 1, 17 ± 3, 63 500 8 8 87,39 90,82 1, 77 ± 4, 15 E.2.5 Optimisation de ∆QU pour RR&Ramp Pour ce test, les pas de quantification optimaux calculés pour chacune des variables intégrées (RR et Ramp) ont été utilisés : ∆RR QU = 1300 pour quantifier les séquences d’obser- vation RR et ∆Ramp QU = 40 pour quantifier les séquences d’observation Ramp. Les valeurs de M1 et M2 ont été de 10 et 10 états, respectivement. Le tableau E.8 montre la performance de détection pour ce cas bivarié et on peut observer qu’il n’y a pas d’améliorations dans la détection par rapport au cas sans quantification RR&RAMP.
  • 217.
    E.3. Détermination de∆QNU optimal 187 Tableau E.8 – Performance de détection en utilisant la variable RR&RampQU. ∆RR QU ∆Ramp QU SEN (%) SPC (%) TRD (s) 1300 40 64,28 85,46 1, 51 ± 4, 71 E.2.6 Optimisation de ∆QU pour RR&QRSd Pour ce test, les pas de quantification optimaux calculés pour chacune des variables intégrées ont été utilisés : ∆RR QU = 1300 pour quantifier les séquences d’observation RR et sans quantification (∆QRSd QU = 0) pour les séquences d’observation QRSd. Les valeurs de M1 et M2 ont été de 8 et 8 états, respectivement. La performance de détection montrée tableau E.9 indique une amélioration de la détection par rapport au cas non quantifié, cependant, cette valeur n’est pas trop importante par rapport aux autres variables analysées. Tableau E.9 – Performance de détection en utilisant la variable RR&QRSdQU. ∆RR QU ∆QRSd QU SEN (%) SPC (%) TRD (s) 1300 0 85,87 87,85 1, 06 ± 3, 87 E.3 Détermination de ∆QNU optimal Dans cette section, l’optimisation de ∆QNU (δQNU) pour les variables RR, Ramp, QRSd, RR, RR&Ramp et RR&QRSd, est présentée. E.3.1 Optimisation de δQNU pour RR Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de δQNU, sont montrés tableau E.10. La meilleure performance de détection est atteinte pour δQNU = 0, 05 et cette valeur est meilleure que dans le cas sans quantification de la série RR. Pour des valeurs δQNU > 0, 05 il n’était pas possible de déterminer les paramètres de λ1 car σνk 2 i → 0.
  • 218.
    188 Annexe E TableauE.10 – Nombre d’états par MSMC et performance de détection en utilisant la variable RRQNU pour différentes valeurs de δQNU. δQNU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 0,001 9 10 86,93 91,68 1, 77 ± 4, 32 0,005 7 9 89,47 92,33 1, 68 ± 3, 73 0,01 6 8 90,63 91,66 1, 91 ± 3, 57 0,05 5 6 89,95 93,90 1, 93 ± 3, 34 E.3.2 Optimisation de δQNU pour Ramp et QRSd La quantification non uniforme des variables Ramp et QRSd a été réalisée, cependant les résultats ne montrent pas d’amélioration, du fait que l’histogramme de ces variables tend à être Gaussien. Par conséquent, les résultats ne sont pas montrés. E.3.3 Optimisation de δQNU pour RR Le nombre d’états des MSMC et les performances de détection, pour les différentes valeurs de δQNU, sont montrés tableau E.11. La meilleure performance de détection est atteinte pour δQNU = 0, 002 et cette valeur est meilleure que dans le cas sans quantification RR. Tableau E.11 – Nombre d’états par MSMC et performance de détection en utilisant la variable RRQNU pour différentes valeurs de δQNU. δQNU M1 (États) M2 (États) SEN (%) SPC (%) TRD (s) 0,001 8 7 88,81 94,88 1, 99 ± 3, 34 0,002 6 6 90,80 92,26 1, 12 ± 3, 62 0,005 6 6 89,99 93,19 1, 33 ± 3, 45 0,01 6 6 88,64 94,01 2, 07 ± 3, 46 E.3.4 Optimisation de δQNU pour Ramp et QRSd De même que pour le cas univarié Ramp et QRSd, les quantifications non uniformes des variables Ramp et QRSd ne montrent pas d’amélioration de la détection et en conséquence, les résultats ne sont pas montrés.
  • 219.
    E.3. Détermination de∆QNU optimal 189 E.3.5 Optimisation de δQNU pour RR&Ramp Pour ce test, les pas de quantification optimaux calculés pour chacune des variables intégrées ont été utilisés : δRR QU = 0, 05 pour quantifier les séquences d’observation RR et sans quantification (δRamp QU = 0) pour les séquences d’observation Ramp. Les valeurs de M1 et M2 ont été de 10 et 8 états, respectivement. Le tableau E.12 montre la performance de détection pour ce cas bivarié et on peut observer qu’il n’y pas d’amélioration dans la détection par rapport au cas sans quantification RR&Ramp. Tableau E.12 – Performance de détection en utilisant la variable RR&RampQNU. δRR QU δRamp QU SEN (%) SPC (%) TRD (s) 0,05 0 69,02 85,03 2, 81 ± 5, 11 E.3.6 Optimisation de δQNU pour RR&QRSd Pour ce test, les pas de quantification optimaux calculés pour chacune des variables intégrées ont été utilisés : δRR QU = 0, 05 pour quantifier les séquences d’observation RR et sans quantification (δQRSd QU = 0) pour les séquences d’observation QRSd. Les valeurs de M1 et M2 ont été de 6 et 6 états, respectivement. La performance de détection montrée tableau E.13 indique une amélioration de la détection par rapport au cas non quantifié, cependant, cette valeur n’est pas importante par rapport aux autres variables analysées. Tableau E.13 – Performance de détection en utilisant la variable RR&QRSdQNU. ∆RR QU ∆QRSd QU SEN (%) SPC (%) TRD (s) 0,05 0 82,62 92,16 1, 93 ± 4, 04
  • 223.
    UNIVERSIDAD SIMÓN BOLÍVAR DECANATODE ESTUDIOS DE POSTGRADO COORDINACIÓN DE POSTGRADO EN INGENIERÍA ELECTRÓNICA DOCTORADO EN INGENIERÍA DETECCIÓN MULTIVARIADA DE EPISODIOS DE APNEA-BRADICARDIA EN EL NEONATO PREMATURO POR MODELOS SEMI-MARKOVIANOS Por: Altuve Paredes Miguel Alfonso Carnet No.: 03-83313 Tutores: Dr Guy Carrault y Dr Alfredo Hernández, Universidad de Rennes 1 Dr Julio Cruz, Universidad Simón Bolívar 08 de Julio de 2011 RESUMEN La apnea-bradicardia en el neonato prematuro es definida como una pausa respiratoria asociada a una disminución de la frecuencia cardiaca. Una detección precoz de los episodios de apnea- bradicardia es de vital importancia para disminuir los riesgos asociados a esta problemática y garantizar el buen desarrollo del neonato prematuro. En este trabajo se pretende detectar precozmente la apnea-bradicardia analizando la dinámica de las series temporales extraídas del electrocardiograma. Primeramente, una metodología novedosa basada en algoritmos evolutivos fue propuesta para adaptar dos técnicas de análisis del electrocardiograma (detección de latidos y segmentación del electrocardiograma) para funcionar en el electrocardiograma del neonato prematuro. Una vez adaptados estos métodos, las series temporales que caracterizan la duración del ciclo cardíaco, la amplitud de la onda R y la duración del complejo QRS fueron extraídas del electrocardiograma y analizadas en cuatro intervalos de interés: reposo, antes, durante y después de la apnea-bradicardia. Los resultados de este análisis revelaron modificaciones en la evolución temporal de estas series temporales asociadas a la aparición de la bradicardia. Estos resultados nos motivaron a realizar un detector de la dinámica de estas series temporales usando una metodología basada en modelos semi-Markovianos. Con el fin de aumentar el rendimiento de detección, dos proposiciones fueron presentadas, la primera basada en una cuantificación uniforme y no uniforme de las series temporales, y la segunda basada en la inclusión de un retardo en las series temporales. Estas modificaciones propuestas permitieron mejorar la detección de los episodios de apnea- bradicardia en un 13% en sensibilidad y en un 7% en especificidad y permitieron disminuir en 3 segundos el tiempo de retardo en la detección. Estos resultados muestran claramente la importancia de tomar en cuenta la dinámica de las series temporales y que con un pre-tratamiento adecuado se puede obtener una ganancia significativa en el rendimiento del detector. Palabras claves: algoritmos evolutivos, modelos semi-Markovianos ocultos, electrocardiograma, apnea-bradicardia, neonato prematuro.
  • 224.
    Résumé Cette thèse acomme domaine applicatif la détection précoce des événements d’apnée-bradycardie (AB) chez le prématuré. Après avoir situé l’importance sur le plan clinique de la détection des AB, une démarche méthodologique est proposée. Elle s’appuie sur un processus de fouille de données qui inclut le nettoyage et l’extraction de caractéristiques. Au chapitre 3, une méthode originale à base d’algorithmes évolutionnaires, pour optimiser des seuils et fenêtres d’analyse, est proposée pour adapter les algorithmes de traitement du signal ECG aux caractéristiques spécifiques du prématuré, très différentes de l’ECG de l’adulte. Au chapitre 4, une approche semi-Markovienne est adaptée pour la modélisation des dynamiques et plusieurs améliorations sont proposées : hétérogénéité des modèles, adaptation au traitement en ligne, optimisation de la gamme dynamique, extension de l’observabilité. Au chapitre 5, ces propositions sont exploitées dans des expériences de classification et de détection en ligne, tant sur signaux simulés que réels. Les résultats mettent bien en exergue l’intérêt de prendre en compte la dynamique des signaux. Ils soulignent également qu’avec un prétraitement approprié tel que la quantifica- tion des observations, l’introduction du retard entre observables, un gain notable en performance peut être observé. Mots clés : analyse des données multidimensionnelles, algorithmes évolutionnaires, modèles semi-Markoviens cachés, électrocardiogramme, apnée-bradycardie, nouveau-né prématuré. Abstract This dissertation studies the early detection of apnea-bradycardia (AB) events in preterm infants. After defining the importance of AB detection from a clinical point of view, a methodological approach is proposed. It relies on a data mining process that includes data cleansing and feature extraction. In chapter 3, a novel method based on evolutionary algorithms, for optimizing the thresholds and the analysis windows, is proposed to adapt the algorithms of the ECG signal to the specific characteristics of preterm infants, very different from the ECG of adult. In Chapter 4, a semi-Markovian approach is adapted for modeling of dynamics and several improvements are proposed : heterogeneous models, adaptation to online processing, optimization of the dynamic range, and extension of observability. In chapter 5, results of classification and online detection experiments, are reported on simulated and real signals. They clearly highlight the importance of considering the dynamics of the signals. They also emphasize that with a suitable pre-treatment such as the quantification of ob- servations and the introduction of delay between the observable, a significant gain in performance can be observed. Keywords : multidimensional data analysis, evolutionary algorithms, hidden semi-Markov models, electro- cardiogram, apnea-bradycardia, preterm infants.