Université des Sciences et de Technologie Houari Boumediene
Faculté d’Electronique et d’Informatique
Département Télécommu...
INTRODUCTION
Reconnaissance Automatique du
Locuteur :
Espace englobant les variabilités
du locuteur et du canal :
Reconnai...
Approche des i-vecteurs (modélisation de
l’EVT)
Approche GMM-UBM
SOMMAIRE
I- Principes de la R.A.L
II- Extraction des para...
r
I.1 Contexte de la R.A.L
r
I.2 Taches de la R.A.L
Identification du
locuteur
Prochain SlideShare
Chargement dans…5
×

iVector vs GMM/UBM for Automatic Speaker Recognition system

681 vues

Publié le

Ce travail s’inscrit dans le domaine de la Reconnaissance Automatique du Locuteur (RAL) dont l’objectif est de reconnaitre une personne en analysant sa voix en conditions réelles.
Le système développé dans le cadre de ce projet repose sur l’utilisation des MFCC (Mel Frequency
Cepstral Coefficients) comme paramètres caractéristiques de la voix et l’approche GMM-UBM (Gaussian Mixture Models- Universal Background Model) comme une première phase de modélisation. La deuxième phase consiste à projeter les modèles GMM dans un espace réduit qui englobe la variabilité du locuteur et celle du canal communément appelé espace de variabilité totale. Les modèles résultants de cette projection s’appellent i-vecteurs et ils représentent les identités des locuteurs clients. La dernière phase de cette modélisation consiste à éliminer les composantes indésirables dues essentiellement aux effets du canal à travers l’application de certaines techniques d’analyse factorielle.
L’évaluation des performances de la modélisation par i-vecteurs a été effectuée en comparant ses résultats en termes de temps de réponse, de complexité et de taux de reconnaissance, avec ceux obtenus en utilisant la modélisation classique GMM-UBM.
This

Publié dans : Logiciels
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
681
Sur SlideShare
0
Issues des intégrations
0
Intégrations
9
Actions
Partages
0
Téléchargements
14
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

iVector vs GMM/UBM for Automatic Speaker Recognition system

  1. 1. Université des Sciences et de Technologie Houari Boumediene Faculté d’Electronique et d’Informatique Département Télécommunications Option : Systèmes intelligents de communication Objet : Mémoire de Projet de Fin D’études Pour l’obtention du diplôme de Master EVALUATION DE LA MODELISATION DE L’ESPACE DE VARIABILITE GLOBALE POUR LA RECONNAISSANCE AUTOMATIQUUE DU LOCUTEUR Présenté par : Mr . BOUAFFOU Walid Mr . KOUACHE Adel Proposé et dirigé par : Pr . AMROUCHE Abderahmane Mr . DJELLAB Mourad
  2. 2. INTRODUCTION Reconnaissance Automatique du Locuteur : Espace englobant les variabilités du locuteur et du canal : Reconnaitre automatiquement une personne en analysant le signal de sa parole. Le signal vocal est très variable => Prise en compte des différentes variabilités lors de la modélisation Évaluation de la modélisation de l’espace de variabilité globale pour la R.A.L
  3. 3. Approche des i-vecteurs (modélisation de l’EVT) Approche GMM-UBM SOMMAIRE I- Principes de la R.A.L II- Extraction des paramètres vocaux IV- Résultats et discussion III- Classification des locuteurs Conclusion et perspectives
  4. 4. r I.1 Contexte de la R.A.L
  5. 5. r I.2 Taches de la R.A.L Identification du locuteur

×