Identification d'une empreinte vocale pour les Nuls

@AmauryCrickx#dv14ievn
Identification d’une Empreinte
Vocale pour les Nuls
@AmauryCrickx
Développeur Java
Ingénieur du son
Recognito

@YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn

Agenda
Périmètre du
Problème
Comment ça
marche ?
Aspects
Pratiques

Caractéristiques de la voix p
arlée
Tonalité Timbre AccentFlot Vocabulaire
Physique Comportement

D’où vient la différence ?
Larynx
Cordes vocales
1. Pharynx
3. Cavité nasale
2. Cavité buccale
4. Cavité labiale

Captation du signal
+
-
0

Numérisation du signal
Fréquence
d’échantillonnage
de 16 KHz
Amplitude
Temps
 Encodé sur 16 bits

Empreinte vocale
Modèle mathématique basé
sur les formants de la voix
• Trigonométrie
• Equations différentielles
et intégrales
• Nombre Complexe
(Réel + Imaginaire)

Buts poursuivis
Authentification
Classification
Identification
Segmentation
(Diarisation)

En résumé
Fréquences
Uniques
Numériser Extraction
Modèle
Mathématique
Authentifier
Identifier
Classifier
Segmenter

Recognito ?
Identification du locuteur
indépendamment du texte
• Librairie orientée développeurs
• Thread safe
• Licence Apache 2

Enrôlement

Constructeur 2

Identification

Dans les coulisses

Suppression du silence

Normalisation du volume

• Linear Predictive Coding – LPC
 Utilisé pour compresser la voix dans la téléphonie
 double[20]
• Fenêtres de 25ms
• Empreinte vocale = moyenne des double[20]
Extraction des caractéristiques
…
Empreinte vocale
Fen. 1
Fen. 2 Moyenne

Fenêtrage

Distance Euclidienne
 Somme du carré des différences

Une poignée de classes
Recognito
Voice
Activity
Detector
Normalizer
Features
Extractor
Window
Function
LPC
Distance
Calculator
Voice
Print

FOSS
• ALIZE – C/C++ – LGPL
• Laboratoire Informatique d’Avignon
• Plateforme open source d'authentification biométrique
• LIUM – Java – GPL
• Laboratoire Informatique de l’Université du Maine (Le Mans)
• Diarisation des locuteurs
• VoiceId – Python – GPL
• Diarisation LIUM + Identification
• MARF – Java – GPL

De nombreux acteurs
• Nuance
• VoiceVault
• ValidSoft
• Agnitio
• VoiceSecure
• Verint
• SesTek
• SpeechPro
• VoiceTrust
• Authentify
• Voice Biometrics Group
• Neurotechnology
• OxfordWaveResearch
• Recognition Technologies
• Acustek
• …

Marchés visés
Institutions
Gouvernementales
Call
Centers
Applications
Mobiles

Authentification
Référence
Individuelle
Modèle
Universel
seuil
Echantillon à authentifier

Indicateurs de performance
Seuil
%Erreur
False
Acceptance
Rate
False
Rejection
Rate
Equal
Error
Rate

Indicateurs de performance
FAR, FRR, EER
N’ont de sens que lorsqu’on compare
les mêmes jeux de données
Par exemple :
NIST, PRISM, …

Modalités d’authentification
1. Phrase clé « Ma voix est mon mot de passe »
Enrôlement : répéter 3 fois la phrase

Reconnaissance
Vocale
Intonation Flot Robuste
au bruit

• Pas 2 enregistrements identiques
• Détection de traitements numériques

• Plus difficile à obtenir
2. Phrase aléatoire « correct cheval batterie agrafe »
Enrôlement : lire une (longue) liste de mots

• Vérificateur humain
• Encore plus difficile à contrefaire
• Sensible au bruit environnant
3. En continu au cours d’une conversation
Enrôlement : première conversation vérifiée

Vérification à facteurs multiples
Savoir Posséder Etre
Mot de passe
Question / réponse
Générateur
de Token
Biométrie

En résumé
• Technologie mature
• Coût faible
• Meilleure expérience
utilisateur
• Sensibilité au bruit
• Variabilité de la voix
• Statistique par nature

Crédit image / Creative Commons
• Rue pavée — By-Nc-Sa
•http://www.flickr.com/photos/22914687@N05/4957591422/sizes/l/
• Sous la Tour Eiffel — By-Nc-Sa
•http://www.flickr.com/photos/stewiedewie/244850735/sizes/l/in/photostream/
• Sous le pont — photo par B.Monginoux - By-Nc-Nd
•http://www.landscape-photo.net/displayimage.php?pid=5194
• Le Louvre – Photo par Anthony Gaudun - By-Nc-Sa
•http://www.flickr.com/photos/anthonygaudun/7474397964/sizes/o/in/photostream/
• Slide template created by @glaforge, completed by @nmartignole for Devoxx FR2014

Identification d'une empreinte vocale pour les Nuls

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Identification d'une empreinte vocale pour les Nuls