L’Empreinte Audio Numérique au service de l’analyse des diffusions
Solutions de reconnaissance automatique de contenu
Masterclass OPNS au Salon de la Radio et de l'Audio Digital 2019
Barometre de l'Audio Digital 2018 vs 2017 Kantar Media @ Salon de la Radio et...
L'empreinte audio numerique au service de l'analyse des diffusions Masterclass OPNS SalonRadio2019
1. AUDIO FINGERPRINT FOR BROADCAST MONITORING
…automatic content recognition solution…
L’Empreinte Audio Numérique au service de l’analyse des diffusions
…Solutions de reconnaissance automatique de contenu…
Salon de la Radio 2019 - MasterClass
4. Pourquoi analyser le contenu ?
Les besoins de (re)connaissance du contenu existent depuis
toujours :
Listes de diffusion pour les annonceurs :
➢ Quantité
➢ Durée
➢ Horodatage
Listes de diffusion pour les organismes de droits d’auteur
Listes de diffusion pour surveillance des quotas
( musique/parole, langues,…)
+ Listes de diffusion pour surveillance des concurrents
5. Signification de l’analyse de contenu
L’analyse automatique de contenu signifie :
la possibilité de reconnaître sans équivoque des
éléments sonores diffusés quelle qu’en soit la
nature (publicités, jingles, virgules, chansons,
musiques, ...)
Elle diffère de l’analyse vocale qui vise à obtenir la
retranscription automatique des textes, les 2
approches peuvent être complémentaires.
6. Comment collecter l’information?
On distingue principalement 3 grandes
familles de solutions techniques :
Filigrane / Tatouage (Watermarking)
Modulation de fréquence
Empreinte Numérique (Fingerprinting)
7. Comment ? FILIGRANE/TATOUAGE
Promoteurs les plus connus : Digimarc et l’Institut Frauhofer.
Un filigrane audio est un identifiant électronique unique intégré dans un signal audio.
Cela ressemble à un filigrane sur une photo.
Le filigranage est le processus consistant à incorporer des informations dans un signal
(audio, vidéo ou images, par exemple) d'une manière difficile à éliminer. Si le signal est
copié, les informations sont également transportées dans la copie. Le filigranage est
devenu de plus en plus important pour permettre la protection du droit d'auteur et la
vérification de la propriété.
Les informations injectées dans le signal audio doivent idéalement être inaudibles. La
technologie de filigrane est basée sur des transformées de Fourier. Les dernières
versions proposées par l’institut Fraunhofer annoncent un support de l’encodage MP3,
de time stretching & pitch shifting, des changements de volume, de la compression
dynamique et des conversions AD/DA.
9. Comment ? FILIGRANE/TATOUAGE
Les inconvénients principaux sont :
Le fait de devoir modifier la source
Le fait que les métadonnées soient propres au diffuseur
Une certaine sensibilité mesurée aux traitements de sons (très classiques en radio)
Une certaine sensibilité au contenu audio (silence, musique classique, …)
Une certaine limite dans les données transportées (taille)
Les avantages principaux
☺ Présence directe des métadonnées dans l’élément sonore
☺ Une certaine facilité d’extraction si la source n’a pas été perturbée.
☺ Possibilité de différentiation immédiate entre 2 éléments quasi identiques (sans attendre
le point de différence)
10. Comment ? MODULATION DE FREQUENCE
Promoteur connu : Chirp.
Le codage de données audio - ou modulation / démodulation - est une technologie qui a
été utilisé depuis les débuts de la communication radio, du code Morse aux tonalités DTMF
vers les protocoles 56 kbps V.90 / V.92 utilisés par les modems et télécopieurs.
Contrairement aux approches précédentes, aucun signal audio existant n’est nécessaire
pour fonctionner. Au lieu de cela, les données sont codées en générant un nouveau signal
dont les propriétés sont déterminées par les données à transmettre. Dans la cartographie la
plus simple, la présence d’un signal indique un «1» et l’absence d’un signal indique un «0»
Bien sûr, il est possible d’aller au-delà d’une approche binaire on-ou-off. Le système de
communication de Chirp mappe les entiers sur de plus grands ensembles de fréquences: le
protocole standard utilise des tonalités de 32 fréquences différentes, ce qui permet un débit
beaucoup plus grand.
Cependant, l’envoi d’informations acoustiques entre des appareils peut poser des
problèmes particuliers. Le bruit de fond et la réverbération distordent le signal d'origine,
ce qui signifie que le débit de transmission doit être réduit pour maintenir
une fiabilité élevée.
12. Comment ? MODULATION DE FREQUENCE
Les inconvénients principaux sont :
Le fait de devoir modifier la source
Le fait que les métadonnées soient propres au diffuseur
Une limite claire dans le volume de données transportées (débit)
Les avantages principaux
☺ Présence directe des métadonnées dans l’élément sonore
☺ Une certaine facilité d’extraction si la source n’a pas été perturbée.
☺ Possibilité de différentiation immédiate entre 2 éléments quasi identiques (sans attendre
le point de différence)
☺ Technologie extrêmement éprouvée
13. Comment ? EMPREINTE NUMERIQUE
Promoteur connu : Shazam, Samsung, OPNS
Les empreintes digitales, ou «identification audio basée sur le contenu», produisent
l'empreinte d'un extrait audio en analysant son contenu musical et en en définissant
les contours généraux, par exemple en recherchant des mélodies ou des rythmes
distinctifs.
En pratique, la plupart des implémentations du monde réel déduisent des mesures
plus sophistiquées en dérivant des propriétés du spectre de fréquence, de l’énergie, du
rythme,...
Les empreintes sont stockées dans une base de données pour comparaison ultérieure
Les empreintes sont uniquement répertoriées par un identifiant qui est lié à des
métadonnées généralement statiques.
Un même élément diffusé par 2 réseaux distincts sera identifié de façon unique
contrairement aux autres méthodes qui ne permettent que des identifications
verticales (au sein du même diffuseur) et non horizontales.
15. Comment ? EMPREINTE NUMERIQUE
Les inconvénients principaux sont :
La complexité des calculs mathématiques
Différentiation entre 2 éléments quasi identiques en fin de diffusion (le point de
différence)
Une vitesse d’analyse proportionnelle aux nombres d’éléments à reconnaître
Les avantages principaux
☺ Le fait de NE PAS devoir modifier la source
☺ La fiabilité des résultats
☺ La résistance aux perturbations et aux compressions/décompressions
☺ L’analyse de toute source, sans contrainte de longueur ou contenu
16. En résumé
Filigrane Modulation Empreinte
Type de données Dynamiques Dynamiques Statiques
Volume de données Limité Très limité Illimité
Fiable pour DRM Oui Non Oui
Nécessite contenu Oui Non Oui
Nécessite
modification de la
source
Oui Oui Non
18. analyser. L’ELEMENT PRINCIPAL DE LA SOLUTION
…pour stocker, indexer et gérer
les empreintes digitales uniques (signatures)
de contenu audio connu,
avec les métadonnées sonores uniques
« IDLibrary »
musiques, pubs,
jingles,…
audio / vidéo
à retrouver
</>
titre, artiste,
année,…
métadonnées
+
flux audio / vidéo
à analyser
19. analyser. UNE ASSOCIATION DE MOTEURS INTELLIGENTS
V
X
…détecte les éléments
connus dans un flux de
diffusion en comparant
l’empreinte en direct avec
toutes les empreintes
stockées dans la
bibliothèque IDLibrary
Analyse
en direct …détecte et dissocie les
échantillons de musique ET
de parole dans un flux de
diffusion avec horodatage
Détection
musique/voix
2 x
n x
…recherche d’empreintes
répétées dans une ou
plusieurs sources sur une
longue période afin de
découvrir un nouvel
élément sonore
Détection
des répétitions
+BPM calc
…pour l’analyse du
rythme
20. analyser. SOLUTION D’ANALYSE AUDIO DE BOUT EN BOUT
audio/vidéo
à retrouver
</>
métadonnées
flux audio/video
à analyser post-
traitement
STATISTIQUES
analyses multicritères
personnalisables sur les éléments
reconnus (artistes, clients, années,
langues,...)
RÉÉCOUTE
avec un outil de visualisation élaboré
affichant les résultats d’analyses et
des informations détaillées...
RAPPORTS
confirmation de diffusion,
horodatage officiel des éléments
reconnus, analyse BPM, distribution
musique/voix, vérification des
quotas
DÉCOUVERTE
CONCURRENCIELLE
listes d’éléments communs ou
récurrents inconnus découverts
dans les flux de diffusion
Empreinte
Empreinte IDLive
S/M split
DUP finder
BPM calc
IDLibrary
DÉDUPLICATION
Détection des doublons & nettoyage
du contenu de votre base sonore
21. EMPREINTE AUDIO NUMÉRIQUE UNIQUE POUR
ANALYSE DES RADIODIFFUSIONS
…solution de reconnaissance automatique de contenu…
CARACTÉRISTIQUES PRINCIPALES
nombre de sources virtuellement illimité
adapté à tout type d’enregistrements audio: radio, TV,…
combinaison de Systèmes Experts indépendants
gestion de tout type de son: publicités, jingle, fillers,…
conçu et efficace tant pour une radio que pour des réseaux étendus
rapports multiples et outil statistique paramétrable à volonté
identification formelle des sons signés
découverte automatique de sons non répertoriés
génération des conduites antennes basées sur la diffusion
analyser.
23. analyser. PRÊT POUR INTÉGRATION
…intégration facile pour les équipes de développement
ou avec des processus et logiciels tiers
services web
standard
base de données
ouverte SQL
rapports et
statistiques
personnalisés
connecteurs
génériques
ou dédiés
25. +
+
analyser. UNE ARCHITECTURE MODULABLE
IDLibrary
+
+
+
+
Analyse
en direct
Séparation
musique/voix
Détection des
répétitions
…solution
évolutive grâce à
la distribution et
parallélisation
des tâches
26. EMPREINTE AUDIO NUMÉRIQUE UNIQUE POUR
ANALYSE DES RADIODIFFUSIONS
Notre solution de reconnaissance automatique de contenu non intrusive!
analyser.
36. planifier. diffuser. enregistrer. analyser.
Merci pour votre attention !
Vous êtes les bienvenus pour poursuivre la conversation
sur notre stand B13 !!!