Le document présente les enjeux scientifiques de l'indexation vidéo, notamment les techniques d'analyse et de description des contenus multimédias. Il aborde les défis liés à la reconnaissance de la parole et des visages, la multimodalité et les problématiques de synchronisation entre les flux audio et vidéo. Enfin, il évoque l'importance d'apprendre les dépendances entre variables pour améliorer la qualité de l'indexation et de l'exploitation des contenus.