Julien Cojan, membre de l'équipe Wimmics à Inria, traite de l'extraction de données depuis Wikipédia, notamment pour le musée du Louvre. Le document aborde les défis liés à l'extraction textuelle, les normes de vocabulaire, ainsi que l'utilisation de l'ontologie DBpedia pour structurer ces données. Il présente également des exemples d'interrogations des données via SPARQL et l'accès à un large volume de données extraites.