Conférence Mondeca au salon Documation 2012
WebTV : http://www.documation.tv
Blog : http://www.documation.net
Site : http://www.documation.fr
Salon : 20 et 21 mars 2013 au CNIT Paris La Défense
Mondeca - Smart content ou comment rendre vos contenus plus intelligents par les technologies du web sémantique
1. SMART CONTENT
SMART CONTENT FACTORY
rendre vos contenus plus intelligents
par les technologies sémantiques
Documation/MIS Master Class – 21/03/2012
2. SMART CONTENT
Smart Content : la vision de Mondeca
• Valoriser toutes les informations et contenus
• Révéler les éléments clefs et de connaissance
• Agréger les contenus et intégrer de l’information complémentaire
• Mettre en réseau les contenus pour offrir richesse et performance
Smart Content Factory
3. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
4. SMART CONTENT
Pourquoi rendre les contenus plus intelligents?
Accroitre la valeur pour les utilisateurs
• Accès plus efficace et personalisé
• Lecture et analyse facilitées
• Decouvert et mash-ups
Smart Content Factory
5. SMART CONTENT
Pourquoi rendre les contenus plus intelligents?
Accroitre les revenus par le trafic et la consommation
• Visibilité
• Nombre de pages vues
• Réutilisation
Smart Content Factory
9. SMART CONTENT FACTORY
Aperçu des composants
Ontologies, référentiels Extraction connaissances et
connaissances, vocabulaires annotation de contenus
rules match
Publication
connectors
Smart Content Factory
10. SMART CONTENT FACTORY
Aperçu des solutions
Assistance clients
Digital Asset
Linked Open Data Management
Base de SEO
connaissances
Portail
Sémantique
Smart Content Factory
17. SMART CONTENT FACTORY
Accroitre la productivité
• Automatiser l'annotation, la classification, l'enrichissement,
l'interopérabilité et le contrôle de la qualité
• Mettre en place de workflows collaboratifs
Smart Content Factory
18. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
19. RAISONNEMENT
Intérêt du raisonnement
Pourquoi raisonner ?
• Organiser automatiquement le contenu
• Contrôler la qualité du contenu et en localiser les anomalies
• Enrichir le contenu existant par ajout de nouvelles informations
Bénéfices clients
• Améliorer la qualité et la richesse du contenu
• Réduire les temps et coûts de traitement du contenu
Smart Content Factory
20. RAISONNEMENT
Organiser
Comment ?
Catégorie C =
SI un objet vérifie les critères exprimés dans la condition
ALORS on le range dans la catégorie C
Smart Content Factory
21. RAISONNEMENT : ORGANISER
Cas d’application : Tourisme
SI un hôtel possède au moins 5 étoiles et un Spa
ALORS on le range dans la catégorie «Hôtel de Luxe»
Smart Content Factory
22. RAISONNEMENT
Contrôler
Localiser les manques Localiser les conflits
Comment ?
Règle d’obligation : localiser les manques
SI la condition est trouvée ALORS la partie obligation doit l’être aussi.
Règle d’interdiction : localiser les conflits
SI la condition est trouvée ALORS la partie interdiction ne doit pas l’être.
Smart Content Factory
23. RAISONNEMENT : CONTRÔLER
Cas d’application : Gestion terminologique
- racine = true
Règle d’obligation : Règle d’interdiction :
SI un terme n’a pas d’hyperonyme SI deux termes sont liés par synonymie
ALORS il doit avoir racine=vraie ALORS pas de lien d’hyperonymie
24. RAISONNEMENT
Enrichir
Compléter les manques Etablir des corrélations Enrichir les objets
Comment ?
Règle d’inférence =
SI la condition est trouvée
ALORS on ajoute les informations de la conclusion
Smart Content Factory
25. RAISONNEMENT : ENRICHIR
Cas d’application : Réglementation
SI un bateau est de type « navire à passagers »
et taille > 20m
et date de construction D > au 24/01/12
ALORS le chapitre S41 de la réglementation maritime s’applique à partir de D
Smart Content Factory
26. RAISONNEMENT
Aspects techniques
Les outils en raisonnement
• Editeur de règles
• Moteur de raisonnement
Simplicité et flexibilité
• Utilisable par des non-informaticiens
• Règles indépendantes des données
• Spécialement adapté pour la publication
Fonctionnalités avancées
• Héritage dans la hiérarchie des règles
• Détection de cycles dans l’exécution des règles
• Subsomption de règles
• Gestion de la temporalité
27. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
28. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Situation actuelle
• Temporalité : impliquée dans tous les domaines
• Un axe fondamental pour la recherche d’information
• Pourtant seulement 1,5% des requêtes soumises aux moteurs de
recherche
29. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Situation actuelle
• Sémantique non prise en
compte (mots-clés)
• Raisonnement : faire le lien
entre 1510 et début du XVIe
siècle
• Text-mining : Pas
uniquement métadonnées
autour du document, mais
informations à l’intérieur d’un
document
30. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
1. Acquisition de connaissances temporelles
complexes
31. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
2. Recherche d’informations temporelles
32. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
3. Visualisation d’informations temporelles
33. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
ACQUISITION D’INFORMATIONS
TEMPORELLES
34. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
RECHERCHE D’INFORMATIONS
TEMPORELLES
35. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
RECHERCHE D’INFORMATIONS
TEMPORELLES
36. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Solutions
• Traitement automatique des langues pour l’annotation (ingénierie
des langues)
• Raisonnement temporel (ingénierie des connaissances)
• Indexation sémantique (recherche d’information)
Prix de la meilleure application au DeRiVE 2011 Data Challenge
37. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
39. Customers
>800 clients autour du monde
>100 chaines à l’antenne
Présent dans plus de 30 pays
TV & networks, Centres de diffusion, Post-Production, Universités,
Indépendants…
40. SPARK IGNITION
Les besoins
Pérennisation des archives
Mise à disposition des médias
Valorisation d’un patrimoine
Augmentation de la productivité
Impossibilité de se passer
d’automatisation
Un trop grand volume
d’information à traiter
Un besoin de consolider les
informations et les médias.
41. Valorisation d’un patrimoine
• Sortir les médias des armoires
• Les indexer pour les retrouver
• Mettre à jour automatiquement les données
éditoriales en fonction de la Géo Politique /
Langues
• Ouvrir un fond documentaire ou le lier à d’autres
• Echanger les données
• Amortir les investissements
42. Augmentation de la productivité
• Automatiser les taches répétitives
• Indexer automatiquement
• Intégrer les ERP et les CRM
• Limiter les surfaces de Stockage et les
déplacements
43. Impossibilité de se passer
d’automatisation
• Accès 24/24 7/7
• Réseaux complexes
• Stockages hétérogènes
• Contrôle qualité automatisé
• Opérations complexes de transcodage
• De Livraison
• De restauration
44. Un trop grand volume d’information à
traiter
• Les méthodes de classement et de rangement
sont obsolète
• Les supports dont multiples pour une même
instance dans plusieurs localisations
• Les stockages évoluent en fonction des besoins
• Des relations existent entre les médias
45. Un besoin de consolider les
informations et les médias
• Synchronisation avec des bases tierces
• Evolution de la qualification du média au fil du
temps
• Utilisation / Mise à jour des métas données
intrinsèque du média.
46. Points Clés de SPARK IGNITION
• Base de données plurimédias
• Moteur de Workflow
• Gestion multi-formats et multi localisations
• Indexation et recherches avancées
• Archivage
• Open Exchange
• Unicode
• Multi channels play-Out Operations