Comment mettre en relation données et documents pour produire une information métier plus riche et plus utile ?
Présentation d'Antidot Information Factory et de l'approche Linked Enterprise Data, par Pierre Col, directeur marketing d'Antidot.
Retours d'expérience de Pierre Boudigues, directeur Projets et SI de Electre, et Marc Pautrat, responsable SI éditoriaux du Groupe Moniteur.
Wikidata : quand Wikipédia s'intéresse aux données
Comment mettre en relation données et documents pour produire une information métier plus riche et plus utile ?
1. Confidentiel Antidot™ 1
Comment mettre en relation
données et documents pour produire
une information métier plus riche et plus
utile
Pierre Col – Directeur Marketing
pcol@antidot.net
2. Confidentiel Antidot™ 2
Agenda
La société Antidot
Le logiciel Antidot Information Factory
L’approche Linked Enterprise Data
Le témoignage d’Electre
Le témoignage du groupe Moniteur
4. Confidentiel Antidot™ 4
Société ANTIDOT
Éditeur de logiciels
depuis 1999 | Paris, Lyon, Aix-en-Provence
moteurs de recherche | enrichissement des données
Mission : Apporter à nos clients des solutions
hautement configurables et innovantes qui
créent de la valeur à partir de leurs données
et accroissent leur performance opérationnelle
5. Confidentiel Antidot™ 5
Faits & Chiffres
La passion de l’innovation
50% du chiffre d’affaires investi en R&D
46 personnes dont 26 à la R&D
Leaders dans le Web Sémantique
(nous avons été pionniers des standards du W3C)
Orienté Client
Engagement à livrer les projets
Nous n’avons jamais abandonné ni échoué
Plus de 120 clients
90% sont leaders sur leur marché
6. Confidentiel Antidot™ 6
Faits & Chiffres
Déjà dans le Cloud
SaaS depuis 1999
80% de nos clients sont en SaaS
+1 milliard de recherches / an
Et aussi en licence
Dans votre SI
Hébergée sur notre infrastructure
10. Confidentiel Antidot™ 10
Antidot Information Factory
AIF : un outil industriel et évolutif
Une chaîne de
captation
et de traitement
Un cadre de
développeme
nt
Un modèle
d’Unité Documentaire
11. Confidentiel Antidot™ 11
AIF : une chaîne de traitement
Créer des chaînes de traitement de données par
assemblage de modules
Sources de
données
Module
connecteur
Modules de transformation
et enrichissement
12. Confidentiel Antidot™ 12
AIF : des briques à assembler
Déjà plus de 60 modules prêts à l’emploi en standard
Connecteurs Traitements XML
Text-miningTraitements RDF
13. Confidentiel Antidot™ 13
AIF : des briques à assembler
Enrichir les contenus
Classification et tagging
Extraction d’entités nommées
Création de liens sémantiques
Prime à la qualité !
14. Confidentiel Antidot™ 14
AIF : Tagging automatique
Classifieur : utilisable avec toute taxonomie / langue
Evalué par l’AFP et jugé
comme le classifieur
le plus précis (88%)
16. Confidentiel Antidot™ 16
AIF : Maillage sémantique de données
Transforme les entités en connaissances liées à
des jeux de données
17. Confidentiel Antidot™ 17
AIF : un cadre de développement
Un cadre de développement pour construire des modules
60+ filtres prêts à l’emploi
Un environnement d’exécution
18. Confidentiel Antidot™ 18
Mettre en relation données et documents pour
produire une information métier plus riche et plus utile
21. Confidentiel Antidot™ 21
Consolider l’information
Intégrer les données internes et externes : l’intérêt de vos
données est démultiplié par celles disponibles sur le Web
23. Confidentiel Antidot™ 23
Mailler l’information interne avec
des données bibliographiques ouvertes
Pierre Boudigues - directeur Projets et SI
24. Confidentiel Antidot™ 24
ELECTRE : notre activité
Bases de données bibliographiques :
Base de production Calipse : 1.700.000 œuvres, 1.600.000 auteurs,
86.000 marques éditoriales
Base de diffusion electre.com : 10.000 utilisateurs, 2 M requêtes / j
1.400.000 notices, 450.000 auteurs, 17.000 marques et sociétés
Magazine Livre Hebdo + site www.livreshebdo.fr :
Édition papier : 44 numéros + 4 suppléments
Édition web : 250.000 objets rédactionnels de 15 types différents
8.000 abonnés, 16.000 utilisateurs web, 31.000 abonnés newsletter
Editions du cercle de la Librairie
150 ouvrages de référence pour les professionnels du livre
12 parutions par an
25. Confidentiel Antidot™ 25
ELECTRE : nos enjeux pour les données
Interopérabilité des données
Données internes : décloisonner les silos existants
Données externes : moissonner Wikipedia / Dbpedia
Urbanisation du Système d’Information
Créer un infocentre / datawarehouse…
… sans toucher aux applications métier
26. Confidentiel Antidot™ 26
ELECTRE : problématique
Pour Electre :
faire un apprentissage de l’Open Data en moissonnage et en
restitution
valider la compatibilité de nos référentiels pour ses usages
Pour Livres Hebdo :
indexer et relier les informations non structurées produites par la
rédaction avec des référentiels
28. Confidentiel Antidot™ 28
ELECTRE : bénéfices d’AIF
Les services rendus par l’outil Antidot Information Factory
justifient déjà, pour les besoins internes, la mise en
œuvre d’un entrepôt RDF
Les données Electre / Livres Hebdo sont maintenant
« Open Data ready »
Pour autant, AIF n’est pas la solution magique à tous les
problèmes, notamment pour l’administration des données
29. Confidentiel Antidot™ 29
ELECTRE : et maintenant ?
Imaginer de nouvelles offres de services
Quel modèle économique / quelle rémunération pour
Electre dans l’Open Data ?
30. Confidentiel Antidot™ 30
Favoriser la découverte d’informations et de services
grâce aux liens inter-silos
Marc Pautrat - Responsable SI éditoriaux
31. Confidentiel Antidot™ 31
Le Groupe Moniteur
Depuis 1903 : information et services
à destination des professionnels de
la construction et des collectivités
locales
Presse : 21 publications
Edition : Plus de 700 ouvrages en
catalogue, livres et classeurs à mises à jour
Salons, formation
Plus de 30 sites web et services numériques
Fait partie depuis janvier 2014 du
Groupe Infopro Digital, groupe
d'information professionnelle leader en
France
32. Confidentiel Antidot™ 32
Nos enjeux vis-à-vis des données
Le Groupe Moniteur brasse énormément
de données structurées / non structurées...
Articles de presse
Information sur les entreprises du BTP
Information sur les collectivités locales
Information Produits
Projets de construction
Appels d'offres
etc
Enjeux : faire émerger et
valoriser l'information enfouie au sein de
nos contenus afin de les mettre en
perspective dans un contexte métier
pertinent
33. Confidentiel Antidot™ 33
La problématique à traiter
Les données sont cloisonnées en
silos
il faut les décloisonner
Les données sont hétérogènes
il faut en donner une
vue homogène
Les référentiels sont épars
il faut les aligner
La pertinence de l'information sous-
jacente est difficile à évaluer
il faut pouvoir
expérimenter simplement
34. Confidentiel Antidot™ 34
Ce qui a été réalisé concrètement
On ne retient pas la solution qui consisterait à créer une base de
données uniforme : trop complexe, long et impactant pour les
systèmes en place
Solution retenue plus pragmatique : s'appuyer sur une base
d’indexation externe
Avantages :
Données sont déjà envoyées à la plateforme Antidot
Technologie connue et intégrée dans notre SI
Licences produit déjà acquises
Cohérence technique et facilité de mise en œuvre
35. Confidentiel Antidot™ 35
Ce qui a été réalisé concrètement
Profiter des flux d'indexation qui alimentent le moteur de recherche
pour créer une "base de maillage" entre ces entités
Traitements AIF : normalisation, inférence, valorisation
En s'appuyant sur les pivots de maillage suivants :
Le thésaurus Groupe et les plans de classements
Les bases Entreprises/Collectivités
La géolocalisation
37. Confidentiel Antidot™ 37
Bénéfice attendu
Améliorer la navigation transverse au sein de nos produits grâce à
un accès à l'information plus efficace, plus contextuel
Mettre en avant des contenus premium (payants)
Proposer de produits connexes (up selling)
38. Confidentiel Antidot™ 38
Pour aller plus loin…
Bâtir de nouvelles offres produits grâce à l'information
ainsi extraite
Exemple : vue 360 sur des Réalisations-Acteurs-
Techniques-
Produits