1. Ze Ontology News Extractor
Celui qui contrôle les données contrôle le web
Christophe DESCLAUX
Pour le concours BoostYourCode 2012
2. CONTEXTE
CONTEXTE ZONE(UR)
BoostMyZone !
Christophe Desclaux
Ingénieur Informatique
Knowledge Information Systems
2
3. CONTEXTE
CONTEXTE ZONE(UR)
Mes engagements
BoostMyZone !
Aide à la mise en place de serveurs
Animation de conférences
vice président
Organisation des « Journées Méditerranéennes du
Logiciel Libre » depuis 2009
3
4. CONTEXTE
CONTEXTE ZONE(UR)
Cas d'utilisation
BoostMyZone !
Que se passe-t-il dans l'écosystème de la
fondation Apache en ce moment ?
4
22. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
Evenements ville Montpellier
Élément de
besoin configuratio critères
utilisa n
teur
22
23. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
Élément de Création
besoin configuratio critères requête
utilisa n
teur
23
24. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
BDD
Requête
Élément de Réponse
Création
besoin configuratio critères requête
utilisa n
teur
24
25. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
BDD
Requête
Élément de Réponse
Création
besoin configuratio critères requête
utilisa n
teur Transformatio
Flux n
RSS 25
26. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
Clients possibles :
Smartphone
Interface WEB
Plugins
BDD
ZONEUR Requête
Élément de Réponse
Création
besoin configuratio critères requête
utilisa n
teur Transformatio
Flux n
RSS 26
27. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
ZONE
Annotateur
Item
News annoté
Flux Lecteur Stockage
Flux Items annotés
de flux des
RSS Flux annotés
BDD
ZONEUR Requête
Élément de Réponse
Création
besoin configuratio critères requête
utilisa n
teur Transformatio
Flux n
RSS 27
28. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
État actuel du prototype
BoostMyZone !
Proof of concept : http://zone.zouig.org
Code : http://github.com/descl/ZONE
Etude du web sémantique
Démarche d'architecture logicielle
Diffusion à la communauté scientifique
CIEL 2012 : Conférence en IngénieriE du Logiciel
28
29. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
Apports communautaires
BoostMyZone !
Publication API Java
Correction de bugs
Corese
29
30. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
BoostMyZone !
Place à la démo
30
36. CONTEXTE
CONTEXTE BoostMyZone
ZONE(UR) ZONE(UR)
BoostMyZone !
BoostMyZONE
Permettez moi de concrétiser mon projet !
36
37. CONTEXTE
CONTEXTE BoostMyZone
ZONE(UR) ZONE(UR)
Apports du projet
BoostMyZone !
37
38. CONTEXTE
CONTEXTE BoostMyZone
ZONE(UR) ZONE(UR)
Choix de la licence
BoostMyZone !
Serveur : licence GPL v3
Classique
Connue et reconnue
Compatible avec la licence Apache
Client : licence AGPL
Moins permissive
Prise en compte de la distribution sous forme de
service
38
39. CONTEXTE
CONTEXTE BoostMyZone
ZONE(UR) ZONE(UR)
Organisation
BoostMyZone !
WP1 : la communauté
Présentation au public
Appels à contributions
WP2 : le serveur d'annotation
Passage à l'échelle
Ajout de services d'annotations
Data clustering
WP3 : les clients
Amélioration visuelle
Client android 39
40. CONTEXTE
CONTEXTE BoostMyZone O
ZONE(UR) ZONE(UR)
BoostMyZone !
N
C
L
U
S
I
O
Pourquoi me financer ? N
40
41. C
CONTEXTE
CONTEXTE BoostMyZone
ZONE(UR) ZONE(UR) O
BoostMyZone !
N
C
L
Merci de votre attention
U
S
I
O
“J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de
coopération entre les êtres humains. Et dans un second temps, j’aimerais que ce soit les N
ordinateurs qui coopèrent. Quand mon rêve sera réalisé, le Web sera un univers où la
fantaisie de l’être humain et la logique de la machine pourront coexister pour former un
mélange idéal et puissant.” Tim Berners-Lee
Merci à Mireille Blay-Fornarino, Christian Brel, Luc Champalle, Patrice Deschaux, Catherine
Faron-Zucker, Amélie Gyrard, Romaric Pighetti, Matti Schenider et Simon Urli pour leur aide
précieuse
41
43. Planning prototype
Octobre / Novembre : découverte du sujet, étude
bibliographique et recherche de solutions
existantes
Plein temps décembre (2s) : Étude des différents
services d'annotation possibles , tests poussés
des solutions et rédaction de tests unitaires pour
vérifier les problèmes de régression
Janvier : Construction du workflow d'annotation
Février : Spécification concernant la première
version du service de filtrage
Plein temps Mars (2s) : Finalisation du service de
filtrage et rédaction de l'article scientifique
44. Valorisation commerciale
Les entreprises on besoin d'installer ce genre
d'application sur leurs machine
Fournir des solutions de consulting pour projets
de pilotage
Ajout de nouveaux services d'annotation dictés
par les besoins d'entreprises
45. CONTEXTE
CONTEXTE ZONE(UR)
ZONE(UR)
Apports communautaires
BoostMyZone !
Projet WikiMeta (annotateur)
Publication API Java
Correction de bugs
Projet 4Store (serveur RDF)
Rapport de bugs concernant la suppression
d'informations par requêtes Sparql
Projet Corese (Moteur SPARQL)
Rapport de bug concernant des problèmes de
performance sur de grands jeux de données
Librairie 4store-ruby
Fork de l'application pour permettre des requêtes 45
46. CONTEXTE ZONE(UR)
Aspects juridiques
BoostMyZone !
Droit d'auteurs
Droit de citation
Respect de la vie privée
Rester hébergeur et non éditeur de contenu
46
48. Planning
Serveur
Gestion d'un grand nombre de flux
Agrégation des news similaires
Ajout de services d'annotation
Communauté
Présentation au public
Diffusion prototype
Compilation des retours
Appel à contribution
Création d'autres clients
Client Amélioration visuelle du client web
Fourniture d'un client final
Doc sur la création de clients
T-2 T0 T2 T4 T6 T8 T10 T12
Notes de l'éditeur
Mot interdit : récupérer => annoter Expliciter les uri à l'oral
Bien expliciter que les soltuions sont trop limité sans base de connaissances expliquer bien clair Y passer du temps !
Bien expliciter que les soltuions sont trop limité sans base de connaissances expliquer bien clair Y passer du temps !
Bien expliciter que les soltuions sont trop limité sans base de connaissances expliquer bien clair Y passer du temps !
Web de données Déléguer la gestion des connaissances à l'ordinateur Pour cela on tente de lier toutes les donnés entre elles pour permettre aux ordinateurs d'y acceder Ici on a un graphe qui représente tous les liens actuels de données visibles sur le web. Au centre wikipedia qui est le plus gros fournisseur d'URIs concepts On a aussi sur le graphe d'autres entités qui y sont liés
Web de données Déléguer la gestion des connaissances à l'ordinateur Pour cela on tente de lier toutes les donnés entre elles pour permettre aux ordinateurs d'y acceder Ici on a un graphe qui représente tous les liens actuels de données visibles sur le web. Au centre wikipedia qui est le plus gros fournisseur d'URIs concepts On a aussi sur le graphe d'autres entités qui y sont liés
Récupération de flux RSS standards
Expliciter le faite qu'on bosse sur des URIs
Expliciter enormément que les 2 parties fonctionnent une apres l'autre Asynchrone On annote