Nous avons produit plus
d'informations en 2012
que pendant 5000 ans
(4 millions de Tera octets)
INFOBÉSITÉ
Un outil de filtrage automatique de
news, puissant et simple pour
organiser, à faible coût, votre veille
sur      
R...
READOR :PROCESSUSDEVEILLE
 
 

EXTRACTION
DES DONNEES
FILTRAGE
SEMANTIQUE

CREATION
DE VOS
JOURNAUX
GENERATION
DE TA...
RETOURD'EXPERIENCE
FONCTIONNEL
“Où est l'utilité des technos. sémantiques ? ”
TECHNIQUE
“ Est-ce que ça marche bien ? ”
RETOURD'EXPERIENCE
FONCTIONNEL
“Où est l'utilité des technos. sémantiques ? ”
TECHNIQUE
“ Est-ce que ça marche bien ? ”
RETOURD'EXPERIENCEFONCTIONNEL
●Suppression du bruit plus poussée
– Basé sur du TAL pour pour effectuer la
reconnaissance d...
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
EXEMPLEDERECHERCHE#BIGDATA
RETOURD'EXPERIENCEFONCTIONNEL
●Suppression du bruit plus poussée
– Basé sur du TAL pour pour effectuer la reconnaissance d...
EXEMPLEDAVIDCAMERON
EXEMPLEDAVIDCAMERON
EXEMPLEDAVIDCAMERON
EXEMPLEDAVIDCAMERON
EXEMPLEDAVIDCAMERON
EXEMPLEDAVIDCAMERON
RETOURD'EXPERIENCEFONCTIONNEL
●Suppression du bruit plus poussée
– Basé sur du TAL pour pour effectuer la reconnaissance d...
Langagesdeprogrammation
INFERENCES
Langagesdeprogrammation
INFERENCES
programmationdeLangages
Web 2.0
Langagesdeprogrammation
Langages
Web 3.0
Langages de programmation
Java Python Rails
INFERENCES
DBpedia
programmationdeLan...
IncubateurPaca-Est
EstPacaIncubateur
Web 2.0 Web 3.0
Incubateur Paca Est
INFERENCES
Accompagne
Entreprises
France Labs
Aza...
INFERENCES SURREADOR
“ Où est l'utilité des technos. sémantiques ? ”
“Oùestl'utilitédestechnos.sémantiques ? ”
STRUCTURER
La donnée
& ENRICHIR
“ Où est l'utilité des technos. sémantiques ? ”
RETOURD'EXPERIENCE
FONCTIONNEL
“Où est l'utilité des technos. sémantiques ? ”
TECHNIQUE
“ Est-ce que ça marche bien ? ”
COTÉDATA
 Déjà 22 millions de données traitées
 Plus de 300 millions de triplets
 4 serveurs : 150 Go de RAM et 20 cœurs
SGBDSÉMANTIQUE :VIRTUOSO
●Actuellement en prod. chez Wikipedia
●Quasiment la totalité chargée en RAM => 100Go alloués
●De ...
GÉNÉRATIONDESREQUÊTES
PREFIX RSS: <http://purl.org/rss/1.0/>
SELECT * WHERE{
SELECT DISTINCT(?concept),?pubDateTime,
CONCA...
RETOURD'EXPERIENCE
FONCTIONNEL
“Où est l'utilité des technos. sémantiques ? ”
TECHNIQUE
“ Est-ce que ça marche bien ? ”
christophe@reador.net
07 62 59 64 17
@descl3
@readornet
Retour d'expérience Reador sur le #WebSem sophiaconf2014
Retour d'expérience Reador sur le #WebSem sophiaconf2014
Retour d'expérience Reador sur le #WebSem sophiaconf2014
Prochain SlideShare
Chargement dans…5
×

Retour d'expérience Reador sur le #WebSem sophiaconf2014

1 010 vues

Publié le

Publié dans : Internet
0 commentaire
4 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 010
Sur SlideShare
0
Issues des intégrations
0
Intégrations
22
Actions
Partages
0
Téléchargements
8
Commentaires
0
J’aime
4
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Retour d'expérience Reador sur le #WebSem sophiaconf2014

  1. 1. Nous avons produit plus d'informations en 2012 que pendant 5000 ans (4 millions de Tera octets)
  2. 2. INFOBÉSITÉ
  3. 3. Un outil de filtrage automatique de news, puissant et simple pour organiser, à faible coût, votre veille sur       READOR
  4. 4. READOR :PROCESSUSDEVEILLE      EXTRACTION DES DONNEES FILTRAGE SEMANTIQUE  CREATION DE VOS JOURNAUX GENERATION DE TAGS 
  5. 5. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  6. 6. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  7. 7. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants
  8. 8. EXEMPLEDERECHERCHE#BIGDATA
  9. 9. EXEMPLEDERECHERCHE#BIGDATA
  10. 10. EXEMPLEDERECHERCHE#BIGDATA
  11. 11. EXEMPLEDERECHERCHE#BIGDATA
  12. 12. EXEMPLEDERECHERCHE#BIGDATA
  13. 13. EXEMPLEDERECHERCHE#BIGDATA
  14. 14. EXEMPLEDERECHERCHE#BIGDATA
  15. 15. EXEMPLEDERECHERCHE#BIGDATA
  16. 16. EXEMPLEDERECHERCHE#BIGDATA
  17. 17. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants ●Enrichissement des tweets ●Lien avec d'autres bases de connaissances – Grâce à Wikipedia/DBpedia – Inférences
  18. 18. EXEMPLEDAVIDCAMERON
  19. 19. EXEMPLEDAVIDCAMERON
  20. 20. EXEMPLEDAVIDCAMERON
  21. 21. EXEMPLEDAVIDCAMERON
  22. 22. EXEMPLEDAVIDCAMERON
  23. 23. EXEMPLEDAVIDCAMERON
  24. 24. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants ●Enrichissement des tweets ●Lien avec d'autres bases de connaissances – Grâce à Wikipedia/DBpedia – Inférences
  25. 25. Langagesdeprogrammation INFERENCES
  26. 26. Langagesdeprogrammation INFERENCES programmationdeLangages Web 2.0
  27. 27. Langagesdeprogrammation Langages Web 3.0 Langages de programmation Java Python Rails INFERENCES DBpedia programmationdeLangages Web 2.0
  28. 28. IncubateurPaca-Est EstPacaIncubateur Web 2.0 Web 3.0 Incubateur Paca Est INFERENCES Accompagne Entreprises France Labs Azameo Reador.NET Baseinterne Sophia Antipolis Biot Valbonne DBpedia Lieu Toulon Nice
  29. 29. INFERENCES SURREADOR
  30. 30. “ Où est l'utilité des technos. sémantiques ? ”
  31. 31. “Oùestl'utilitédestechnos.sémantiques ? ” STRUCTURER La donnée & ENRICHIR “ Où est l'utilité des technos. sémantiques ? ”
  32. 32. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  33. 33. COTÉDATA  Déjà 22 millions de données traitées  Plus de 300 millions de triplets  4 serveurs : 150 Go de RAM et 20 cœurs
  34. 34. SGBDSÉMANTIQUE :VIRTUOSO ●Actuellement en prod. chez Wikipedia ●Quasiment la totalité chargée en RAM => 100Go alloués ●De nombreuses journées de config des options... ●Encore en dev...
  35. 35. GÉNÉRATIONDESREQUÊTES PREFIX RSS: <http://purl.org/rss/1.0/> SELECT * WHERE{ SELECT DISTINCT(?concept),?pubDateTime, CONCAT( ?filter272,?filter273,?filter274 ) AS ?filtersVals FROM <http://zone-project.org/datas/items> FROM <http://zone-project.org/datas/sources> WHERE { ?concept RDF:type RSS:item. { ?concept <http://zone-project.org/model/plugins/twitter#hashtag> "#bigdata".} ?concept ?filter275 <http://dbpedia.org/resource/Machine_learning>. ?concept ?filter276 <http://dbpedia.org/resource/Python_(programming_language)>. OPTIONAL { ?concept ?filter272 <http://dbpedia.org/resource/Apache_Hadoop>.} OPTIONAL { ?concept ?filter273 <http://dbpedia.org/resource/Java(programming_language)>. } OPTIONAL { ?concept ?filter277 <http://dbpedia.org/resource/International_Business_Machines>}. FILTER (!bound(?filter277)) ?concept RSS:pubDateTime ?pubDateTime. } } ORDER BY DESC(?pubDateTime) LIMIT 10 OFFSET 0
  36. 36. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  37. 37. christophe@reador.net 07 62 59 64 17 @descl3 @readornet

×