Mettre de l'intelligence dans les donnees liees

525 vues

Publié le

Seminar at LIRIS, Lyon, France on 02/12/2014

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
525
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
15
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Mettre de l'intelligence dans les donnees liees

  1. 1. METTREDE L'INTELLIGENCE DANSLESDONNÉES LIÉES MATHIEUD'AQUIN-@MDAQUIN KNOWLEDGEMEDIAINSTITUTE,THEOPEN UNIVERSITY
  2. 2. Le web des données liées c'est bien....
  3. 3. Le web des données liées c'est bien.... Pourvoir en faire quelques chose, c'est mieux !
  4. 4. LEWEBDESDONNÉESLIÉESC'ESTBIEN....
  5. 5. LEWEBDESDONNÉESLIÉESC'ESTBIEN....
  6. 6. EXEMPLE:DATA.OPEN.AC.UK
  7. 7. EXEMPLE:DATA.OPEN.AC.UK Cours: 600 module de cours + nivaux, crédits, sujets, etc. Publications: 30,000 articles de recherche + auteurs, conférences, etc. Podcasts: 2220 podcasts video et 1500 podcats audio + liens vers les cours, etc. Ressources éducationnelles ouvertes: 640 unités + liens vers les cours, etc. Videos Youtube: 900 videos + liens vers les cours et les checheurs Bâtiments: 100 Bâtiments + address et photos Bibliothèque: 12,000 livres + liens vers les cours Others...
  8. 8. EXEMPLE:DATA.OPEN.AC.UK Applications: "Study at the OU", "OU Buildings", "OU Anywhere", "Facebook Course Profile", etc.
  9. 9. EXEMPLE:DATA.OPEN.AC.UK Un autre exemple d'application, un peu moins simple : inscription aux course de différents sujets, a diffèrent endroits
  10. 10. PLUSD'INTELLIGENCE? Données Données liées Web Sémantique
  11. 11. EXEMPLE:RECOMMANDATION Version simple
  12. 12. EXEMPLE:RECOMMANDATION Quand les resources sont hétérogènes...
  13. 13. EXEMPLE:RECOMMANDATION Quand les resources sont hétérogènes...
  14. 14. EXEMPLE:RECOMMANDATION Quand les resources sont hétérogènes...
  15. 15. EXEMPLE:RECOMMANDATION-DISCOU( )DISCOU.INFO d'Aquin et al, demo @ ISWC 2012
  16. 16. EXEMPLE:RECOMMANDATION-DISCOU( )DISCOU.INFO
  17. 17. EXEMPLE:RECOMMANDATION-DISCOU( )DISCOU.INFO
  18. 18. EXEMPLE:RECOMMANDATION-DISCOU( )DISCOU.INFO
  19. 19. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO Explaining Patterns with Linked Data Tiddi et al. @ ESWC 2014 et COLD 2014
  20. 20. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays Pays où les hommes ont plus d'éducation ; les femmes ; égalité
  21. 21. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays Pays où les hommes ont plus d'éducation en jaune; les femmes en bleue; égalité en verts
  22. 22. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO
  23. 23. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO
  24. 24. (i.e. un chemin de relations, et une valeur) qui sont les plus représentative du cluster (maximum F-Score). Difficulté : On ne connaît pas le graphe à l'avance - il faut le construire au fur et à mesure de l'exploration EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO Principe : Un algorithme A* qui recherche les règles de la forme X - p1 - p2-...- pn - valeur -> inCluster(X)
  25. 25. EXEMPLEPLUSAVANCÉ:DEDALO( )LINKEDU.EU/DEDALO Aider nous a evaluer Dedalo: linkedu.eu/dedalo/eval/
  26. 26. GOINGMETA Pour exploiter les données du Web, il ne fait pas seulement raisonner avec les données, mais aussi raisonner sur les données.
  27. 27. EXEMPLE:CATALOGUELINKEDUPDEDONNÉESWEBLIEESÀ L'ENSEIGNEMENT data.linkededucation.org/linkedup/catalog/
  28. 28. ANALYSEDESRELATIONSENTREJEUXDEDONNÉES Avant alignement
  29. 29. ANALYSEDESRELATIONSENTREJEUXDEDONNÉES Après alignement d'Aquin et al. @ WebSci 2013
  30. 30. ANALYSEDESRELATIONSENTREJEUXDEDONNÉES Après alignement
  31. 31. POURQUOIC'ESTIMPORTANT? EXAMPLEDU"DATAHUB"DUPROJETMK:SMART ( )MKSMART.ORG
  32. 32. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  33. 33. Triangulation a partir de plusieurs capteurs EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  34. 34. Simple analyse statistique EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  35. 35. Simple analyse statistique EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  36. 36. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  37. 37. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  38. 38. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  39. 39. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  40. 40. EXEMPLEDECAPTEURS:MESURERL'UTILISATIONDES LOCAUXAVECDUWIFI
  41. 41. AUNIVEAUDU"DATAHUB"
  42. 42. ODRL pour la représentation structurées de licences de données POINTDEDÉPART:META-DONNÉES STRUCTURÉES
  43. 43. DataNode pour la representation des relations entre jeux de donnees - POINTDEDÉPART:META-DONNÉES STRUCTURÉES http://purl.org/datanode/ns/
  44. 44. POINTDEDÉPART:META-DONNÉES STRUCTURÉES
  45. 45. Permet la propagation de meta-caractéristiques comme les droits et conditions d'utilisation. POINTDEDÉPART:META-DONNÉES STRUCTURÉES
  46. 46. UNDERNIEREXEMPLEDE RAISONNEMENTMETA MESURERLEBIAISDANSLEDONNÉES Selon WikiPedia (anglais): "A statistic is biased if it is calculated in such a way that it is systematically different from the population parameter of interest."
  47. 47. UNDERNIEREXEMPLEDE RAISONNEMENTMETA MESURERLEBIAISDANSLEDONNÉES Selon WikiPedia (anglais): "A statistic is biased if it is calculated in such a way that it is systematically different from the population parameter of interest." Hypothèse : Toute donnée sur le web est biaisée - avoir conscience de ce biais est important
  48. 48. UNDERNIEREXEMPLEDE RAISONNEMENTMETA MESURERLEBIAISDANSLEDONNÉES Selon WikiPedia (anglais): "A statistic is biased if it is calculated in such a way that it is systematically different from the population parameter of interest." Hypothèse : Toute donnée sur le web est biaisée - avoir conscience de ce biais est important. Mais comment mesurer un biais sans connaître la population de référence?
  49. 49. MESURERLEBIAISDANSLEDONNÉES Compare les distributions de valeurs dans la projection du jeu de données à tester sur un jeu de données lié avec les distributions dans l'ensemble du jeu de données. Utilise le test de Student (test t) pour tester la signification des différences de distributions. Tiddi et al. @ EKAW 2014
  50. 50. MESURERLEBIAISDANSLEDONNÉES Sur cet exemple, S est la projection de LMDB (Linked Movie Database) sur DBpedia. Tiddi et al. @ EKAW 2014
  51. 51. MESURERLEBIAISDANSLEDONNÉES Quelques résultats peu surprenants... Tiddi et al. @ EKAW 2014
  52. 52. MESURERLEBIAISDANSLEDONNÉES Et d'autres un peu plus... Tiddi et al. @ EKAW 2014
  53. 53. CONCLUSION/FUTUR Le web sémantique avant: La promesse d'un web intelligent, avec du sens et des raisonnements Le web sémantique maintenant: Des données, des fois liées Aller vers de nouvelles forme de raisonnement qui s'adaptent aux caractéristiques des données liées et qui font émerger le sens !
  54. 54. MERCI Alessandro Adamou Enrico Daga Ilaria Tiddi Shuangyan Liu Keerthi Thomas Enrico Motta

×