Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Séminaire Inria IST - Référentiels et interoperabilité (2)

3 188 vues

Publié le

Présentation pour le Séminaire IST organisé par Inria : http://www.inria.fr/actualite/agenda/document-numerique

Publié dans : Technologie
  • I have always found it hard to meet the requirements of being a student. Ever since my years of high school, I really have no idea what professors are looking for to give good grades. After some google searching, I found this service ⇒ www.HelpWriting.net ⇐ who helped me write my research paper. The final result was amazing, and I highly recommend ⇒ www.HelpWriting.net ⇐ to anyone in the same mindset as me.
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download Full EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download Full doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book THIS can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer THIS is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story THIS Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money THIS the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths THIS Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • DOWNLOAD THAT BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { http://shorturl.at/mzUV6 } ......................................................................................................................... Download Full EPUB Ebook here { http://shorturl.at/mzUV6 } ......................................................................................................................... Download Full doc Ebook here { http://shorturl.at/mzUV6 } ......................................................................................................................... Download PDF EBOOK here { http://shorturl.at/mzUV6 } ......................................................................................................................... Download EPUB Ebook here { http://shorturl.at/mzUV6 } ......................................................................................................................... Download doc Ebook here { http://shorturl.at/mzUV6 } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book that can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer that is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story That Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money That the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths that Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • DOWNLOAD THAT BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download Full EPUB Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download Full doc Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download EPUB Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download doc Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book that can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer that is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story That Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money That the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths that Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici

Séminaire Inria IST - Référentiels et interoperabilité (2)

  1. 1. Référentiels et interoperabilité (2) Antoine Isaac Europeana & Vrije Universiteit Amsterdam Séminaire INRIA IST Carnac, 2 Octobre 2012
  2. 2. Interopérabilité des éléments de données• Objectif: passer de données exprimées avec un jeu d’éléments de données à un autre jeu• Typiquement, relier classes et propriétés de deux ontologies – owl:equivalentClass, owl:equivalentProperty – rdfs:subClassOf, rdfs:subPropertyOf – Axiomes « ad hoc » edm:Agent rdfs:subClassOf [ rdf:type owl:Restriction ; owl:maxCardinality "1"^^xsd:nonNegativeInteger ; owl:onProperty rdaGr2:dateOfBirth ].
  3. 3. Idéalement: réutiliser un maximum de référentielsExemple: EDM http://lov.okfn.org/dataset/lov/details/vocabulary_edm.html
  4. 4. Idéalement: réutiliser un maximum de référentielsDelacroix en EDM<http://www.mied.fr/personne/Eugene_Delacroix> rdf:type edm:Agent ; foaf:name "Eugène Delacroix" ; skos:altLabel " Ferdinand Victor Eugène Delacroix" ; rdaGr2:dataOfBirth "26 avril 1798" .
  5. 5. Application ProfilesDublin Core Singapore Framework http://dublincore.org/documents/singapore-framework/
  6. 6. Leçons pour la réutilisation d’éléments de donnéesPoints cruciaux :• Accessibilité technique (Linked Data)• Documentation Le support institutionnel est crucial• Bonne interconnection - Eviter la duplication• Réponse à des besoins spécifiques (requirements), pas seulement des problèmes philosophiques• Nécessité de “cartographier” l’offre disponible Cf. Linked Open vocabularies: http://lov.okfn.org/dataset/lov/
  7. 7. En pratique: alignement post hoc• Souvent la roue a déjà été inventée, quelque part• Mais elle n’était peut-être pas belle…• Et/ou pas vraiment adaptée à votre besoin Cas des ontologies applicatives ou de sous-domaines Privilégier une élément d’un jeu particulier peut être contre-productifMalheureusement beaucoup sont encore réticents à assembler leur jeux d’éléments en recyclant directement des vocabulaires existants
  8. 8. Scenario EuropeanaCorrespondance entre éléments “locaux” utilisés par les fournisseurs et EDM EDM property - “Original” property -
  9. 9. Comment ?• En général les fournisseurs voudront créer le mapping eux mêmes – Travail ardu, mais la précision est cruciale – Beaucoup ont déjà l’expérience• Pas d’instruction sur comment le réaliser Plus tard: inférence en utilisant des axiomes OWL, matérialisation par requête SPARQL CONSTRUCT Pour l’instant: n’importe quelle feuille de style XSLT ou script XML- >EDM/XML
  10. 10. OutillageMINT: http://mint.image.ece.ntua.gr/
  11. 11. Outillage• Autres projets liés à Europeana PrestoPrime prestoprime.joanneum.at EuropeanaConnect semanticweb.cs.vu.nl/xmlrdf• Context plus général R2R www4.wiwiss.fu-berlin.de/bizer/r2r Datalift datalift.org …
  12. 12. Intéropérabilité des vocabulaires de valeurs Provient d’un jeu d’éléments de données / ontologieProvient d’un vocabulaire contrôlé 12
  13. 13. Intéropérabilité des vocabulaires de valeurs• Requiert l’alignement des éléments de données utilisés pour chacun des vocabulaires, ou la conversion vers un jeu d’élément pivots (par ex. SKOS)• Requiert la détection d’équivalences « sémantiques » entre concepts
  14. 14. Créer un réseau d’équivalences
  15. 15. DemoConcepts equivalents• American LCSH http://id.loc.gov/authorities/subjects/sh85145447• French RAMEAU http://data.bnf.fr/ark:/12148/cb11931913j• German SWD http://d-nb.info/gnd/4064689-0• STW http://zbw.eu/stw/descriptor/14188-0• DBPedia http://dbpedia.org/resource/Water
  16. 16. SKOS mappings KOS 2:KOS 1: animalanimals humancats objectwildcats
  17. 17. Un problème difficileL’alignement manuel de vocabulaires demande beaucoup de travail• LCSH, RAMEAU et SWD alignés dans le projet MACS• SWD et Dewey alignés dans le projet CRISS-CROSSProblème: taille, langue, différence d’approchesLe crowdsourcing n’a pas encore été expérimenté pour des vocabulaires experts
  18. 18. Techniques d’alignement automatiques• Lexicales• Structurelles• Connaissances de contexte• ExtensionnellesSémantique et interopérabilité
  19. 19. Alignement lexical • Utilise les libellés des concepts, définitions… exactMatch chat chat exactMatch chats chat exactMatch cat chat broaderMatch Barque barque avancée à la percheWeb Sémantique etInteropérabilité desVocabulaires Conceptuels
  20. 20. Alignement structurel “Objet” “Objet” “Oeuvre” “Création” “Livre” “Livre”Thesaurus 1 Thesaurus 2
  21. 21. Connaissances de contexteExploitation des liens d’une référence partagée Référentiel de contexte “Publication” “Calendar”Thesaurus 1 Thesaurus 2
  22. 22. Extensionnelles Utilisant les ressources décrites avec les vocabulaires de valeursThesaurus 1 Thesaurus 2 Néerlandais Litérature néerlandaise
  23. 23. Combiner des techniques: AMALGAME• Do not try to make the tool smart – use simple atomic matching components – fast, scalable, with predictable and understandable results• Empower domain experts by interactive iteration loop – try most promising component(s) – analyze the results – decide on next step: • discard results from last attempt • refine current results to improve precision • look for more results to improve recall http://semanticweb.cs.vu.nl/amalgame/ 23
  24. 24. Amsterdam Museum case, http://semanticweb.cs.vu.nl/lod/am/
  25. 25. Alignement: pas de solution triviale• Ces techniques permettent d’obtenir des résultats STW, AGROVOC…• Mais seules, elles ne suffisent pas Combinaison avec travail manuel (vérification, complétion)• L’alignement est un problème de recherche difficile• La R&D s’est surtout concentrée sur les ontologies• Le Web de données change la donne Des outils pour jeux de données sont dévoloppés, e.g., SILK www4.wiwiss.fu-berlin.de/bizer/silk/
  26. 26. Un problème général d’alignementhttp://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
  27. 27. Un problème général d’alignement• Les vocabulaires de valeurs sont des jeux de données, d’un point de vue technique• Ils sont plus « réguliers » que les jeux de données généraux Une sous-famille utilisant SKOS comme ontologie• Des techniques similaires sont appliquées aux ontologies, valeurs de vocabulaires et autres jeux de données, même si les caractéristiques des référentiels et les besoins en relations sont différents
  28. 28. Des challenges de haut niveau
  29. 29. Sparse linkage: the LD cloud[Cyganiak, Jentzsch] http://linkeddata.org/
  30. 30. Sparse of linkage: another view [Guéret, 2010] http://blog.larkc.eu/?p=1941
  31. 31. Stratégies d’alignement ?
  32. 32. Stratégie pivot vs. alignement par paire Backbone, hub-and-spoke [BS8723]
  33. 33. Guidage par la communauté ?http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
  34. 34. Guidage par la communauté ?• Liens entre ressources spécifiques aux bibliothèques VIAF, LCSH, Dewey, UDC, Worldcat, PND…• Liens de/vers des ressources plus générales – Musées, archives – Coommunauté scientifique: données de recherche – Editeurs – Europeana et autres aggrégateurs
  35. 35. Critères de sélectionExemple: EuropeanaConnect• Pertinence institutionnelle, par rapport aux collections• Adequation du type de ressources (lieux, sujets, personnes…) à l’application• “Qualité” – Grain conceptuel et couverture – Couverture lexicale – langues – Couverture et précision des liens sémantiques• Licenses
  36. 36. Flexibiliser l’approche pivot ?• Aligner des ressources petites et spécialisées à des ressources plus grandes et générales, multi-lingues et/ou largement adoptées• Des ressources plus spécialisées pourraient être retenues comme points d’ancrage, en fonction des domaines et des alignement existants• Plusieurs ressources complémentaires, d’importance comparable, pourraient ensemble jouer le rôle de pivot – La combinaison LCSH-RAMEAU-SWD-etc. peut jouer pour les sujets un rôle similaire à VIAF – Il est possible d’aligner des vocabulaires spécifiques à l’un ou l’autre
  37. 37. Flexibiliser l’approche pivot ?Les outils d’alignment doivent supporter des stratégies flexibles, avec essais et erreurs
  38. 38. Quels types de liens ?Beaucoup d’ontologies proposent des liens d’équivalence sémantique pour des instances de classes• owl:sameAs• skos:exactMatch, skos:closeMatch• skos:broadMatch, narrowMatch & relatedMatch• umbel:isLike• ore:isSimilarTo• foaf:focus…
  39. 39. Problèmes d’application des liens : owl:sameAs• En principe, deux URIs liées par owl:sameAs partagent automatiquement ex:a name “Antoine Isaac” . ex:b owl:sameAs ex:a . implique ex:b name “Antoine Isaac” .• En pratique, owl:sameAs est appliqué entre des ressources qui ne sont que “très similaires” Une même ressource, mais dans differents contextes
  40. 40. Problèmes d’application des liens : owl:sameAs• Par ex., première version de data.nytimes.com http://data.nytimes.com/60694995023816375851 dcterms:rightsHolder The New York Times Company . http://data.nytimes.com/60694995023816375851 owl:sameAs http://dbpedia.org/resource/Park_Slope%2C_Brooklyn .• Quelles conséquences? On peut se contenter de ne pas “appliquer” la sémantique de owl:sameAs
  41. 41. Bonnes pratiques (1)Regarder ce qui est aligné Concepts ou autorités vs. documents vs. entités “du monde réel” (personnes, lieux…)Tenir compte de comment ça a été aligné Co-reference exacte obtenue par reconnaissance d’identifiants uniques vs. similarité (incl. équivalence) dérivée de libellés ou relations sémantiques Représenter les données sur l’alignment et/ou la correspondance individuelle est une option
  42. 42. Au-delà des liens simplesPour des besoins spécifiques, on peut représenter des alignments et leur provenance de façon très fine http://alignapi.gforge.inria.fr/edoal.html
  43. 43. Bonnes pratiques (2)Minimiser l’engagement sémantique des liens utilisés • skos:exactMatch est transitive: les concepts liés peuvent être échangés en toute généralité, par ex. pour des applications de recherche d’information • skos:closeMatch n’est pas transitive, pour représenter un lien qui ne se “propage” pas dans les cas où plus de deux vocabulaires sont alignés de manière approximativeTenir compte de l’application de l’alignement • SKOS implique un “contexte d’application” des alignements • La qualité d’un alignement dépend aussi du type d’application qui l’emploie !
  44. 44. Evaluation spécifique à une application Campagne Ontology alignment Evaluation Initiative 2007 3 outils évalués suivant deux scénarios: “fusion de thesaurus” et “ré-indexation de livres”100% 100%90% 90%80% 80%70% 70%60% Falcon 60% Falcon50% Silas 50% Silas40% DSSim 40% DSSim30% 30%20% 20%10% 10% 0% 0% Precision Coverage Pa Ra
  45. 45. Evaluation spécifique à une applicationCas: 2 thesauri à la bibliothèque nationale des Pays-Bas: GTT and Brinkman• Pour la fusion de thesaurus, gtt:excavation doit être aligné avec brinkman:excavation• Pour la ré-indexation, gtt:excavation doit être aligné avec brinkman:archeology_netherlands
  46. 46. Applications d’alignementsPar exemple:• Recherche à base de concepts• Ré-indexation de livres• Fusion de thesaurus• Integration d’un thesaurus dans un autre• Recherche plein texte• NavigationSuggère l’utilisation des correspondences et l’information qu’elles devraient fournir
  47. 47. Prédiction de sujets à la KBPoint de départ• 2 collections• Chacune indexée par son propre thesaurus
  48. 48. Prédiction de sujets à la KBRé-indexation• But: avoir les livres d’une collection décrits avec le thesaurus de la seconde• Par ex: si un thesaurus est abandonné, les livres doivent être indexés avec l’autre
  49. 49. Ré-indexation de livresConvertir index source en un système d’indexation cible
  50. 50. Prototype Dans le projet STITCH • Etant donnés des index NND/Biblion, prédire un index Brinkman • Mix de techniques – Lexicales – Statistiques, utilisant 240000 livres communs, très spécifique au scénario • Integration dans le logiciel de catalogage • Etude utilisateurs (catalogueurs)STITCH final event
  51. 51. Règles de prédiction de sujetsSource combination → target concept Confidence Correct books level / TotalDGP:Jeugd fictie; vanaf 13 jaar + KAR:Stripverhaal → 0.995 182/182BTR:stripverhalenLTR:Reisgidsen + LTR:Spanje → 0.982 50/50BTR:Spanje ; reisgidsenLTR:Liefde + AUT:Jeanette Winterson → 0.540 1/1romans en novellen ; vertaaldLTR:Bouwkunde → BTR:leermiddelen ; bouwtechniek 0.196 25/123 Les techniques d’alignment extensionnelles prennent en compte les variation d’usage et peuvent être très utiles pour des applications spécifiques
  52. 52. Conclusions• Des solutions techniques qui permettent de résoudre des problèmes, mais mettent en valeur là où la difficulté se pose vraiment – Interopérabilité et contexte – Applications et requirements• Il semble qu’il y ait besoin de professionnels de l’information ! – Sélection de ressources – Alignement manuel et semi-automatique – Relation aux application• Focus de cette présentation : pas les outils, mais un contexte pour juger les outils
  53. 53. Merci !aisaac@few.vu.nlEuropeanaConnect WP1 @ VU Amsterdam Jacco van Ossenbruggen, Victor de Boer, Jan Wielemaker, Guus SchreiberEquipe projet STITCH: Lourens van der Meij, Shenghui Wang, Stefan Schlobach, Frank van Harmelen, Henk Matthezing, Claus Zinn

×