Exploiter les données issues de WikipediaRobert Viseur
Wikipedia est un projet collaboratif de référence. Il s’agit aussi d’un formidable réservoir de données, utilisable par exemple pour des applications reposant sur les technologies du Web sémantique (DBpedia).
Cette conférence proposera un cas pratique d’extraction et d’intégration de données biographiques, ainsi que les résultats d’une évaluation de la qualité des données.
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Atelier JDEV2017 : initiation à SPARQL avec Wikidata
Cet atelier a pour objectif de vous montrer comment dans l’avenir un étudiant et un chercheur (et demain les machines) vont naviguer dans le Linked Data (Web des données) à l’aide du langage SPARQL. Nous utiliserons un outil d'auto-complétion qui facilitera la création de votre première requête. Nous utiliserons le logiciel http://LinkedWiki.com afin d’écrire et partager les requêtes des participants de l’atelier ou bien https://io.datascience-paris-saclay.fr/map.php si le participant est membre de cette université.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
Exploiter les données issues de WikipediaRobert Viseur
Wikipedia est un projet collaboratif de référence. Il s’agit aussi d’un formidable réservoir de données, utilisable par exemple pour des applications reposant sur les technologies du Web sémantique (DBpedia).
Cette conférence proposera un cas pratique d’extraction et d’intégration de données biographiques, ainsi que les résultats d’une évaluation de la qualité des données.
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Atelier JDEV2017 : initiation à SPARQL avec Wikidata
Cet atelier a pour objectif de vous montrer comment dans l’avenir un étudiant et un chercheur (et demain les machines) vont naviguer dans le Linked Data (Web des données) à l’aide du langage SPARQL. Nous utiliserons un outil d'auto-complétion qui facilitera la création de votre première requête. Nous utiliserons le logiciel http://LinkedWiki.com afin d’écrire et partager les requêtes des participants de l’atelier ou bien https://io.datascience-paris-saclay.fr/map.php si le participant est membre de cette université.
Slides de l'atelier JDEV2017 : SPARQL, avancé
Vous saurez après cet atelier : lire un document RDF écrit en Turtle, découvrir une ontologie au travers d’un service SPARQL et lire la documentation officielle de SPARQL.
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
Le monde universitaire est producteur de données de différentes natures. L'ouverture et le partage de chaque type de données introduit des problématiques spécifiques. Cette variété s'explique en premier lieu par les situations particulières qui ont gouverné leur création. Mais les enjeux d'utilisation, par les communautés universitaires, les communautés de chercheurs ou la société en général, diffèrent aussi suivant chaque type de données.
Nous évoquerons brièvement un premier type de données, celles pédagogiques, en lien avec le mouvement en accès libre intitulé Open Educational Ressources (OER). Le second type de données, cette fois faisant partie du résultat de la recherche, concerne les publications. Notre communication rappellera brièvement, afin de mieux les distinguer du dernier type de données, les contraintes particulières qui ont motivé le développement de l'accès libre (open access) aux publications, les différentes voies suivies, l'état actuel après plus de 10 ans d'existence. L'essentiel de notre propos sera consacré au partage des données de la recherche, qui peuvent ou non être reliées aux publications. Nous décrirons les motivations de ce mouvement OpenData, les enjeux pour les chercheurs, les conditions particulières de mise à disposition que devront avoir ces données pour être réellement OpenData. Nous évoquerons enfin les transformations profondes du métier de chercheur qui peuvent en résulter, en nous appuyant sur des exemples provenant principalement des sciences humaines.
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
Le web sémantique, théorisé il y a déjà longtemps par Tim Berners-Lee, a tardé à prendre son envol. Mais aujourd'hui la vague est là et les premiers à la surfer sont les grands acteurs du web, comme Google qui bâtit son Knowledge Graph. Les standards sont aujourd'hui matures, et des organisations de toutes tailles les mettent en oeuvre dans des projets concrets, avec un vrai retour sur investissement. Cependant faire une application à l’aide des technologies du Web Sémantique peut s’avérer être une tâche fastidieuse pour ceux qui souhaitent découvrir ce domaine. De nombreuses questions restent souvent en suspens. Quel est le rôle des ontologies ? Pourquoi utiliser RDF et SPARQL ? Qu’est ce qu’un triplestore et comment l’exploiter ? Comment tirer parti du Web de données pour enrichir ses données métier à l'aide de ces outils ? Autant de questions auxquelles nous essaieront de répondre à partir d’un exemple concret : les données de l'institution culturelle Les Champs Libres à Rennes.
Web sémantique et référentiels : l'avenir de l'image sur le WebAntidot
Diaporama de la présentation de Gautier Poupeau (Antidot) faite à l'occasion de la journée d'études : indexation, Web sémantique, Web de données organisée à l'Ecole nationale de la photographie d'Arles
Les outils du web en bibliotheque 2eme partieXavier Galaup
Diaporama présenté lors de la formation "Les outils du web au service des bibliothèques" à la BDP de la Haute-Saone les 9 et 10 mai 2011 à Vesoul (2eme partie)
محاضرة تم تقديمها من خلال قاعة إفتراضية تتبع الأكاديمية العربية للتعليم الإلكترونى بدبى وقدمها الدكتور عادل محمد خليفة خبير التعليم والنشر الإلكترونى فى مصر والعالم العبى وتتناول نظرة عامة حول النشر الإلكترونى وتتناول الندوة أيضا التعليم الإلكترونى حيث أت النشر يتناول أيضا نشر المناهج الإلكترونية التى يت تطويرها لأستخدامها فى أنظمة التعلم الإلكترونى
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
Le monde universitaire est producteur de données de différentes natures. L'ouverture et le partage de chaque type de données introduit des problématiques spécifiques. Cette variété s'explique en premier lieu par les situations particulières qui ont gouverné leur création. Mais les enjeux d'utilisation, par les communautés universitaires, les communautés de chercheurs ou la société en général, diffèrent aussi suivant chaque type de données.
Nous évoquerons brièvement un premier type de données, celles pédagogiques, en lien avec le mouvement en accès libre intitulé Open Educational Ressources (OER). Le second type de données, cette fois faisant partie du résultat de la recherche, concerne les publications. Notre communication rappellera brièvement, afin de mieux les distinguer du dernier type de données, les contraintes particulières qui ont motivé le développement de l'accès libre (open access) aux publications, les différentes voies suivies, l'état actuel après plus de 10 ans d'existence. L'essentiel de notre propos sera consacré au partage des données de la recherche, qui peuvent ou non être reliées aux publications. Nous décrirons les motivations de ce mouvement OpenData, les enjeux pour les chercheurs, les conditions particulières de mise à disposition que devront avoir ces données pour être réellement OpenData. Nous évoquerons enfin les transformations profondes du métier de chercheur qui peuvent en résulter, en nous appuyant sur des exemples provenant principalement des sciences humaines.
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
Présentation sur la démarche de l'Open Data (quelles données ? Quels acteurs ?) et sur les technologies gravitant autour du Linked Data (le modèle RDF, RDFS, OWL, les ontologies, les triplestores, etc).
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
Diaporama de la présentation faite à l'occasion du Co-lab Semantique organisé par le consortium Scribo. L'enjeu était de présenter en 45-60min les enjeux du Web sémantique.
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
Le web sémantique, théorisé il y a déjà longtemps par Tim Berners-Lee, a tardé à prendre son envol. Mais aujourd'hui la vague est là et les premiers à la surfer sont les grands acteurs du web, comme Google qui bâtit son Knowledge Graph. Les standards sont aujourd'hui matures, et des organisations de toutes tailles les mettent en oeuvre dans des projets concrets, avec un vrai retour sur investissement. Cependant faire une application à l’aide des technologies du Web Sémantique peut s’avérer être une tâche fastidieuse pour ceux qui souhaitent découvrir ce domaine. De nombreuses questions restent souvent en suspens. Quel est le rôle des ontologies ? Pourquoi utiliser RDF et SPARQL ? Qu’est ce qu’un triplestore et comment l’exploiter ? Comment tirer parti du Web de données pour enrichir ses données métier à l'aide de ces outils ? Autant de questions auxquelles nous essaieront de répondre à partir d’un exemple concret : les données de l'institution culturelle Les Champs Libres à Rennes.
Web sémantique et référentiels : l'avenir de l'image sur le WebAntidot
Diaporama de la présentation de Gautier Poupeau (Antidot) faite à l'occasion de la journée d'études : indexation, Web sémantique, Web de données organisée à l'Ecole nationale de la photographie d'Arles
Les outils du web en bibliotheque 2eme partieXavier Galaup
Diaporama présenté lors de la formation "Les outils du web au service des bibliothèques" à la BDP de la Haute-Saone les 9 et 10 mai 2011 à Vesoul (2eme partie)
محاضرة تم تقديمها من خلال قاعة إفتراضية تتبع الأكاديمية العربية للتعليم الإلكترونى بدبى وقدمها الدكتور عادل محمد خليفة خبير التعليم والنشر الإلكترونى فى مصر والعالم العبى وتتناول نظرة عامة حول النشر الإلكترونى وتتناول الندوة أيضا التعليم الإلكترونى حيث أت النشر يتناول أيضا نشر المناهج الإلكترونية التى يت تطويرها لأستخدامها فى أنظمة التعلم الإلكترونى
El documento habla sobre la situación crítica de los osos pandas. Actualmente solo quedan alrededor de 2000 ejemplares en China. Su principal fuente de alimento, el bambú, está disminuyendo debido a la tala masiva. Los pandas también tienen dificultades para reproducirse. Sin embargo, los esfuerzos de conservación están dando esperanzas de que la especie pueda salvarse en el próximo siglo. Organizaciones como el WWF y reservistas están trabajando para proteger a los pandas y su hábitat.
Julian Beever es un artista británico que se dedica a dibujar con tiza. Ha creado dibujos de tiza en 3D en el pavimento utilizando un método llamado anamorfosis que crea una ilusión óptica. Sus dibujos en las calles desafían las leyes de la perspectiva
The document discusses Maddy Pendergast and her future. In a few short sentences, it introduces Maddy and implies she is looking forward in a positive way towards what is to come. The brevity leaves many details unspecified but conveys an overall tone of optimism.
Este documento describe diferentes tipos de cuentas bancarias y productos de captación de recursos, incluyendo cuentas de ahorro, cuentas corrientes y certificados de depósito a término (CDT). Explica las características, beneficios y requisitos de apertura de cada uno.
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
La production, la consommation et l'échange de données s'intensifient et le besoin d'interopérabilité n'a jamais été aussi prégnant. Mais a-t-on encore le temps de développer des interfaces ou de mettre au point une langue commune entre acteurs ? A-t-on encore besoin de telles interfaces qui ne serviront peut-être qu’une fois ? Ou bien la solution n’est pas plutôt dans une data interopérable ? Le linked data n'est plus un Eldorado incertain, il est devenu une réalité aux dimensions vastes et en expansion mais encore méconnue.
Datalift est une plateforme tout-en-un productrice de linked data qui apporte une solution concrète et aisée. Les données à traiter sont captées dans leurs structures d'origine (fichiers, bases de données, requêtes, données géographiques, etc.). A l'aide de vocabulaires (thesaurus, ontologies), elles sont transformées pour faciliter leurs liaisons. Les fusions obtenues enrichissent mutuellement les sources en même temps qu’elles forment un ensemble de données liées (linked data) exploitables de multiples façons : requêtes, data visualisation, extractions, exports dans de nombreux formats. Ces opérations peuvent être réalisées sans programmation sur un socle open source de façon interactive, elles peuvent aussi être automatisées. La richesse fonctionnelle et technologique de Datalift fait que ses utilisateurs vont des simples utilisateurs aux datascientistes, mais aussi au dialogue machine to machine.
Le développement de la plateforme et son utilisation permettent aujourd'hui de dresser un premier regard rétrospectif que nous nous proposons de présenter en trois temps. Nous commencerons notre exposé par la démonstration d’une interconnexion de jeux de données hétérogènes rendue possible par un alignement d’ontologies. Cette démo visibilisera le caractère « tout-en-un » d’une plateforme qui s’installe en un clic. Nous poursuivrons par un survol de l’architecture de la plateforme. Nous terminerons par un triple retour d’expérience : méthodologique, architectural et usages.
De l'intelligence dans les données ouvertes - Problèmes et solutions dans les...Mathieu d'Aquin
Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013
Presentation at the Open Data workshop LIRMM
http://odrg.lirmm.fr/index.php/event-details?id=14
Journée d'étude "Evolutions des catalogues, évolutions des métiers, ce qui va changer dans nos établissements" le 29 mars 2013, proposée par le CRFCB en collaboration avec l'ABF Midi-Pyrénées
Depuis plusieurs années l’évolution des catalogues, l’arrivée de RDA, l’implémentation des FRBR alimentent les débats. Au-delà du jargon et des débats de spécialistes, il y a de vraies questions pour les bibliothèques, des enjeux importants pour l’avenir, des décisions qu’il convient d’anticiper et de préparer.
Cette journée a pour objectif de rappeler la réalité derrière des mots parfois abscons, souvent lointains, de souligner ce qui va changer dans nos établissements et les questions que soulèvent ces changements certes longs, parfois encore en instance mais auxquels tous les établissements devront demain se préparer...
Après une 1re journée organisée le 29 mars, l'ABF Midi-Pyrénées et le CRFCB Midi Pyrénées Languedoc Roussillon on proposé une 2e journée sur les enjeux organisationnels de l'arrivée de la norme RDA dans les bibliothèques, le 27 mai à Toulouse (Amphi Cujas, Université Toulouse 1, angle rue Lautmann et rue des puits creusés)
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
Foire aux questions - FAQ sur les donnnées de la recherche
Fiche créée en septembre 2015 et révisée en octobre 2016
Qu'est-ce que l'ouverture des données (Open Data) ?
Quelles données préserver ?
Où déposer mes données ?
Comment définir les conditions de réutilisation de mes données ?
Et si mes données sont déjà déposées dans les réseaux sociaux (ResearchGate, Academia...) ?
Qu'est-ce qu'un jeu de données ?
Où rechercher des jeux de données ?
Qu'est-ce qu'un DOI ?
Comment citer un jeu de données ?
Qu'est-ce qu'un PGD ?
A quelles questions répond un PGD ?
De quels outils je dispose pour rédiger un PGD ?
Avec qui interagir pour élaborer un PGD ?
L'éthique du partage et moi ?
Auteurs : Cécile Adamolle, Annabelle Filatre, Hanka Hensens, Isabelle Nault, Chantal Salson, Christine Silvy, Marie-Violaine Tatry
Fiche créée en septembre 2015 et révisée en octobre 2016
Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une ins...Odile Contat
Les réseaux sociaux sont devenus incontournables pour les chercheurs comme pour les institutions de recherche. Ce sont des outils très efficaces, très utilisés...et les enjeux qui concernent les chercheurs concernent également les institutions : visibilité et diffusion, propriété et pérennité des données, concurrence avec les outils institutionnels et confusion avec les services d’archives ouvertes...
Similaire à Le Web de données - nouvelles pratiques de publication et nouveaux services? (20)
Smart semantic content for the Future Internetchessmu
The document discusses approaches for context-aware and personalized transmission of information on future internet networks. It describes the Content Centric Networking approach defined by Jacobson et al. that introduces a semantic layer at the network level. It also discusses a Content Object model that represents content, data, and metadata. The proposed approach aims to optimize information aggregation across different layers and relate the Content Object and Content Centric Networking frameworks for context-aware routing and personalization of information.
The document discusses context-aware personalized mobile services for hybrid networks and the challenges of transmitting information in a context- and user- aware way. It proposes using a content object model and semantic layer at the network level, represented by metadata, to optimize how information and data are aggregated and personalized based on context. Future work involves experimenting with encoding metadata as rules to help distribute content objects on the network based on relevance to users.
Generating educational assessment items from Linked Open Datachessmu
The document discusses generating educational assessment items from Linked Open Data sources like DBpedia. It describes challenges in retrieving accurate and complete knowledge from these sources to generate item stems, responses, and distractors. It also discusses limitations in using open data sources for assessment generation due to issues like incomplete ontologies, missing or inaccurate statements, and unavailable data links.
The document discusses the Tudor Research Centre in Luxembourg which develops open source assessment platforms and provides online and offline assessment services. It summarizes some of the research projects and international collaborations. It also discusses the need to improve management of assessment resources through standard metadata sets and models to describe items, tests, and multimedia resources and better exchange of items and tests across platforms.
Open Archives Initiative Protocol for Metadata Harvestingchessmu
The document summarizes the Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH). It describes OAI-PMH as a standard that allows repositories of content to share metadata and enables aggregators to harvest metadata from data providers to build services. It outlines how OAI-PMH works, examples of repositories that use it, common metadata formats, and challenges and best practices for improving interoperability.
Dublin Core et partage de métadonnées - Faire interagir les objets numériqueschessmu
The document discusses Dublin Core (DC) metadata standards and issues with aggregating metadata from different sources. It notes that DC allows for heterogeneous resources and metadata formats through its flexible structure. However, this also leads to inconsistencies in encoding when metadata is applied by different communities and sectors. The document recommends following established best practices and guidelines to help improve metadata quality and enable better discovery of resources through consistent application of standards.
Virtual Collections for researchers
The HAL archive
and
The Digital Repositories Infrastructure Vision for European Research
Dublin Core Conference 2007 Singapour
intervention Institut de Recherche pour l'Innovation, Centre Georges Pompidou, Ministere de la culture et de la Communication, Ecole du Louvre, Seminaire "Muséologie/Muséographie et nouvelles formes d'adresse au public", 2007. Muriel Foulonneau
Le Web de données - nouvelles pratiques de publication et nouveaux services?
1. Le Web de données
nouvelles pratiques de publication et
nouveaux services?
Muriel Foulonneau
muriel.foulonneau@tudor.lu
2. Une couche du Web où les données sont
structurées sémantiquement
“In the coming years, we will see a revolution in
the ability of machines to access, process, and
apply information. This revolution will emerge
from three distinct areas of activity connected to
the Semantic Web: the Web of Data, the Web of
Services, and the Web of Identity providers.
These webs aim to make semantic knowledge of
data accessible…”
Alexander Korth April 18, 2009
http://readwrite.com/2009/04/18/web_of_data_machine_accessible_information
24/10/2014 2
5. Modèles de publication Web 2.0 (social)
http://www.lemonde.fr/politique/article/2013/10/10/a-l-assemblee-le-sexisme-
en-accusation_3492868_823448.html
http://www.imdb.com/title/tt1454468/ratings?ref_=tt_ov_rt
24/10/2014 5
http://trignacechecs.blogspot.com/
6. Modèles de publication Web 3.0 (lisible
par des machines)
http://en.wikipedia.org/wiki/JSON
http://fr.wikipedia.org/wiki/Resource_Description_Framework
24/10/2014 6
7. L’accès à un layer du Web qui contient
des données structurées
Une version lisible par les machines et une version lisible par les
humains
Albert Einstein
24/10/2014 7
8. Le Web de données: des liens entre les
données
http://commons.wikimedia.org/wiki/File:Web.jpg
24/10/2014 8
9. Des données au Web de données
24/10/2014 Presentation Tudor 9
10. Différents niveaux de structuration
Bases de données
CSV / Excel
XML
JSON
Micro-formats
RDF
RDFa
Linked Data
Des liens entre les données
24/10/2014 10
11. Les principes des Linked Data
1- Use URIs as names for things
2- Use HTTP URIs so that people can look up those names.
3- When someone looks up a URI, provide useful information,
using the standards (RDF*, SPARQL)
4- Include links to other URIs. so that they
can discover more things.
24/10/2014 11
12. Le principe 1 à 1 du Dublin Core: ex. objet
numérique vs objet physique
Contenu Propriété
intellectuelle
Instantiation
Coverage
Description
Relation
Type
Source
Title
Subject
Rights
Contributor
Publisher
Creator
Language
Identifier
Format
Date
13. Vocabulaires et modèles de données
Des formats de métadonnées aux ontologies
=> définir et identifier les ressources
=> définir et identifier les relations entre les ressources
February 1945
E7 Activity
http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt
“Crimea Conference”
P86 falls within
E65 Creation
Event
E38 Image
P82 at some time
within
E39 Actor
E39 Actor
E53 Place
7012124
24/10/2014 13
14. RDF et modélisation sémantique des
données
RDF
http://me/hasBirthPlace
Einstein Ulm
Classes and instances
rdfs:subclass_of
14
Me:Scientist
Me:Location
Me:City
rdf:type
Einstein Ulm
rdf:type
http://me/hasBirthPlace
15. La capacité à raisonner sur des données
Mécanismes d’inférence liés au langage
ex. Ulm est un lieu
Mécanismes d’inférence liés à
des règles
Me:Location
rdfs:subclass_of
Me:City
Ulm
rdf:type
24/10/2014 15
16. Représentation sémantique des données
Des données en RDF
• Sujet – Prédicat - Objet
Des modèles
• Des classes de ressources
Des URIs (identifiants) pour des ressources abstraites ou
concrètes
• Plus d’ambiguités
Des mécanismes d’inférence
• permettre aux ordinateurs de raisonner sur les contenus
16
19. Liens entre les jeux de données (Linked
Data)
19
Me:
Einstein
Dbpedia:Ulm
http://me/hasBirthPlace
Me:
Einstein
Me:Ulm
http://me/hasBirthPlace
Owl:sameAs
Dbpedia:Ulm
20. Exemple de page de Wikipedia
24/10/2014 Presentation Tudor 20
24. Identité: Owl:sameAs
“links an individual to an individual. Such an owl:sameAs
statement indicates that two URI references actually refer to the
same thing: the individuals have the same ‘identity’ ”.
24
http://www.w3.org/TR/owl-ref/#sameAs-def
24/10/2014 24
25. Quels liens?
y rdf:type foaf:Person
y foaf:name James Bond
y foaf:nickname 007
x rdf:type skos:concept
x skos:prefLabel James Bond
x skos:altLabel 007
?
24/10/2014 25
35. Réutiliser le Web de données
Exemple de génération de questions
de tests en éducation
24/10/2014 Presentation Tudor 35
36. Objectifs de l’expérimentation
Quelles sont les limitations à l’utilisation des Linked
open Data comme modèle de connaissance dans un
contexte éducationnel ?
• Est-ce faisable?
• Est-ce que les données sont pertinentes?
• Quel niveau de contrôle qualité est nécessaire?
Test sur des données factuelles pour créer des
questions de test à choix multiples
24/10/2014 Presentation Tudor 36
37. Un template avec des variables
Variable de
la question
Options:
réponse
correcte +
distracteurs
Clef
Information
auxiliaire
Item extrait de Gierl, M.J., Zhou, J., Alves, C. (2008).
Developing a Taxonomy of Item Model Types to Promote
Assessment Engineering. Journal of Technology, Learning, and
Assessment, 7(2).
24/10/2014 ESWC 2011 37
38. Le processus de génération d’items
(questions) de test
24/10/2014 Presentation Tudor 38
39. La génération des items à partir de
différentes sources de données
Dbpedia
Sindice
OpenLink
24/10/2014 Presentation Tudor 39
40. Requêtes SPARQL pour retrouver les
données
Label
SELECT ?country ?capital
WHERE {
?c <http://dbpedia.org/property/commonName> ?country .
?c <http://dbpedia.org/property/capital> ?capital
}
LIMIT 30
24/10/2014 ESWC 2011 40
42. Test avec des données de DBpedia
Who succeeded to {Charles VII the Victorious} as ruler of France ?
1 variable était inexacte (The three Musketeers)
Des labels multiples pour la même ressource
Louis IX, Saint Louis, Saint Louis IX
Un item généré avec des options aux labels incohérents:
Charles VII the Victorious, Charles 09 Of France, Louis VII
24/10/2014 ESWC 2011 42
43. Problèmes liés aux données
• Les ontologies utilisées
• Le manque de persistence des URLs
• Fermetures transitives
• Fiabilité des sources d’informations
• Cohérence syntaxique des labels
• Liens entre les données
24/10/2014 43
44. Calcul de la similarité sémantique entre
la réponse correcte et les distracteurs
Quelle est la capitale du Gabon?
Ulan Bator
Libreville
Manila
Maputo
Port Louis
Libreville
Sans SemSim
Avec SemSim
24/10/2014 44
45. Résultats sur les tests utilisateurs
Baisse claire de performance en tenant compte de la
similarité sémantique
24/10/2014 45
46. Et les usages?
D’une logique de production à une
logique de services
24/10/2014 Presentation Tudor 46
47. Quelques early adopters
Ex. BBC
http://www.bbc.co.uk/blogs/internet/posts/Linked-Data-Connecting-together-
the-BBCs-Online-Content
http://www.bbc.co.uk/blogs/internet/posts/olympic_data_xml_latency
24/10/2014 47
54. Problèmes de l’utilisation des données
dans les services: Le mélange des
licences
Plusieurs stratégies
- Europeana pour CC0
- Portail Open Data de Singapour pour la documentation des
conditions de propriété intellectuelle
24/10/2014 54
55. Problèmes de l’utilisation des données
dans les services: Les données
- Les mises à jour
- La qualité (fiabilité, complétude, …)
- Provenance
- Les processus de maintenance
- Les droits de propriété intellectuelle et conditions d’usage
- Interopérabilité: modèles sémantiques
- Documentation
- …. etc
24/10/2014 55
56. Leçons des Open Data: Services et
applications développés à partir de
données
Construire 1 service
• avec 1 seul jeu de données
• avec plusieurs jeux de données
• avec un mashup avec des sources de données sous licence
Utilisation des données
• Uniquement pour enrichir des données existantes
• Uniquement pour améliorer la qualité des données existantes (ex.
exactitude des informations)
=> Pour le Web de données, l’utilisation conjointe de plusieurs datasets
requiert de passer par un service tiers ou de naviguer
24/10/2014 56
57. Conclusion:
Le Web de données est en cours
Existe-t-il un modèle pour le Web of
Services?
24/10/2014 Presentation Tudor 57
58. La fin du rêve d’un Web intelligent?
Des problèmes de qualité des données
Ex. Louis XIII
Problèmes de modélisation
Ex. VIAF et les noms vs.
Les personnes
Problèmes de pérennité
Le Web n’a pas (ou
presque) de mémoire
Les liens impliquent
la confiance
Jeux de données pivot,
généralistes
www.data.gov/ [14/10/2013]
24/10/2014 58
59. Des modèles de création de données
dans le Future Internet
Données de capteurs et Internet of Things
http://www.gpsreview.net/pigeonblog-gps-pigeons-monitor-air-quality/
24/10/2014 59
60. Les moteurs de recherche et la
sémantique
Bing, Google, Yahoo!, Yandex
Microdata
24/10/2014 60
62. Data scientists, data engineers, data
analysts: de nouvelles compétences
http://www.biginnovationcentre.com/Assets/Docs/Reports/Hackday%2
0Lessons%20Learnt_final.pdf
http://www.technologyreview.com/news/513866/in-a-data-deluge-companies-seek-to-fill-a-new-role/?
24/10/2014 Presentation Tudor 62
utm_campaign=newsletters&utm_source=newsletter-daily-all&utm_medium=email&utm_content=20130523
63. Quelques références
Tutoriel Linked Data
http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
Chan, C. M. (2013, January). From Open Data to Open Innovation Strategies: Creating E-Services
Using Open Government Data. In System Sciences (HICSS), 2013 46th Hawaii
International Conference on (pp. 1890-1899). IEEE.
Martin, S., Foulonneau, M., Turki, S. (2013). 1-5 stars: Metadata on the Openness Level of Open
Data Sets in Europe. In Metadata and Semantics Research 2013. Communications in
Computer and Information Science, Springer Verlag, Heidelberg
Martin, S., Foulonneau, M., Turki, S., Ihadjadene, M. (2013). Open Data: Barriers, Risks, and
Opportunities. European Conference on eGovernment, Como, Italy, 13-14th June, 2013.
Foulonneau, M. Generating Educational Assessment Items from Linked Open Data: the Case of
DBpedia. In R. Garcia-Castro et al. (Eds.): ESWC 2011 Workshops, LNCS 7117, pp. 16--27.
Springer, Heidelberg (2012)
Foulonneau, M., Grouès, V. Common vs. Expert knowledge: making the Semantic Web an
educational model. In Proceedings of the 2nd International Workshop on Learning and
Education with the Web of Data (LiLe-2012 at WWW-2012). Stefan Dietze, Mathieu d'Aquin,
Dragan Gasevic (eds.). CEUR workshop proceedings, vol. 840. http://www.ceur-ws.org/Vol-
840/
24/10/2014 63
64. Quelques questions
Comment construire des services sur le Web de données?
Quels freins à la réutilisation?
Quelle intervention humaine?
24/10/2014 64
65. Note: des éléments de cette présentation ont été repris de
ressources créées par des tiers. Une attribution est fournie
sous la forme d’un lien.
24/10/2014 65