OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
Le monde universitaire est producteur de données de différentes natures. L'ouverture et le partage de chaque type de données introduit des problématiques spécifiques. Cette variété s'explique en premier lieu par les situations particulières qui ont gouverné leur création. Mais les enjeux d'utilisation, par les communautés universitaires, les communautés de chercheurs ou la société en général, diffèrent aussi suivant chaque type de données.
Nous évoquerons brièvement un premier type de données, celles pédagogiques, en lien avec le mouvement en accès libre intitulé Open Educational Ressources (OER). Le second type de données, cette fois faisant partie du résultat de la recherche, concerne les publications. Notre communication rappellera brièvement, afin de mieux les distinguer du dernier type de données, les contraintes particulières qui ont motivé le développement de l'accès libre (open access) aux publications, les différentes voies suivies, l'état actuel après plus de 10 ans d'existence. L'essentiel de notre propos sera consacré au partage des données de la recherche, qui peuvent ou non être reliées aux publications. Nous décrirons les motivations de ce mouvement OpenData, les enjeux pour les chercheurs, les conditions particulières de mise à disposition que devront avoir ces données pour être réellement OpenData. Nous évoquerons enfin les transformations profondes du métier de chercheur qui peuvent en résulter, en nous appuyant sur des exemples provenant principalement des sciences humaines.
Pour les universités et instituts du Sud, les bouleversements de l'IST ouvrent des perspectives nouvelles : la littérature scientifique devient plus accessible et la production scientifique de l’organisme peut être diffusée plus facilement, grâce aux mouvements du Libre Accès et de la Science Ouverte, et aux développement de technologies de l’information basées sur des logiciels libres.
Marc Goovaerts met en application ce nouveau paradigme dans différents projets de coopération Nord-Sud-Sud, en portant une attention particulière à l’interopérabilité, aux métadonnées et aux identifiants uniques.
Marc Goovaerts, bibliothécaire à l’Université de Hasselt (Belgique), coordonne depuis 20 ans divers projets de coopération financés par le programme IODE de l’UNESCO (https://www.iode.org/) et VLIR-UOS (https://www.vliruos.be/en) avec des bibliothèques et instituts du Sud. Deux récents projets de coopération avec 5 universités cubaines serviront d’exemple.
Exploiter les données issues de WikipediaRobert Viseur
Wikipedia est un projet collaboratif de référence. Il s’agit aussi d’un formidable réservoir de données, utilisable par exemple pour des applications reposant sur les technologies du Web sémantique (DBpedia).
Cette conférence proposera un cas pratique d’extraction et d’intégration de données biographiques, ainsi que les résultats d’une évaluation de la qualité des données.
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...Pierre-Carl Langlais
Support d'un rapport commandé par BSN 4 et BSN 7 sur les transformations éditoriales introduites par le libre accès. La présentation est découpée de la même manière que le rapport final (il aborde successivement les outils d'édition, les formes d'écriture, l'évaluation, l'économie et les questions d'infrastructures et de gouvernance) mais inclut aussi plusieurs éléments qui figureront dans une version « longue », publiée ultérieurement.
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Rayna Stamboliyska
Cette présentation était la keynote de fermeture pour l'édition 2015 de la conférence SOData! tenu le 26 mars 2015 (voir le programme ici http://sodata.org/?page_id=162). Pierre-Carl Langlais et moi-même avons parlé des défis et opportunités d'une politique publique visant l'ouverture des données de la recherche.
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
Le monde universitaire est producteur de données de différentes natures. L'ouverture et le partage de chaque type de données introduit des problématiques spécifiques. Cette variété s'explique en premier lieu par les situations particulières qui ont gouverné leur création. Mais les enjeux d'utilisation, par les communautés universitaires, les communautés de chercheurs ou la société en général, diffèrent aussi suivant chaque type de données.
Nous évoquerons brièvement un premier type de données, celles pédagogiques, en lien avec le mouvement en accès libre intitulé Open Educational Ressources (OER). Le second type de données, cette fois faisant partie du résultat de la recherche, concerne les publications. Notre communication rappellera brièvement, afin de mieux les distinguer du dernier type de données, les contraintes particulières qui ont motivé le développement de l'accès libre (open access) aux publications, les différentes voies suivies, l'état actuel après plus de 10 ans d'existence. L'essentiel de notre propos sera consacré au partage des données de la recherche, qui peuvent ou non être reliées aux publications. Nous décrirons les motivations de ce mouvement OpenData, les enjeux pour les chercheurs, les conditions particulières de mise à disposition que devront avoir ces données pour être réellement OpenData. Nous évoquerons enfin les transformations profondes du métier de chercheur qui peuvent en résulter, en nous appuyant sur des exemples provenant principalement des sciences humaines.
Pour les universités et instituts du Sud, les bouleversements de l'IST ouvrent des perspectives nouvelles : la littérature scientifique devient plus accessible et la production scientifique de l’organisme peut être diffusée plus facilement, grâce aux mouvements du Libre Accès et de la Science Ouverte, et aux développement de technologies de l’information basées sur des logiciels libres.
Marc Goovaerts met en application ce nouveau paradigme dans différents projets de coopération Nord-Sud-Sud, en portant une attention particulière à l’interopérabilité, aux métadonnées et aux identifiants uniques.
Marc Goovaerts, bibliothécaire à l’Université de Hasselt (Belgique), coordonne depuis 20 ans divers projets de coopération financés par le programme IODE de l’UNESCO (https://www.iode.org/) et VLIR-UOS (https://www.vliruos.be/en) avec des bibliothèques et instituts du Sud. Deux récents projets de coopération avec 5 universités cubaines serviront d’exemple.
Exploiter les données issues de WikipediaRobert Viseur
Wikipedia est un projet collaboratif de référence. Il s’agit aussi d’un formidable réservoir de données, utilisable par exemple pour des applications reposant sur les technologies du Web sémantique (DBpedia).
Cette conférence proposera un cas pratique d’extraction et d’intégration de données biographiques, ainsi que les résultats d’une évaluation de la qualité des données.
Étude critique sur les nouveaux modes d'éditorialisation scientifique en accè...Pierre-Carl Langlais
Support d'un rapport commandé par BSN 4 et BSN 7 sur les transformations éditoriales introduites par le libre accès. La présentation est découpée de la même manière que le rapport final (il aborde successivement les outils d'édition, les formes d'écriture, l'évaluation, l'économie et les questions d'infrastructures et de gouvernance) mais inclut aussi plusieurs éléments qui figureront dans une version « longue », publiée ultérieurement.
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Rayna Stamboliyska
Cette présentation était la keynote de fermeture pour l'édition 2015 de la conférence SOData! tenu le 26 mars 2015 (voir le programme ici http://sodata.org/?page_id=162). Pierre-Carl Langlais et moi-même avons parlé des défis et opportunités d'une politique publique visant l'ouverture des données de la recherche.
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
De plus en plus d’applications installées jadis sur poste de travail basculent aujourd’hui en mode SaaS (Software-as-a-Service) et s’utilisent directement depuis le navigateur sans installation locale. Ce mode de mise à disposition a suscité la polémique dans la communauté du logiciel libre, à l’image de Richard Stallman assimilant le cloud computing à une "campagne marketing branchée".
Cette conférence passera en revue quelques enjeux liés au cloud computing (e.g. vie privée, propriété des données et liberté), développera en particulier la question du lock-in et passera en revue les initiatives existantes d’open cloud (e.g. TIO).
Presentation de Dominique Babini – CLACSO dans le contexte de l´École internationale d'études supérieures en Haïti, Partenariat CLACSO / UEH, Univesité d´Etat d¨Haïti, Port-au-Prince, Haïti, 17-18 Juin 2014
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Lesticetlart Invisu
Communication présentée lors de la journée d'étude "Outils, méthodes, corpus : la modélisation des données en SHS" (Paris, Institut national d'histoire de l'art, 17 novembre 2014).
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
Analyser les statistiques de consultation de la documentation en vue d'évaluer les besoins des chercheurs
Etre un acteur de l'indexation des données : "médiateur de la valorisation des données" (Catherine Morel-Pair)
Constituer une cellule d'appui pour la gestion des données de la recherche : l'élaboration d'un Digital Management Plan (DMP) ou Plan de Gestion des Données (PGD)
La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
Les archives ouvertes : 10 ans après, où en est-on ?OpenEdition
Université d'été de l'édition électronique ouverte CLEO/Revues.org
"Les archives ouvertes : 10 ans après, où en est-on ?" avec Gabriel Gallezot (09/09/2009)
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...Chokri Ben Romdhane
My presentation during the open access study day 2016 JELA2016 Monastir Tunisia: Collaborate in order to implement Tunisian Open Archive http://www.cnudst.rnrt.tn/JELA2016.html
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
La réflexion sur les enjeux épistémologiques, culturels, politiques et économiques de l’exposition, la valorisation et la réutilisation des données de la recherche mobilise actuellement une variété d’acteurs du milieu de la recherche : institutions, chercheurs, éditeurs scientifiques, documentalistes / bibliothécaires, etc. A partir d’une série d’entretiens semi-directifs menés auprès de chercheurs en sciences humaines et sociales (SHS), nous avons essayer de comprendre la façon spécifique dont cette question plurielle se pose dans ces disciplines : Qu’est-ce qu’une donnée de la recherche en SHS ? Quelles données partager et dans quel but ? Quelles conditions et quels freins à l’accès et au partage dans ces domaines ? Comment les chercheurs souhaitent-ils valoriser ces données ? Cette étude exploratoire a donné lieu à un présentation du groupe "Big data / Smart data" du GFII.
Presentation of the use and benefits of Creative Commons for scientific publishing at the conference of the University of Angers on "Copyrights and the challence of the digital age"
Présentation donnée pour le secteur "Coopération et Développement" de l'ADBS, à l'occasion d'un atelier intitulé "Web sémantique et développement durable", à l'UNESCO, le 31 janvier 2011.
Présentation de Lise Arena, Bernard Conein et Alexandre Monnin le 20 novembre l'Université Nice-Sophia Antipolis (UNS) dans le cadre de la présentation des axes interdisciplinaires de l'UNS.
De plus en plus d’applications installées jadis sur poste de travail basculent aujourd’hui en mode SaaS (Software-as-a-Service) et s’utilisent directement depuis le navigateur sans installation locale. Ce mode de mise à disposition a suscité la polémique dans la communauté du logiciel libre, à l’image de Richard Stallman assimilant le cloud computing à une "campagne marketing branchée".
Cette conférence passera en revue quelques enjeux liés au cloud computing (e.g. vie privée, propriété des données et liberté), développera en particulier la question du lock-in et passera en revue les initiatives existantes d’open cloud (e.g. TIO).
Presentation de Dominique Babini – CLACSO dans le contexte de l´École internationale d'études supérieures en Haïti, Partenariat CLACSO / UEH, Univesité d´Etat d¨Haïti, Port-au-Prince, Haïti, 17-18 Juin 2014
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Lesticetlart Invisu
Communication présentée lors de la journée d'étude "Outils, méthodes, corpus : la modélisation des données en SHS" (Paris, Institut national d'histoire de l'art, 17 novembre 2014).
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
Analyser les statistiques de consultation de la documentation en vue d'évaluer les besoins des chercheurs
Etre un acteur de l'indexation des données : "médiateur de la valorisation des données" (Catherine Morel-Pair)
Constituer une cellule d'appui pour la gestion des données de la recherche : l'élaboration d'un Digital Management Plan (DMP) ou Plan de Gestion des Données (PGD)
La Science Ouverte est à l’ordre du jour, en France et en Europe.
Après les publications, les données de la recherche sont sous le feu des projecteurs.
Ce gisement de connaissances, trop peu connu et exploité, est même souvent voué à l’oubli et à la destruction, faute de signalisation et de sauvegarde pérenne.
L’IRD, plus encore que les autres organismes de recherche, se doit de proposer une politique, des méthodologies et des outils de préservation et de partage des données recueillies dans, par et pour les pays du Sud par l’ensemble de ses équipes de recherche.
Lors de cette conférence, Pascal Aventurier, responsable du Service Information Scientifique et Technique (IST), et Jean-Christophe Desconnets, Directeur de la Mission Infrastructure et Données Numériques (MIDN), présenteront le projet d’entrepôt de données de l’IRD qui ouvrira mi 2019.
Les archives ouvertes : 10 ans après, où en est-on ?OpenEdition
Université d'été de l'édition électronique ouverte CLEO/Revues.org
"Les archives ouvertes : 10 ans après, où en est-on ?" avec Gabriel Gallezot (09/09/2009)
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...Chokri Ben Romdhane
My presentation during the open access study day 2016 JELA2016 Monastir Tunisia: Collaborate in order to implement Tunisian Open Archive http://www.cnudst.rnrt.tn/JELA2016.html
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
La réflexion sur les enjeux épistémologiques, culturels, politiques et économiques de l’exposition, la valorisation et la réutilisation des données de la recherche mobilise actuellement une variété d’acteurs du milieu de la recherche : institutions, chercheurs, éditeurs scientifiques, documentalistes / bibliothécaires, etc. A partir d’une série d’entretiens semi-directifs menés auprès de chercheurs en sciences humaines et sociales (SHS), nous avons essayer de comprendre la façon spécifique dont cette question plurielle se pose dans ces disciplines : Qu’est-ce qu’une donnée de la recherche en SHS ? Quelles données partager et dans quel but ? Quelles conditions et quels freins à l’accès et au partage dans ces domaines ? Comment les chercheurs souhaitent-ils valoriser ces données ? Cette étude exploratoire a donné lieu à un présentation du groupe "Big data / Smart data" du GFII.
Presentation of the use and benefits of Creative Commons for scientific publishing at the conference of the University of Angers on "Copyrights and the challence of the digital age"
Présentation donnée pour le secteur "Coopération et Développement" de l'ADBS, à l'occasion d'un atelier intitulé "Web sémantique et développement durable", à l'UNESCO, le 31 janvier 2011.
Présentation de Lise Arena, Bernard Conein et Alexandre Monnin le 20 novembre l'Université Nice-Sophia Antipolis (UNS) dans le cadre de la présentation des axes interdisciplinaires de l'UNS.
Présentation de Wikisocialedits au lancement de SemanticPediaAlexandre Monnin
Présentation par Alexandre Monnin du projet de sémantisation des actes d'édition de Wikipédia, lors de la journée de lancement de SemanticPedia, à l'INHA, le 19 novembre 2012.
Routines et improvisation, à propos de Computation and Human Experience de Ph...Alexandre Monnin
2nde séance de l'atelier de lecture transdisciplinaire UCA JEDI organisé par Alexandre Monnin et Manuel Boutet. Présentation de textes de Phil Agre par Bernard Conein et discussion d'Alexandre Monnin.
Façonner les données. Travail et valeur de l'informationAlexandre Monnin
Présentation de Jérôme Denis donnée dans le cadre du séminaire "Artéfacts numériques et matérialités" organisé par Lise Arena, Bernard Conein et Alexandre Monnin, le 18 février 2016, à l'Université Nice Sophia Antipolis.
Atelier JDEV2017 : initiation à SPARQL avec Wikidata
Cet atelier a pour objectif de vous montrer comment dans l’avenir un étudiant et un chercheur (et demain les machines) vont naviguer dans le Linked Data (Web des données) à l’aide du langage SPARQL. Nous utiliserons un outil d'auto-complétion qui facilitera la création de votre première requête. Nous utiliserons le logiciel http://LinkedWiki.com afin d’écrire et partager les requêtes des participants de l’atelier ou bien https://io.datascience-paris-saclay.fr/map.php si le participant est membre de cette université.
Formation sur les approches d'activation de la découvrabilité pour les contenus culturels incluant 12 mesures à adopter tout en ayant recours aux communs numériques.
Le web participatif en bibliotheque publiqueXavier Galaup
Diaporama présenté lors d'une formation Bibliothèque et web participatif à la Bibliothèque Départementale de la Vienne le 4 décembre 2008.
Synthèse actualisé de diaporama déjà en ligne ici
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
L'émergence du phénomène du web 2.0, des nouveaux outils d'accès à l'information qu'il propose, des nouveaux types de contenus qu'il met en ligne, et des nouveaux protocoles de filtrage et de validation qu'il abolit ou transcende, interroge les pratiques actuelles de formation à l'IST. Parmi d'autres, le phénomène des blogs d'experts gagne le domaine de l'enseignement en général et de l'université en particulier. Des institutions, des composantes, des formations, des services, des communautés scientifiques, mais aussi des enseignants-chercheurs ouvrent de nouveaux espaces de paroles, mettant en œuvre de nouvelles dynamique de collaboration. Ces nouveaux collaboratoires, sous l'angle des rapports entre science et société, permettent d'articuler différemment un grand nombre de pratiques scientifiques en terme de diffusion, de collecte, de recherche, de publication et d'enseignement. Le domaine de la culture informationnelle et de la maîtrise de l'information en particulier, et celui des sciences de l'information et de la communication en général est à la fois un terrain et un révélateur particulièrement pertinent pour analyser les problématiques sous-jacentes de ces nouveaux collaboratoires, au rang desquelles la construction d'une culture du préprint, la mise à disposition d'indicateurs adaptés, la facilitation du déploiement rapide d'expertises dispersées et la reconfiguration des champs.
Enjeux de la recherche en SHS à l'ère des digital studiesAmar LAKEL, PhD
C'est une bien étrange conférence que j'ai donnée là, durant la Master Class DNHD 2020 de Bordeaux. En février 2020, alors même que nous étions à la porte d'une crise pandémique mondiale qui allait faire entrer notre monde au XXIème, c'est en toute innocence et avec un sentiment étrange que j'improvisais ce qui aura pour but, encore inconscient, d'exprimer ma position pour une révolution de la recherche en SHS en France.
Dans l'ombre d'une énième réforme universitaire qui achèvera l'oeuvre de destruction de la recherche en sciences sociales et humaines (mais aussi à l'ombre d'une révolution interne dans ma pratique de chercheur depuis 4 ans), j'ai voulu accoucher de mon manifeste pour une recherche ouverte et libre que j'appellerai plus tard : les Z.A.R. - Les Zones Autonomes de Recherche. Entre Bureaucratie centralisatrice au service de la radicalisation idéologique du néolibéralisme et retrait dépressif de chercheurs broyéd par la machinerie technocratique, j'ai fait un rêve. L'émergence d'une N.A.R., c'est-à-dire une Non Agence de la Recherche. Rassemblement rhizotopique de chercheurs libres voulant travailler ensemble, conduit par une seule pulsion : le désir de savoir.
De l'intelligence dans les données ouvertes - Problèmes et solutions dans les...Mathieu d'Aquin
Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013
Presentation at the Open Data workshop LIRMM
http://odrg.lirmm.fr/index.php/event-details?id=14
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...pascal aventurier
un récent rapport de COAR (Confederation of Open Access
Repositories) sur les archives ouvertes de nouvelle génération explique que celles-ci n’ont pas développé pleinement leur potentiel et ne sont pas assez connectées. Ce travail
analyse comment les principales recommandations du rapport COAR pourraient être appliquées à l’archive ouverte institutionnelle Horizon Plein textes de l’IRD.
Grands projets numériques et défis écologiques : contradictoires, ou nécessaires ?
Good in Tech - Futurs Pluriels #1
Par la chaire Good in Tech, portée par l’EMI de Sciences Po et l’Institut Mines Telecom Business School et le Réseau Université de la Pluralité
Intervention d'Alexandre Monnin, Gauthier Roussilhe et Diego Landivar en conclusion de la journée "L'obsolescence dans tous ses états", organisée par le GDS EcoInfo (CNRS) le 26 novembre 2018 : https://ecoinfo.cnrs.fr/2018/10/11/26-nov-2018-a-grenoble-lobsolescence-dans-tous-les-sens/
Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...Alexandre Monnin
Présentation au séminaire de Paris 1 :"(R)évolution numérique et travail. Nouvelles questions théoriques et d’intervention pour l’ergonomie", du pôle ergonomie et écologie humaine (FCPS), le 28 mai 2018.
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Alexandre Monnin
Présentation du projet ValueModels financé par l'Académie 1 de l'Idex UCA JEDI entre janvier et septembre 2017 (présentation donnée le 6 juillet 2017 lors de la journée de présentation des projets de l'Académie 1, RISE).
La question de la durabilité des technologies de calcul et de télécommunicationAlexandre Monnin
Intervention de José Halloy (Professeur de Physique à l'Université Paris Diderot), dans le Cadre du Café-In du jeudi 11 mai 2017, dans les locaux du centre de recherche d'Inria Sophia Antipolis - Méditerranée.
Le monde devient numérique, a-t-il les moyens de le rester ?Alexandre Monnin
Intervention le 7 avril 2017 dans le cadre de Devoxx 2017, à Paris, au Palais des Congrès.
Vidéo de l'intervention :
https://www.youtube.com/watch?v=bl6Ivdy777A
ou
https://www.wetube.io/video/%E2%80%8B%E2%80%8Ble-monde-devient-numerique-a-t-il-les-moyens-de-le-rester-alexandre-monnin/
Portails documentaires et référentiels du Web sémantique : exemples et enjeu...Alexandre Monnin
Présentation à l'occasion de la journée d'étude ALMA du 14 février 2014 organisée par les étudiants du Master 2 Histoire et document, Métiers des archives et des bibliothèques de l'université d'Angers et par l'Association des étudiants et diplômés en archivistique d'Angers (AEDAA).
Portails documentaires et référentiels du Web sémantique : exemples et enjeu...
DBpedia ou le Linked Open Data et la question du public
1. Interopérabilité, controverses
et édification d'un monde commun
Alexandre Monnin
- Short-term Fellow @Bauhaus-Universität Weimar (IKKM)
- Membre du Réseau d’experts « Open Data » @Etalab
- Co-initiateur du projet SemanticPedia, chercheur associé @Inria Wimmics
- Docteur en philosophie (Philosophie duWeb)@Paris 1
- Chair du « Philosophy of the Web » Community Group @W3C
Site : Web-and-Philosophy.org,Twitter : @aamonnz, @PhiloWeb
2. Le Web un système de nommage d’objets appelés
« ressources » (architecture orientée-ressources, ROA)
Les ressources aussi bien des objets numériques que
des objets physiques, abstraits, etc.
Le principe AAA « Anyone can say Anything About
Anything ». Autrement dit, n’importe qui peut créer une
URI pour désigner n’importe quelle ressource.
Comment , dès lors, s’accorder sur la nature des objets
composant un monde commun ?
Rappel : l’architecture duWeb
3. Réponse autrefois : synthèse raisonnée des connaissances
des faits et des idées (ensembles d’objets identifiés par
des entrées = encyclopédie).
Réponse actuelle : synthèse contributive des
connaissances sur le Web (ensemble d’objet/ressources
identifiés par des entrées, elles-mêmes identifiées par des
URI = Wikipedia).
Wikipedia, joue à l’échelle du Web, le rôle d’une plate-
forme où sont recensées, mises à l’épreuve et triées les
entités du collectif . DBpedia, on va le voir, en donne une
image à un instant t.
Le rôle centrale deWikipédia
4. Avec le Web de données, il s’agit de relier des ressources les
unes aux autres par l’intermédiaire de leurs identifiants (URI).
Pour cela il existe un modèle, RDF, et plusieurs sérialisations
pour l’écrire, fruits des travaux engagés au sein du W3C sur le
Web Sémantique.
Depuis 2006, l’initiative LOD (Linked Open Data) vise à
encourager la publication, sur le Web, de jeux de données
répondant à un certain nombre de standards techniques et de
bonnes pratiques. Le résultat tangible de ces efforts a pris la
forme du LOD cloud, le nuage des données liées.
LeWeb de données ?
8. Des données :
Coproduites & sur tous les sujets (open knowledge) : « nos établissements sont
invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant
sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue
française, mais aussi son efficacité sur le Web sémantique. »
(Aurélie Filippetti, 19 novembre 2012, journée de lancement de SemanticPedia)
Ouvertes (open license) : même licence que Wikipedia (CC by-sa 3.0 : liberté de
partager avec réutilisation commerciale possible, et GNU General Public License)
Techniquement réutilisables (open standards) : les langages et formats utilisés sont
ceux, ouverts, du W3C, pour une publication adaptée au Web. Elle ne sont pas
dissimulées derrière des API. L’API, ici, c’est le Web (espace qui relève lui-même du
domaine public depuis le 30 avril 1993)
Extraites à partir de logiciels libres (open source)
Open Data ?
9. « Le 19 Novembre 2012, le ministère de la Culture et de la Communication a signé une
convention avec Wikimédia et l’Inria créant la plate-forme collaborative « Sémanticpédia
», visant à créer des programmes de recherche et de développement en matière culturelle à partir
des données extraites de Wikipédia francophone. La délégation générale à la langue française et
aux langues de France soutient également le projet de version sémantique du Wiktionnaire
francophone. C’est ainsi plus de deux millions de termes qui viendront s’ajouter au réseau
sémantique des articles de Wikipédia.
L’ensemble de ces travaux s’inscrivent dans le cadre des études et des projets de la Commission
Européenne – comme Interoperability Solutions for European Public Administrations, Linked
Open Data 2 ou la plateforme ENGAGE – et des organismes internationaux tels que le World
Wide Web Consortium (W3C).
Etalab, mission du Premier ministre en charge de l’ouverture des données publiques mais aussi de
la promotion de l’innovation privée et publique sur ces données, compte s’appuyer
sur l’important travail réalisé par la communauté scientifique française du web sémantique, et
en attend beaucoup pour le développement d’une véritable culture de la donnée en France. »
(HenriVerdier, Directeur d’Etalab, 28 mai 2013, http://www.etalab.gouv.fr/article-ouverture-de-la-
dixieme-edition-de-la-conference-europeenne-sur-le-web-semantique-eswc-2013-attent-
118103002.html )
Selon Etalab…
21. « Argumenter autour d’un projet, promouvoir pour mener campagne,
éclairer pour fédérer, optimiser pour mieux gérer, diffuser pour valoriser,
développer pour faciliter... sont autant d’actions courantes des acteurs de
l’ESS que l’open data invite à aborder sous l’angle des données. »
(Claire Gallon, association LiberTIC)
DBpedia :
Des données ouvertes résultant de la contribution des Wikipédiens
Soumises à des règles éditoriales strictes (citation de sources secondaires)
Portant sur tous les sujets (y compris les plus controversés),
Constamment mises à jour,
Dont on peut suivre l’évolution dans le temps (via les historiques – en
cours de sémantisation) et les débats suscités (via les espaces de discussions)
Des données (ouvertes) au service de la
démocratie
22. Politique : l’édification d’un monde commun
Economique : Comment
a) valoriser la participation de chacun ?
b) mesurer les externalités positives ainsi produites ?
c) entretenir le cycle de la contribution ?
d) éviter les nouvelles enclosures économiques ?
Scientifique : à l’heure du big data, alors que l’on parle de « science
des données » ou des nouveaux « data scientists », n’y a-t-il pas un
risque d’aboutir à de nouvelles exclusions, justifiées précisément au
nom de « la Science » ?
Un triple enjeu
23. Réponse politique : explorer le collectif et laisser les identités se recomposer au sein
du public
Réponse économique :
a) limite des marchés & importance des biens communs (Wikipédia) et du domaine
public (le Web) dans la création de valeur et d’externalités positives
b) Production d’une information destinée à mettre en évidence les externalités
négatives – d’où la controverse (climat, gaz de schiste, limite du modèle actuel de
la publication scientifique, etc.)
Réponse scientifique : penser la science non seulement du point de vue de la
« recherche confinée », mais aussi de la « recherche de plein air », sensible aux valeurs
d’ouverture (importance de l’open access pour la mobilisation des sources secondaires ;
de la science contributive comme modèle pour comprendre la contribution et la
mettre en valeur, etc.)
Cf. http://mappingcontroversies.net/
Un parallèle pour comprendre ces enjeux :
l’analyse des controverses
24. On dira alors que le couple Wikipedia/DBpedia joue le rôle
d’un forum hybride, selon l’expression de Michel Callon,
Pierre Lascoumes etYannick Barthe (cf. Agir dans un
monde incertain).
25. Avec le plugin SemanticWebImport développé par l’équipe Inria
Wimmics pour Gephi, les données structurées du LOD cloud sont
désormais susceptibles de nourrir la cartographie des controverses :
http://wiki.gephi.org/index.php/SemanticWebImport
Un pont entre deux mondes
26. Autres projets : Render, représenter les
points de vue surWP
http://render-project.eu/
http://render-project.eu/tools-and-demos/
27. Sémantiser, centraliser et ajouter des sources aux données
« factuelles » contenues dans les infoboxes.
Différentes sources = différents points de vue.
https://www.wikidata.org/wiki/Wikidata:Main_Page
Autres projets :Wikidata