SlideShare une entreprise Scribd logo
1  sur  13
Open Mining Infrastructure
for TExt and Data
Patricia Geretto, INRA-Versailles
Forum du GFII, Paris, 8 Décembre 2015
Une infrastructure text-mining au service des scientifiques
L’INRA
OPENMINTED : LES OBJECTIFS
OPENMINTED : LE PROJET
Forum du GFII, Paris, 8 Décembre 2015
SOMMAIRE
CAS D’USAGE ‘BIOLOGIE VEGETALE’ : ENJEUX - GAINS
Institut National de la Recherche Agronomique
Forum du GFII - Paris, 8 décembre 2015
Alimentation - Agriculture - Environnement
8290 agents titulaires dont
13 départements scientifiques et 8 métaprogrammes
186 unités de recherche et 49 unités expérimentales
881,71 M€ : Budget exécuté
2552 stagiaires accueillis et 510 doctorants rémunérés
Rapport d’activité INRA, 2014
17 centres de recherche
360 brevets en stock dont 67 nouveaux
1840 chercheurs titulaires
MaIAGE
Unité de recherche
"Mathématiques et Informatique Appliquées
du Génome à l'Environnement"
L’équipe Bibliome développe des méthodes de
linguistique computationnelle et d’apprentissage
automatique appliquées au domaine des
Sciences de la Vie.
Suite Alvis développée par MaIAGE
http://bibliome.jouy.inra.fr
Participation de l’INRA au projet OpenMinTeD
Forum du GFII - Paris, 8 décembre 2015
Cas d’Usage en Agronomie
DIST
Délégation à l’Information Scientifique et
Technique
La DIST est chargée de construire et mener la
politique de l'Information Scientifique et
technique (IST) pour l'INRA.
Appel à projet
H2020-EINFRA-2014-2
(Research and Innovation Actions,
Framework Partnership Agreement
with Multiple Beneficiaries)
3 ans (2015-2018)
5,4 millions d’euros
16 partenaires
Le Projet OpenMinTeD
Utilisateurs finaux
Forum du GFII - Paris, 8 décembre 2015
Chercheurs, curateurs de
bases de données…
Editeurs de littérature et d’outils
de text-mining, bibliothèques,
PME …
Fournisseurs de contenus et services
Réaliser une plateforme et une infrastructure de Text
et Data Mining (TDM), ouverte et pérenne, qui permette
aux chercheurs de découvrir, créer, partager et ré-utiliser
la connaissance extraite d’un vaste éventail de sources
de la littérature scientifique.
Text-mining
Communautés scientifiques
Infrastructure
Fournisseurs de contenu OA
OpenAIRE
Open Access
Infrastructure
for Research in
Europe
SSOAR,
Social
Science
Open
Access
Repository
Clarin,
European
research
infrastructure
for the
humanities
and social
sciences
AGRIS,
Agricultural
Science and
Technology
Information
Spécialistes
du
droit
Partenaires d’OpenMinTeD
Forum du GFII - Paris, 8 décembre 2015
Forum du GFII - Paris, 8 décembre 2015
Biologie Végétale & Biodiversité
2 cas d’usage à l’INRA
Approche “chercheur centrée”
Les spécifications de la plateforme reposent sur des Cas d’Usage
Constat – Difficultés pour les Chercheurs
• Dispersion des sources d’information
• Manque d’uniformité des modes de recherche et de récupération des
contenus
• Accès restreint, payant ; règles de copyright et licences
OpenMinTeD
• Explicite les règles d’accès au contenu/aux sources
• Favorise l’utilisation des ressources en open access (littérature
scientifique, données et vocabulaires partagés)
• Offre un accès fédéré aux ressources (métadonnées et protocoles
d’échange standards)
Les Sources – Le Contenu
Forum du GFII - Paris, 8 décembre 2015
OpenMinted focuses on interoperability across text
mining services and content providers
Constat – Difficultés pour les Chercheurs
• Manque de moyens informatiques (stockage, calcul, compétences…)
• Difficultés à identifier des services de text-mining appropriés aux
problématiques
• Manque de connaissances des capacités/limites des services de text-mining
OpenMinTeD
• Met à disposition un environnement accessible à distance pour construire,
utiliser et partager des chaînes de traitement de text-mining à façon
• Permet le traitement de gros volumes de données
• Documente et rend les services de text-mining plus faciles à appréhender
OpenMinted does not build new services, but adopts and adapts
existing services for new communities
Le Traitement de Text-Mining
Forum du GFII - Paris, 8 décembre 2015
Constat – Difficultés pour les Chercheurs
• Manque d’uniformité dans les formats de production
• Peu de ré-utilisation des ressources produites et des chaînes de
traitement construites
• Peu de traçabilité du lien entre les ressources utilisées et les
résultats produits
OpenMinTeD
• Garde la trace des versions et des licences des ressources
utilisées
• Met à disposition des espaces de partage de corpus annotés, de
vocabulaires, des chaînes de traitement…
• Permet la reproductibilité des résultats
• Favorise des sorties en format standard
L’Exploitation des Résultats
Forum du GFII - Paris, 8 décembre 2015
Questionnaire
82 participants
66 questionnaires complets
17 sujets abordés
15 questions sur le sujet
des difficultés
(difficultés à trouver
l’information pertinente, à la
collecter et l’exploiter, à la
relier à des données…)
17 questions sur le sujet
des solutions
(annotations, visualisations,
extractions, liens
sémantiques entre données
et textes…)
Cas d’Usage ‘Biologie végétale’
Forum du GFII - Paris, 8 décembre 2015
Personas
Cas d’Usage ‘Biologie végétale’
Forum du GFII - Paris, 8 décembre 2015
Le Text-Mining permet de
• Remobiliser les connaissances
existantes et dispersées
• Sélectionner des paramètres
biologiques d’intérêt
• Réduire le champ des
expérimentations possibles
• Diminuer le coût des expériences
Enjeux - Gains
© Christophe MAITRE, INRA
© William BEAUCARDET,INRA
Contact us
www.openminted.eu
Project Coordinator: Natalia Manola
natalia@di.uoa.gr
twitter.com/openminted_eu
facebook.com/openminted
bit.do/openmintedlinkedin
vimeo.com/openminted
bit.do/openmintedplus
http://fr.slideshare.net/openminted_eu
Two OPEN CALLS and two
HACKATONS will be organized to
develop applications with special focus on
innovative ideas improving the uptake of
the OpenMinTeD infrastructure, promoting
the openness and reuse principle
(2017, March & July)
Patricia Geretto, Sophie Aubin (DIST)
patricia.geretto@versailles.inra.fr
sophie.aubin@versailles.inra.fr
Claire Nédellec (MaIAGE)
claire.nedellec@jouy.inra.fr

Contenu connexe

Tendances

Le cnudst :votre partenaire en Information Scientifique et Technique
Le cnudst :votre partenaire en Information Scientifique et Technique Le cnudst :votre partenaire en Information Scientifique et Technique
Le cnudst :votre partenaire en Information Scientifique et Technique Bessem Aamira
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Jabes 2019 - Poster "Plateforme ISTEX : contenus et services associés"
Jabes 2019 - Poster "Plateforme ISTEX : contenus et  services associés"Jabes 2019 - Poster "Plateforme ISTEX : contenus et  services associés"
Jabes 2019 - Poster "Plateforme ISTEX : contenus et services associés"ABES
 
Le projet du dépôt institutionnel de l'UMA : état des lieux
Le projet du dépôt institutionnel de l'UMA : état des lieuxLe projet du dépôt institutionnel de l'UMA : état des lieux
Le projet du dépôt institutionnel de l'UMA : état des lieuxMohamed Ben Romdhane
 
Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)Antoine Isaac
 
Le libre accès à l’IST et les archives ouvertes
Le libre accès à l’IST et les archives ouvertesLe libre accès à l’IST et les archives ouvertes
Le libre accès à l’IST et les archives ouvertesMohamed Ben Romdhane
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...ABES
 
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...Bessem Aamira
 
Quelle collaboration autour des archives ouvertes à toulouse
Quelle collaboration autour des archives ouvertes à toulouseQuelle collaboration autour des archives ouvertes à toulouse
Quelle collaboration autour des archives ouvertes à toulousebviry
 
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...Mohamed Ben Romdhane
 
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...Jeannette Frey
 
Publications en accès libre chez BioMed Central et Springer Open – visibilité...
Publications en accès libre chez BioMed Central et Springer Open – visibilité...Publications en accès libre chez BioMed Central et Springer Open – visibilité...
Publications en accès libre chez BioMed Central et Springer Open – visibilité...Bessem Aamira
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 
Presentation Huma-Num
Presentation Huma-NumPresentation Huma-Num
Presentation Huma-NumHuma-Num
 
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...Chokri Ben Romdhane
 

Tendances (20)

Le cnudst :votre partenaire en Information Scientifique et Technique
Le cnudst :votre partenaire en Information Scientifique et Technique Le cnudst :votre partenaire en Information Scientifique et Technique
Le cnudst :votre partenaire en Information Scientifique et Technique
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Jabes 2019 - Poster "Plateforme ISTEX : contenus et services associés"
Jabes 2019 - Poster "Plateforme ISTEX : contenus et  services associés"Jabes 2019 - Poster "Plateforme ISTEX : contenus et  services associés"
Jabes 2019 - Poster "Plateforme ISTEX : contenus et services associés"
 
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
 
Le projet du dépôt institutionnel de l'UMA : état des lieux
Le projet du dépôt institutionnel de l'UMA : état des lieuxLe projet du dépôt institutionnel de l'UMA : état des lieux
Le projet du dépôt institutionnel de l'UMA : état des lieux
 
Projet PIST.TN
Projet PIST.TN Projet PIST.TN
Projet PIST.TN
 
Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)
 
Le libre accès à l’IST et les archives ouvertes
Le libre accès à l’IST et les archives ouvertesLe libre accès à l’IST et les archives ouvertes
Le libre accès à l’IST et les archives ouvertes
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...
Ressources electroniques à accès libre en sciences aquatiques & halieutiques-...
 
Quelle collaboration autour des archives ouvertes à toulouse
Quelle collaboration autour des archives ouvertes à toulouseQuelle collaboration autour des archives ouvertes à toulouse
Quelle collaboration autour des archives ouvertes à toulouse
 
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...
Partenariat ISD/CNUDST dans les activités du groupe de recherche sur le libre...
 
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
 
Les archives ouvertes
Les archives ouvertesLes archives ouvertes
Les archives ouvertes
 
Publications en accès libre chez BioMed Central et Springer Open – visibilité...
Publications en accès libre chez BioMed Central et Springer Open – visibilité...Publications en accès libre chez BioMed Central et Springer Open – visibilité...
Publications en accès libre chez BioMed Central et Springer Open – visibilité...
 
Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213
 
Documentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et ServicesDocumentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et Services
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Presentation Huma-Num
Presentation Huma-NumPresentation Huma-Num
Presentation Huma-Num
 
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...
S'aligner au modèle de publication en libre accès : Collaborer pour instaurer...
 

Similaire à OpenMinTeD - Une infrastructure text-mining au service des scientifiques

Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...pascal aventurier
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
 
infrastructure de données et de service THEIA et calcul à distance
infrastructure de données et de service THEIA et calcul à distance infrastructure de données et de service THEIA et calcul à distance
infrastructure de données et de service THEIA et calcul à distance Desconnets Jean-Christophe
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...infoclio.ch
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementAntoine Blanchard
 
Comité de Ressources Biologiques à l’Institut Pasteur de Tunis
Comité de Ressources Biologiques à l’Institut Pasteur de TunisComité de Ressources Biologiques à l’Institut Pasteur de Tunis
Comité de Ressources Biologiques à l’Institut Pasteur de TunisPasteur_Tunis
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
 
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Institut National Polytechnique de Toulouse
 
Jabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinJabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinABES
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesDesconnets Jean-Christophe
 
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...Institut National Polytechnique de Toulouse
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...AssociationAF
 

Similaire à OpenMinTeD - Une infrastructure text-mining au service des scientifiques (20)

Presentation jeudistv2
Presentation jeudistv2Presentation jeudistv2
Presentation jeudistv2
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Open Access scientific Literature
Open Access scientific LiteratureOpen Access scientific Literature
Open Access scientific Literature
 
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...
Mettre en pratique les recommandations sur les archives ouvertes de nouvelle ...
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
Ontology Repository and Ontology-based Services
Ontology Repository and Ontology-based ServicesOntology Repository and Ontology-based Services
Ontology Repository and Ontology-based Services
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
infrastructure de données et de service THEIA et calcul à distance
infrastructure de données et de service THEIA et calcul à distance infrastructure de données et de service THEIA et calcul à distance
infrastructure de données et de service THEIA et calcul à distance
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
 
JE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPauJE_FGouzi-ABarrio_SCDPau
JE_FGouzi-ABarrio_SCDPau
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
 
Comité de Ressources Biologiques à l’Institut Pasteur de Tunis
Comité de Ressources Biologiques à l’Institut Pasteur de TunisComité de Ressources Biologiques à l’Institut Pasteur de Tunis
Comité de Ressources Biologiques à l’Institut Pasteur de Tunis
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
 
Jabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinJabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium Couperin
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
 
Les bibliothèques numériques et la recherche, Fabrice PAPY, 5 décembre 2011
Les bibliothèques numériques et la recherche, Fabrice PAPY, 5 décembre 2011Les bibliothèques numériques et la recherche, Fabrice PAPY, 5 décembre 2011
Les bibliothèques numériques et la recherche, Fabrice PAPY, 5 décembre 2011
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
 

Plus de openminted_eu

Supporting the uptake of TDM
Supporting the uptake of TDMSupporting the uptake of TDM
Supporting the uptake of TDMopenminted_eu
 
OpenMinTeD, LIBER conference 2017
OpenMinTeD, LIBER conference 2017OpenMinTeD, LIBER conference 2017
OpenMinTeD, LIBER conference 2017openminted_eu
 
Resource sync overview and real-world use cases for discovery, harvesting, an...
Resource sync overview and real-world use cases for discovery, harvesting, an...Resource sync overview and real-world use cases for discovery, harvesting, an...
Resource sync overview and real-world use cases for discovery, harvesting, an...openminted_eu
 
Seamless access to the world's open access research papers via resources sync
Seamless access to the world's open access research papers via resources syncSeamless access to the world's open access research papers via resources sync
Seamless access to the world's open access research papers via resources syncopenminted_eu
 
Webinar slides: Interoperability between resources involved in TDM at the lev...
Webinar slides: Interoperability between resources involved in TDM at the lev...Webinar slides: Interoperability between resources involved in TDM at the lev...
Webinar slides: Interoperability between resources involved in TDM at the lev...openminted_eu
 
Text Mining: the next data frontier. Beyond Open Access
Text Mining: the next data frontier. Beyond Open AccessText Mining: the next data frontier. Beyond Open Access
Text Mining: the next data frontier. Beyond Open Accessopenminted_eu
 
Legal issues Text and Data Mining
Legal issues Text and Data MiningLegal issues Text and Data Mining
Legal issues Text and Data Miningopenminted_eu
 
How can repositories support the text mining of their content and why?
How can repositories support the text mining of their content and why?How can repositories support the text mining of their content and why?
How can repositories support the text mining of their content and why?openminted_eu
 
Tentative steps in mining UK theses
Tentative steps in mining UK thesesTentative steps in mining UK theses
Tentative steps in mining UK thesesopenminted_eu
 
OpenMinTeD - Repositories in the centre of new scientific knowledge
OpenMinTeD - Repositories in the centre of new scientific knowledgeOpenMinTeD - Repositories in the centre of new scientific knowledge
OpenMinTeD - Repositories in the centre of new scientific knowledgeopenminted_eu
 
Jisc Text Mining Capabilities
Jisc Text Mining CapabilitiesJisc Text Mining Capabilities
Jisc Text Mining Capabilitiesopenminted_eu
 
OpenMinted: It's Uses and Benefits for the Social Sciences
OpenMinted: It's Uses and Benefits for the Social SciencesOpenMinted: It's Uses and Benefits for the Social Sciences
OpenMinted: It's Uses and Benefits for the Social Sciencesopenminted_eu
 
The Future is All Mine
The Future is All MineThe Future is All Mine
The Future is All Mineopenminted_eu
 
Infrastructure crossroads... and the way we walked them in DKPro
Infrastructure crossroads... and the way we walked them in DKProInfrastructure crossroads... and the way we walked them in DKPro
Infrastructure crossroads... and the way we walked them in DKProopenminted_eu
 
OpenMinTeD: Making Sense of Large Volumes of Data
OpenMinTeD: Making Sense of Large Volumes of DataOpenMinTeD: Making Sense of Large Volumes of Data
OpenMinTeD: Making Sense of Large Volumes of Dataopenminted_eu
 
Experiences of Text Mining; the National Library of Austria perspective
Experiences of Text Mining; the National Library of Austria perspectiveExperiences of Text Mining; the National Library of Austria perspective
Experiences of Text Mining; the National Library of Austria perspectiveopenminted_eu
 
Text and Data Mining at the Royal Library in the Netherlands
Text and Data Mining at the Royal Library in the NetherlandsText and Data Mining at the Royal Library in the Netherlands
Text and Data Mining at the Royal Library in the Netherlandsopenminted_eu
 
The Breakdown: What is OpenMinTeD?
The Breakdown: What is OpenMinTeD?The Breakdown: What is OpenMinTeD?
The Breakdown: What is OpenMinTeD?openminted_eu
 

Plus de openminted_eu (18)

Supporting the uptake of TDM
Supporting the uptake of TDMSupporting the uptake of TDM
Supporting the uptake of TDM
 
OpenMinTeD, LIBER conference 2017
OpenMinTeD, LIBER conference 2017OpenMinTeD, LIBER conference 2017
OpenMinTeD, LIBER conference 2017
 
Resource sync overview and real-world use cases for discovery, harvesting, an...
Resource sync overview and real-world use cases for discovery, harvesting, an...Resource sync overview and real-world use cases for discovery, harvesting, an...
Resource sync overview and real-world use cases for discovery, harvesting, an...
 
Seamless access to the world's open access research papers via resources sync
Seamless access to the world's open access research papers via resources syncSeamless access to the world's open access research papers via resources sync
Seamless access to the world's open access research papers via resources sync
 
Webinar slides: Interoperability between resources involved in TDM at the lev...
Webinar slides: Interoperability between resources involved in TDM at the lev...Webinar slides: Interoperability between resources involved in TDM at the lev...
Webinar slides: Interoperability between resources involved in TDM at the lev...
 
Text Mining: the next data frontier. Beyond Open Access
Text Mining: the next data frontier. Beyond Open AccessText Mining: the next data frontier. Beyond Open Access
Text Mining: the next data frontier. Beyond Open Access
 
Legal issues Text and Data Mining
Legal issues Text and Data MiningLegal issues Text and Data Mining
Legal issues Text and Data Mining
 
How can repositories support the text mining of their content and why?
How can repositories support the text mining of their content and why?How can repositories support the text mining of their content and why?
How can repositories support the text mining of their content and why?
 
Tentative steps in mining UK theses
Tentative steps in mining UK thesesTentative steps in mining UK theses
Tentative steps in mining UK theses
 
OpenMinTeD - Repositories in the centre of new scientific knowledge
OpenMinTeD - Repositories in the centre of new scientific knowledgeOpenMinTeD - Repositories in the centre of new scientific knowledge
OpenMinTeD - Repositories in the centre of new scientific knowledge
 
Jisc Text Mining Capabilities
Jisc Text Mining CapabilitiesJisc Text Mining Capabilities
Jisc Text Mining Capabilities
 
OpenMinted: It's Uses and Benefits for the Social Sciences
OpenMinted: It's Uses and Benefits for the Social SciencesOpenMinted: It's Uses and Benefits for the Social Sciences
OpenMinted: It's Uses and Benefits for the Social Sciences
 
The Future is All Mine
The Future is All MineThe Future is All Mine
The Future is All Mine
 
Infrastructure crossroads... and the way we walked them in DKPro
Infrastructure crossroads... and the way we walked them in DKProInfrastructure crossroads... and the way we walked them in DKPro
Infrastructure crossroads... and the way we walked them in DKPro
 
OpenMinTeD: Making Sense of Large Volumes of Data
OpenMinTeD: Making Sense of Large Volumes of DataOpenMinTeD: Making Sense of Large Volumes of Data
OpenMinTeD: Making Sense of Large Volumes of Data
 
Experiences of Text Mining; the National Library of Austria perspective
Experiences of Text Mining; the National Library of Austria perspectiveExperiences of Text Mining; the National Library of Austria perspective
Experiences of Text Mining; the National Library of Austria perspective
 
Text and Data Mining at the Royal Library in the Netherlands
Text and Data Mining at the Royal Library in the NetherlandsText and Data Mining at the Royal Library in the Netherlands
Text and Data Mining at the Royal Library in the Netherlands
 
The Breakdown: What is OpenMinTeD?
The Breakdown: What is OpenMinTeD?The Breakdown: What is OpenMinTeD?
The Breakdown: What is OpenMinTeD?
 

OpenMinTeD - Une infrastructure text-mining au service des scientifiques

  • 1. Open Mining Infrastructure for TExt and Data Patricia Geretto, INRA-Versailles Forum du GFII, Paris, 8 Décembre 2015 Une infrastructure text-mining au service des scientifiques
  • 2. L’INRA OPENMINTED : LES OBJECTIFS OPENMINTED : LE PROJET Forum du GFII, Paris, 8 Décembre 2015 SOMMAIRE CAS D’USAGE ‘BIOLOGIE VEGETALE’ : ENJEUX - GAINS
  • 3. Institut National de la Recherche Agronomique Forum du GFII - Paris, 8 décembre 2015 Alimentation - Agriculture - Environnement 8290 agents titulaires dont 13 départements scientifiques et 8 métaprogrammes 186 unités de recherche et 49 unités expérimentales 881,71 M€ : Budget exécuté 2552 stagiaires accueillis et 510 doctorants rémunérés Rapport d’activité INRA, 2014 17 centres de recherche 360 brevets en stock dont 67 nouveaux 1840 chercheurs titulaires
  • 4. MaIAGE Unité de recherche "Mathématiques et Informatique Appliquées du Génome à l'Environnement" L’équipe Bibliome développe des méthodes de linguistique computationnelle et d’apprentissage automatique appliquées au domaine des Sciences de la Vie. Suite Alvis développée par MaIAGE http://bibliome.jouy.inra.fr Participation de l’INRA au projet OpenMinTeD Forum du GFII - Paris, 8 décembre 2015 Cas d’Usage en Agronomie DIST Délégation à l’Information Scientifique et Technique La DIST est chargée de construire et mener la politique de l'Information Scientifique et technique (IST) pour l'INRA.
  • 5. Appel à projet H2020-EINFRA-2014-2 (Research and Innovation Actions, Framework Partnership Agreement with Multiple Beneficiaries) 3 ans (2015-2018) 5,4 millions d’euros 16 partenaires Le Projet OpenMinTeD Utilisateurs finaux Forum du GFII - Paris, 8 décembre 2015 Chercheurs, curateurs de bases de données… Editeurs de littérature et d’outils de text-mining, bibliothèques, PME … Fournisseurs de contenus et services Réaliser une plateforme et une infrastructure de Text et Data Mining (TDM), ouverte et pérenne, qui permette aux chercheurs de découvrir, créer, partager et ré-utiliser la connaissance extraite d’un vaste éventail de sources de la littérature scientifique.
  • 6. Text-mining Communautés scientifiques Infrastructure Fournisseurs de contenu OA OpenAIRE Open Access Infrastructure for Research in Europe SSOAR, Social Science Open Access Repository Clarin, European research infrastructure for the humanities and social sciences AGRIS, Agricultural Science and Technology Information Spécialistes du droit Partenaires d’OpenMinTeD Forum du GFII - Paris, 8 décembre 2015
  • 7. Forum du GFII - Paris, 8 décembre 2015 Biologie Végétale & Biodiversité 2 cas d’usage à l’INRA Approche “chercheur centrée” Les spécifications de la plateforme reposent sur des Cas d’Usage
  • 8. Constat – Difficultés pour les Chercheurs • Dispersion des sources d’information • Manque d’uniformité des modes de recherche et de récupération des contenus • Accès restreint, payant ; règles de copyright et licences OpenMinTeD • Explicite les règles d’accès au contenu/aux sources • Favorise l’utilisation des ressources en open access (littérature scientifique, données et vocabulaires partagés) • Offre un accès fédéré aux ressources (métadonnées et protocoles d’échange standards) Les Sources – Le Contenu Forum du GFII - Paris, 8 décembre 2015 OpenMinted focuses on interoperability across text mining services and content providers
  • 9. Constat – Difficultés pour les Chercheurs • Manque de moyens informatiques (stockage, calcul, compétences…) • Difficultés à identifier des services de text-mining appropriés aux problématiques • Manque de connaissances des capacités/limites des services de text-mining OpenMinTeD • Met à disposition un environnement accessible à distance pour construire, utiliser et partager des chaînes de traitement de text-mining à façon • Permet le traitement de gros volumes de données • Documente et rend les services de text-mining plus faciles à appréhender OpenMinted does not build new services, but adopts and adapts existing services for new communities Le Traitement de Text-Mining Forum du GFII - Paris, 8 décembre 2015
  • 10. Constat – Difficultés pour les Chercheurs • Manque d’uniformité dans les formats de production • Peu de ré-utilisation des ressources produites et des chaînes de traitement construites • Peu de traçabilité du lien entre les ressources utilisées et les résultats produits OpenMinTeD • Garde la trace des versions et des licences des ressources utilisées • Met à disposition des espaces de partage de corpus annotés, de vocabulaires, des chaînes de traitement… • Permet la reproductibilité des résultats • Favorise des sorties en format standard L’Exploitation des Résultats Forum du GFII - Paris, 8 décembre 2015
  • 11. Questionnaire 82 participants 66 questionnaires complets 17 sujets abordés 15 questions sur le sujet des difficultés (difficultés à trouver l’information pertinente, à la collecter et l’exploiter, à la relier à des données…) 17 questions sur le sujet des solutions (annotations, visualisations, extractions, liens sémantiques entre données et textes…) Cas d’Usage ‘Biologie végétale’ Forum du GFII - Paris, 8 décembre 2015 Personas
  • 12. Cas d’Usage ‘Biologie végétale’ Forum du GFII - Paris, 8 décembre 2015 Le Text-Mining permet de • Remobiliser les connaissances existantes et dispersées • Sélectionner des paramètres biologiques d’intérêt • Réduire le champ des expérimentations possibles • Diminuer le coût des expériences Enjeux - Gains © Christophe MAITRE, INRA © William BEAUCARDET,INRA
  • 13. Contact us www.openminted.eu Project Coordinator: Natalia Manola natalia@di.uoa.gr twitter.com/openminted_eu facebook.com/openminted bit.do/openmintedlinkedin vimeo.com/openminted bit.do/openmintedplus http://fr.slideshare.net/openminted_eu Two OPEN CALLS and two HACKATONS will be organized to develop applications with special focus on innovative ideas improving the uptake of the OpenMinTeD infrastructure, promoting the openness and reuse principle (2017, March & July) Patricia Geretto, Sophie Aubin (DIST) patricia.geretto@versailles.inra.fr sophie.aubin@versailles.inra.fr Claire Nédellec (MaIAGE) claire.nedellec@jouy.inra.fr