Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Projet FSOV/SAM
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Les Partenaires
● INRA
● Clermont-Ferrand
– Unité Génétique, Diversité et Ecophysiologie des Céréales
(GDEC) [Coordinateur]
● MIG (!)
● ARVALIS - Institut du végétal
● UFS (Union Française des Semenciers)
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
L'objectif
● Le partage de connaissances entre partenaires en
forme d'une...
Base de Connaissances
● Base de données extraite de la bibliographie
● Vérifiée, testée par les experts & des expériences (ex .
phénotypage)
● Mise à jour en continu
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
L'organisation
● En trois années
● Création de la base
● Validation
● ...
● MIG est impliqué surtout dans la phase 1 – création
de la base
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Nos propres objectifs
● Moteur de recherche (AlvisIR)
● Aide à la recherche manuelle par les partenaires
● Permet le retour par les partenaires
● Ontologie
● Gène
● Marqueur
● Variété
● Caractère (phénotype)
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Notre Partie
* l'étoile indique 'In progress/Coming'
● Extraction des articles à partir du web
– Trouver
– Récupérer
– Transformer en texte
● TAL des articles
– Définir les bons outils (lexiques, termes etc)
● Aide par des Experts
● Transformer l'information en Ontologie
● Créer une Base de Données
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Extraction d'Information à partir du Web [1]
● Collection: recherche par mots-clés ou par
« Related/Citing » - offline , batch
● Web of Science – Thomson Reuters
● Web service pour les détails bibliographiques
– Pas de liens vers les éditeurs/article
– Identifient unique Thomson/Reuters
● « Article Match Retrieval » Service (xml toujours)
– DOI/PupMed ID/etc
– Liens vers la page normale de WoS
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Extraction d'Information à partir du Web [2]
● Récupérer le lien vers l'éditeur
● DOI : dx.doi.org
● PMID : google-scholar *
● UT : WoS (à voir) *
● Récupérer le pdf / html chez l'éditeur
● Transformer en texte *
● PDF
– Acrobat / Pdftotext
– Abbyy
● HTML ***
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Traitement du texte
● Utilisation d' AlvisNLP
● Les bons lexiques
● Utilisation des ressources disponibles : *
– Données BIO: GrainGenes, MASWheat, SwissProt,...
– Données Agro : GG,MASWheat, listes Arvalis, commerciales...
● Validation par les experts nécessaire *
– mais pas donnée.... surtout pour les données type 'langue
naturelle' + agronomiques
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Moteur de Recherche [1]
● Utilisation d' AlvisIR
● Recherches par mots-clés, catégories, … - online*
● Résultats avec « valeur ajoutée »
● Snippets, étiquettés et coloriés
● Lien vers la source
● Structures et statistiques extraites
● Question des privilèges des utilisateurs (partenaires) *
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Moteur de Recherche [2]
● Adaptation d'AlvisIR *
● Info biliographique
● Structures/champs pertinents
● Autres idées bienvenues
● Retour par les utilisateurs *
● Validation/ évaluation des résultats par les utilisateurs
– Utilisation de cette information (?)
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Ontologie
● La même nécessité des lexiques et validation
● PLUS :
● Relations entre les termes à
– Définir à la main *
– Donner par les experts *
– Apprendre *
– Valider par les experts *
● Interface appropriée
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Base de Données
● A voir … ****
● Questions de caractère
– Informatique
– Administratif
– Pratique
– De stratégies / préférences des partenaires
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Prochaines Étapes
● L'utilisation et verification de la base de
connaissance par les partenaires
Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Merci de votre patience !
D'autres questions ?

ble-presentation

  • 1.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Projet FSOV/SAM
  • 2.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Les Partenaires ● INRA ● Clermont-Ferrand – Unité Génétique, Diversité et Ecophysiologie des Céréales (GDEC) [Coordinateur] ● MIG (!) ● ARVALIS - Institut du végétal ● UFS (Union Française des Semenciers)
  • 3.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome L'objectif ● Le partage de connaissances entre partenaires en forme d'une... Base de Connaissances ● Base de données extraite de la bibliographie ● Vérifiée, testée par les experts & des expériences (ex . phénotypage) ● Mise à jour en continu
  • 4.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome L'organisation ● En trois années ● Création de la base ● Validation ● ... ● MIG est impliqué surtout dans la phase 1 – création de la base
  • 5.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Nos propres objectifs ● Moteur de recherche (AlvisIR) ● Aide à la recherche manuelle par les partenaires ● Permet le retour par les partenaires ● Ontologie ● Gène ● Marqueur ● Variété ● Caractère (phénotype)
  • 6.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Notre Partie * l'étoile indique 'In progress/Coming' ● Extraction des articles à partir du web – Trouver – Récupérer – Transformer en texte ● TAL des articles – Définir les bons outils (lexiques, termes etc) ● Aide par des Experts ● Transformer l'information en Ontologie ● Créer une Base de Données
  • 7.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Extraction d'Information à partir du Web [1] ● Collection: recherche par mots-clés ou par « Related/Citing » - offline , batch ● Web of Science – Thomson Reuters ● Web service pour les détails bibliographiques – Pas de liens vers les éditeurs/article – Identifient unique Thomson/Reuters ● « Article Match Retrieval » Service (xml toujours) – DOI/PupMed ID/etc – Liens vers la page normale de WoS
  • 8.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Extraction d'Information à partir du Web [2] ● Récupérer le lien vers l'éditeur ● DOI : dx.doi.org ● PMID : google-scholar * ● UT : WoS (à voir) * ● Récupérer le pdf / html chez l'éditeur ● Transformer en texte * ● PDF – Acrobat / Pdftotext – Abbyy ● HTML ***
  • 9.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Traitement du texte ● Utilisation d' AlvisNLP ● Les bons lexiques ● Utilisation des ressources disponibles : * – Données BIO: GrainGenes, MASWheat, SwissProt,... – Données Agro : GG,MASWheat, listes Arvalis, commerciales... ● Validation par les experts nécessaire * – mais pas donnée.... surtout pour les données type 'langue naturelle' + agronomiques
  • 10.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Moteur de Recherche [1] ● Utilisation d' AlvisIR ● Recherches par mots-clés, catégories, … - online* ● Résultats avec « valeur ajoutée » ● Snippets, étiquettés et coloriés ● Lien vers la source ● Structures et statistiques extraites ● Question des privilèges des utilisateurs (partenaires) *
  • 11.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Moteur de Recherche [2] ● Adaptation d'AlvisIR * ● Info biliographique ● Structures/champs pertinents ● Autres idées bienvenues ● Retour par les utilisateurs * ● Validation/ évaluation des résultats par les utilisateurs – Utilisation de cette information (?)
  • 12.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Ontologie ● La même nécessité des lexiques et validation ● PLUS : ● Relations entre les termes à – Définir à la main * – Donner par les experts * – Apprendre * – Valider par les experts * ● Interface appropriée
  • 13.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Base de Données ● A voir … **** ● Questions de caractère – Informatique – Administratif – Pratique – De stratégies / préférences des partenaires
  • 14.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Prochaines Étapes ● L'utilisation et verification de la base de connaissance par les partenaires
  • 15.
    Dialekti Valsamou ~17 Février 2011 Réunion Équipe Bibliome Merci de votre patience ! D'autres questions ?