JABES 21 MAI 2014 - MONTPELLIER
Guillaume BILLEY, Etienne CARON, Stéphane GULLY,
William PAUL, Stanislas PERRIN, Claude NI...
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
CARTOGRAPHIE DES PROJETS
2
Le
SOCLE
Reconstruction
de Réf....
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
ARCHITECTURE GLOBALE
3
OAI PMH
SPARQL ENDPOINT
API Web
RES...
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
> CHARGEMENT
4
 Cartographie des objets
 Validation
 St...
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
> ENRICHISSEMENTS
 Reconstruction des réf. citées
 Extra...
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
> DIFFUSION
6
Accès aux ressources
ISTEX à travers un widg...
ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER
7
http://api.istex.fr/documentation
istex@inist.fr
http://...
Prochain SlideShare
Chargement dans…5
×

Journées ABES 2014 - Focus sur la plateforme Istex

735 vues

Publié le

Journées ABES 2014 - Session "ISTEX et ses Données" - Laurent Schmitt, Inist-CNRS :"Plate-forme ISTEX, intégration et complémentarité".

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
735
Sur SlideShare
0
Issues des intégrations
0
Intégrations
14
Actions
Partages
0
Téléchargements
22
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Journées ABES 2014 - Focus sur la plateforme Istex

  1. 1. JABES 21 MAI 2014 - MONTPELLIER Guillaume BILLEY, Etienne CARON, Stéphane GULLY, William PAUL, Stanislas PERRIN, Claude NIEDERLENDER, Laurent SCHMITT { prénom.nom@inist.fr } PLATEFORME ISTEX INTÉGRATION ET COMPLÉMENTARITÉ Plateforme HUB de Méta données Portails Services à valeurs ajoutée ENT SOCLE Infrastructure matérielle et logicielle Projets de Recherch e
  2. 2. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER CARTOGRAPHIE DES PROJETS 2 Le SOCLE Reconstruction de Réf. citées ISTEX-R LOREXPLOR CELLO …….. HUB De Métadonnés
  3. 3. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER ARCHITECTURE GLOBALE 3 OAI PMH SPARQL ENDPOINT API Web REST/JSON WIDGETS Utilisateurs METS, DC, PREMIS Entrepôt central Normalisation des objets Standardisation des formats Génération de formats (Zip) Génération Etat de collection Enrichissement Chargement Enrichissement Diffusion
  4. 4. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER > CHARGEMENT 4  Cartographie des objets  Validation  Standardisation des formats  Gestion des formats  Génération des états de collection { IdIstext : 8772EC3749E3B85D81DE561444CE21E14EE7649C2 , Corpus : springer , Metadata : { Path : /data/springer/ ……/Article.xml.meta , Mime : text/xml , Original : true, } , Fulltext : { Path: /data/springer/ ……/Article.pdf , Mime: application/pdf, Original: true, } , Cover : { Front_matter : /data/springer/ ……/cover.gif , Back_matter : /data/springer/ ……/back.gif , } , Supplements: { Path : /data/springer/ ……/suppl/ } , Objet documentaire normé Homogénéisation de la granularité { Path: /data/springer/ ……/Article.xml.mods , Mime: text/xml , Original: false, } , Métadonnées vers MODS PDF vers TEI ( ) { Path: /data/springer/ ……/Article.xml.tei, Mime: text/xml, Original : false, } , XmlWellFormed : true, XmlValid: true, Dtd : dtd/A++2/A++2V2-4.dtd XML bien formé et valide Génération de nouveaux formats { Path: /data/springer/ ……/Article.zip, Mime: application/zip, Original : false, } ,
  5. 5. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER > ENRICHISSEMENTS  Reconstruction des réf. citées  Extraction terminologique  Indexation automatique  Entités nommées 5 } Entities : { Path : /data/springer/ ……/Article.xml.ent, Mime : text/xml , Original : false, } , URL, Dates, Projets, Nom de personnes, ….. Article.xml.ent PROLEX : http://www.cnrtl.fr/lexiques/prolex/ Citations : { Path : /data/springer/ ……/Article.xml.cita, Mime : text/xml , Original : false, } , Article.xml.cita GROBID ET/ou BILBO Article.xml.kw Keywords : { Path : /data/springer/ ……/Article.xml.kw, Mime : text/xml , Original : false, } , Terminology : { Path : /data/springer/ ……/Article.xml.term, Mime : text/xml , Original : false, } , Filtrage des mots vides, Lemmatisation Groupes nominaux, Fréquence, …. TCC : http://ttc.syllabs.com/ Article.xml.term
  6. 6. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER > DIFFUSION 6 Accès aux ressources ISTEX à travers un widget d’interrogation qui s’intègre dans un site web. 1 Sélection d’un sous-corpus via les APIs scriptées, un moissonnage ou SPARQL4 Accès aux ressources ISTEX à travers des outils de découverte ET/OU de résolveur de liens. 3Accès aux ressources ISTEX à travers les APIs interfacées . 2
  7. 7. ANR-10-IDEX-0004-02 – 21 Mai 2014 – Journées ABES - MONTPELLIER 7 http://api.istex.fr/documentation istex@inist.fr http://www.istex.fr @istexdev

×