SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
XML TEI : un outil méthodologique
   pour la recherche en SHS
Atelier pratique. Indexation d'un corpus TEI à partir
            d'une plateforme collaborative.
                 EHESS – 3 février 2010




                   Nicole Dufournaud
                 Ingénieure de recherche
                      CESR Tours
                 Chercheuse en Histoire
Plan
●   La plate-forme Millefeuille
        –   Le projet Millefeuille
        –   La plate-forme
●   Les entités nommés :
        –   Les lieux
        –   Les noms de personnes
La partie « Atelier »
●   Présentation :
        –   de la plate-forme
        –   indexation
●   Démonstration
●   Atelier :
        –   Exercices encodés
        –   1 exercice à encoder avec <persName>
              <placeName> <geogName>
Le projet Millefeuille
                  2006- 2007
●   Projet Millefeuille : Archives nationales, Ecole
    nationale des Chartes, IDHE de l'Université
    Paris I et l'INRIA (2006-2007)
        –   Encodage des almanachs royaux, nationaux
             et impériaux entre 1750 et 1850
        –   Création d'une plate-forme collaborative qui
             autorise un travail collectif : un véritable
             outil de travail mais un prototype
                ●   Créé par Félicien François sur une idée de
                     Jean-Daniel Fekete (INRIA)
Le projet Millefeuille
                  2006- 2007
●   Projet Millefeuille 2006-2007:
        –   Emacs, une plate-forme de travail efficace et
             souple: recherche dans le corpus facile
             (grep et agrep pour la recherche
             approximative), gestion des versions de
             documents (cvs) et convertisseur de dates
        –   Inconvénient : lourd apprentissage et aspect
              rebutant pour les non-initiés
        –   Préparer la seconde phase du projet
La plate-forme Millefeuille
●   Eclipse
       –   Éditeur XML : logiciel libre
●   Plugin (module accessoire ou “greffon” ou
    “extension”) :
       –   Affichage des documents en HTML
       –   Création et génération d'index
       –   Filtres et navigation dans les index
●   Co-développé par l'IRHT (Richard Walter) et
    l'INRIA (JD Fekete)
       –   Troisième version sur le site de Telma
             http://www.cn-telma.fr/ (février 2010)
A savoir !
●   Le système de perspective Millefeuille : par
    défaut Eclipse propose la perspective Java
●   Structure du document XML/TEI
        –   L'affichage se fait sous forme d'arbre.
        –   Le menu contextuel (bouton droit de la
              souris) propose des fonctions d'édition :
                ●   Ajout d'attribut
                ●   Ajout d'élément
Exercices sur les minutes
●   Une minute notariale est l'acte original
    notarié, signé par les parties en présence
    ainsi que par les notaires ; la minute est
    conservée chez le notaire à la différence de
    la « grosse » qui est la copie remise aux
    parties.
Exemple d'une minute notariale (AD44)
Exercices sur les lettres de
        rémission
  « ...La lettre de rémission est un acte de la
    Chancellerie par lequel le roi octroie son
    pardon à la suite d’un crime ou d’un délit,
    arrêtant ainsi le cours ordinaire de la
    justice, qu’elle soit royale, seigneuriale,
    urbaine ou ecclésiastique... » Claude
    Gauvard.
Exemple d'une lettre de rémission (AD44)
Les entités nommés
●   Plusieurs types : on en retient deux
        –   Personnes
        –   Lieux
●   Lieux : problèmes
        –   Orthographe et variante : « Bretaigne »
        –   Changement de noms de lieux
●   Personnes : problèmes
        –   Orthographe : « Lefebure » « Lefebvre »
        –   Identité sociale
Les entités nommés et TEI
●   <rs>       chaîne de caractères
    <rs type="person">François Rabelais</rs>
    <rs type="person">sa mère</rs>
    <rs type="airport">Charles de Gaulle</rs> 
●   <name>
    <name type="person">François Rabelais</name>
    <name    type="place">Charles de Gaulle</name>
    <name type="person">Charles de Gaulle</name>
       –    ou <persName> !
Les noms de lieux
     <placeName> <geogName>
●   <placename> nom de lieu
    <placename>Paris</placename>
●   <geogName> nom associé à un lieu géo.
    <geogName>Pont Neuf</geogName>
Les noms de personnes
                <persName>
●   <surname> nom de famille ou patronyme
●   <forename> prénom
●   <roleName> titre et avant-nom
●   <addName> épithète
●   <nameLink> particules nobiliaires

    Exemple : « haute dame dame Suzanne de Bourbon dame
    de Rieux »
    <persName>
    <addName type="epithete-honneur">haute dame</addName>
    <roleName type="avant-nom">dame</roleName>
    <forename>Suzanne</forename><nameLink>de</nameLink>
    <surname>Bourbon</surname>
    <roleName type="titre">dame</roleName> de
    <geogName>Rieux</geogName>
    </persName>
Démonstration
●   Démonstration sur les fichiers des minutes
    notariales et lettres de rémission
       –   Présentation de la plate-forme
       –   Index de chaque fichier particulier
       –   Index du fichier général
Indexation
●   Les index sont de plusieurs couleurs
       –   Bleu foncé : occurrence dans le fichier ouvert
       –   Bleu clair : occurrence régularisée dans le fichier
             externe
●   Les index sont triés alphabétiquement; par défaut
●   Externaliser signifie copier une information d'un
    fichier particulier dans un fichier commun à un
    projet.
       –   Seul l'enrichissement commun des données est
            externalisé.
       –   Le texte reste intact.
Index particulier
●   Pour supprimer une régularisation :
        –   un clic droit sur une occurrence régularisée,
        –   puis sélectionner « Supprimer la référence dans
              ce fichier ».
            Attention ! Seule la suppression dans le fichier
              particulier est effective.
●   Pour externaliser plusieurs occurrences :
        –   Externalisation en masse n'est pas
              recommandée
        –   Si plusieurs occurrences concernent la même
              référence : sélectionner l'occurrence de
              référence avec les autres.
Index général
●   La couleur verte indique un fichier particulier suivi du
    nombre d'occurrences d'une même référence que
    l'on peut y trouver
●   La suppression d'une référence entraîne aussi la
    suppression dans les fichiers particuliers : la couleur
    rouge y indique une référence morte
●   La régularisation orthographique s'effectue dans le
    fichier général.
        –   Attention ! Ne pas toucher à l'identifiant généré
             automatiquement !
●   Afficher au format HTML
●   Les filtres
A VOUS !




http://www.wordle.net/

Contenu connexe

Tendances

HAL : archive commune et partagée
HAL : archive commune et partagéeHAL : archive commune et partagée
HAL : archive commune et partagéeOAccsd
 
DBpédia en français
DBpédia en françaisDBpédia en français
DBpédia en françaisJulienCojan
 
Les fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesLes fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesEquipex Biblissima
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Jean-Michel Mermet
 
Pleade 3 : Un logiciel Open Source de Recherche, Consultation, Publication d...
Pleade 3 : Un logiciel Open Source de  Recherche, Consultation, Publication d...Pleade 3 : Un logiciel Open Source de  Recherche, Consultation, Publication d...
Pleade 3 : Un logiciel Open Source de Recherche, Consultation, Publication d...infoclio.ch
 
Logiciels d'archives open source - Introduction
Logiciels d'archives open source - IntroductionLogiciels d'archives open source - Introduction
Logiciels d'archives open source - Introductioninfoclio.ch
 

Tendances (6)

HAL : archive commune et partagée
HAL : archive commune et partagéeHAL : archive commune et partagée
HAL : archive commune et partagée
 
DBpédia en français
DBpédia en françaisDBpédia en français
DBpédia en français
 
Les fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesLes fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de données
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...
 
Pleade 3 : Un logiciel Open Source de Recherche, Consultation, Publication d...
Pleade 3 : Un logiciel Open Source de  Recherche, Consultation, Publication d...Pleade 3 : Un logiciel Open Source de  Recherche, Consultation, Publication d...
Pleade 3 : Un logiciel Open Source de Recherche, Consultation, Publication d...
 
Logiciels d'archives open source - Introduction
Logiciels d'archives open source - IntroductionLogiciels d'archives open source - Introduction
Logiciels d'archives open source - Introduction
 

Similaire à N. Dufournaud : XML TEI : un outil méthodologique pour la recherche en SHS. Atelier pratique

Exploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXEmmanuelle Morlock
 
Lyon JUG - Elasticsearch
Lyon JUG - ElasticsearchLyon JUG - Elasticsearch
Lyon JUG - ElasticsearchDavid Pilato
 
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHSN. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHSOpenEdition
 
Apache solr andré bois-crettez 08
Apache solr   andré bois-crettez 08Apache solr   andré bois-crettez 08
Apache solr andré bois-crettez 08Loïc Descotte
 
Initiation à la fouille de texte - formation AJPro
Initiation à la fouille de texte - formation AJProInitiation à la fouille de texte - formation AJPro
Initiation à la fouille de texte - formation AJProEttore Rizza
 
Elasticsearch - OSDC France 2012
Elasticsearch - OSDC France 2012Elasticsearch - OSDC France 2012
Elasticsearch - OSDC France 2012David Pilato
 
cours-gratuit.com--id-3443.pdf
cours-gratuit.com--id-3443.pdfcours-gratuit.com--id-3443.pdf
cours-gratuit.com--id-3443.pdfSouha Bennani
 
Nantes JUG - Elasticsearch
Nantes JUG - ElasticsearchNantes JUG - Elasticsearch
Nantes JUG - ElasticsearchDavid Pilato
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchRobert Viseur
 
Finist JUG - Elasticsearch
Finist JUG - ElasticsearchFinist JUG - Elasticsearch
Finist JUG - ElasticsearchDavid Pilato
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresRobert Viseur
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchDavid Pilato
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - ElasticsearchDavid Pilato
 
De la caractérisation des données à leur transformation
De la caractérisation des données à leur transformationDe la caractérisation des données à leur transformation
De la caractérisation des données à leur transformationDiane Le Hénaff
 
atol_alfresco.pdf
atol_alfresco.pdfatol_alfresco.pdf
atol_alfresco.pdfatolcd
 
Elasticsearch - Montpellier JUG
Elasticsearch - Montpellier JUGElasticsearch - Montpellier JUG
Elasticsearch - Montpellier JUGDavid Pilato
 
Big Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache ZeppelinBig Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache ZeppelinBruno Bonnin
 
Créer des documents accessibles RMLL 2011 AEGIS
Créer des documents accessibles RMLL 2011 AEGISCréer des documents accessibles RMLL 2011 AEGIS
Créer des documents accessibles RMLL 2011 AEGISAEGIS-ACCESSIBLE Projects
 
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-201518 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015Emmanuelle Morlock
 

Similaire à N. Dufournaud : XML TEI : un outil méthodologique pour la recherche en SHS. Atelier pratique (20)

Exploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseX
 
Lyon JUG - Elasticsearch
Lyon JUG - ElasticsearchLyon JUG - Elasticsearch
Lyon JUG - Elasticsearch
 
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHSN. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
 
Apache solr andré bois-crettez 08
Apache solr   andré bois-crettez 08Apache solr   andré bois-crettez 08
Apache solr andré bois-crettez 08
 
Initiation à la fouille de texte - formation AJPro
Initiation à la fouille de texte - formation AJProInitiation à la fouille de texte - formation AJPro
Initiation à la fouille de texte - formation AJPro
 
Elasticsearch - OSDC France 2012
Elasticsearch - OSDC France 2012Elasticsearch - OSDC France 2012
Elasticsearch - OSDC France 2012
 
Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
cours-gratuit.com--id-3443.pdf
cours-gratuit.com--id-3443.pdfcours-gratuit.com--id-3443.pdf
cours-gratuit.com--id-3443.pdf
 
Nantes JUG - Elasticsearch
Nantes JUG - ElasticsearchNantes JUG - Elasticsearch
Nantes JUG - Elasticsearch
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend Search
 
Finist JUG - Elasticsearch
Finist JUG - ElasticsearchFinist JUG - Elasticsearch
Finist JUG - Elasticsearch
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libres
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - Elasticsearch
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - Elasticsearch
 
De la caractérisation des données à leur transformation
De la caractérisation des données à leur transformationDe la caractérisation des données à leur transformation
De la caractérisation des données à leur transformation
 
atol_alfresco.pdf
atol_alfresco.pdfatol_alfresco.pdf
atol_alfresco.pdf
 
Elasticsearch - Montpellier JUG
Elasticsearch - Montpellier JUGElasticsearch - Montpellier JUG
Elasticsearch - Montpellier JUG
 
Big Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache ZeppelinBig Data Viz (and much more!) with Apache Zeppelin
Big Data Viz (and much more!) with Apache Zeppelin
 
Créer des documents accessibles RMLL 2011 AEGIS
Créer des documents accessibles RMLL 2011 AEGISCréer des documents accessibles RMLL 2011 AEGIS
Créer des documents accessibles RMLL 2011 AEGIS
 
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-201518 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
 

Plus de OpenEdition

boiteaoutils-presentationespaceacquereuropenedition2022.pdf
boiteaoutils-presentationespaceacquereuropenedition2022.pdfboiteaoutils-presentationespaceacquereuropenedition2022.pdf
boiteaoutils-presentationespaceacquereuropenedition2022.pdfOpenEdition
 
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition Books
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition BooksBoite à outils : s'authentifier sur OpenEdition Journals et OpenEdition Books
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition BooksOpenEdition
 
Boite à outils : presentation des services freemium d'OpenEdition 2021
Boite à outils : presentation des services freemium d'OpenEdition 2021Boite à outils : presentation des services freemium d'OpenEdition 2021
Boite à outils : presentation des services freemium d'OpenEdition 2021OpenEdition
 
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...OpenEdition
 
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020Boite à outils de l'espace acquéreur d'OpenEdition Books 2020
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020OpenEdition
 
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019OpenEdition
 
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018Boiteaoutilspresentationdesservicesfreemiumopenedition 2018
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018OpenEdition
 
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...OpenEdition
 
Open edition journals
Open edition journalsOpen edition journals
Open edition journalsOpenEdition
 
Boite à outils : présentation des services freemium en ligne d'OpenEdition
Boite à outils : présentation des services freemium en ligne d'OpenEditionBoite à outils : présentation des services freemium en ligne d'OpenEdition
Boite à outils : présentation des services freemium en ligne d'OpenEditionOpenEdition
 
Boite à outils : espace acquéreur d'OpenEdition Books
Boite à outils : espace acquéreur d'OpenEdition BooksBoite à outils : espace acquéreur d'OpenEdition Books
Boite à outils : espace acquéreur d'OpenEdition BooksOpenEdition
 
Assemblée 2015-2016 des carnetiers d'Hypothèses - Introduction
Assemblée 2015-2016 des carnetiers d'Hypothèses - IntroductionAssemblée 2015-2016 des carnetiers d'Hypothèses - Introduction
Assemblée 2015-2016 des carnetiers d'Hypothèses - IntroductionOpenEdition
 
Bibliodiversité et multilinguisme
Bibliodiversité et multilinguismeBibliodiversité et multilinguisme
Bibliodiversité et multilinguismeOpenEdition
 
Les enjeux de l'Open Access pour les sciences humaines et sociales
Les enjeux de l'Open Access pour les sciences humaines et socialesLes enjeux de l'Open Access pour les sciences humaines et sociales
Les enjeux de l'Open Access pour les sciences humaines et socialesOpenEdition
 
A cost structure study for French HSS journals
A cost structure study for French HSS journalsA cost structure study for French HSS journals
A cost structure study for French HSS journalsOpenEdition
 
Infrastructure for OA publishing
Infrastructure for OA publishingInfrastructure for OA publishing
Infrastructure for OA publishingOpenEdition
 
Open Access Scholarly Publishing models for SSH
Open Access Scholarly Publishing models for SSHOpen Access Scholarly Publishing models for SSH
Open Access Scholarly Publishing models for SSHOpenEdition
 
Dh hypotheses-ated-tunis 2015 06 22
Dh hypotheses-ated-tunis 2015 06 22Dh hypotheses-ated-tunis 2015 06 22
Dh hypotheses-ated-tunis 2015 06 22OpenEdition
 
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...L’édition en sciences humaines et sociales en libre accès : modèles de diffus...
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...OpenEdition
 
OpenEdition Books platform for humanities and social sciences
OpenEdition Books platform for humanities and social sciencesOpenEdition Books platform for humanities and social sciences
OpenEdition Books platform for humanities and social sciencesOpenEdition
 

Plus de OpenEdition (20)

boiteaoutils-presentationespaceacquereuropenedition2022.pdf
boiteaoutils-presentationespaceacquereuropenedition2022.pdfboiteaoutils-presentationespaceacquereuropenedition2022.pdf
boiteaoutils-presentationespaceacquereuropenedition2022.pdf
 
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition Books
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition BooksBoite à outils : s'authentifier sur OpenEdition Journals et OpenEdition Books
Boite à outils : s'authentifier sur OpenEdition Journals et OpenEdition Books
 
Boite à outils : presentation des services freemium d'OpenEdition 2021
Boite à outils : presentation des services freemium d'OpenEdition 2021Boite à outils : presentation des services freemium d'OpenEdition 2021
Boite à outils : presentation des services freemium d'OpenEdition 2021
 
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
 
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020Boite à outils de l'espace acquéreur d'OpenEdition Books 2020
Boite à outils de l'espace acquéreur d'OpenEdition Books 2020
 
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019
Acces ouvert et bibliotheques, l'exemple d 'OpenEdition - Enssib mai 2019
 
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018Boiteaoutilspresentationdesservicesfreemiumopenedition 2018
Boiteaoutilspresentationdesservicesfreemiumopenedition 2018
 
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
Les plateformes OpenEdition Books et OpenEdition Journals et leurs services e...
 
Open edition journals
Open edition journalsOpen edition journals
Open edition journals
 
Boite à outils : présentation des services freemium en ligne d'OpenEdition
Boite à outils : présentation des services freemium en ligne d'OpenEditionBoite à outils : présentation des services freemium en ligne d'OpenEdition
Boite à outils : présentation des services freemium en ligne d'OpenEdition
 
Boite à outils : espace acquéreur d'OpenEdition Books
Boite à outils : espace acquéreur d'OpenEdition BooksBoite à outils : espace acquéreur d'OpenEdition Books
Boite à outils : espace acquéreur d'OpenEdition Books
 
Assemblée 2015-2016 des carnetiers d'Hypothèses - Introduction
Assemblée 2015-2016 des carnetiers d'Hypothèses - IntroductionAssemblée 2015-2016 des carnetiers d'Hypothèses - Introduction
Assemblée 2015-2016 des carnetiers d'Hypothèses - Introduction
 
Bibliodiversité et multilinguisme
Bibliodiversité et multilinguismeBibliodiversité et multilinguisme
Bibliodiversité et multilinguisme
 
Les enjeux de l'Open Access pour les sciences humaines et sociales
Les enjeux de l'Open Access pour les sciences humaines et socialesLes enjeux de l'Open Access pour les sciences humaines et sociales
Les enjeux de l'Open Access pour les sciences humaines et sociales
 
A cost structure study for French HSS journals
A cost structure study for French HSS journalsA cost structure study for French HSS journals
A cost structure study for French HSS journals
 
Infrastructure for OA publishing
Infrastructure for OA publishingInfrastructure for OA publishing
Infrastructure for OA publishing
 
Open Access Scholarly Publishing models for SSH
Open Access Scholarly Publishing models for SSHOpen Access Scholarly Publishing models for SSH
Open Access Scholarly Publishing models for SSH
 
Dh hypotheses-ated-tunis 2015 06 22
Dh hypotheses-ated-tunis 2015 06 22Dh hypotheses-ated-tunis 2015 06 22
Dh hypotheses-ated-tunis 2015 06 22
 
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...L’édition en sciences humaines et sociales en libre accès : modèles de diffus...
L’édition en sciences humaines et sociales en libre accès : modèles de diffus...
 
OpenEdition Books platform for humanities and social sciences
OpenEdition Books platform for humanities and social sciencesOpenEdition Books platform for humanities and social sciences
OpenEdition Books platform for humanities and social sciences
 

Dernier

SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfssuser40e112
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 

Dernier (20)

SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 

N. Dufournaud : XML TEI : un outil méthodologique pour la recherche en SHS. Atelier pratique

  • 1. XML TEI : un outil méthodologique pour la recherche en SHS Atelier pratique. Indexation d'un corpus TEI à partir d'une plateforme collaborative. EHESS – 3 février 2010 Nicole Dufournaud Ingénieure de recherche CESR Tours Chercheuse en Histoire
  • 2. Plan ● La plate-forme Millefeuille – Le projet Millefeuille – La plate-forme ● Les entités nommés : – Les lieux – Les noms de personnes
  • 3. La partie « Atelier » ● Présentation : – de la plate-forme – indexation ● Démonstration ● Atelier : – Exercices encodés – 1 exercice à encoder avec <persName> <placeName> <geogName>
  • 4. Le projet Millefeuille 2006- 2007 ● Projet Millefeuille : Archives nationales, Ecole nationale des Chartes, IDHE de l'Université Paris I et l'INRIA (2006-2007) – Encodage des almanachs royaux, nationaux et impériaux entre 1750 et 1850 – Création d'une plate-forme collaborative qui autorise un travail collectif : un véritable outil de travail mais un prototype ● Créé par Félicien François sur une idée de Jean-Daniel Fekete (INRIA)
  • 5. Le projet Millefeuille 2006- 2007 ● Projet Millefeuille 2006-2007: – Emacs, une plate-forme de travail efficace et souple: recherche dans le corpus facile (grep et agrep pour la recherche approximative), gestion des versions de documents (cvs) et convertisseur de dates – Inconvénient : lourd apprentissage et aspect rebutant pour les non-initiés – Préparer la seconde phase du projet
  • 6. La plate-forme Millefeuille ● Eclipse – Éditeur XML : logiciel libre ● Plugin (module accessoire ou “greffon” ou “extension”) : – Affichage des documents en HTML – Création et génération d'index – Filtres et navigation dans les index ● Co-développé par l'IRHT (Richard Walter) et l'INRIA (JD Fekete) – Troisième version sur le site de Telma http://www.cn-telma.fr/ (février 2010)
  • 7. A savoir ! ● Le système de perspective Millefeuille : par défaut Eclipse propose la perspective Java ● Structure du document XML/TEI – L'affichage se fait sous forme d'arbre. – Le menu contextuel (bouton droit de la souris) propose des fonctions d'édition : ● Ajout d'attribut ● Ajout d'élément
  • 8. Exercices sur les minutes ● Une minute notariale est l'acte original notarié, signé par les parties en présence ainsi que par les notaires ; la minute est conservée chez le notaire à la différence de la « grosse » qui est la copie remise aux parties.
  • 9. Exemple d'une minute notariale (AD44)
  • 10. Exercices sur les lettres de rémission « ...La lettre de rémission est un acte de la Chancellerie par lequel le roi octroie son pardon à la suite d’un crime ou d’un délit, arrêtant ainsi le cours ordinaire de la justice, qu’elle soit royale, seigneuriale, urbaine ou ecclésiastique... » Claude Gauvard.
  • 11. Exemple d'une lettre de rémission (AD44)
  • 12. Les entités nommés ● Plusieurs types : on en retient deux – Personnes – Lieux ● Lieux : problèmes – Orthographe et variante : « Bretaigne » – Changement de noms de lieux ● Personnes : problèmes – Orthographe : « Lefebure » « Lefebvre » – Identité sociale
  • 13. Les entités nommés et TEI ● <rs> chaîne de caractères <rs type="person">François Rabelais</rs> <rs type="person">sa mère</rs> <rs type="airport">Charles de Gaulle</rs>  ● <name> <name type="person">François Rabelais</name> <name type="place">Charles de Gaulle</name> <name type="person">Charles de Gaulle</name> – ou <persName> !
  • 14. Les noms de lieux <placeName> <geogName> ● <placename> nom de lieu <placename>Paris</placename> ● <geogName> nom associé à un lieu géo. <geogName>Pont Neuf</geogName>
  • 15. Les noms de personnes <persName> ● <surname> nom de famille ou patronyme ● <forename> prénom ● <roleName> titre et avant-nom ● <addName> épithète ● <nameLink> particules nobiliaires Exemple : « haute dame dame Suzanne de Bourbon dame de Rieux » <persName> <addName type="epithete-honneur">haute dame</addName> <roleName type="avant-nom">dame</roleName> <forename>Suzanne</forename><nameLink>de</nameLink> <surname>Bourbon</surname> <roleName type="titre">dame</roleName> de <geogName>Rieux</geogName> </persName>
  • 16. Démonstration ● Démonstration sur les fichiers des minutes notariales et lettres de rémission – Présentation de la plate-forme – Index de chaque fichier particulier – Index du fichier général
  • 17. Indexation ● Les index sont de plusieurs couleurs – Bleu foncé : occurrence dans le fichier ouvert – Bleu clair : occurrence régularisée dans le fichier externe ● Les index sont triés alphabétiquement; par défaut ● Externaliser signifie copier une information d'un fichier particulier dans un fichier commun à un projet. – Seul l'enrichissement commun des données est externalisé. – Le texte reste intact.
  • 18. Index particulier ● Pour supprimer une régularisation : – un clic droit sur une occurrence régularisée, – puis sélectionner « Supprimer la référence dans ce fichier ». Attention ! Seule la suppression dans le fichier particulier est effective. ● Pour externaliser plusieurs occurrences : – Externalisation en masse n'est pas recommandée – Si plusieurs occurrences concernent la même référence : sélectionner l'occurrence de référence avec les autres.
  • 19. Index général ● La couleur verte indique un fichier particulier suivi du nombre d'occurrences d'une même référence que l'on peut y trouver ● La suppression d'une référence entraîne aussi la suppression dans les fichiers particuliers : la couleur rouge y indique une référence morte ● La régularisation orthographique s'effectue dans le fichier général. – Attention ! Ne pas toucher à l'identifiant généré automatiquement ! ● Afficher au format HTML ● Les filtres