Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma

1 830 vues

Publié le

Atelier XML / TEI pour le stage d'ecdotique de l'Institut des Sources Chrétiennes - UMR 5189 HISoMA

Publié dans : Formation
  • Identifiez-vous pour voir les commentaires

  • Soyez le premier à aimer ceci

2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma

  1. 1. Stage d’ecdotique Sources Chrétiennes - UMR 5189 Hisoma Lyon, 6 mars 2014
  2. 2. Sommaire ● Spécificités de la publication en ligne ● Ce qu’il faut savoir d’XML
  3. 3. Spécificités de l’édition électronique
  4. 4. Qu’est-ce qu’un livre numérique ? Définition de F. Kaplan : “La description numérique standard du contenu d’un livre”
  5. 5. Qu’est-ce qu’un livre ? Pour Kaplan, un livre constitue une “représentation régulée” == représentation dont la production et l’ usage sont soumis à un ensemble de règles ● annuaire, ● facture, ● arbre généalogique, ● présentation powerpoint, ● édition critique...
  6. 6. Double mécanisation Les représentations régulées évoluent dans le sens d’une plus grande régularité == les conventions se transforment en mécanismes. exemple : les cartes Processus en 2 étapes : 1. règles de production 2. règles d’usage
  7. 7. Standardisation du livre selon Kaplan ● un système dont la production et l’usage sont standardisés est une “machine” ● aujourd’hui, un livre numérique est la description numérique standard du contenu d’un livre ● à partir de ce standard on peut produire un livre papier ou lu sur écran
  8. 8. Standardisation du livre (suite) ● le livre cesse d’être un objet pour devenir une ressource ● la chaîne du livre va progressivement se réorganiser autour de ce nouveau modèle (guerre économique / guerre de standards - familles de formats en compétition : ePub et TEI prennent le pas sur pdf et PS (permettent mieux de décrire le contenu) ● les textes et les images peuvent être associés à des noeuds sémantiques bien définis => vont servir de pivots entre “livres” standardisés (cf. notions d’interopérabilité et de web de données)
  9. 9. Processus éditorial “classique” Etapes : • Évaluation et sélection des manuscrits • Préparation du contenu des ouvrages • Traitement et mise en forme du texte • Définition du support • Diffusion • Distribution • Conservation, valorisation du fonds Contraintes : Garantir « citabilité », pérennité, stabilité, reconnaissance par les pairs et les évaluateurs
  10. 10. Fonctions éditoriales Dans un cadre numérique, on a donc ces mêmes “grandes fonctions éditoriales” à transposer. Selon D. Roux et P.-Y. Buard (Presses universitaires de Caen) : “ ● éditer c’est traduire une structure logique en une forme intelligible adaptée à un support donné… ● éditer c’est produire des formes référençables… ● éditer c’est diffuser… ”
  11. 11. Enjeux dans un contexte numérique ● La structuration à la source, par les auteurs (ce sont eux qui ont la meilleure maîtrise des distinctions à opérer (balises) ● L’organisation d’une production la plus automatisée possible de la mise en page papier ● Le constat d’un élargissement de la notion d'ouvrage
  12. 12. Enjeux dans un contexte numérique ● La question cruciale et difficile des interopérabilitéS ● Innover, inventer de nouveaux objets éditoriaux : cf. l'avenir machinique du Livre (F. Kaplan)... ● ..tout en respectant les contraintes de stabilité, de citabilité, de pérennité correspondant aux exigences de l’édition scientifique...
  13. 13. Notions clés pour l’édition électronique ● principe de séparation : contenu vs présentation ● 1 fichier source → plusieurs mises en forme ● Le balisage = explicitation des distinctions que l’on considère comme pertinentes
  14. 14. Chaîne éditioriale numérique (Exemple des Presses universitaires de Caen - P.-Y Buard, D. Roux)
  15. 15. à quoi sert XML ? 1. qu’est-ce que c’est ? 2. 4 principes 3. comment s’affiche-t-il ? 4. comment passe-t-on d’une source à des mises en formes modelées sur les spécificités des supports ?
  16. 16. Introduction à XML
  17. 17. 1. XML = “extensible markup language” ● un langage de balisage qui enrichit l’information textuelle en délimitant des séquences à l’intérieur d’un flux (comme html) ● un langage extensible qui permet de créer ses propres balises et des langages avec leurs propres vocabulaire et grammaire
  18. 18. balisage bla bla <balise>mon contenu</balise> bla bla bla bla <titre>Phèdre</titre> bla bla bla bla <persName>Phèdre</persName> bla bla
  19. 19. affichage possible bla bla “mon contenu” bla bla bla bla Phèdre bla bla bla bla PHEDRE bla bla
  20. 20. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  21. 21. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  22. 22. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  23. 23. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  24. 24. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  25. 25. structure d’un balise XML <balise>chaîne de caractères</balise> balise ouvrante balise fermanteContenu
  26. 26. structure d’un balise XML <p> bla bla bla <titre>Phèdre</titre> bla bla </p> explicitation de la fonction de la chaîne de caractères “Phèdre” explicitation de la fonction de la chaîne de caractères “bla bla bla bla bla” dans la structure du texte
  27. 27. le début du fichier XML Commence par une déclaration qui indique : ● la version de XML ● le type d’encodage des caractères <?xml version="1.0" encoding="UTF-8"?>
  28. 28. Structure Un document XML est structuré comme un arbre.
  29. 29. <recette> <titre>Lait de poule</titre> <ingredients> <ingredient><qté>1</qté><nom>oeuf</nom></ingredient> <ingredient><qté>10 cl</qté><nom>de lait chaud</nom></ingredient> <ingredient><nom>sucre en poudre</nom></ingredient> </ingredients> <preparation> <explications>Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade râpée. </explications> <durée/> </preparation> </recette>
  30. 30. recette titre ingrédients préparation ingrédient ingrédient ingrédient qté nom qté nom qté nom explications durée
  31. 31. [ [lait de poule][ [ [1] [oeuf] ] [ [10 cl][de lait chaud] ] ] [ [Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade râpée. ] ]
  32. 32. conformité / validité ● document bien formé : conforme aux règles de syntaxe générales (par ex. fermeture des balises, chevauchements interdits) ● document valide : suit des règles spécifiques définis dans une DTD ou un schéma (définit les autorisations d'imbrications et l'ordre d'apparition des éléments et de leurs attributs)
  33. 33. schéma ou DTD ● pas obligatoire mais compense la liberté laissée à chacun d’inventer ses balises ● avant tout : se mettre d’accord sur un langage commun… et expliciter des propriétés, des contraintes sur les relations entre éléments, etc.
  34. 34. vérifications automatiques ● des logiciels et des outils permettent de vérifier qu’un fichier est conforme à une DTD ou un schéma ● les logiciels d’édition XML permettent aussi d’afficher dans le contexte d’usage les propriétés possibles définies par le schéma
  35. 35. ex. dans Oxygen editor
  36. 36. Le schéma TEI ? ● La TEI est un cadre d’encodage générique (les recommandations ou “guidelines” pour la représentation des textes). ● Chaque projet fait un choix (une “personnalisation”) ● Cette personnalisation est explicitée dans un fichier XML de référence qui contient le schéma et sa documentation (notion de ODD)
  37. 37. affichage d’un fichier XML La manière dont les éléments de l’arbre sont affichés est spécifié dans un autre fichier : le fichier CSS (feuille de style de présentation)
  38. 38. propriétés css recette { display:block; font-family:"Times new roman"; margin:30px; } titre { display:block; font-weight:bold; font-size:2em; margin:30px; } ingredients { display:block; border:5px solid red; }
  39. 39. Transformation d’un fichier XML On a souvent besoin de réorganiser les éléments d’un fichier XML avant de les afficher, par ex. pour satisfaire les exigences différenciées de différents supports... C’est le langage de transformation XSLT qui permet de faire cela.
  40. 40. Structure d’un fichier TEI <TEI> <teiHeader/> <facsimile/> <sourceDoc/> <text/> </TEI> métadonnées images (optionnel) représentation “génétique” (optionnel) du document source représentation du texte à travers sa structure logique

×