Stage d’ecdotique
Sources Chrétiennes - UMR 5189 Hisoma
Lyon, 6 mars 2014
Sommaire
● Spécificités de la publication en ligne
● Ce qu’il faut savoir d’XML
Spécificités de l’édition électronique
Qu’est-ce qu’un livre numérique ?
Définition de F. Kaplan :
“La description numérique standard
du
contenu d’un livre”
Qu’est-ce qu’un livre ?
Pour Kaplan, un livre constitue une
“représentation régulée”
== représentation dont la production ...
Double mécanisation
Les représentations régulées évoluent dans le
sens d’une plus grande régularité
== les conventions se ...
Standardisation du livre selon Kaplan
● un système dont la production et l’usage sont
standardisés est une “machine”
● auj...
Standardisation du livre (suite)
● le livre cesse d’être un objet pour devenir une ressource
● la chaîne du livre va progr...
Processus éditorial “classique”
Etapes :
• Évaluation et sélection des manuscrits
• Préparation du contenu des ouvrages
• ...
Fonctions éditoriales
Dans un cadre numérique, on a donc ces mêmes “grandes
fonctions éditoriales” à transposer.
Selon D. ...
Enjeux dans un contexte numérique
● La structuration à la source, par les auteurs (ce sont
eux qui ont la meilleure maîtri...
Enjeux dans un contexte numérique
● La question cruciale et difficile des interopérabilitéS
● Innover, inventer de nouveau...
Notions clés pour l’édition électronique
● principe de séparation : contenu vs présentation
● 1 fichier source → plusieurs...
Chaîne éditioriale numérique
(Exemple des Presses universitaires de Caen - P.-Y Buard, D. Roux)
à quoi sert XML ?
1. qu’est-ce que c’est ?
2. 4 principes
3. comment s’affiche-t-il ?
4. comment passe-t-on d’une source à...
Introduction à XML
1. XML = “extensible markup language”
● un langage de balisage qui enrichit l’information
textuelle en délimitant des séqu...
balisage
bla bla <balise>mon contenu</balise> bla bla
bla bla <titre>Phèdre</titre> bla bla
bla bla <persName>Phèdre</pers...
affichage possible
bla bla “mon contenu” bla bla
bla bla Phèdre bla bla
bla bla PHEDRE bla bla
2. Principes
● XML décrit les données mais ne les affiche pas
○ il ne fait rien, il décrit
● Les balises ne sont pas prédé...
2. Principes
● XML décrit les données mais ne les affiche pas
○ il ne fait rien, il décrit
● Les balises ne sont pas prédé...
2. Principes
● XML décrit les données mais ne les affiche pas
○ il ne fait rien, il décrit
● Les balises ne sont pas prédé...
2. Principes
● XML décrit les données mais ne les affiche pas
○ il ne fait rien, il décrit
● Les balises ne sont pas prédé...
2. Principes
● XML décrit les données mais ne les affiche pas
○ il ne fait rien, il décrit
● Les balises ne sont pas prédé...
structure d’un balise XML
<balise>chaîne de caractères</balise>
balise ouvrante balise fermanteContenu
structure d’un balise XML
<p> bla bla bla <titre>Phèdre</titre> bla bla </p>
explicitation de la fonction de la chaîne de ...
le début du fichier XML
Commence par une déclaration qui indique :
● la version de XML
● le type d’encodage des caractères...
Structure
Un document XML est structuré comme un
arbre.
<recette>
<titre>Lait de poule</titre>
<ingredients>
<ingredient><qté>1</qté><nom>oeuf</nom></ingredient>
<ingredient><qté...
recette
titre
ingrédients
préparation
ingrédient
ingrédient
ingrédient
qté
nom
qté
nom
qté
nom
explications
durée
[ [lait de poule][ [ [1] [oeuf] ]
[ [10 cl][de lait chaud] ] ] [ [Verser le tout dans un verre à
anse. Sucrer selon son go...
conformité / validité
● document bien formé : conforme aux règles de
syntaxe générales (par ex. fermeture des balises,
che...
schéma ou DTD
● pas obligatoire mais compense la liberté
laissée à chacun d’inventer ses balises
● avant tout : se mettre ...
vérifications automatiques
● des logiciels et des outils permettent de
vérifier qu’un fichier est conforme à une DTD
ou un...
ex. dans Oxygen editor
Le schéma TEI ?
● La TEI est un cadre d’encodage générique (les
recommandations ou “guidelines” pour la représentation
des...
affichage d’un fichier XML
La manière dont les éléments de l’arbre sont
affichés est spécifié dans un autre fichier :
le f...
propriétés css
recette {
display:block;
font-family:"Times new roman";
margin:30px;
}
titre {
display:block;
font-weight:b...
Transformation d’un fichier XML
On a souvent besoin de réorganiser les
éléments d’un fichier XML avant de les afficher,
pa...
Structure d’un fichier TEI
<TEI>
<teiHeader/>
<facsimile/>
<sourceDoc/>
<text/>
</TEI>
métadonnées
images (optionnel)
repr...
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma
Prochain SlideShare
Chargement dans…5
×

2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma

972 vues

Publié le

Atelier XML / TEI pour le stage d'ecdotique de l'Institut des Sources Chrétiennes - UMR 5189 HISoMA

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
972
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

2014 03 atelier-xml-tei-stage-ecdotique-institut-sources-chretiennes-hisoma

  1. 1. Stage d’ecdotique Sources Chrétiennes - UMR 5189 Hisoma Lyon, 6 mars 2014
  2. 2. Sommaire ● Spécificités de la publication en ligne ● Ce qu’il faut savoir d’XML
  3. 3. Spécificités de l’édition électronique
  4. 4. Qu’est-ce qu’un livre numérique ? Définition de F. Kaplan : “La description numérique standard du contenu d’un livre”
  5. 5. Qu’est-ce qu’un livre ? Pour Kaplan, un livre constitue une “représentation régulée” == représentation dont la production et l’ usage sont soumis à un ensemble de règles ● annuaire, ● facture, ● arbre généalogique, ● présentation powerpoint, ● édition critique...
  6. 6. Double mécanisation Les représentations régulées évoluent dans le sens d’une plus grande régularité == les conventions se transforment en mécanismes. exemple : les cartes Processus en 2 étapes : 1. règles de production 2. règles d’usage
  7. 7. Standardisation du livre selon Kaplan ● un système dont la production et l’usage sont standardisés est une “machine” ● aujourd’hui, un livre numérique est la description numérique standard du contenu d’un livre ● à partir de ce standard on peut produire un livre papier ou lu sur écran
  8. 8. Standardisation du livre (suite) ● le livre cesse d’être un objet pour devenir une ressource ● la chaîne du livre va progressivement se réorganiser autour de ce nouveau modèle (guerre économique / guerre de standards - familles de formats en compétition : ePub et TEI prennent le pas sur pdf et PS (permettent mieux de décrire le contenu) ● les textes et les images peuvent être associés à des noeuds sémantiques bien définis => vont servir de pivots entre “livres” standardisés (cf. notions d’interopérabilité et de web de données)
  9. 9. Processus éditorial “classique” Etapes : • Évaluation et sélection des manuscrits • Préparation du contenu des ouvrages • Traitement et mise en forme du texte • Définition du support • Diffusion • Distribution • Conservation, valorisation du fonds Contraintes : Garantir « citabilité », pérennité, stabilité, reconnaissance par les pairs et les évaluateurs
  10. 10. Fonctions éditoriales Dans un cadre numérique, on a donc ces mêmes “grandes fonctions éditoriales” à transposer. Selon D. Roux et P.-Y. Buard (Presses universitaires de Caen) : “ ● éditer c’est traduire une structure logique en une forme intelligible adaptée à un support donné… ● éditer c’est produire des formes référençables… ● éditer c’est diffuser… ”
  11. 11. Enjeux dans un contexte numérique ● La structuration à la source, par les auteurs (ce sont eux qui ont la meilleure maîtrise des distinctions à opérer (balises) ● L’organisation d’une production la plus automatisée possible de la mise en page papier ● Le constat d’un élargissement de la notion d'ouvrage
  12. 12. Enjeux dans un contexte numérique ● La question cruciale et difficile des interopérabilitéS ● Innover, inventer de nouveaux objets éditoriaux : cf. l'avenir machinique du Livre (F. Kaplan)... ● ..tout en respectant les contraintes de stabilité, de citabilité, de pérennité correspondant aux exigences de l’édition scientifique...
  13. 13. Notions clés pour l’édition électronique ● principe de séparation : contenu vs présentation ● 1 fichier source → plusieurs mises en forme ● Le balisage = explicitation des distinctions que l’on considère comme pertinentes
  14. 14. Chaîne éditioriale numérique (Exemple des Presses universitaires de Caen - P.-Y Buard, D. Roux)
  15. 15. à quoi sert XML ? 1. qu’est-ce que c’est ? 2. 4 principes 3. comment s’affiche-t-il ? 4. comment passe-t-on d’une source à des mises en formes modelées sur les spécificités des supports ?
  16. 16. Introduction à XML
  17. 17. 1. XML = “extensible markup language” ● un langage de balisage qui enrichit l’information textuelle en délimitant des séquences à l’intérieur d’un flux (comme html) ● un langage extensible qui permet de créer ses propres balises et des langages avec leurs propres vocabulaire et grammaire
  18. 18. balisage bla bla <balise>mon contenu</balise> bla bla bla bla <titre>Phèdre</titre> bla bla bla bla <persName>Phèdre</persName> bla bla
  19. 19. affichage possible bla bla “mon contenu” bla bla bla bla Phèdre bla bla bla bla PHEDRE bla bla
  20. 20. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  21. 21. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  22. 22. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  23. 23. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  24. 24. 2. Principes ● XML décrit les données mais ne les affiche pas ○ il ne fait rien, il décrit ● Les balises ne sont pas prédéfinies ○ grande liberté pour décrire une structure spécifique = souplesse ● Le balisage transmet la structure et le contenu ○ la position du contenu dans la structure est auto-descriptive, signifiante = grande expressivité ● Le jeu de balises peut être figé en une DTD ou schéma ○ qui permet de vérifier automatiquement la conformité des balisages produits = rigueur ● XML permet un traitement automatisé en restant lisible par des humains ○ il sert à écrire des descriptions pivots dans une chaîne de production
  25. 25. structure d’un balise XML <balise>chaîne de caractères</balise> balise ouvrante balise fermanteContenu
  26. 26. structure d’un balise XML <p> bla bla bla <titre>Phèdre</titre> bla bla </p> explicitation de la fonction de la chaîne de caractères “Phèdre” explicitation de la fonction de la chaîne de caractères “bla bla bla bla bla” dans la structure du texte
  27. 27. le début du fichier XML Commence par une déclaration qui indique : ● la version de XML ● le type d’encodage des caractères <?xml version="1.0" encoding="UTF-8"?>
  28. 28. Structure Un document XML est structuré comme un arbre.
  29. 29. <recette> <titre>Lait de poule</titre> <ingredients> <ingredient><qté>1</qté><nom>oeuf</nom></ingredient> <ingredient><qté>10 cl</qté><nom>de lait chaud</nom></ingredient> <ingredient><nom>sucre en poudre</nom></ingredient> </ingredients> <preparation> <explications>Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade râpée. </explications> <durée/> </preparation> </recette>
  30. 30. recette titre ingrédients préparation ingrédient ingrédient ingrédient qté nom qté nom qté nom explications durée
  31. 31. [ [lait de poule][ [ [1] [oeuf] ] [ [10 cl][de lait chaud] ] ] [ [Verser le tout dans un verre à anse. Sucrer selon son goût. Remuer et ajouter un peu de noix de muscade râpée. ] ]
  32. 32. conformité / validité ● document bien formé : conforme aux règles de syntaxe générales (par ex. fermeture des balises, chevauchements interdits) ● document valide : suit des règles spécifiques définis dans une DTD ou un schéma (définit les autorisations d'imbrications et l'ordre d'apparition des éléments et de leurs attributs)
  33. 33. schéma ou DTD ● pas obligatoire mais compense la liberté laissée à chacun d’inventer ses balises ● avant tout : se mettre d’accord sur un langage commun… et expliciter des propriétés, des contraintes sur les relations entre éléments, etc.
  34. 34. vérifications automatiques ● des logiciels et des outils permettent de vérifier qu’un fichier est conforme à une DTD ou un schéma ● les logiciels d’édition XML permettent aussi d’afficher dans le contexte d’usage les propriétés possibles définies par le schéma
  35. 35. ex. dans Oxygen editor
  36. 36. Le schéma TEI ? ● La TEI est un cadre d’encodage générique (les recommandations ou “guidelines” pour la représentation des textes). ● Chaque projet fait un choix (une “personnalisation”) ● Cette personnalisation est explicitée dans un fichier XML de référence qui contient le schéma et sa documentation (notion de ODD)
  37. 37. affichage d’un fichier XML La manière dont les éléments de l’arbre sont affichés est spécifié dans un autre fichier : le fichier CSS (feuille de style de présentation)
  38. 38. propriétés css recette { display:block; font-family:"Times new roman"; margin:30px; } titre { display:block; font-weight:bold; font-size:2em; margin:30px; } ingredients { display:block; border:5px solid red; }
  39. 39. Transformation d’un fichier XML On a souvent besoin de réorganiser les éléments d’un fichier XML avant de les afficher, par ex. pour satisfaire les exigences différenciées de différents supports... C’est le langage de transformation XSLT qui permet de faire cela.
  40. 40. Structure d’un fichier TEI <TEI> <teiHeader/> <facsimile/> <sourceDoc/> <text/> </TEI> métadonnées images (optionnel) représentation “génétique” (optionnel) du document source représentation du texte à travers sa structure logique

×