XML – un panorama


        Ivry 28 juin 2005

        Michel GRECH
        INFOTIQUE
L’information électronique, l’état des lieux

   Typologie de l’information électronique: information
    structurée – information faiblement structurée
   L’association contenu et présentation, la confusion
   L’échange des documents électroniques, les obstacles
   La pérennité de l’information
   La question des documents multilingues
Typologie de l’information électronique
structurée / non structurée

   L’information structurée : les bases de données et les
    applications « ad hoc »
    –   Mécanismes de structuration et de vérification de la cohérence
        efficaces
    –   Ne contiennent en pratique que les méta données
   L’information semi structurée : exemple des tableurs
    –   Structure « à plat » - pas de vérification de la cohérence
   L’information pas ou peu structurée : le texte
Contenu et présentation, les effets de la
confusion

   Maintenance du contenu
   Maintenance de la présentation
   La question du multi-supports
L’échange des documents électroniques
les obstacles

   Des formats propriétaires (formats de données,
    formats de fichiers)
   Des formats standards mais pas universel (rtf pour le
    texte, csv pour les bases de données)
   Des formats « pauvres » en sémantique
   La question du multilinguisme
La question de la pérennité des informations
électroniques

   La vraie nature de l’information électronique et de son
    support
   Les formats propriétaires (formats de données, formats
    de fichiers ou de stockage) et pas documentés
XML, objectifs, concepts, technologies
Ce qu’est XML, ce qu’il n’est pas

   XML est un langage à balise (comme HTML)
   XML est un métalangage (pas comme HTML)
   XML n’est pas un langage de programmation
   XML n’est pas un protocole de transport réseau
Les objectifs de XML : sémantique, portabilité
et pérennité

   Capturer la sémantique des documents électroniques
     –   Le balisage sémantique, auto-description des documents XML
   Constituer un format d’échange riche, standard et universel -
    garantir la pérennité des informations électroniques
     –   XML Norme du W3C (non propriétaire) abondamment documentée
     –   Format texte « pur » (multi plate-forme, multi-OS …) avec sémantique
     –   Support UNICODE
     –   Possibilité de partager une « grammaire commune » pour les
         échanges inter-applications
   Séparer contenu et présentation pour l’édition multi-supports
Les concepts clefs

   Documents XML
   DTD (Document Type Description) et Schémas XML
   Présentation et transformation
Documents XML

   Anatomie d’un document XML
   Arbre d’un document XML
   Eléments de syntaxe : prologue, encodage, balises,
    éléments, attributs
   Les parseurs, documents XML bien formés
   Exemple de documents XML narratifs
   Exemple de documents « orientés données »
XML et le multillinguisme

   Représentation de l’information électronique
   Jeux de caractères, codes de caractères
   Au commencement était l’ASCII
   Puis vint l’ASCII étendu et les codes « Latin-n »
   Enfin apparut UNICODE
   Les codifications UNICODE USC-2, UTF-16, UTF-8
   XML et UNICODE
Les DTD (Document Type Description)

   Le rôle d’une DTD
    –   Assurer un niveau minimum de qualité de l’information
    –   Partager des structures de documents « métiers »
   Anatomie d’une DTD
   Déclaration des éléments et des attributs
   DTD internes et DTD externes
   Validation d’un document XML
   XML et applications XML
   Limites des DTD
Schémas XML

   Rôle des schémas XML
   Le traitement des métadonnées : typage, nombre
    d’occurrences …
   Les espaces de noms
   Choix : DTD ou schémas XML ?
XML comme « bus de données »
 Échange de données – Échanges inter-
 applications


                Messages
                XML           Application
                               + parseur
Application
 + parseur
                                                               Stockage
                                            Application      Format XML
                                             + parseur
                             DTD
                           XML Schéma
                                               Application
                                                + parseur


  Application
                                 Messages
   + parseur                     XML
Présentation des contenus XML

   Utilisation des feuilles de style CSS
   Transformations XSLT
Transformation d’un document XML avec
XSLT

   Le rôle d’une feuille de style XSLT : transformer les
    documents XML
   Les feuilles de style XML sont écrites en XML
   Processeurs XSLT
   Modèles et règles modèles
Les applications d’XML
Outils et applications XML,

   Éditeurs et Parseurs
   Les « Applications XML » : Dublin Core, TEI …
   Open Office et XML
   Les bases de données et XML, exportation de
    requêtes, importation de XML schémas
Bibliographie

   Introduction à XML – éditions O’REILLY
   Introduction : http://www.chez.com/xml/
   Plus complet : http://xmlfr.org/
   Pour les développeurs : http://xml.developpez.com/

Xml un panorama

  • 1.
    XML – unpanorama Ivry 28 juin 2005 Michel GRECH INFOTIQUE
  • 2.
    L’information électronique, l’étatdes lieux  Typologie de l’information électronique: information structurée – information faiblement structurée  L’association contenu et présentation, la confusion  L’échange des documents électroniques, les obstacles  La pérennité de l’information  La question des documents multilingues
  • 3.
    Typologie de l’informationélectronique structurée / non structurée  L’information structurée : les bases de données et les applications « ad hoc » – Mécanismes de structuration et de vérification de la cohérence efficaces – Ne contiennent en pratique que les méta données  L’information semi structurée : exemple des tableurs – Structure « à plat » - pas de vérification de la cohérence  L’information pas ou peu structurée : le texte
  • 4.
    Contenu et présentation,les effets de la confusion  Maintenance du contenu  Maintenance de la présentation  La question du multi-supports
  • 5.
    L’échange des documentsélectroniques les obstacles  Des formats propriétaires (formats de données, formats de fichiers)  Des formats standards mais pas universel (rtf pour le texte, csv pour les bases de données)  Des formats « pauvres » en sémantique  La question du multilinguisme
  • 6.
    La question dela pérennité des informations électroniques  La vraie nature de l’information électronique et de son support  Les formats propriétaires (formats de données, formats de fichiers ou de stockage) et pas documentés
  • 7.
  • 8.
    Ce qu’est XML,ce qu’il n’est pas  XML est un langage à balise (comme HTML)  XML est un métalangage (pas comme HTML)  XML n’est pas un langage de programmation  XML n’est pas un protocole de transport réseau
  • 9.
    Les objectifs deXML : sémantique, portabilité et pérennité  Capturer la sémantique des documents électroniques – Le balisage sémantique, auto-description des documents XML  Constituer un format d’échange riche, standard et universel - garantir la pérennité des informations électroniques – XML Norme du W3C (non propriétaire) abondamment documentée – Format texte « pur » (multi plate-forme, multi-OS …) avec sémantique – Support UNICODE – Possibilité de partager une « grammaire commune » pour les échanges inter-applications  Séparer contenu et présentation pour l’édition multi-supports
  • 10.
    Les concepts clefs  Documents XML  DTD (Document Type Description) et Schémas XML  Présentation et transformation
  • 11.
    Documents XML  Anatomie d’un document XML  Arbre d’un document XML  Eléments de syntaxe : prologue, encodage, balises, éléments, attributs  Les parseurs, documents XML bien formés  Exemple de documents XML narratifs  Exemple de documents « orientés données »
  • 12.
    XML et lemultillinguisme  Représentation de l’information électronique  Jeux de caractères, codes de caractères  Au commencement était l’ASCII  Puis vint l’ASCII étendu et les codes « Latin-n »  Enfin apparut UNICODE  Les codifications UNICODE USC-2, UTF-16, UTF-8  XML et UNICODE
  • 13.
    Les DTD (DocumentType Description)  Le rôle d’une DTD – Assurer un niveau minimum de qualité de l’information – Partager des structures de documents « métiers »  Anatomie d’une DTD  Déclaration des éléments et des attributs  DTD internes et DTD externes  Validation d’un document XML  XML et applications XML  Limites des DTD
  • 14.
    Schémas XML  Rôle des schémas XML  Le traitement des métadonnées : typage, nombre d’occurrences …  Les espaces de noms  Choix : DTD ou schémas XML ?
  • 15.
    XML comme «bus de données » Échange de données – Échanges inter- applications Messages XML Application + parseur Application + parseur Stockage Application Format XML + parseur DTD XML Schéma Application + parseur Application Messages + parseur XML
  • 16.
    Présentation des contenusXML  Utilisation des feuilles de style CSS  Transformations XSLT
  • 17.
    Transformation d’un documentXML avec XSLT  Le rôle d’une feuille de style XSLT : transformer les documents XML  Les feuilles de style XML sont écrites en XML  Processeurs XSLT  Modèles et règles modèles
  • 18.
  • 19.
    Outils et applicationsXML,  Éditeurs et Parseurs  Les « Applications XML » : Dublin Core, TEI …  Open Office et XML  Les bases de données et XML, exportation de requêtes, importation de XML schémas
  • 20.
    Bibliographie  Introduction à XML – éditions O’REILLY  Introduction : http://www.chez.com/xml/  Plus complet : http://xmlfr.org/  Pour les développeurs : http://xml.developpez.com/