ISO DIS 25964-1 Thésaurus pour la recherche documentaire  Sylvie Dalbin http://claimid.com/sylviedalbin À partir d’un docu...
Sommaire <ul><li>Statut de cette présentation 3 </li></ul><ul><li>1. Contexte normatif 4 </li></ul><ul><li>2. DIS 25964-1 ...
Statut de cette présentation <ul><li>Document de communication </li></ul><ul><li>A l’attention des professionnels de l’inf...
1. CONTEXTE NORMATIF
Procédures de normalisation ISO <ul><li>Des étapes formalisées </li></ul><ul><ul><li>Suivi de la procédure pour l’ISO 2596...
Documents normatifs actuels sur les thésaurus <ul><li>Les “très” anciennes normes </li></ul><ul><ul><ul><ul><li>ISO 2788:1...
Projet ISO 25964 (a) <ul><li>Proposition faite par UK en 2006 </li></ul><ul><ul><ul><ul><li>Validée par 5 pays en 2007 (US...
Projet ISO 25964 (b) <ul><li>Déroulement </li></ul><ul><ul><ul><li>Validation du démarrage du projet en ao ût 2007  </li><...
2. DIS 25964-1 : THESAURUS  POUR LA RECHERCHE DOCUMENTAIRE Partie 1 - Thésaurus pour la recherche d’information Le projet ...
Ce qui est inchangé (a) / Z47-100  (1981) <ul><li>« recommandations pour le développement et la maintenance de thésaurus. ...
Ce qui est inchangé (b) / Z47-100  (1981) <ul><li>Une liste  (ensemble/set)  de concepts  </li></ul><ul><ul><li>Utilisés e...
Ce qui est nouveau ou modifié / Z47-100  (1981) <ul><li>Un seul document normatif pour les thésaurus  monolingues et multi...
Ce qui est nouveau ou modifié / Z47-100  (exemples) <ul><li>Relations sémantiques enrichies </li></ul><ul><ul><ul><li>TGP ...
Ce qui est modifié / Z47-100 : enrichissement <ul><li>Un Guide de bonnes pratiques et un outil pratique, de 134 p. </li></...
Changements terminologiques Groupement par facettes Thesaurus Array Facette Libellé (ou étiquette) de nœud Node label Rela...
3. COMPOSANTS DE LA NORME A partir du modèle de données Chapitre 15 du DIS
Principes généraux du modèle ISO 25964-1 <ul><li>Un modèle  </li></ul><ul><ul><ul><li>représenté par des classes, attribut...
ISO25964-1  Diagramme UML scindé par Entités dans la suite du document Format  tabulaire ( excel  en ligne)
Classe -  Thesaurus  (Table 4, p.100 du DIS) <ul><li>Représentation formalisée du Thésaurus en tant qu’entité </li></ul><u...
Classe -  ThesaurusConcept  (a)   (Table 6, p.102 du DIS) <ul><li>Concepts : Identifiants obligatoires </li></ul><ul><ul><...
Classe -  ThesaurusConcept  (b) <ul><li>Concept </li></ul><ul><ul><ul><li>concept simple : « chat » </li></ul></ul></ul><u...
Classe -  ThesaurusTerm  (a)   (Table 8, p.105 du DIS) <ul><li>Terme  </li></ul><ul><ul><ul><li>terme préférentiel unique ...
Classe -  ThesaurusTerm  (b)   ( Table 8, p.105 du DIS) <ul><li>Relations d’équivalence entre termes  </li></ul><ul><ul><l...
Concept et Termes <ul><li>Le cœur d’un thésaurus est constitué des concepts et de leurs relations sémantiques </li></ul><u...
Classe -  Note  (Table 9, p. 106 du DIS) <ul><li>Attributs pour les notes </li></ul><ul><ul><li>nom de la note, date de cr...
Classe -  ConceptGroup  (Table 7, p.104 du DIS) <ul><li>Groupe de concepts/Domaines </li></ul><ul><ul><li>Facultatif </li>...
Classe -  ThesaurusArray  (a)   (Table 5, p.101 du DIS) <ul><li>Un concept appartient à une série ( ThesaurusArray)  </li>...
Classe -  ThesaurusArray  (b)   (Table 5, p.101 du DIS) <ul><li>(products) </li></ul><ul><li>milk </li></ul><ul><ul><li>(m...
Définitions et symboles employés  (p.1 à 12 du DIS) <ul><li>Définitions </li></ul><ul><ul><li>65 notions définies http://t...
Multilinguisme  (Chap. 9, Chap. 13.3.3. du DIS) <ul><li>Relations d’équivalence inter-langue  (cross-language) </li></ul><...
Présentation/Affichage du thésaurus  (chap 12, p.60 du DIS) <ul><li>Reprise des différents types d’affichage habituels </l...
Gestion du thésaurus  (chap 13, p.78-89 du DIS) <ul><li>Gestion de la construction et de la maintenance du thésaurus </li>...
Logiciel de gestion de thésaurus  (chap 14, p.90-94 du DIS) <ul><li>Partie enrichie par des recommandations sur : </li></u...
Modèle de données - Schéma XML  (Chap 15, Annexe B du DIS) <ul><li>Pour faciliter la prise en main par les concepteurs d’a...
Intégration dans des applications  (Chap. 16, p.106-109) <ul><li>Quelques recommandations sur les caractéristiques et fonc...
Formats d’échange et protocoles  (Chap. 17 et 18) <ul><li>Formats d’échange </li></ul><ul><ul><li>Sont brièvement cités qu...
Protocoles : SKOS et schéma ISO 25964-1 <ul><li>SKOS  </li></ul><ul><ul><li>Format et spécifications fonctionnelles permet...
En conclusion : recherche d’un équilibre <ul><li>Entre un outil sémantique de recherche / Un vocabulaire </li></ul><ul><ul...
4. COMMENTER
Comment commenter le DIS ? <ul><li>Fin de la période de commentaires publics : 26 Mars 2010 </li></ul><ul><li>Possibilité ...
Annexes
Annexe 1 - Participants - ISO-WG8 et NF-GE10 <ul><li>Excellent travail de groupe, au national et à l’international ! </li>...
Annexe 2 - Ressources ISO DIS 25964 en ligne <ul><li>La norme en ligne  (après inscription sur le site du BSI)   </li></ul...
Annexe 3a - Modèle de données  et représentation graphique <ul><li>Utilisation d’UML*  ( Unified Modeling Language )   </l...
Annexe 3b - UML et son vocabulaire <ul><li>UML =  langage graphique de modélisation des données et des traitements.   </li...
Annexe 3c - Comment lire le diagramme UML ? <ul><li>Vocabulaire utilisé pour le diagramme UML </li></ul><ul><li>0..1 optio...
Prochain SlideShare
Chargement dans…5
×

Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus

4 817 vues

Publié le

Présentation du projet de norme ISO DIS 25964-1 sur les thésaurus pour la recherche. A commenter avant mars 2010. (http://dossierdoc.typepad.com/descripteurs/2009/10/parution-de-la-norme-iso-dis-25964-th%C3%A9saurus.html)

Publié dans : Technologie, Business
2 commentaires
0 j’aime
Statistiques
Remarques
  • Vous l'aurez compris : vous inversez le nom des présentations :
    5à7 ADBS par Hélène Rabault et Hélène Zysman - http://www.slideshare.net/2helene/adbs-5-7-une-nouvelle-norme-pour-le-thesaurus
    Présentation destinée aux éditeurs de logiciels : http://www.slideshare.net/Dalb/iso-25964-thsaurus-pour-la-recherche-documentaire
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Ressources plus récentes :
    5à7 ADBS par Hélène Rabault et Hélène Zysman - http://www.slideshare.net/Dalb/iso-25964-thsaurus-pour-la-recherche-documentaire
    Présentation destinée aux éditeurs de logiciels : http://www.slideshare.net/2helene/adbs-5-7-une-nouvelle-norme-pour-le-thesaurus
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
4 817
Sur SlideShare
0
Issues des intégrations
0
Intégrations
271
Actions
Partages
0
Téléchargements
106
Commentaires
2
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Suivi de la procédure pour l’ISO 25964 http://tinyurl.com/yz2vgzu = http://spreadsheets.google.com/pub?key=pOP3RjZt9TWe0kLGr3PU9Nw
  • ISO TC46/SC9 - http://www.iso.org/iso/fr/iso_technical_committee.html?commid=48836
  • Thésaurus à des fins de recherche d’information ??
  • Trad. par Sylvie Dalbin Texte original - Scope : « gives recommendations for the development and maintenance of thesauri intended for information retrieval applications. It applies to vocabularies used for retrieving information about all types of information resources, irrespective of the media used (text, sound, still or moving image, physical object ormultimedia) including knowledge bases and portals, bibliographic databases, text, museum or multimediacollections, and the items within them.
  • Relations - enrichissement sémantique : typage plus fin, personnalisable - relation d’instance (spécimen, exemplaire) - des notes adaptées à l&apos;entité visée (concept, terme) et aux usages (utilisateur final, gestionnaire...) Modèle de représentation du thésaurus (modèle conceptuel) et notation - le formalisme propre au modèle entité-relation (classe-attribut-relation) - lire un diagramme des classes (avec le langage graphique UML) Eléments obligatoires (mandatory) ou optionnels (optional). Si vous voyez d&apos;autres choses qui vous semblent importantes, n&apos;hésitez pas
  • Ceci n’est qu’un exemple
  • COMMENTAIRE DIS : Sur le plan éditorial, comment rédiger le texte normatif en distinguant « visuellement » terme et concept Concernant le document lui m ême : - Ce document est surtout très enrichi par rapport à la norme NF. - Principe d&apos;une norme : un cadre général hors applicatif, des principes directeurs, des recommandations, un document technique (et non pédagogique) - Ne couvre pas tous les besoins en indexation ou en recherche. - En particulier, ce n’est pas un manuel, mais un document technique qui décrit ce qu’est un thésaurus, ce qu&apos;il doit a minima comporter et qui donne des recommandations sur la démarche de conception.
  • Lien tableau (non modifiable) : http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYdENMVFdVckFVN1JKTXYyc2Njdkp6UEE&amp;hl=fr COMMENTAIRE les regroupements par facettes et les groupes de concepts de type Domaine, sont tous deux des regroupements de concepts ! Ils sont construits sur des critères différents et ils opèrent au sein du thésaurus de façon assez différente, ce qui a poussé le groupe ISO à les distinguer sur le plan du modèle de données.
  • http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYdENMVFdVckFVN1JKTXYyc2Njdkp6UEE&amp;hl=fr COMMENTAIRE SD Pour les documentalistes ou gestionnaire de thésaurus, ce diagramme et les tableaux constituent une représentation plus rapide à percevoir, du modèle de donnée métier (le thésaurus). Toutefois, le schéma UML représente toutes les classes et en m ême temps, il ne rend pas compte de toutes les possibilités offertes dans la norme. Il ne constitue donc pas le modèle de VOTRE THESAURUS. Pour un développeur, le modèle de donnée constituent une spécification presque complète de ce qu&apos;un développeur veut savoir pour traduire le modèle selon un langage de définition de données. Ici nous avons la plupart de ce qui est nécessaire pour décider si, et dans quelle mesure, une application va se conformer à la norme. Ces spécifications sont exposés à travers un diagramme UML et des tableaux, deux outils bien connus des informaticiens.
  • COMMENTAIRE DIS : revoir le modèle de donnée et la distinction entre les deux classes
  • COMMENTAIRES identification pérenne du thésaurus, des concepts et des termes distinction entre des regroupements (ConceptGroup) et termes de tête (terme générique de haut niveau sur la branche hiérarchique) Possibilité de spécifier les relations hiérarchiques : type de relation associative Cause/Conséquence,… Domaine est le terme choisi pour s’aligner sur la terminologie des taxonomies, ontologies. Il s’apparente aux champs sémantiques, micro thesaurus, thèmes, etc. Certaines pratiques utilisaient la notion de domaine, non normée, comme un regroupement de champs sémantiques.
  • COMMENTAIRE DIS : pourquoi la relation qui unit le terme au concept n’est il pas formalisée ? Dommage de ne pas rendre la langue obligatoire pour le terme, y compris dans le cas d’un thésaurus monolingue.
  • Les « termes non préférentiels à décomposer » ne sont que des termes, mais au sein de ce langage, ces termes ne représentent pas un Concept du thésaurus. COMMENTAIRE DIS : - attributs possibles pour les termes non préférentiels décomposés (SplitsNonPreferredTerm) : désigner le vocabulaire d’origine des termes
  • Transparents à compléter avec vos propres avis …
  • S’applique à l’ensemble des concepts d’un thésaurus (quand il existe)
  • COMMENTAIRES DIS - Proposer de modifier l’intitulé de cette classe : ThesaurusArray en ConceptArray (série de concepts) Facette - « Facet analysis is useful in generating hierarchies that conform to the rules for hierarchical relationships, as setout in 10.2, because these relationships are valid only for concepts belonging to the same general category » - Dommage que le nœud soit représenté obligatoirement par terme préférentiel. Justement sur les taxonomies de navigation, on pourrait vouloir choisir un autre terme, voire un autre signe non lexical (un graphisme…) [SD] 
  • Documentation complémentaire : Du bon usage des facettes&amp;quot;, Documentaliste - Sciences de l’information, 1999, vol. 36, n° 4-5 (non accessible en ligne), qui &amp;quot;plaide [...] pour un usage plus rigoureux du terme et de l’outil [classification à facettes), qui fasse clairement le partage entre la classification des concepts et le classement des sujets. « generating hierarchies that conform to the rules for hierarchical relationships […] because these relationships are valid only for concepts belonging to the same general category » (p.58) organisation combinable à celle des regroupements thématiques ne s’applique pas nécessairement sur tout le thésaurus Utilisable dans le cas de taxonomies de navigation
  • URL du tableau des définitions - http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYdDJGeVVzT2JYbVBCZy1ScVNQcFNpU1E&amp;hl=fr
  • [autre qqchose à dire ?]
  • Symboles (explications p.95) Triangle = Is-a : terme préférentiel est « une type de » terme ; Losange = Has-a : un thésaurus (Thesaurus) contient des concepts (ThesaurusConcept)
  • Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus

    1. 1. ISO DIS 25964-1 Thésaurus pour la recherche documentaire Sylvie Dalbin http://claimid.com/sylviedalbin À partir d’un document de travail du CG46/CN357/GE10 Etabli avec Hélène Zysman et Nathalie Yakovleff - Relecture : François Feyler v1 du 21/11/2009 ISO TC46 - Information et documentation Présentation du projet de norme ISO 25964 - Thésaurus et interopérabilité avec d'autres vocabulaires
    2. 2. Sommaire <ul><li>Statut de cette présentation 3 </li></ul><ul><li>1. Contexte normatif 4 </li></ul><ul><li>2. DIS 25964-1 - Thésaurus pour la recherche documentaire 9 </li></ul><ul><ul><ul><ul><ul><li>Ce qui est inchangé / Z47-100 (1981) </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Ce qui est nouveau ou modifié / Z47-100 (1981) </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Ce qui est modifié / Z47-100 : enrichissement </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Changements terminologiques </li></ul></ul></ul></ul></ul><ul><li>3. Composants de la norme 16 </li></ul><ul><ul><ul><ul><ul><li>Principes généraux du modèle de données </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Diagramme UML </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Classes </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Définitions et symbo les </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Multilinguisme </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Présentation/Affichage du thésaurus </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Gestion du thésaurus </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Logiciel de gestion de thésaurus </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Modèle de donnée - Schéma XML </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Intégration dans des applications </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Protocoles : SKOS et schéma ISO 25964-1 </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>En conclusion : recherche d’un équilibre </li></ul></ul></ul></ul></ul><ul><li>4. Comment commenter le DIS ? 39 </li></ul><ul><li>Annexes 41 </li></ul>
    3. 3. Statut de cette présentation <ul><li>Document de communication </li></ul><ul><li>A l’attention des professionnels de l’infodoc </li></ul><ul><ul><li>Connaissant les thésaurus </li></ul></ul><ul><ul><ul><li>Cette présentation n’explique pas ce que sont les thésaurus) </li></ul></ul></ul><ul><ul><li>Utilisateurs de thésaurus suivant la norme NF Z47100 (1981) </li></ul></ul><ul><ul><ul><li>Cette présentation expose les points communs et les divergences par rapport à cette norme </li></ul></ul></ul><ul><li>S’approprier plus aisément le document normatif </li></ul><ul><ul><li>Ne se substitue pas au projet de norme elle-m ême </li></ul></ul><ul><ul><li>Comment acquérir ou consulter ce projet de norme </li></ul></ul><ul><ul><ul><li>Voir Annexe 2 </li></ul></ul></ul>
    4. 4. 1. CONTEXTE NORMATIF
    5. 5. Procédures de normalisation ISO <ul><li>Des étapes formalisées </li></ul><ul><ul><li>Suivi de la procédure pour l’ISO 25964 : http://tinyurl.com/yz2vgzu </li></ul></ul><ul><li>ISO 25964 - Partie 1 - Thésaurus pour la recherche </li></ul><ul><ul><li>Stade 4 - Enqu ête publique </li></ul></ul><ul><ul><ul><li>projet de Norme internationale (DIS = Draft Int. Standard) </li></ul></ul></ul><ul><ul><ul><li>distribué à tous les comités membres de l'ISO pour vote et observations publiques dans un délai de cinq mois, avant de passer au stade de projet final avant publication. </li></ul></ul></ul><ul><ul><ul><li>Cl ôture des commentaires : 26 mars 2010. </li></ul></ul></ul><ul><li>ISO 25964 - Partie 2 - Interopérabilité </li></ul><ul><ul><li>Stade 2 - Stade préparatoire </li></ul></ul><ul><ul><ul><li>Travail en cours au sein d’un groupe international d’experts appuyés par des groupes de travail locaux. </li></ul></ul></ul><ul><ul><ul><li>Passage au stade suivant (non publique) en 2010 </li></ul></ul></ul>
    6. 6. Documents normatifs actuels sur les thésaurus <ul><li>Les “très” anciennes normes </li></ul><ul><ul><ul><ul><li>ISO 2788:1986 (monolingue) ; ISO 5964:1985 (multilingue) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>NF Z47-100:1981 (monolingue) ; NF Z47-101:1990 (multilingue) </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Ces normes seront remplacées par l’ISO 25964-1 </li></ul></ul></ul></ul></ul><ul><li>Mises à jour dans une période récente par les anglos-saxons </li></ul><ul><ul><ul><ul><li>ANSI/NISO Z39.19:2005 - ouverture vers : </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>d’autres types de vocabulaires </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>des problématiques d’interopérabilité </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><li>BS 8723, Structured vocabularies for information retrieval, 2004/2008 </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>renforce les questions d’interopérabilité entre vocabulaires </li></ul></ul></ul></ul></ul><ul><li>IFLA - Guidelines for multilingual thesauri, 2005 et 2008 </li></ul><ul><li>W3C - SKOS Reference - Recommandation ao ût 2009 </li></ul><ul><ul><ul><ul><li>Format permettant l’exploitation sur le Web, de systèmes d’organisation de concepts comme les thésaurus ou classification </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Repose sur un modèle de thésaurus simplifié </li></ul></ul></ul></ul><ul><ul><ul><ul><li>ISO 25964-2 - interopérabilité avec ce modèle </li></ul></ul></ul></ul><ul><ul><li>Tous les liens - http://dossierdoc.typepad.com/descripteurs/2005/08/documents-normatifs.html </li></ul></ul>
    7. 7. Projet ISO 25964 (a) <ul><li>Proposition faite par UK en 2006 </li></ul><ul><ul><ul><ul><li>Validée par 5 pays en 2007 (USA, DE, ES, FR et UK) </li></ul></ul></ul></ul><ul><li>Porté par l’ ISO TC46/SC9/WG8 </li></ul><ul><ul><ul><ul><li>« Identification et description » / Vocabulaires structurés </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Miroir à l’Afnor pour la France par le CG46/CN357/GE10 </li></ul></ul></ul></ul><ul><li>Fondements : </li></ul><ul><ul><ul><ul><li>Thésaurus à des fins de recherche documentaire </li></ul></ul></ul></ul><ul><ul><ul><ul><li>S’inscrit dans les évolutions actuelles </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Tout en restant dans la continuité des normes et des pratiques </li></ul></ul></ul></ul><ul><li>Un projet de norme en 2 parties : </li></ul><ul><ul><ul><ul><li>Thesauri and interoperability with other vocabularies / Thésaurus et interopérabilité avec d’autres vocabulaires </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Part 1: Thesauri for information retrieval / Thésaurus pour la recherche d’information ( échéance fin 2010/début 2011) </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Part 2: Interoperability with other vocabularies / Interopérabilité avec d’autres vocabulaires (échéance 2011 voire 2012) </li></ul></ul></ul></ul></ul>
    8. 8. Projet ISO 25964 (b) <ul><li>Déroulement </li></ul><ul><ul><ul><li>Validation du démarrage du projet en ao ût 2007 </li></ul></ul></ul><ul><ul><ul><li>ISO DIS 25964-1 - Partie 1 </li></ul></ul></ul><ul><ul><ul><ul><ul><li>Version CD ( committee draft) en Décembre 2008 </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Version DIS (draft) - octobre 2009 - Commentaires attendus pour mars 2010 </li></ul></ul></ul></ul></ul><ul><ul><ul><li>ISO DIS 25964-1 - Partie 2 </li></ul></ul></ul><ul><ul><ul><ul><ul><li>Version WD (working draft) en juillet 2009 > DIS attendu pour le 26 mars 2010 </li></ul></ul></ul></ul></ul><ul><ul><ul><li>Calendrier du projet (explication des sigles) - http://tinyurl.com/ylre6cj </li></ul></ul></ul><ul><li>Participants </li></ul><ul><ul><ul><li>Groupe ISO - Pays représentés </li></ul></ul></ul><ul><ul><ul><ul><li>CA (2 personnes), DN (1), FR (2), DE (3), DK (2) - UK (4), US (1), SP (1) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Auditeur hors WG : ZH (1) </li></ul></ul></ul></ul><ul><ul><ul><li>Groupe Afnor : membres participants en Annexe 1 </li></ul></ul></ul>
    9. 9. 2. DIS 25964-1 : THESAURUS POUR LA RECHERCHE DOCUMENTAIRE Partie 1 - Thésaurus pour la recherche d’information Le projet de norme est présenté sous forme d’un document numérique structuré sur le site du BSI (UK) http://drafts.bsigroup.com/?d=517 (pré-inscription gratuite obligatoire)
    10. 10. Ce qui est inchangé (a) / Z47-100 (1981) <ul><li>« recommandations pour le développement et la maintenance de thésaurus. » (Scope, p.1) </li></ul><ul><ul><li>“ Cette partie de la norme ISO 25964 fournit des recommandations pour le développement et la maintenance de thésaurus destinés à des applications de recherche documentaire. Elle s’applique à des vocabulaires utilisés en recherche d’information de tout type de ressources d’information quel que soit le media concerné (texte, son, image fixe ou animé, objet physique ou multiméidas), incluant des bases de connaissances ou des portails, des bases bibliographiques ou textuelles, des collections muséales ou multimédia, et tout élément en leur sein”. </li></ul></ul>
    11. 11. Ce qui est inchangé (b) / Z47-100 (1981) <ul><li>Une liste (ensemble/set) de concepts </li></ul><ul><ul><li>Utilisés en post-coordination à l’indexation/recherche </li></ul></ul><ul><ul><li>Reliés entre eux par des relations sémantiques </li></ul></ul><ul><ul><ul><li>hiérarchiques, associatives et d’équivalence. </li></ul></ul></ul><ul><ul><li>Représentés par des termes </li></ul></ul><ul><ul><ul><li>un terme préférentiel et un seul, dans chaque langue </li></ul></ul></ul><ul><ul><ul><li>le terme préférentiel est accompagné de termes non préférentiels </li></ul></ul></ul><ul><ul><ul><li>forme des termes : langage naturel </li></ul></ul></ul><ul><li>Possibilité d’organiser ou de regrouper des ensembles de concepts sous d’autres formes </li></ul><ul><ul><li>des domaines (ou champs sémantiques, micro thésaurus) (cf.planche 27) </li></ul></ul><ul><ul><li>des facettes (cf.planches 28-29) </li></ul></ul><ul><li>Conception et maintenance d’un thésaurus </li></ul><ul><ul><li>Des règles pour le choix des concepts et des termes, et l’établissement des relations </li></ul></ul><ul><ul><li>Hors exploitation </li></ul></ul>
    12. 12. Ce qui est nouveau ou modifié / Z47-100 (1981) <ul><li>Un seul document normatif pour les thésaurus monolingues et multilingues - ISO DIS 25964-1 (2009) </li></ul><ul><li>Un enrichissement sémantique </li></ul><ul><ul><ul><li>Des relations typées (tout/partie, instance,…), personnalisables </li></ul></ul></ul><ul><ul><ul><li>Poids des concepts - un thésaurus est un « schéma de concepts » </li></ul></ul></ul><ul><ul><ul><li>Concept formellement distingué du Terme, c’est-à-dire de la forme linguistique choisie pour le représenter </li></ul></ul></ul><ul><li>Un formalisme adapté aux systèmes informatiques actuels </li></ul><ul><ul><ul><li>« Système de représentation de concepts » modélisé autour de 5 « classes » (cf. planche 18) </li></ul></ul></ul><ul><ul><ul><li>Représenté visuellement selon le formalisme UML </li></ul></ul></ul><ul><ul><ul><li>Chaque entité qui compose ce système a un identifiant, qui peut être un URI </li></ul></ul></ul><ul><li>Une norme étendue aux problématiques d’interopérabilité des thésaurus avec d’autres vocabulaires </li></ul><ul><ul><ul><li>Partie 2 initiée fin 2009, articulée avec cette Partie 1 </li></ul></ul></ul>
    13. 13. Ce qui est nouveau ou modifié / Z47-100 (exemples) <ul><li>Relations sémantiques enrichies </li></ul><ul><ul><ul><li>TGP = terme générique (partitif) et TSP = terme spécifique (partitif) </li></ul></ul></ul><ul><ul><ul><ul><ul><li>système nerveux central TGP système nerveux </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>système nerveux TSP système nerveux central </li></ul></ul></ul></ul></ul><ul><ul><ul><li>TGI = terme générique (instance) - TSI = terme spécifique (instance) </li></ul></ul></ul><ul><ul><ul><ul><ul><li>Paris TGI capitales </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>capitales TSI Paris </li></ul></ul></ul></ul></ul><ul><ul><ul><li>Rq - Cette typologie existe dans la norme ISO 2788:1986 </li></ul></ul></ul><ul><li>Relations sémantiques personnalisables </li></ul><ul><ul><li>Au lieu de EM (employer) /EP( employé pour) pour les équivalents, on peut distinguer par exemple </li></ul></ul><ul><ul><ul><li>les abréviations (étiquette AB) </li></ul></ul></ul><ul><ul><ul><li>les acronymes (étiquette AC) </li></ul></ul></ul><ul><ul><li>Autres types de relations possibles dans certains environnements </li></ul></ul><ul><ul><ul><li>Cause/Conséquence ; Processus/Produits,.. </li></ul></ul></ul>
    14. 14. Ce qui est modifié / Z47-100 : enrichissement <ul><li>Un Guide de bonnes pratiques et un outil pratique, de 134 p. </li></ul><ul><li>Des recommandations </li></ul><ul><ul><ul><li>Comment sélectionner les concepts et les organiser </li></ul></ul></ul><ul><ul><ul><ul><li>Désambigu ïser les concepts ; concepts complexes </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Enrichir les relations - Personnaliser les relations </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Prendre en compte des langues et des cultures : recommandations pour établir les équivalences - pas de norme distincte pour le multilinguisme - prise en compte des systèmes d’écriture </li></ul></ul></ul></ul><ul><ul><ul><li>Comment représenter les concepts par des termes </li></ul></ul></ul><ul><ul><ul><ul><li>Désambigu ïsation lexicale </li></ul></ul></ul></ul><ul><ul><ul><li>Comment organiser un projet « thésaurus » (conception, maintenance) </li></ul></ul></ul><ul><ul><ul><li>Quelles fonctionnalités attendre des logiciels de gestion de thésaurus </li></ul></ul></ul><ul><li>Un modèle de données </li></ul><ul><ul><ul><ul><li>Classes, attributs, relations et un schéma UML - Format d’échange XML </li></ul></ul></ul></ul><ul><li>De nombreux exemples </li></ul><ul><ul><ul><ul><li>concepts, termes, formats de présentation, mono/multilingue </li></ul></ul></ul></ul>
    15. 15. Changements terminologiques Groupement par facettes Thesaurus Array Facette Libellé (ou étiquette) de nœud Node label Relais virtuel Groupe de concepts, Domaine Concept Group Champ sémantique, micro- thésaurus, domaines,… Note explicative (ou d’emploi) Terme non préférentiel Terme préférentiel Maintenant (Fra) Scope note Non-preferred term Preferred term Maintenant (Eng) Le projet de norme n’étant pas encore traduit en français, ces traductions peuvent évoluer. Note d’application Non Descripteur Descripteur Avant (Fra)
    16. 16. 3. COMPOSANTS DE LA NORME A partir du modèle de données Chapitre 15 du DIS
    17. 17. Principes généraux du modèle ISO 25964-1 <ul><li>Un modèle </li></ul><ul><ul><ul><li>représenté par des classes, attributs, associations </li></ul></ul></ul><ul><ul><ul><li>Précision sur UML - Unified modeling language - Annexe 3 de cette présentation </li></ul></ul></ul><ul><li>5 classes principales </li></ul><ul><ul><ul><li>Thesaurus (thésaurus) [Table 4, p.100 du DIS] </li></ul></ul></ul><ul><ul><ul><li>ThesaurusConcept (concept) [Table 6, p.102 du DIS] </li></ul></ul></ul><ul><ul><ul><li>ThesaurusTerm (terme) [Table 8, p.105 du DIS] </li></ul></ul></ul><ul><ul><ul><li>Note (note) [Table 8, p.106 du DIS] </li></ul></ul></ul><ul><ul><ul><li>ConceptGroup (groupe de concepts= Domaines ) [Table 7, p.104] du DIS </li></ul></ul></ul><ul><ul><ul><li>ThesaurusArray (groupement par facettes) [Table 4, p.100 du DIS] </li></ul></ul></ul><ul><li>Chacune de ces 5 classes possède </li></ul><ul><ul><ul><li>des attributs -- obligatoires ou optionnels </li></ul></ul></ul><ul><ul><ul><ul><li>Identifiant, date (création, modification), langue, notation, type de valeur, … </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Possibilité de personnaliser des attributs </li></ul></ul></ul></ul><ul><ul><ul><li>des associations entre classes </li></ul></ul></ul><ul><ul><ul><ul><li>Exemple : la classe Concept est associée à la Classe Term </li></ul></ul></ul></ul>
    18. 18. ISO25964-1 Diagramme UML scindé par Entités dans la suite du document Format tabulaire ( excel en ligne)
    19. 19. Classe - Thesaurus (Table 4, p.100 du DIS) <ul><li>Représentation formalisée du Thésaurus en tant qu’entité </li></ul><ul><li>Des attributs pour présenter le thésaurus </li></ul><ul><ul><li>essentiellement ceux du Dublin Core </li></ul></ul><ul><ul><li>Identifiant et langue : obligatoires </li></ul></ul><ul><ul><li>Gestion des versions ( VersionHistory) </li></ul></ul><ul><ul><ul><li>version, date, note, indication de la version courante </li></ul></ul></ul><ul><ul><ul><li>Non obligatoire </li></ul></ul></ul><ul><li>Classe composée de 3 sous-classes </li></ul><ul><ul><li>ThesaurusConcept </li></ul></ul><ul><ul><li>ConceptGroup </li></ul></ul><ul><ul><li>ThesaurusArray </li></ul></ul>
    20. 20. Classe - ThesaurusConcept (a) (Table 6, p.102 du DIS) <ul><li>Concepts : Identifiants obligatoires </li></ul><ul><ul><ul><li>Distincts des Termes </li></ul></ul></ul><ul><li>Relations sémantiques entre concepts (cf aussi planche 13) </li></ul><ul><ul><ul><li>Hiérarchiques </li></ul></ul></ul><ul><ul><ul><ul><li>Concept de t ête de hiérarchie (top concept - symbole TT) </li></ul></ul></ul></ul><ul><ul><ul><li>Associatives </li></ul></ul></ul><ul><ul><ul><li>Attribution de rôles (TG, TS, TSI,…) </li></ul></ul></ul><ul><li>Notes associées au concept </li></ul><ul><ul><ul><li>Note explicative (d’emploi) </li></ul></ul></ul><ul><ul><ul><li>Note historique </li></ul></ul></ul><ul><ul><ul><li>Personnalisation avec possibilité de typer les notes </li></ul></ul></ul><ul><li>Représentation </li></ul><ul><ul><ul><li>Terme ( ThesaurusTerm ) </li></ul></ul></ul><ul><li>Regroupements </li></ul><ul><ul><ul><li>Domaines ( ConceptGroup ) </li></ul></ul></ul><ul><ul><ul><li>Facettes (ThesaurusArray) </li></ul></ul></ul>
    21. 21. Classe - ThesaurusConcept (b) <ul><li>Concept </li></ul><ul><ul><ul><li>concept simple : « chat » </li></ul></ul></ul><ul><ul><ul><li>concept complexe (chapitre 7, p.31 du DIS) </li></ul></ul></ul><ul><ul><ul><ul><li>«biodégradabilité” ou “militant des Droits de l’Homme” </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Des recommandations sur les facteurs à prendre en compte pour la division ou le maintien d’un concept complexe </li></ul></ul></ul></ul><ul><li>Catégories de concepts </li></ul><ul><ul><ul><ul><li>Objets et leurs parties physiques </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Matériaux </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Activités ou processus </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Evènements ou faits </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Propriétés des personnes, objets, matériaux ou actions </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Disciplines ou domaines </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Unités de mesure </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Types de personnes ou d’organisations </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Entités uniques analogues à des noms propres </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Lieux </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Objets spécifiques, caractéristiques topographiques, et autres entités </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Individus, fonctions et organismes </li></ul></ul></ul></ul></ul>
    22. 22. Classe - ThesaurusTerm (a) (Table 8, p.105 du DIS) <ul><li>Terme </li></ul><ul><ul><ul><li>terme préférentiel unique par langue </li></ul></ul></ul><ul><li>Attributs pour les termes </li></ul><ul><ul><ul><li>Identifiant et valeur lexicale : obligatoires </li></ul></ul></ul><ul><ul><ul><li>Gestion du terme : date, source, statut, </li></ul></ul></ul><ul><ul><ul><li>Langue </li></ul></ul></ul><ul><ul><ul><li>R ôle : abréviation, forme obsolète, caché,… </li></ul></ul></ul><ul><ul><ul><li>Personnalisation d’attributs </li></ul></ul></ul><ul><li>Note associée au terme </li></ul><ul><ul><ul><li>Historique, éditoriale, définition </li></ul></ul></ul><ul><li>Relations entre termes et concepts </li></ul><ul><ul><ul><li>non formalisées </li></ul></ul></ul><ul><li>Relations d’équivalence des termes intra-langue </li></ul><ul><ul><ul><li>Voir planche suivante </li></ul></ul></ul>
    23. 23. Classe - ThesaurusTerm (b) ( Table 8, p.105 du DIS) <ul><li>Relations d’équivalence entre termes </li></ul><ul><ul><li>entre « terme non préférentiel simple » ( SimpleNonPreferredTerm) et « terme préférentiel » ( PreferredTerm) </li></ul></ul><ul><ul><li>Exemple : café soluble EM café instantané </li></ul></ul><ul><li>Relation d’équivalence composée ( CompoundEquivalence ) entre termes </li></ul><ul><ul><li>un « terme non préférentiel à décomposer » ( SplitNonPreferredTerm) est décomposé ou scindé en au moins deux « termes préférentiels «  ( PreferredTerm) </li></ul></ul><ul><ul><li>Exemple : transplantation de rein USE transplantation d'organe + rein ( Ethique des Sciences de la Vie) </li></ul></ul>
    24. 24. Concept et Termes <ul><li>Le cœur d’un thésaurus est constitué des concepts et de leurs relations sémantiques </li></ul><ul><li>Le formalisme d’encodage distinguant concepts et termes rend : </li></ul><ul><ul><li>le dispositif plus complexe… </li></ul></ul><ul><ul><ul><li>Une gestion double : pour le concept et pour les termes </li></ul></ul></ul><ul><ul><li>mais plus souple </li></ul></ul><ul><ul><ul><li>L’indexation devrait/pourrait se faire sur l’identifiant du concept, la maintenance des termes devenant plus facile et permettant potentiellement une prise en compte plus rapide des environnements culturels et des pratiques </li></ul></ul></ul><ul><ul><ul><li>Les extractions et exports devraient également être plus simples </li></ul></ul></ul><ul><ul><li>plus proche du langage naturel </li></ul></ul><ul><ul><ul><li>« tout terme du langage naturel pouvant exprimer un concept de façon non ambiguë, étant susceptible d’être intégré comme terme non préférentiel » </li></ul></ul></ul>
    25. 25. Classe - Note (Table 9, p. 106 du DIS) <ul><li>Attributs pour les notes </li></ul><ul><ul><li>nom de la note, date de création/modification, langue, type </li></ul></ul><ul><li>Type de note </li></ul><ul><ul><li>Concepts </li></ul></ul><ul><ul><ul><li>Note explicative (ScopeNote) </li></ul></ul></ul><ul><ul><ul><li>Note historique (HistoryNote) </li></ul></ul></ul><ul><ul><ul><li>Définition (Definition) </li></ul></ul></ul><ul><ul><ul><li>Note éditoriale (EditorialNote) </li></ul></ul></ul><ul><ul><ul><li>Note personnalisable (CustomNote) </li></ul></ul></ul><ul><ul><li>Termes </li></ul></ul><ul><ul><ul><li>Note historique (HistoryNote) </li></ul></ul></ul><ul><ul><ul><li>Définition (Definition) </li></ul></ul></ul><ul><ul><ul><li>Note éditoriale (EditorialNote) </li></ul></ul></ul><ul><ul><ul><li>Note personnalisable (CustomNote) - manque sur la copie d’écran </li></ul></ul></ul>
    26. 26. Classe - ConceptGroup (Table 7, p.104 du DIS) <ul><li>Groupe de concepts/Domaines </li></ul><ul><ul><li>Facultatif </li></ul></ul><ul><ul><li>Type : « microthésaurus », « champs sémantiques », « thèmes », « domaines »… </li></ul></ul><ul><li>Attributs des domaines </li></ul><ul><ul><li>Identifiant : obligatoire </li></ul></ul><ul><ul><li>Type : obligatoire </li></ul></ul><ul><li>Relations </li></ul><ul><ul><li>relient des Concepts au ConceptGroup </li></ul></ul><ul><ul><li>HasSubGroup/ HasSuperGroup </li></ul></ul><ul><li>Forme lexicale des Domaines ( ConceptGroupL abel) </li></ul><ul><ul><li>attributs spécifiques (dates, langue) </li></ul></ul>
    27. 27. Classe - ThesaurusArray (a) (Table 5, p.101 du DIS) <ul><li>Un concept appartient à une série ( ThesaurusArray) </li></ul><ul><ul><ul><li>La série de concepts est produite en « appliquant une facette » </li></ul></ul></ul><ul><ul><ul><li>Au sein de cette série, les concepts sont frères (sibling) </li></ul></ul></ul><ul><ul><ul><li>le terme choisi pour représenter le concept est le terme préférentiel </li></ul></ul></ul><ul><ul><ul><li>Les concepts peuvent être ordonnancés ou classés (attribut : ordered) au sein de ce regroupement, indépendamment des relations hiérarchiques de chaque concept dans sa branche hiérarchique </li></ul></ul></ul><ul><li>Un libellé (étiquette) de noeud ( NodeLabel) représente la facette </li></ul><ul><ul><ul><li>Ce nœud n’est pas un concept du thésaurus </li></ul></ul></ul>
    28. 28. Classe - ThesaurusArray (b) (Table 5, p.101 du DIS) <ul><li>(products) </li></ul><ul><li>milk </li></ul><ul><ul><li>(milk by fat content) </li></ul></ul><ul><ul><ul><li>whole milk </li></ul></ul></ul><ul><ul><ul><li>low fat milk </li></ul></ul></ul><ul><ul><ul><li>skim milk </li></ul></ul></ul><ul><ul><li>(milk by form) </li></ul></ul><ul><ul><ul><li>dried milk </li></ul></ul></ul><ul><ul><ul><li>liquid milk </li></ul></ul></ul><ul><ul><li>(milk by source animal) </li></ul></ul><ul><ul><ul><li>buffalo milk </li></ul></ul></ul><ul><ul><ul><li>cow milk </li></ul></ul></ul><ul><ul><ul><li>goat milk </li></ul></ul></ul><ul><ul><ul><li>sheep milk </li></ul></ul></ul><ul><ul><li>(milk by treatment type) </li></ul></ul><ul><ul><ul><li>condensed milk </li></ul></ul></ul><ul><ul><ul><li>evaporated milk </li></ul></ul></ul><ul><ul><ul><li>homogenized milk </li></ul></ul></ul><ul><ul><ul><li>pasteurized milk </li></ul></ul></ul><ul><ul><ul><li>sterilized milk </li></ul></ul></ul><ul><li>Concepts regroupés par facettes </li></ul><ul><ul><ul><li>approche différente des regroupements thématiques </li></ul></ul></ul><ul><li>Facettes de concepts </li></ul><ul><ul><ul><li>« catégories universelles applicables à toute classification de concepts indépendamment des domaines » (Maniez, 1999) </li></ul></ul></ul><ul><ul><ul><li>entre universel et spécialisation </li></ul></ul></ul><ul><ul><ul><li>Catégories universelles </li></ul></ul></ul><ul><ul><ul><ul><li>Objets (Ex: « produits »), Matière (Ex: « matière grasse »), agents, actions/processus, lieux, temps </li></ul></ul></ul></ul><ul><li>Types de regroupements combinable avec des regroupements thématiques </li></ul>Etiquette de nœud = Node label Série de m ême rang = Array
    29. 29. Définitions et symboles employés (p.1 à 12 du DIS) <ul><li>Définitions </li></ul><ul><ul><li>65 notions définies http://tinyurl.com/yzz4pnb (tableau non modifiable) </li></ul></ul><ul><li>Symboles </li></ul><ul><ul><li>http://tinyurl.com/yj2dee5 (tableau non modifiable) </li></ul></ul><ul><ul><li>Tableau établi en fonction des pays représentés dans le Groupe ISO WG8 </li></ul></ul>TSI Terme spécifique (instance) NTI Narrower term (instantial) TSP Terme spécifique (partitif) NTP Narrower term (partitive) TSG Terme spécifique (générique) NTG Narrower term (generic) TGI Terme générique (instance) BTI Broader term (instantial) TGP Terme générique (partitif) BTP Broader term (partitive) TGG Terme générique (générique) BTG Broader term (generic) TA Terme associé RT Related term TS Terme spécifique NT Narrower term TG Terme générique BT Broader term EP Employé pour Employer pour UF Use for Used for a EM Employer USE Use NE Note explicative b Note d'emplo i SN Scope note Tags en Français Tags in English
    30. 30. Multilinguisme (Chap. 9, Chap. 13.3.3. du DIS) <ul><li>Relations d’équivalence inter-langue (cross-language) </li></ul><ul><ul><li>Equivalence exacte </li></ul></ul><ul><ul><ul><ul><li>en: sun / es: sol / fr: soleil / de: Sonne </li></ul></ul></ul></ul><ul><ul><ul><ul><li>en: rail network / fr: réseau ferroviaire / de: Schienennetz / nl: spoorwegnet </li></ul></ul></ul></ul><ul><ul><li>Equivalence inexacte ou proche </li></ul></ul><ul><ul><ul><ul><li>en: information retrieval / fr: recherche d’information </li></ul></ul></ul></ul><ul><ul><ul><ul><li>fr: jeu didactique / en: learning games </li></ul></ul></ul></ul><ul><ul><li>Equivalence partielle </li></ul></ul><ul><ul><ul><ul><li>équivalence générique/spécifique </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>de: Wissenschaft / en: science </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>NE: Comprend les sciences naturelles et sociales, et la connaissance (les savoirs) en général. </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><li>équivalence &quot;1-à-n”, “une-à-plusieurs” </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>fr: sécurité / de: Sicherheit / en: safety, security </li></ul></ul></ul></ul></ul><ul><ul><li>Non-équivalence </li></ul></ul><ul><li>Attention : cette propriété (niveau d’équivalence) n’est pas formalisée dans le modèle </li></ul>
    31. 31. Présentation/Affichage du thésaurus (chap 12, p.60 du DIS) <ul><li>Reprise des différents types d’affichage habituels </li></ul><ul><ul><li>Notice d’un concept/terme </li></ul></ul><ul><ul><li>Alphabétique </li></ul></ul><ul><ul><li>Hiérarchique avec ou sans facettes </li></ul></ul><ul><ul><li>Systémique (organisé par domaines) </li></ul></ul><ul><ul><li>Organisation par facettes </li></ul></ul><ul><ul><li>Permuté </li></ul></ul><ul><li>Pour des thésaurus multilingues </li></ul><ul><ul><li>Par langue </li></ul></ul><ul><ul><li>Table de correspondance multilingue </li></ul></ul>
    32. 32. Gestion du thésaurus (chap 13, p.78-89 du DIS) <ul><li>Gestion de la construction et de la maintenance du thésaurus </li></ul><ul><ul><li>Planification et démarche </li></ul></ul><ul><ul><li>Méthode de construction </li></ul></ul><ul><ul><li>Rédaction d’une introduction au thésaurus </li></ul></ul><ul><ul><li>Moyens de diffusion </li></ul></ul><ul><ul><li>Méthodes d’actualisation </li></ul></ul><ul><ul><li>25 ans de pratiques ont permis d’enrichir ce chapitre </li></ul></ul>
    33. 33. Logiciel de gestion de thésaurus (chap 14, p.90-94 du DIS) <ul><li>Partie enrichie par des recommandations sur : </li></ul><ul><ul><li>Taille et limitations des caractères </li></ul></ul><ul><ul><li>Relations entre termes et entre concepts </li></ul></ul><ul><ul><li>Notes se rapportant aux termes et aux concepts </li></ul></ul><ul><ul><li>Codes et notations </li></ul></ul><ul><ul><li>Regroupement par facettes </li></ul></ul><ul><ul><li>Statuts des langues </li></ul></ul><ul><ul><li>Import/export des données </li></ul></ul><ul><ul><li>Navigation et supports (aides) éditoriaux </li></ul></ul><ul><ul><li>Sauvegardes éditoriales </li></ul></ul><ul><ul><li>Outils de gestion du thésaurus </li></ul></ul><ul><ul><ul><li>25 ans de pratiques ont permis d’enrichir ce chapitre </li></ul></ul></ul>
    34. 34. Modèle de données - Schéma XML (Chap 15, Annexe B du DIS) <ul><li>Pour faciliter la prise en main par les concepteurs d’application et les développeurs </li></ul><ul><ul><li>Modèle de données (Chap.15 p.93-106 du DIS) </li></ul></ul><ul><ul><ul><li>Double présentation : en format tableau et diagramme UML </li></ul></ul></ul><ul><ul><li>Représentation graphique UML (Annexe 3 de cette présentation) </li></ul></ul><ul><ul><li>Schéma XML (Annexe B du DIS) </li></ul></ul><ul><ul><ul><li>En cours de consolidation </li></ul></ul></ul><ul><ul><ul><li>S’appuie sur un modèle standard de thésaurus (sans personnalisation) </li></ul></ul></ul><ul><ul><ul><li>Est fourni à titre informatif </li></ul></ul></ul><ul><ul><ul><li>Après une période de tests (en cours), sera en libre accès sur le site du Niso (USA) </li></ul></ul></ul><ul><ul><ul><ul><li>Bient ôt en ligne - http://www.niso.org/schemas/iso25964/ </li></ul></ul></ul></ul>
    35. 35. Intégration dans des applications (Chap. 16, p.106-109) <ul><li>Quelques recommandations sur les caractéristiques et fonctions nécessaires : </li></ul><ul><ul><li>pour permettre l’intéropérabilité entre systèmes et réseaux </li></ul></ul><ul><ul><li>pour permettre l’utilisation d’un thésaurus dans une application simple d’indexation et de recherche. </li></ul></ul><ul><ul><ul><li>Expansion à la recherche (search expansion) </li></ul></ul></ul><ul><ul><ul><li>Suggestion de termes de recherche alternatifs </li></ul></ul></ul><ul><ul><ul><li>Classification ou autres moyens pour affiner une recherche </li></ul></ul></ul><ul><ul><ul><li>Identification de fautes d’orthographe usuelles </li></ul></ul></ul><ul><ul><ul><li>Support à l’indexation automatique </li></ul></ul></ul>
    36. 36. Formats d’échange et protocoles (Chap. 17 et 18) <ul><li>Formats d’échange </li></ul><ul><ul><li>Sont brièvement cités quelques formats (MARC, SKOS, Zthes,…) </li></ul></ul><ul><li>Protocoles de recherche (Chap. 18, p.110-111) </li></ul><ul><ul><li>Présentation des buts et cas d’utilisation </li></ul></ul><ul><ul><li>Brefs éléments techniques sur l’environnement applicatif </li></ul></ul><ul><ul><li>Présentation de protocoles spécifiques aux thésaurus (SKOS API, ADL) ou orientés Web (Search Web Services, SPARQL, Z3950) </li></ul></ul>
    37. 37. Protocoles : SKOS et schéma ISO 25964-1 <ul><li>SKOS </li></ul><ul><ul><li>Format et spécifications fonctionnelles permettant l’exploitation, sur le Web, de systèmes d’organisation de concepts (thésaurus, classification,…) </li></ul></ul><ul><ul><li>Repose sur un modèle de thésaurus simplifié, mais offre des solutions pour la cohabitation simultanée de plusieurs schémas </li></ul></ul><ul><ul><li>S’appuie sur le même modèle que la norme ISO 25964, avec des spécifications fonctionnelles propres au Web </li></ul></ul><ul><ul><li>Publiée avant l’ISO 25964-1 </li></ul></ul><ul><li>Schéma XML de l’ISO 25964-1 </li></ul><ul><ul><li>Le schéma s’appuie sur un modèle standard de thésaurus (sans personnalisation) </li></ul></ul><ul><ul><li>Fourni à titre informatif </li></ul></ul><ul><ul><li>Nécessite d’être accompagné par des spécifications fonctionnelles </li></ul></ul>Ressources sur Descripteurs
    38. 38. En conclusion : recherche d’un équilibre <ul><li>Entre un outil sémantique de recherche / Un vocabulaire </li></ul><ul><ul><ul><ul><li>Une partie exclusivement dédiée aux concepts et aux relations entre concepts, indépendamment des termes </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Un (essai de) rééquilibrage du poids de tous les types de termes utiles à la recherche par rapport à la logique du « terme préféré » représentant une notion pour l’indexation </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Se détacher des spécificités des langues française et surtout anglaise, support de développement des normes initiales </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Se positionner par rapport aux normes similaires existantes : SKOS et terminologies </li></ul></ul></ul></ul><ul><li>Entre des Usages humains / Usages informatiques </li></ul><ul><ul><ul><ul><li>“ ISO 25964 makes the transition needed for the world of electronic information management” </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Tout au long du document, formulation attentive à l’Ancien et au Nouveau; ne pas bloquer les situations existantes </li></ul></ul></ul></ul><ul><li>Entre un Guide métier / Un modèle applicatif formel </li></ul><ul><ul><ul><ul><li>Décalage entre certaines règles énoncées ( ex:travailler selon le principe de l’égalité de la représentation des langues ) et un modèle formel ne pouvant suivre toutes ces règles (ex:le modèle repose sur une structure unique du thésaurus) </li></ul></ul></ul></ul><ul><li>Intégrer mieux d’autres normes </li></ul><ul><ul><ul><ul><li>RFC 4646, Tags for identifying languages </li></ul></ul></ul></ul><ul><ul><ul><ul><li>SKOS </li></ul></ul></ul></ul>
    39. 39. 4. COMMENTER
    40. 40. Comment commenter le DIS ? <ul><li>Fin de la période de commentaires publics : 26 Mars 2010 </li></ul><ul><li>Possibilité de travailler sur des chapitres particuliers </li></ul><ul><ul><ul><ul><ul><li>Concepts </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Termes </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Concepts complexes </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Relations : équivalence, hiérarchiques, associatives </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Multilinguisme (sur l’ensemble de la norme) </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Analyse par facettes </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Présentation </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Construction et gestion du thésaurus </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Fonctionnalités d’un logiciel de gestion de thésaurus </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Modèle de données </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Schémas XML </li></ul></ul></ul></ul></ul><ul><li>Commenter sous quelle forme ? </li></ul><ul><ul><ul><li>Sur le site du BSI, commentaires par chapitres - http://drafts.bsigroup.com/?d=517 </li></ul></ul></ul><ul><ul><ul><li>Via la message (avant début mars 2010) au responsable du GE10 ( [email_address] ) ou à un membre du groupe </li></ul></ul></ul>
    41. 41. Annexes
    42. 42. Annexe 1 - Participants - ISO-WG8 et NF-GE10 <ul><li>Excellent travail de groupe, au national et à l’international ! </li></ul><ul><ul><li>ISO TC46/SC9/WG8 - piloté par Stella Dextre Clarke (UK) </li></ul></ul><ul><ul><ul><ul><li>CA: Michèle Hudon, Sophie Lessard - DN: Marianne Lykke Nielsen - FR: Sylvie Dalbin, Bernard Vatant - DE: Traugott Koch, Esther Scheven ; Daniel Kless (via DK) - UK: Stella Dextre Clarke ; Leonard Will; Alan Gilchrist, Richard Light (schéma XML); US: Marcia Zeng ; SP: Francisco Javier García et Anna Martin (NISO) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Auditeur hors WG : ZH: Zhu Lijun </li></ul></ul></ul></ul><ul><ul><li>Afnor - CG46/CN357/GE10 - piloté par Sylvie Dalbin </li></ul></ul><ul><ul><ul><ul><li>Groupe constitué à partir d’un Groupe de travail de l’ADBS depuis 2003 </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Actualité des langages documentaires - Vol. 44, N° 1, février 2007 http://www.adbs.fr/revue-docsi-volume-44-n-1-fevrier-2007-15735.htm?RH=1202382041875 </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><li>Ont travaillé sur le DIS - Dominique Chichereau ; Odile Contat ; Sylvie Dalbin ; Danièle Dégez ; Alina Deniau ; Francois Feyler ; Thierry Guillotin; Dominique Ménillet ; Michel Mingam ; Hélène Rabault; Bernard Vatant ; Virginie Triboulin ; Nathalie Yakovleff, Hélène Zysman. </li></ul></ul></ul></ul>
    43. 43. Annexe 2 - Ressources ISO DIS 25964 en ligne <ul><li>La norme en ligne (après inscription sur le site du BSI) </li></ul><ul><ul><li>http://drafts.bsigroup.com/?d=517 </li></ul></ul><ul><li>Acheter la norme </li></ul><ul><ul><li>http://dossierdoc.typepad.com/descripteurs/2009/11/commenter-dis-25964-1.html </li></ul></ul><ul><li>Un Dossier Public sur GoogleDocs partiellement en français </li></ul><ul><ul><ul><li>http://tinyurl.com/ye8scrq </li></ul></ul></ul><ul><ul><ul><li>http://docs.google.com/leaf?id=0B530K5-aANOYZWFkY2NlMTAtYjIxMC00MjA2LThkODctN2MyZDBhYzk1OWY4&hl=fr </li></ul></ul></ul><ul><ul><li>4 documents en ligne </li></ul></ul><ul><ul><ul><li>Procédure ISO – </li></ul></ul></ul><ul><ul><ul><ul><li>http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYcE9QM1JqWnQ5VFdlMGtMR3IzUFU5Tnc&hl=fr </li></ul></ul></ul></ul><ul><ul><ul><li>Définitions - http://tinyurl.com/yzz4pnb </li></ul></ul></ul><ul><ul><ul><ul><li>Chapitre 2 du DIS 25964-1 </li></ul></ul></ul></ul><ul><ul><ul><ul><li>http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYdDJGeVVzT2JYbVBCZy1ScVNQcFNpU1E&hl=fr </li></ul></ul></ul></ul><ul><ul><ul><li>Codes et symboles - http://tinyurl.com/yj2dee5 </li></ul></ul></ul><ul><ul><ul><ul><li>Chapitre 3 du DIS 25964-1 </li></ul></ul></ul></ul><ul><ul><ul><ul><li>http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYcmlVeldiQTNrR3M4dHRtMTJFOFNUeGc&hl=fr </li></ul></ul></ul></ul><ul><ul><ul><li>Modèle de donnée en format tableau </li></ul></ul></ul><ul><ul><ul><ul><li>Chapitre 15 du DIS 25964-1 </li></ul></ul></ul></ul><ul><ul><ul><ul><li>http://spreadsheets.google.com/ccc?key=0Ap30K5-aANOYdENMVFdVckFVN1JKTXYyc2Njdkp6UEE&hl=fr </li></ul></ul></ul></ul>
    44. 44. Annexe 3a - Modèle de données et représentation graphique <ul><li>Utilisation d’UML* ( Unified Modeling Language ) </li></ul><ul><ul><li>langage graphique de modélisation des données et des traitements. </li></ul></ul><ul><ul><li>propose une représentation graphique du modèle métier appréhendable rapidement </li></ul></ul><ul><li>Limite </li></ul><ul><ul><li>La norme est ouverte et laisse à l’initiative du concepteur de thésaurus, un grand nombre de possibilités </li></ul></ul><ul><ul><ul><li>Toutes ces possibilités ne sont pas visibles sur le diagramme UML </li></ul></ul></ul><ul><ul><ul><li>Ce diagramme n’est pas autosuffisant pour le développement d’applications. Il doit être complété par des spécifications </li></ul></ul></ul><ul><ul><li>Diagramme UML : de classes uniquement, et non de traitements </li></ul></ul><ul><li>* ISO:CEI 19501 : 2005 – Information Technology -- Open Distributed Processing (ODP) -- Unified Modeling Language (UML), version 1.4.2 </li></ul>
    45. 45. Annexe 3b - UML et son vocabulaire <ul><li>UML = langage graphique de modélisation des données et des traitements. </li></ul><ul><li>Classes </li></ul><ul><ul><li>« déclare des propriétés communes à un ensemble d'objets, c’est-à-dire des attributs représentant l'état des objets et des méthodes représentant leur comportement » </li></ul></ul><ul><li>Attributs (valeur lexicale, date de création, de modification, langue) </li></ul><ul><ul><li>Caractéristiques (ou propriétés) des classes ou des associations </li></ul></ul><ul><li>Association (entre la classe Concept ou Terme, et la classe Note) </li></ul><ul><ul><li>connexion sémantique entre deux classes </li></ul></ul><ul><li>http://fr.wikipedia.org/wiki/Unified_Modeling_Language </li></ul>
    46. 46. Annexe 3c - Comment lire le diagramme UML ? <ul><li>Vocabulaire utilisé pour le diagramme UML </li></ul><ul><li>0..1 optionnel et non répétable (zéro ou un) </li></ul><ul><li>0..* optionnel et répétable (zéro ou plus) </li></ul><ul><li>1 obligatoire, non répétable (un seulement) </li></ul><ul><li>1..* obligatoire et répétable (un et plus) </li></ul><ul><li>est un (is-a ; « généralisation »- « type de » entre deux classes) </li></ul><ul><li>a un (has-a ; « agrégation » - relation partie/tout entre instances) </li></ul><ul><li>Types d’éléments </li></ul><ul><ul><ul><li>String ou boolean </li></ul></ul></ul><ul><ul><ul><li>date; language; class </li></ul></ul></ul><ul><ul><ul><li>Précisions pour chaque classe dans la suite du document </li></ul></ul></ul>

    ×