mise en ligne d’objets et d’images électroniques
Objectifs du séminairePrésenter les concepts gérés par Open melodiearchive, ensemble, corpus, champ, objet, représentation, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotation, images très haute résolutionProblématique de la fusion de donnéesProcessus d’indexationProcessus de requêteOuverture sur l’Internet
PlanPartie 1 : création et indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion, perspectives
Analyse du problèmeProblème posé : mettre en ligne les données du MAVIOn dispose au départ de 3 corpusLeur nombre est appelé à augmenterOn souhaite les « mettre en ligne »
Base de données – 1Premier corpus : monnaies persesBase de données – 2Deuxième corpus : monnaies de LycieBase de données – 3Troisième corpus : sceaux « de Collon »Processus d’indexation – 1« entrer les objets dans la base »Processus classiqueIndentification de chaque corpusCréation d’une tableÉventuellement de tables « autour » : thésaurusCréation de champs dans cette table Création de colonnes, attribution d’un type (caractère, nombre, date, etc…)Indexation des objets
Données brutes
Processus d’indexation – 2Indexer un objet = attribuer une valeur à chaque champ de cet objet
Notion de thésaurus – 1Cas des listes d’autoritéMétal, dénomination
Notion de thésaurus – 2Cas des listes d’autoritéMétal, dénomination
Notion de thésaurus – 3Relation père / enfant pour les éléments d’un thésaurusIndépendance corpus / thésaurusCertains éléments peuvent ne pas être référencésUn élément peut être référencé par plusieurs corpus différentsPrincipe : les éléments d’un thésaurus ne doivent pas porter d’information relative à un corpus
Extension des thésaurusCas des thésaurus dont les éléments ne sont pas exclusivement textuelsEx : lieux géographiques« Ensembles de valeurs contrôlées »Mêmes fonctionnalités que les thésaurus
Processus d’indexation – 3Approche classique (Access, FileMaker) : ⇒ on arrive à une structure « figée »Question des évolutions	Ajout de champ : simpleAjouter un corpus = ajouter une table, voire plusieursConfiguration du moteur de recherche
RequêtesRequête classique : R1 : trouver l’objet dont le numéro d’inventaire est CGR 1234
Problèmes approche classique« tous les objets » ⇒ une requête par tableLe nombre de requêtes augmente avec le nombre de corpusConfiguration de métadonnées sur les tablesReconfiguration à chaque ajout de corpusNécessité de prévoir les champs sur lesquels vont opérer les requêtesProblème de « passage à l’échelle »
SolutionApproche MAVI, Open melodieStocker le format de l’indexation en baseLe moteur de recherche connaît le format des indexation, et sait où aller chercher l’informationConserver la notion de corpus, mais traiter l’objet indépendammentUn objet peut vivre indépendamment d’un corpus
Un corpus définit une liste de champs
Attacher un objet à un corpus définit ses champs, permet de l’indexerPremières notions – 1ObjetA un nom, vit indépendamment de son indexationCorpusContient des objetsComporte des champsRelation objet – corpusUn corpus contient des objetsPour être indexé, un objet doit appartenir à un corpusUn objet peut appartenir à plusieurs corpus
Premières notions – 2ObjetObjet du monde réel (une monnaie, un sceau)CorpusEnsemble d’objets qui partagent la même indexationChampÉlément d’indexation d’un objetIndexation – propre à un objetEnsemble des valeurs des champs pour un objet
Base de données – remarquesUne base de données gère des tablesDans les tables sont enregistrées des entitésDans une table :Chaque champ est une colonneChaque ligne est un enregistrementChaque entité possède un ID (= clé primaire)Référence par ID possible (clé étrangère)La valeur des ID est géré par la base
Premières notions – 3Toutes les notions gérées par Open melodie sont des entités en baseLes corpus, objets, champs, thésaurus, mots-clés, valeurs contrôlées, etc… possèdent tous un IDIls possèdent en plus des « champs techniques »Date de création, date dernière modificationCréateur, dernier indexeur à avoir modifié l’entitéChamps permettant de gérer la sécurité
Fusion de données – 1Créer plusieurs corpus revient à faire cohabiter plusieurs bases de données en une seuleProblématique du MAVI : 42 corpus Il s’agit de « fusion de données »Q1 : comment les données interagissent-elles entre elles ? Q2 : comment configurer le moteur de recherche ?
Interactions entre les donnéesLes données partagent les mêmes thésaurusLes données peuvent se référencer les unes les autres« Voir aussi » est un lien vers un autre objet, d’un autre corpus
Interactions entre les donnéesIdentification des champs de même nature
Type de champNotion indépendante d’un corpusPlusieurs champs d’un même corpus peuvent avoir le même typeUn type peut être utilisé par autant de corpus que l’on veutChaque champ possède un typeAutorise les requêtes inter-corpus
Création de corpusObjet : recherche des champs communschampnom du champtype du champ
Création de corpusObjet : recherche des champs communschampnom du champtype du champtype de base
Processus d’indexation – 2« entrer les objets dans la base »Processus de création de corpus et d’objetsCréation d’un corpusAjout de champs à ce corpusCréation d’objetsAttribution d’un objet à un ou plusieurs corpusIndexation des objets, corpus par corpus
Création d’un corpusRéserve de type de champs commune à tous les corpusMots-clés iconoDénominationCorpusID de corpusChamps techniquesNum. Inv.CatégorieNomTypeBibliographieMatériauChamp 1PRNRéf.Champ 2Dénom.Réf.CommentairesChamp 3DescriptionRéf.Champ 4BiblioRéf.Description
Le MAVI possède une quarantaine de types de champsEnviron 20 sont vraiment utilisésLes types de champs on été créés à partir des 12 corpus initiauxDepuis l’ouverture du MAVI, 30 corpus ont été ajouté, sans modification de la liste des types de champCette liste est donc stable depuis 6 ansCas du MAVI
Exemple d’indexation – 1
Exemple d’indexation – 2
Exemple d’indexation – 3
Exemple d’indexation – 4
Exemple d’indexation – 5
Exemple d’indexation – 6
Moteur de rechercheRequête faite sur les types de champ plutôt que sur le corpus : Ex : sélectionner tous les objets dont le numéro d’inventaire est CGR 1234Possibilité de créer des formulaires de requêtes à partir des types de champ existantsEx : Numéros d’inventaire, catégories, thèmes iconos, matériaux, lieu de trouvaille, etc…Contraintes au niveau de l’indexationCas des données « intrinsèques »
LimitationsExtension de la plateforme à d’ « autres projets SHS »projets inconnus, données inconnuesLes 40 types de champs vont-il suffire ? Probablement pas -> le risque est rédhibitoireMAVI : liste de types de champs fixéesOpen melodie : types de champs dynamiqueson peut créer ses propres types de champs
Types de champs dynamiquesNotion propre à Open melodieMêmes propriétés que les types de champs du MAVIAutorise toujours les requêtes inter-corpusCouche d’abstraction supplémentaire à gérerComplexité supplémentaire de la BD
Processus d’indexation – 3Processus de création de corpus et d’objets dans Open melodieIdentification et création de types de champsCréation d’un corpusAjout de champs à ce corpusCréation d’objetsAttribution d’un objet à un ou plusieurs corpusIndexation des objets, corpus par corpus
Création d’un type de champ – 1Un type de champ est créé sur un type de baseProcessus de création d’un type de champ : Choix d’un nomChoix d’un type de base (chaîne de caractère, nombre, date, etc…)Création du type de champ
Création d’un type de champ – 2Liste des types de base simplesChaîne de caractères, nombre entier ou décimal, date, booléenMot-clé, valeur contrôléeTexte court ou long, multilingue ou unilingueRelation vers un autre objetRelation vers une ressource
Données textuelles – 1Un texte peut être court ou longTous les textes gérés par Open melodie sont associés à une « locale » (norme ISO 639)Une locale est presque une langueUn texte peut être unilingue ou multilingueMultilingue : traduction exacte possible (cas des mots-clés)Unilingue : associé à une langue, pas de traduction exacte possible
Données textuelles – 2Exemple 1 : texte court multilingue (mot-clé)Chaque version est interchangeable, et affichée en fonction de la langue de l’interfaceExemple 2 : texte long unilingue (description)
Données textuelles – 3Open melodie permet d’ajouter une traduction aux textes unilinguesUne traduction est un texte unilingueIl vient en annotation du texte original, on peut donc l’afficher en tant que telElle ne change pas l’affichage du texte dans sa version originale, quelle que soit la langue de l’interface
Exemple : OIP 117
Texte enrichi – 1Résultat dans un navigateur
Texte enrichi – 2Outil de saisie base Murašû
Création d’un type de champ – 3Liste des types de base complexesListe de type de baseType compositeEx 1 : liste de mots-clés iconographiquesComposé d’autant de mots-clés icono que nécessaireEx 2 : lieu géolocaliséComposé d’un nom de lieu, d’une latitude et d’une longitudeLe nom de lieu vient d’un thésaurus
Création d’un type de champ – 4Ex 3 : liste de mots-clés icono commentéeComposé d’une liste de mots-clés iconoEt d’un commentaire, grand texte unilingueLes types « liste » et « composite » permettent d’assembler des types de champs complexes
Création d’un type de champ – 5Processus de création d’un type de champ : Choix d’un nomChamp simple : choix d’un type de baseChamp liste : choix d’un type de champ élémentChamp composite : choix de types de champs élémentCréation du type de champLe type de champ peut ensuite être utilisé pour créer des champs de corpus
Étude de cas 1 : FANABase de lieux de culte de l’Italie antiqueÉtat du projetLa structure de la base est stabiliséeL’indexation peut démarrer depuis la rentréePrésentation de la base à l’INHA en avril 2009
Structure de la base v3
FANA – 1Cinq types d’objet ⇒ cinq corpusSource littéraireLieu de culteMobilierAménagementInscription
FANA – 2Sources littéraires
FANA – 3Sources littéraires
FANA – 4Aménagements
FANA – 5Aménagements
Étude de cas 2 : MAVIEnsemble des tablettes de PhiladelphieIntégré dans le MAVI actuel via des simplificationsIntégrable en totalité dans Open melodieDeux entrées : Corpus de tablettes Chaque tablette a plusieurs facesChaque face peut comporter des empreintes de sceauxCorpus de sceauxRéférence les empreintes
MAVI – 15 corpus : tablettes, faces, sceaux, empreintesSceauxTablettesFaces de tablettesEmpreintes de sceaux
MAVI – 2Exemple de tablette : CBS 5269CBS 5269CBS-5269-2empreinte-niCBS-5269-Legrain-903CBS-5269-empreinte-ni1Sceau ?CBS-5269-empreinte-ni2Sceau ?
MAVI – 3Exemple de sceauSeal of Ellil-shum-iddina, son of Taddannu5269Seal of Aplâ son of Ninib-nadinSeal of Shum-iddina, son of illu-NinibCBS 5269 ?
MAVI – 4Notion de sous-objet / objet parent transposée du MAVI à Open melodieAjout d’un type de champ « objet en relation » dans Open melodieOn peut donc ajouter les relations qui n’ont pu être créées dans le MAVI
DémonstrationCréation d’un corpus simple « à la main » et indexation de quelques objetsImportation massive d’un corpus du MAVI et ses thésaurus
Moyens d'indexationCréation rapide objet par objetIndexation via les grillesIndexation via des formulairesCréation par import massifPassage par Google spreadsheet (Excel)Possibilité d’import partiel (champs)
PlanPartie 1 : création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
Notion d’ensemblesEspace de rangement d’objetsPeut avoir des sous-ensemblesMême notion que le MAVIRegrouper des objets inter-corpusUtile pour les entrées thématiquesDans Open melodie : utilisés en plus pour la publication
Cas du MAVI – 1Processus d’intégration d’objets (MAVI)Une seule personne
Cas du MAVI – 2Modification d’objets : idem création… en un peu plus compliqué !Effacement d’objets : non prévuLe « processus » est refaire !
Cas d’Open melodie – 1Indexation : processus Open melodie
Cas d’Open melodie – 2Accès à plusieurs : nécessité d’une « sécurité »
Modèle de sécuritéIsoler les données qui ne sont pas dans le même projet	Ex : MAVI et FanaAu sein d’un même projet, empêcher les fausses manipulations	Ex : PFA / Murasu / OstrakaBesoin d’un système de sécurité	Administrateur, jeu de droits en lecture / écriture
Notion d’archive – 1Un projet est une « archive »Les données d’une archive sont isolées des autres archivesUne archive a un / des administrateursToute entité Open melodie doit vivre dans une archiveRien ne vit à l’extérieur d’une archive
Notion d’archive – 2À l’intérieur d’une archive : droits sur des entitésStatut publique / protégé / privé des entitésType de droits : lecture / modification / effacementAppliqués aux entités d’Open melodie, chaque entité possède une étiquette de sécuritéOn peut regrouper les droits en « profils », et attribuer les profils à des utilisateursÀ chaque opération sur une entité, Open melodie vérifie les droitsContrôle au niveau IHM et à « bas niveau »
Base Open melodie – 1    ArchiveCorpusEnsemblesObjetsThésaurusValeurs contrôléesTypes de champsAnnotationsImages haute résolutionTraductionsRessources (PDF, liens, …)Textes
Base Open melodie – 2Repository Open melodie    Archive MAVI    Archive PFA    Archive Murasu    Archive Ostraka    Archive FANA    Archive …Utilisateurs
Base Open melodie – 2L’IHM Open melodie a son propre designPossibilités d’afficher les données MAVI / Fana / etc… dans leur propre interfaceIHM d’administrationOpen melodieBase Open melodie
Organisation généraleBase Open melodieIHM d’administrationOpen melodieConnecteur XMLIHM de consultation MAVIIHM de consultation FANA
Bilan financierMise en ligne classique vs Open melodie
PlanPartie 1 : création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
Processus de publicationProcessus global de création / publicationCréation de donnéesNOKValidationModificationsOKPublicationIHM publiqueOAI – PMHSPARQL / Web sémantique
OAI – PMHPublier des données partielles (références vers les données complètes) auprès de moteurs de recherches globauxProtocole XML avec format de données fixéLes moteurs de recherche moissonnent les données en automatiqueSupporté par le méta portail AdonisOpen melodie supporte(ra) OAI – PMHFutur : support de SPARQL et Web sémantique
Interfaces extérieuresProblème : déclarer les données « publiées » dans l’IHM publiqueCréation de deux ensembles particuliersIHM publique : le contenu est publiée dans l’IHM publiqueOAI – PMH : le contenu est publié sur le connecteur OAI – PMH Connexion possible aux flux RSS
PlanPartie 1 : création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
État des lieux – 1Open melodie est un logiciel open source et libre de droitTout le monde (ie informaticien) peut l’installer  « chez soi » (ie sur l’intranet de son labo)Open source : pérenne (n’importe qui peut le corriger, l’étendre, etc…)Publier les modifications sous la même licenceTesté en automatique avant livraisonLibre de droit : gratuit !
État des lieux – 2Version 0.4 publiée 17/6/09Code serveur stabilisé et testéSupport pour toutes les entités Open melodieArchive, corpus, thésaurus, ensembles de valeurs contrôlées, types de champs, indexationsImport massif des Google spreadsheetsPremiers éléments d’IHM (première version)Prochaine version : 0.7, prévue mi janvierTotalité des fonctionnalités, dans une IHM prototype
Tâches pour la v0.7 – 1
Tâches pour la v0.7 – 2
Tâches futuresConnecteurs XMLDesign d’une interface finaleAméliorations ergonomiques, designJuin 2010 : publication d’une v1.0À partir de juin 2010 :V1.0 sera en maintenance correctiveDébut des développements d’une v2.0 avec nouvelles fonctionnalitésCompatibilité des version corrigées avec la v1.0Possible migration entre v1.0 et v2.0
Utilisation d'Open melodieOutil testé en automatiqueStructure de base / serveur stableLes données enregistrées ne sont pas perdues !Phase d’apprentissagePeut se faire dans une archive « bac à sable »Documentation en ligneOutil en développementToutes les idées sont bonnes à prendrePriorité aux utilisateurs
LiensBlog : http://openmelodie.blogspot.com/Téléchargement : http://sourceforge.net/projects/openmelodie/Bêta-test :http://www.achemenet.com/openmelodie-beta/
Open melodie concepts
Open melodie concepts

Open melodie concepts

  • 1.
    mise en ligned’objets et d’images électroniques
  • 2.
    Objectifs du séminairePrésenterles concepts gérés par Open melodiearchive, ensemble, corpus, champ, objet, représentation, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotation, images très haute résolutionProblématique de la fusion de donnéesProcessus d’indexationProcessus de requêteOuverture sur l’Internet
  • 3.
    PlanPartie 1 :création et indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion, perspectives
  • 4.
    Analyse du problèmeProblèmeposé : mettre en ligne les données du MAVIOn dispose au départ de 3 corpusLeur nombre est appelé à augmenterOn souhaite les « mettre en ligne »
  • 5.
    Base de données– 1Premier corpus : monnaies persesBase de données – 2Deuxième corpus : monnaies de LycieBase de données – 3Troisième corpus : sceaux « de Collon »Processus d’indexation – 1« entrer les objets dans la base »Processus classiqueIndentification de chaque corpusCréation d’une tableÉventuellement de tables « autour » : thésaurusCréation de champs dans cette table Création de colonnes, attribution d’un type (caractère, nombre, date, etc…)Indexation des objets
  • 6.
  • 7.
    Processus d’indexation –2Indexer un objet = attribuer une valeur à chaque champ de cet objet
  • 8.
    Notion de thésaurus– 1Cas des listes d’autoritéMétal, dénomination
  • 9.
    Notion de thésaurus– 2Cas des listes d’autoritéMétal, dénomination
  • 10.
    Notion de thésaurus– 3Relation père / enfant pour les éléments d’un thésaurusIndépendance corpus / thésaurusCertains éléments peuvent ne pas être référencésUn élément peut être référencé par plusieurs corpus différentsPrincipe : les éléments d’un thésaurus ne doivent pas porter d’information relative à un corpus
  • 11.
    Extension des thésaurusCasdes thésaurus dont les éléments ne sont pas exclusivement textuelsEx : lieux géographiques« Ensembles de valeurs contrôlées »Mêmes fonctionnalités que les thésaurus
  • 12.
    Processus d’indexation –3Approche classique (Access, FileMaker) : ⇒ on arrive à une structure « figée »Question des évolutions Ajout de champ : simpleAjouter un corpus = ajouter une table, voire plusieursConfiguration du moteur de recherche
  • 13.
    RequêtesRequête classique :R1 : trouver l’objet dont le numéro d’inventaire est CGR 1234
  • 14.
    Problèmes approche classique« tousles objets » ⇒ une requête par tableLe nombre de requêtes augmente avec le nombre de corpusConfiguration de métadonnées sur les tablesReconfiguration à chaque ajout de corpusNécessité de prévoir les champs sur lesquels vont opérer les requêtesProblème de « passage à l’échelle »
  • 15.
    SolutionApproche MAVI, OpenmelodieStocker le format de l’indexation en baseLe moteur de recherche connaît le format des indexation, et sait où aller chercher l’informationConserver la notion de corpus, mais traiter l’objet indépendammentUn objet peut vivre indépendamment d’un corpus
  • 16.
    Un corpus définitune liste de champs
  • 17.
    Attacher un objetà un corpus définit ses champs, permet de l’indexerPremières notions – 1ObjetA un nom, vit indépendamment de son indexationCorpusContient des objetsComporte des champsRelation objet – corpusUn corpus contient des objetsPour être indexé, un objet doit appartenir à un corpusUn objet peut appartenir à plusieurs corpus
  • 18.
    Premières notions –2ObjetObjet du monde réel (une monnaie, un sceau)CorpusEnsemble d’objets qui partagent la même indexationChampÉlément d’indexation d’un objetIndexation – propre à un objetEnsemble des valeurs des champs pour un objet
  • 19.
    Base de données– remarquesUne base de données gère des tablesDans les tables sont enregistrées des entitésDans une table :Chaque champ est une colonneChaque ligne est un enregistrementChaque entité possède un ID (= clé primaire)Référence par ID possible (clé étrangère)La valeur des ID est géré par la base
  • 20.
    Premières notions –3Toutes les notions gérées par Open melodie sont des entités en baseLes corpus, objets, champs, thésaurus, mots-clés, valeurs contrôlées, etc… possèdent tous un IDIls possèdent en plus des « champs techniques »Date de création, date dernière modificationCréateur, dernier indexeur à avoir modifié l’entitéChamps permettant de gérer la sécurité
  • 21.
    Fusion de données– 1Créer plusieurs corpus revient à faire cohabiter plusieurs bases de données en une seuleProblématique du MAVI : 42 corpus Il s’agit de « fusion de données »Q1 : comment les données interagissent-elles entre elles ? Q2 : comment configurer le moteur de recherche ?
  • 22.
    Interactions entre lesdonnéesLes données partagent les mêmes thésaurusLes données peuvent se référencer les unes les autres« Voir aussi » est un lien vers un autre objet, d’un autre corpus
  • 23.
    Interactions entre lesdonnéesIdentification des champs de même nature
  • 24.
    Type de champNotionindépendante d’un corpusPlusieurs champs d’un même corpus peuvent avoir le même typeUn type peut être utilisé par autant de corpus que l’on veutChaque champ possède un typeAutorise les requêtes inter-corpus
  • 25.
    Création de corpusObjet: recherche des champs communschampnom du champtype du champ
  • 26.
    Création de corpusObjet: recherche des champs communschampnom du champtype du champtype de base
  • 27.
    Processus d’indexation –2« entrer les objets dans la base »Processus de création de corpus et d’objetsCréation d’un corpusAjout de champs à ce corpusCréation d’objetsAttribution d’un objet à un ou plusieurs corpusIndexation des objets, corpus par corpus
  • 28.
    Création d’un corpusRéservede type de champs commune à tous les corpusMots-clés iconoDénominationCorpusID de corpusChamps techniquesNum. Inv.CatégorieNomTypeBibliographieMatériauChamp 1PRNRéf.Champ 2Dénom.Réf.CommentairesChamp 3DescriptionRéf.Champ 4BiblioRéf.Description
  • 29.
    Le MAVI possèdeune quarantaine de types de champsEnviron 20 sont vraiment utilisésLes types de champs on été créés à partir des 12 corpus initiauxDepuis l’ouverture du MAVI, 30 corpus ont été ajouté, sans modification de la liste des types de champCette liste est donc stable depuis 6 ansCas du MAVI
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
    Moteur de rechercheRequêtefaite sur les types de champ plutôt que sur le corpus : Ex : sélectionner tous les objets dont le numéro d’inventaire est CGR 1234Possibilité de créer des formulaires de requêtes à partir des types de champ existantsEx : Numéros d’inventaire, catégories, thèmes iconos, matériaux, lieu de trouvaille, etc…Contraintes au niveau de l’indexationCas des données « intrinsèques »
  • 37.
    LimitationsExtension de laplateforme à d’ « autres projets SHS »projets inconnus, données inconnuesLes 40 types de champs vont-il suffire ? Probablement pas -> le risque est rédhibitoireMAVI : liste de types de champs fixéesOpen melodie : types de champs dynamiqueson peut créer ses propres types de champs
  • 38.
    Types de champsdynamiquesNotion propre à Open melodieMêmes propriétés que les types de champs du MAVIAutorise toujours les requêtes inter-corpusCouche d’abstraction supplémentaire à gérerComplexité supplémentaire de la BD
  • 39.
    Processus d’indexation –3Processus de création de corpus et d’objets dans Open melodieIdentification et création de types de champsCréation d’un corpusAjout de champs à ce corpusCréation d’objetsAttribution d’un objet à un ou plusieurs corpusIndexation des objets, corpus par corpus
  • 40.
    Création d’un typede champ – 1Un type de champ est créé sur un type de baseProcessus de création d’un type de champ : Choix d’un nomChoix d’un type de base (chaîne de caractère, nombre, date, etc…)Création du type de champ
  • 41.
    Création d’un typede champ – 2Liste des types de base simplesChaîne de caractères, nombre entier ou décimal, date, booléenMot-clé, valeur contrôléeTexte court ou long, multilingue ou unilingueRelation vers un autre objetRelation vers une ressource
  • 42.
    Données textuelles –1Un texte peut être court ou longTous les textes gérés par Open melodie sont associés à une « locale » (norme ISO 639)Une locale est presque une langueUn texte peut être unilingue ou multilingueMultilingue : traduction exacte possible (cas des mots-clés)Unilingue : associé à une langue, pas de traduction exacte possible
  • 43.
    Données textuelles –2Exemple 1 : texte court multilingue (mot-clé)Chaque version est interchangeable, et affichée en fonction de la langue de l’interfaceExemple 2 : texte long unilingue (description)
  • 44.
    Données textuelles –3Open melodie permet d’ajouter une traduction aux textes unilinguesUne traduction est un texte unilingueIl vient en annotation du texte original, on peut donc l’afficher en tant que telElle ne change pas l’affichage du texte dans sa version originale, quelle que soit la langue de l’interface
  • 45.
  • 46.
    Texte enrichi –1Résultat dans un navigateur
  • 47.
    Texte enrichi –2Outil de saisie base Murašû
  • 48.
    Création d’un typede champ – 3Liste des types de base complexesListe de type de baseType compositeEx 1 : liste de mots-clés iconographiquesComposé d’autant de mots-clés icono que nécessaireEx 2 : lieu géolocaliséComposé d’un nom de lieu, d’une latitude et d’une longitudeLe nom de lieu vient d’un thésaurus
  • 49.
    Création d’un typede champ – 4Ex 3 : liste de mots-clés icono commentéeComposé d’une liste de mots-clés iconoEt d’un commentaire, grand texte unilingueLes types « liste » et « composite » permettent d’assembler des types de champs complexes
  • 50.
    Création d’un typede champ – 5Processus de création d’un type de champ : Choix d’un nomChamp simple : choix d’un type de baseChamp liste : choix d’un type de champ élémentChamp composite : choix de types de champs élémentCréation du type de champLe type de champ peut ensuite être utilisé pour créer des champs de corpus
  • 51.
    Étude de cas1 : FANABase de lieux de culte de l’Italie antiqueÉtat du projetLa structure de la base est stabiliséeL’indexation peut démarrer depuis la rentréePrésentation de la base à l’INHA en avril 2009
  • 52.
  • 53.
    FANA – 1Cinqtypes d’objet ⇒ cinq corpusSource littéraireLieu de culteMobilierAménagementInscription
  • 54.
    FANA – 2Sourceslittéraires
  • 55.
    FANA – 3Sourceslittéraires
  • 56.
  • 57.
  • 58.
    Étude de cas2 : MAVIEnsemble des tablettes de PhiladelphieIntégré dans le MAVI actuel via des simplificationsIntégrable en totalité dans Open melodieDeux entrées : Corpus de tablettes Chaque tablette a plusieurs facesChaque face peut comporter des empreintes de sceauxCorpus de sceauxRéférence les empreintes
  • 59.
    MAVI – 15corpus : tablettes, faces, sceaux, empreintesSceauxTablettesFaces de tablettesEmpreintes de sceaux
  • 60.
    MAVI – 2Exemplede tablette : CBS 5269CBS 5269CBS-5269-2empreinte-niCBS-5269-Legrain-903CBS-5269-empreinte-ni1Sceau ?CBS-5269-empreinte-ni2Sceau ?
  • 61.
    MAVI – 3Exemplede sceauSeal of Ellil-shum-iddina, son of Taddannu5269Seal of Aplâ son of Ninib-nadinSeal of Shum-iddina, son of illu-NinibCBS 5269 ?
  • 62.
    MAVI – 4Notionde sous-objet / objet parent transposée du MAVI à Open melodieAjout d’un type de champ « objet en relation » dans Open melodieOn peut donc ajouter les relations qui n’ont pu être créées dans le MAVI
  • 63.
    DémonstrationCréation d’un corpussimple « à la main » et indexation de quelques objetsImportation massive d’un corpus du MAVI et ses thésaurus
  • 64.
    Moyens d'indexationCréation rapideobjet par objetIndexation via les grillesIndexation via des formulairesCréation par import massifPassage par Google spreadsheet (Excel)Possibilité d’import partiel (champs)
  • 65.
    PlanPartie 1 :création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
  • 66.
    Notion d’ensemblesEspace derangement d’objetsPeut avoir des sous-ensemblesMême notion que le MAVIRegrouper des objets inter-corpusUtile pour les entrées thématiquesDans Open melodie : utilisés en plus pour la publication
  • 67.
    Cas du MAVI– 1Processus d’intégration d’objets (MAVI)Une seule personne
  • 68.
    Cas du MAVI– 2Modification d’objets : idem création… en un peu plus compliqué !Effacement d’objets : non prévuLe « processus » est refaire !
  • 69.
    Cas d’Open melodie– 1Indexation : processus Open melodie
  • 70.
    Cas d’Open melodie– 2Accès à plusieurs : nécessité d’une « sécurité »
  • 71.
    Modèle de sécuritéIsolerles données qui ne sont pas dans le même projet Ex : MAVI et FanaAu sein d’un même projet, empêcher les fausses manipulations Ex : PFA / Murasu / OstrakaBesoin d’un système de sécurité Administrateur, jeu de droits en lecture / écriture
  • 72.
    Notion d’archive –1Un projet est une « archive »Les données d’une archive sont isolées des autres archivesUne archive a un / des administrateursToute entité Open melodie doit vivre dans une archiveRien ne vit à l’extérieur d’une archive
  • 73.
    Notion d’archive –2À l’intérieur d’une archive : droits sur des entitésStatut publique / protégé / privé des entitésType de droits : lecture / modification / effacementAppliqués aux entités d’Open melodie, chaque entité possède une étiquette de sécuritéOn peut regrouper les droits en « profils », et attribuer les profils à des utilisateursÀ chaque opération sur une entité, Open melodie vérifie les droitsContrôle au niveau IHM et à « bas niveau »
  • 74.
    Base Open melodie– 1 ArchiveCorpusEnsemblesObjetsThésaurusValeurs contrôléesTypes de champsAnnotationsImages haute résolutionTraductionsRessources (PDF, liens, …)Textes
  • 75.
    Base Open melodie– 2Repository Open melodie Archive MAVI Archive PFA Archive Murasu Archive Ostraka Archive FANA Archive …Utilisateurs
  • 76.
    Base Open melodie– 2L’IHM Open melodie a son propre designPossibilités d’afficher les données MAVI / Fana / etc… dans leur propre interfaceIHM d’administrationOpen melodieBase Open melodie
  • 77.
    Organisation généraleBase OpenmelodieIHM d’administrationOpen melodieConnecteur XMLIHM de consultation MAVIIHM de consultation FANA
  • 78.
    Bilan financierMise enligne classique vs Open melodie
  • 79.
    PlanPartie 1 :création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
  • 80.
    Processus de publicationProcessusglobal de création / publicationCréation de donnéesNOKValidationModificationsOKPublicationIHM publiqueOAI – PMHSPARQL / Web sémantique
  • 81.
    OAI – PMHPublierdes données partielles (références vers les données complètes) auprès de moteurs de recherches globauxProtocole XML avec format de données fixéLes moteurs de recherche moissonnent les données en automatiqueSupporté par le méta portail AdonisOpen melodie supporte(ra) OAI – PMHFutur : support de SPARQL et Web sémantique
  • 82.
    Interfaces extérieuresProblème :déclarer les données « publiées » dans l’IHM publiqueCréation de deux ensembles particuliersIHM publique : le contenu est publiée dans l’IHM publiqueOAI – PMH : le contenu est publié sur le connecteur OAI – PMH Connexion possible aux flux RSS
  • 83.
    PlanPartie 1 :création et à l’indexation d’objetscorpus, champ, objet, thésaurus, valeurs contrôlées, traduction, texte , ressource externe, annotationPartie 2 : travail collaboratif et sécuritéArchive, ensemblePartie 3 : publicationConclusion
  • 84.
    État des lieux– 1Open melodie est un logiciel open source et libre de droitTout le monde (ie informaticien) peut l’installer « chez soi » (ie sur l’intranet de son labo)Open source : pérenne (n’importe qui peut le corriger, l’étendre, etc…)Publier les modifications sous la même licenceTesté en automatique avant livraisonLibre de droit : gratuit !
  • 85.
    État des lieux– 2Version 0.4 publiée 17/6/09Code serveur stabilisé et testéSupport pour toutes les entités Open melodieArchive, corpus, thésaurus, ensembles de valeurs contrôlées, types de champs, indexationsImport massif des Google spreadsheetsPremiers éléments d’IHM (première version)Prochaine version : 0.7, prévue mi janvierTotalité des fonctionnalités, dans une IHM prototype
  • 86.
    Tâches pour lav0.7 – 1
  • 87.
    Tâches pour lav0.7 – 2
  • 88.
    Tâches futuresConnecteurs XMLDesignd’une interface finaleAméliorations ergonomiques, designJuin 2010 : publication d’une v1.0À partir de juin 2010 :V1.0 sera en maintenance correctiveDébut des développements d’une v2.0 avec nouvelles fonctionnalitésCompatibilité des version corrigées avec la v1.0Possible migration entre v1.0 et v2.0
  • 89.
    Utilisation d'Open melodieOutiltesté en automatiqueStructure de base / serveur stableLes données enregistrées ne sont pas perdues !Phase d’apprentissagePeut se faire dans une archive « bac à sable »Documentation en ligneOutil en développementToutes les idées sont bonnes à prendrePriorité aux utilisateurs
  • 90.
    LiensBlog : http://openmelodie.blogspot.com/Téléchargement: http://sourceforge.net/projects/openmelodie/Bêta-test :http://www.achemenet.com/openmelodie-beta/