SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Détection d’enluminures dans des manuscrits
médiévaux IIIF à l’aide de l’apprentissage profond
Victoria Eyharabide1 Fouad Aouinti1 Xavier Fresquet2
1Laboratoire STIH, Sorbonne Université, France
2IReMus Laboratory, Sorbonne Université, France
24 mars 2021
Article soumis à ICDAR 2021 (16th International Conference on Document Analysis and Recognition)
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 1 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Plan
1 Introduction
2 Notre proposition
3 Évaluation et discussion
4 Conclusion et perspectives
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 2 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Plan
1 Introduction
2 Notre proposition
3 Évaluation et discussion
4 Conclusion et perspectives
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 3 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Introduction
Figure 1 – Enluminure d’un caractère “B”
https ://iiif.bodleian.ox.ac.uk/iiif/canvas/9da1b4c2-2c04-40e9-a171-dc4b656af141.json
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 4 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Plan
1 Introduction
2 Notre proposition
3 Évaluation et discussion
4 Conclusion et perspectives
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 5 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Notre proposition
Figure 2 – Aperçu de notre proposition pour détecter des enluminures
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 6 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Example
Figure 3 –
https ://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-F-II-00200054r.jp2/full/full/0/default.jpg
https ://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-F-II-
00200054r.jp2/499, 1790, 702, 661/full/0/default.jpg
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 7 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Préparation du jeu de données HBA
Le jeu de données HBA contient :
4436 images vérité terrain ;
1429 images annotées au niveau du
pixel (six classes).
Certaines spécificités du jeu de données HBA pourraient in-
fluencer considérablement le processus d’apprentissage :
dimensions larges et dispersées des images ;
hétérogénéité, style d’illustration, mises en page complexes, etc.
Après l’étape de pré-traitement, nous avons obtenu 366 images
annotées au niveau de pixel en utilisant trois classes (graphic,
text, the rest).
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 8 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Entraı̂nement de YOLO sur le jeu de données HBA
Pour la formation de YOLO, les 366 images HBA sélectionnées
doivent être étiquetées et annotées avec des cadres de
délimitation entourant les enluminures.
Pour chaque image, nous avons généré aléatoirement 10 000
cadres de délimitation et leur avons attribué, en fonction du
seuil de couleur d’arrière-plan, la classe appropriée.
Le sous-ensemble de formation contient 293 images vérité ter-
rain (80% des images) et leurs fichiers d’annotations.
Le jeu de données HBA préparé contient 94 084 annotations :
31 181 → graphic ;
31 138 → text ;
31 765 → the rest.
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 9 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Fusion de boı̂tes englobantes
Figure 4 – Détection d’enluminure après la fusion des boı̂tes graphic
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 10 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Example
Préparation du jeu de données HBA
Entraı̂nement de YOLO sur le jeu de données HBA
Fusion de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
Génération d’URL IIIF à partir de boı̂tes englobantes
IIIF Image API 3.0 spécifie une syntaxe d’URL normalisée pour
la transmission d’une image via une requête HTTP de :
l’image elle-même (fichier image) ;
informations techniques sur l’image (fichier JSON).
Le modèle d’URL pour demander une image doit être conforme
à : {scheme} ://{server}{/prefix}/{identifier}/{region}/{size}/{rotation}/{quality}.{format}
La région est généralement spécifiée par la valeur full, ce qui
signifie que l’image complète doit être renvoyée.
Nous remplaçons la valeur par défaut de la région par les coor-
données de l’enluminure détectée par notre système en suivant
la syntaxe spécifiée par le standard IIIF.
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 11 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Création d’un jeu de données de test IIIF
Résultats expérimentaux
Plan
1 Introduction
2 Notre proposition
3 Évaluation et discussion
4 Conclusion et perspectives
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 12 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Création d’un jeu de données de test IIIF
Résultats expérimentaux
Création d’un jeu de données de test IIIF
Table 1 – Caractéristiques du jeu de données de test IIIF
Manuscrit
Valenciennes
BM, 0099 (092)
Garrett
MS. 28. MS
Nn.2.36
F II 20
Titre Apocalypse De ani-
malibus
Gospel
book
Bible
Date 800-900 1200-
1300
1120-1130 1270
Location
Valenciennes
BnF
Universität
Basel
University of
Cambridge
Princeton
University
Nombre de pages 100 316 489 930
Pages annotées 40 19 10 72
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 13 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Création d’un jeu de données de test IIIF
Résultats expérimentaux
Résultats expérimentaux (1)
Table 2 – Résultats expérimentaux de la détection des enluminures
Bibliothèque Images IIIF Images annotées TP TN FP FN Précision Rappel
BnF 100 40 37 46 14 3 0.73 0.93
Basel 316 19 16 287 10 3 0.62 0.84
Cambridge 489 10 9 461 18 1 0.33 0.9
Princeton 930 72 70 824 34 2 0.67 0.97
La page originale de Basel :
https://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-
F-II-0020 0031r.jp2/full/full/0/default.jpg
L’enluminure détectée :
https://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-
F-II-0020 0031r.jp2/664,2657,430,774/full/0/default.jpg
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 14 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Création d’un jeu de données de test IIIF
Résultats expérimentaux
Résultats expérimentaux (2)
(a) Page avec règle, palette de
couleurs (Basel)
(b) Couverture, petite décoration
(Princeton)
Figure 5 – Exemples de résultats faux positifs
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 15 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Plan
1 Introduction
2 Notre proposition
3 Évaluation et discussion
4 Conclusion et perspectives
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 16 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Conclusion et perspectives
Dans ce travail, nous avons formé YOLOv5 sur le jeu de
données HBA pour détecter les enluminures dans les manus-
crits médiévaux IIIF.
Les résultats obtenus sont satisfaisants et confirment les bonnes
performances de l’approche proposée.
Nous proposons d’utiliser les données de Biblissima pour tester
le modèle sur un jeu de données beaucoup plus large.
Nous envisageons aussi de mettre le standard IIIF en service de
la recherche en musicologie à l’aide des techniques d’apprentis-
sage automatique.
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 17 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Références
M. Mehri, P. Héroux, R. Mullot, J. P. Moreux, B. Coüasnon, B. Barrett.
HBA 1.0 : A pixel-based annotated dataset for historical book analysis.
4th International Workshop on Historical Document Imaging and Processing,
pp. 107-112, 2017.
S. A. Oliveira, B. Seguin, F. Kaplan.
dhSegment : A generic deep-learning approach for document segmentation.
16th International Conference on Frontiers in Handwriting Recognition
(ICFHR), pp. 7-12, 2018.
T. Monnier, M. Aubry.
docExtractor : An off-the-shelf historical document element extraction.
17th International Conference on Frontiers in Handwriting Recognition
(ICFHR), pp. 91–96, 2020.
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 18 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Merci pour votre attention
Victoria Eyharabide
maria-victoria.eyharabide@sorbonne-universite.fr
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 19 / 20
Introduction
Notre proposition
Évaluation et discussion
Conclusion et perspectives
Détection d’enluminures dans des manuscrits
médiévaux IIIF à l’aide de l’apprentissage profond
Victoria Eyharabide1 Fouad Aouinti1 Xavier Fresquet2
1Laboratoire STIH, Sorbonne Université, France
2IReMus Laboratory, Sorbonne Université, France
24 mars 2021
Article soumis à ICDAR 2021 (16th International Conference on Document Analysis and Recognition)
Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 20 / 20

Contenu connexe

Plus de Equipex Biblissima

Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIFEquipex Biblissima
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFEquipex Biblissima
 
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Equipex Biblissima
 
IIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceIIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceEquipex Biblissima
 
The Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesThe Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesEquipex Biblissima
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Equipex Biblissima
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Equipex Biblissima
 
Biblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsBiblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsEquipex Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaEquipex Biblissima
 
Browse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFBrowse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFEquipex Biblissima
 
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Equipex Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaEquipex Biblissima
 
The Biblissima Portal: Current state and future plans
The Biblissima Portal: Current state and future plansThe Biblissima Portal: Current state and future plans
The Biblissima Portal: Current state and future plansEquipex Biblissima
 
Les protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésLes protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésEquipex Biblissima
 
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...Equipex Biblissima
 
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...Equipex Biblissima
 
Biblissima pour l'édition scientifique
Biblissima pour l'édition scientifiqueBiblissima pour l'édition scientifique
Biblissima pour l'édition scientifiqueEquipex Biblissima
 
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...Quelques applications pratiques de IIIF pour les bibliothèques numériques e...
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...Equipex Biblissima
 
La découverte de la médecine médiévale à travers des outils numériques de Wel...
La découverte de la médecine médiévale à travers des outils numériques de Wel...La découverte de la médecine médiévale à travers des outils numériques de Wel...
La découverte de la médecine médiévale à travers des outils numériques de Wel...Equipex Biblissima
 

Plus de Equipex Biblissima (20)

Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIF
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
 
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
 
IIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceIIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in France
 
The Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesThe Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical Names
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
 
Biblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsBiblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts Collections
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
Browse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFBrowse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIF
 
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
The Biblissima Portal: Current state and future plans
The Biblissima Portal: Current state and future plansThe Biblissima Portal: Current state and future plans
The Biblissima Portal: Current state and future plans
 
Les protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésLes protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialités
 
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...
Éparpillés façon puzzle. Rassembler aujourd'hui les manuscrits d'un auteur ca...
 
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...
IIIF au coeur de la recherche: publier, agréger et divulguer les fragments de...
 
Biblissima pour l'édition scientifique
Biblissima pour l'édition scientifiqueBiblissima pour l'édition scientifique
Biblissima pour l'édition scientifique
 
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...Quelques applications pratiques de IIIF pour les bibliothèques numériques e...
Quelques applications pratiques de IIIF pour les bibliothèques numériques e...
 
La découverte de la médecine médiévale à travers des outils numériques de Wel...
La découverte de la médecine médiévale à travers des outils numériques de Wel...La découverte de la médecine médiévale à travers des outils numériques de Wel...
La découverte de la médecine médiévale à travers des outils numériques de Wel...
 

Appliquer les techniques d'apprentissage profond pour détecter les enluminures dans les manuscrits médiévaux IIIF

  • 1. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF à l’aide de l’apprentissage profond Victoria Eyharabide1 Fouad Aouinti1 Xavier Fresquet2 1Laboratoire STIH, Sorbonne Université, France 2IReMus Laboratory, Sorbonne Université, France 24 mars 2021 Article soumis à ICDAR 2021 (16th International Conference on Document Analysis and Recognition) Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 1 / 20
  • 2. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Plan 1 Introduction 2 Notre proposition 3 Évaluation et discussion 4 Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 2 / 20
  • 3. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Plan 1 Introduction 2 Notre proposition 3 Évaluation et discussion 4 Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 3 / 20
  • 4. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Introduction Figure 1 – Enluminure d’un caractère “B” https ://iiif.bodleian.ox.ac.uk/iiif/canvas/9da1b4c2-2c04-40e9-a171-dc4b656af141.json Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 4 / 20
  • 5. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Plan 1 Introduction 2 Notre proposition 3 Évaluation et discussion 4 Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 5 / 20
  • 6. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Notre proposition Figure 2 – Aperçu de notre proposition pour détecter des enluminures Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 6 / 20
  • 7. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Example Figure 3 – https ://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-F-II-00200054r.jp2/full/full/0/default.jpg https ://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb-F-II- 00200054r.jp2/499, 1790, 702, 661/full/0/default.jpg Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 7 / 20
  • 8. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Préparation du jeu de données HBA Le jeu de données HBA contient : 4436 images vérité terrain ; 1429 images annotées au niveau du pixel (six classes). Certaines spécificités du jeu de données HBA pourraient in- fluencer considérablement le processus d’apprentissage : dimensions larges et dispersées des images ; hétérogénéité, style d’illustration, mises en page complexes, etc. Après l’étape de pré-traitement, nous avons obtenu 366 images annotées au niveau de pixel en utilisant trois classes (graphic, text, the rest). Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 8 / 20
  • 9. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Entraı̂nement de YOLO sur le jeu de données HBA Pour la formation de YOLO, les 366 images HBA sélectionnées doivent être étiquetées et annotées avec des cadres de délimitation entourant les enluminures. Pour chaque image, nous avons généré aléatoirement 10 000 cadres de délimitation et leur avons attribué, en fonction du seuil de couleur d’arrière-plan, la classe appropriée. Le sous-ensemble de formation contient 293 images vérité ter- rain (80% des images) et leurs fichiers d’annotations. Le jeu de données HBA préparé contient 94 084 annotations : 31 181 → graphic ; 31 138 → text ; 31 765 → the rest. Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 9 / 20
  • 10. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Fusion de boı̂tes englobantes Figure 4 – Détection d’enluminure après la fusion des boı̂tes graphic Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 10 / 20
  • 11. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Example Préparation du jeu de données HBA Entraı̂nement de YOLO sur le jeu de données HBA Fusion de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes Génération d’URL IIIF à partir de boı̂tes englobantes IIIF Image API 3.0 spécifie une syntaxe d’URL normalisée pour la transmission d’une image via une requête HTTP de : l’image elle-même (fichier image) ; informations techniques sur l’image (fichier JSON). Le modèle d’URL pour demander une image doit être conforme à : {scheme} ://{server}{/prefix}/{identifier}/{region}/{size}/{rotation}/{quality}.{format} La région est généralement spécifiée par la valeur full, ce qui signifie que l’image complète doit être renvoyée. Nous remplaçons la valeur par défaut de la région par les coor- données de l’enluminure détectée par notre système en suivant la syntaxe spécifiée par le standard IIIF. Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 11 / 20
  • 12. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Création d’un jeu de données de test IIIF Résultats expérimentaux Plan 1 Introduction 2 Notre proposition 3 Évaluation et discussion 4 Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 12 / 20
  • 13. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Création d’un jeu de données de test IIIF Résultats expérimentaux Création d’un jeu de données de test IIIF Table 1 – Caractéristiques du jeu de données de test IIIF Manuscrit Valenciennes BM, 0099 (092) Garrett MS. 28. MS Nn.2.36 F II 20 Titre Apocalypse De ani- malibus Gospel book Bible Date 800-900 1200- 1300 1120-1130 1270 Location Valenciennes BnF Universität Basel University of Cambridge Princeton University Nombre de pages 100 316 489 930 Pages annotées 40 19 10 72 Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 13 / 20
  • 14. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Création d’un jeu de données de test IIIF Résultats expérimentaux Résultats expérimentaux (1) Table 2 – Résultats expérimentaux de la détection des enluminures Bibliothèque Images IIIF Images annotées TP TN FP FN Précision Rappel BnF 100 40 37 46 14 3 0.73 0.93 Basel 316 19 16 287 10 3 0.62 0.84 Cambridge 489 10 9 461 18 1 0.33 0.9 Princeton 930 72 70 824 34 2 0.67 0.97 La page originale de Basel : https://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb- F-II-0020 0031r.jp2/full/full/0/default.jpg L’enluminure détectée : https://www.e-codices.unifr.ch/loris/ubb/ubb-F-II-0020/ubb- F-II-0020 0031r.jp2/664,2657,430,774/full/0/default.jpg Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 14 / 20
  • 15. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Création d’un jeu de données de test IIIF Résultats expérimentaux Résultats expérimentaux (2) (a) Page avec règle, palette de couleurs (Basel) (b) Couverture, petite décoration (Princeton) Figure 5 – Exemples de résultats faux positifs Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 15 / 20
  • 16. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Plan 1 Introduction 2 Notre proposition 3 Évaluation et discussion 4 Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 16 / 20
  • 17. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Conclusion et perspectives Dans ce travail, nous avons formé YOLOv5 sur le jeu de données HBA pour détecter les enluminures dans les manus- crits médiévaux IIIF. Les résultats obtenus sont satisfaisants et confirment les bonnes performances de l’approche proposée. Nous proposons d’utiliser les données de Biblissima pour tester le modèle sur un jeu de données beaucoup plus large. Nous envisageons aussi de mettre le standard IIIF en service de la recherche en musicologie à l’aide des techniques d’apprentis- sage automatique. Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 17 / 20
  • 18. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Références M. Mehri, P. Héroux, R. Mullot, J. P. Moreux, B. Coüasnon, B. Barrett. HBA 1.0 : A pixel-based annotated dataset for historical book analysis. 4th International Workshop on Historical Document Imaging and Processing, pp. 107-112, 2017. S. A. Oliveira, B. Seguin, F. Kaplan. dhSegment : A generic deep-learning approach for document segmentation. 16th International Conference on Frontiers in Handwriting Recognition (ICFHR), pp. 7-12, 2018. T. Monnier, M. Aubry. docExtractor : An off-the-shelf historical document element extraction. 17th International Conference on Frontiers in Handwriting Recognition (ICFHR), pp. 91–96, 2020. Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 18 / 20
  • 19. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Merci pour votre attention Victoria Eyharabide maria-victoria.eyharabide@sorbonne-universite.fr Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 19 / 20
  • 20. Introduction Notre proposition Évaluation et discussion Conclusion et perspectives Détection d’enluminures dans des manuscrits médiévaux IIIF à l’aide de l’apprentissage profond Victoria Eyharabide1 Fouad Aouinti1 Xavier Fresquet2 1Laboratoire STIH, Sorbonne Université, France 2IReMus Laboratory, Sorbonne Université, France 24 mars 2021 Article soumis à ICDAR 2021 (16th International Conference on Document Analysis and Recognition) Détection d’enluminures dans des manuscrits médiévaux IIIF Eyharabide et al. Consortium IIIF360 20 / 20