SlideShare une entreprise Scribd logo
1  sur  10
Projet
« Collation numérique »
RTR Images
LI-RFAI / CESR-BVH
http://www.bvh.univ-tours.fr
Assemblée Générale BVH, CESR
Tours, 30/11/2017
Jean-Yves Ramel
(Pr, Laboratoire d’Informatique de Tours)
Présentation de la problématique
• Objectifs : Construire une Machine à collationner
« Identification, alignement et comparaison automatique des 
pages de différents exemplaires de livres anciens numérisés » 
• Cahier des charges
– Rapprochement et alignement d’images de pages issues d’exemplaires
différents d’un meme ouvrage afin de pouvoir ensuite comparer plus 
finement leur contenu
– Suppression du bruit et recalage
des images par application de 
transformations géométriques
– Comparaison page à page et 
signalement des variantes les 
plus importantes au travers 
d’IHMs conviviales
2
Existant ‐ Etat de l’art
• Comparaison d’images de documents
– Beaucoup de travaux en OCR et classification de documents
– Niveau structure / lexical / caractéristiques globales (layout)
– Peu en comparaison / alignement de documents (niveau pixel)
• Recalage d’images
– Beaucoup de travaux en analyse d’images médicales
– Comparaison d’images naturelles : Points d’interêt SURF/SIFT + RANSAC
3
Proposition de chaine de traitement
4
Analyse fine 
des différences
Préparation des 
images
Création des couples 
d’images
Recalage des couples 
d’images
• Création de couples de pages 
potentiels entre ouvrages
– Mesure de similarité entre images 
avec la méthode imregDFT (v2.0 python)
– Comparaison des spectres de Fourier
– Utilisation de OSB / DTW pour reduire
le nombre de tests
Proposition de chaine de traitement
5
http://imreg‐dft.readthedocs.io/. An FFT‐
based technique for translation, rotation and 
scale‐invariant image registration. BS Reddy, 
BN Chatterji. IEEE Trans on IP, 1996
Proposition de chaine de traitement
• Recalage des couples d'images
– Détection de points d’intérêt
– SURF: Speeded Up Robust Features
– RANSAC = Random Sample Consensus
– Texte et graphique
– Robustesse aux différences d’intensité
6
Proposition de chaine de traitement
• Analyse des différences fines
– Différences par région visualisées  sur image binaire
7
Proposition de chaine de traitement
• Analyse des différences fines
– Différences par région visualisées  sur image binaire
8
Proposition de chaine de traitement
• Analyse des différences fines
– Différences par région visualisées  sur image binaire
9
10
Bilan et perspectives
• Conclusion
• Un problème original peu étudié
• Création d’un 1er prototype : OSB/DTW ‐ SURF + RANSAC – Approche Région
• Participative design : Fonctionnalités et interfaces 
• Création d’une base d’images de test
• Perspectives
• Poursuite des développements 
• Poursuite des expérimentations

Contenu connexe

Similaire à Assemblée générale 2017 du programme de recherche BVH : Projet de machine à collationner numérique (CES

Document et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantiqueDocument et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantiqueherve.info.unicaen.fr
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PomedialabSciencesPo
 
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...ABES
 
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...Aurélia Rostaing
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceParis Open Source Summit
 
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"ABES
 

Similaire à Assemblée générale 2017 du programme de recherche BVH : Projet de machine à collationner numérique (CES (6)

Document et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantiqueDocument et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantique
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences Po
 
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...
Jabes 2016 - Comment les établissements Sudoc, les éditeurs et l’ABES collabo...
 
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...
LectAuRep (Lecture automatique de répertoires). La reconnaissance automatique...
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysance
 
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"
Jabes 2011 - Patrimoine : numériser et mutualiser - "Introduction à l'atelier"
 

Plus de Bibliothèques Virtuelles Humanistes - CESR, Université de Tours, UMR 7323

Plus de Bibliothèques Virtuelles Humanistes - CESR, Université de Tours, UMR 7323 (20)

Montaigne : derniers développements sur les travaux éditoriaux
Montaigne : derniers développements sur les travaux éditoriauxMontaigne : derniers développements sur les travaux éditoriaux
Montaigne : derniers développements sur les travaux éditoriaux
 
Les BVH & l’étude des matériels d’imprimerie anciens
 Les BVH & l’étude des matériels d’imprimerie anciens Les BVH & l’étude des matériels d’imprimerie anciens
Les BVH & l’étude des matériels d’imprimerie anciens
 
Évolutions de l’infrastructure & de la bibliothèque numérique
Évolutions de l’infrastructure & de la bibliothèque numériqueÉvolutions de l’infrastructure & de la bibliothèque numérique
Évolutions de l’infrastructure & de la bibliothèque numérique
 
Les « Bibliotheques françoises » (BibFr) – Avancée de l’indexation de La Croi...
Les « Bibliotheques françoises » (BibFr) – Avancée de l’indexation de La Croi...Les « Bibliotheques françoises » (BibFr) – Avancée de l’indexation de La Croi...
Les « Bibliotheques françoises » (BibFr) – Avancée de l’indexation de La Croi...
 
Édition numérique et valorisation du livre de compte de la reine Marguerite d...
Édition numérique et valorisation du livre de compte de la reine Marguerite d...Édition numérique et valorisation du livre de compte de la reine Marguerite d...
Édition numérique et valorisation du livre de compte de la reine Marguerite d...
 
Catalogues régionaux des Incunables des bibliothèques publiques de France
Catalogues régionaux des Incunables des bibliothèques publiques de FranceCatalogues régionaux des Incunables des bibliothèques publiques de France
Catalogues régionaux des Incunables des bibliothèques publiques de France
 
Une nouvelle base de données, Scripta Manent : le “Facebook” des années 1530-...
Une nouvelle base de données, Scripta Manent : le “Facebook” des années 1530-...Une nouvelle base de données, Scripta Manent : le “Facebook” des années 1530-...
Une nouvelle base de données, Scripta Manent : le “Facebook” des années 1530-...
 
Bilan 2022 & perspectives du programme de recherche BVH
Bilan 2022 & perspectives du programme de recherche BVHBilan 2022 & perspectives du programme de recherche BVH
Bilan 2022 & perspectives du programme de recherche BVH
 
Catalogues régionaux des Incunables des bibliothèques publiques de France : S...
Catalogues régionaux des Incunables des bibliothèques publiques de France : S...Catalogues régionaux des Incunables des bibliothèques publiques de France : S...
Catalogues régionaux des Incunables des bibliothèques publiques de France : S...
 
Architecture de la bibliothèque numérique : Déploiement du protocole IIIF - A...
Architecture de la bibliothèque numérique : Déploiement du protocole IIIF - A...Architecture de la bibliothèque numérique : Déploiement du protocole IIIF - A...
Architecture de la bibliothèque numérique : Déploiement du protocole IIIF - A...
 
Autour du projet BiRayMa : "Bibliothèque de Raymond Marcel" (CollEx-Persée) -...
Autour du projet BiRayMa : "Bibliothèque de Raymond Marcel" (CollEx-Persée) -...Autour du projet BiRayMa : "Bibliothèque de Raymond Marcel" (CollEx-Persée) -...
Autour du projet BiRayMa : "Bibliothèque de Raymond Marcel" (CollEx-Persée) -...
 
Rabelais : Les documents de Berne et l'Almanach d'Alessandria - Assemblée gén...
Rabelais : Les documents de Berne et l'Almanach d'Alessandria - Assemblée gén...Rabelais : Les documents de Berne et l'Almanach d'Alessandria - Assemblée gén...
Rabelais : Les documents de Berne et l'Almanach d'Alessandria - Assemblée gén...
 
Projet Scripta Manent : Une nouvelle base de données : les relations sociales...
Projet Scripta Manent : Une nouvelle base de données : les relations sociales...Projet Scripta Manent : Une nouvelle base de données : les relations sociales...
Projet Scripta Manent : Une nouvelle base de données : les relations sociales...
 
Projet Les Bibliotheques françoises de La Croix du Maine et de Du Verdier - A...
Projet Les Bibliotheques françoises de La Croix du Maine et de Du Verdier - A...Projet Les Bibliotheques françoises de La Croix du Maine et de Du Verdier - A...
Projet Les Bibliotheques françoises de La Croix du Maine et de Du Verdier - A...
 
Architecture de la bibliothèque numérique : Modélisation en XML-TEI - Assembl...
Architecture de la bibliothèque numérique : Modélisation en XML-TEI - Assembl...Architecture de la bibliothèque numérique : Modélisation en XML-TEI - Assembl...
Architecture de la bibliothèque numérique : Modélisation en XML-TEI - Assembl...
 
Architecture de la bibliothèque numérique : Veille fonctionnelle et technique...
Architecture de la bibliothèque numérique : Veille fonctionnelle et technique...Architecture de la bibliothèque numérique : Veille fonctionnelle et technique...
Architecture de la bibliothèque numérique : Veille fonctionnelle et technique...
 
Architecture de la bibliothèque numérique : Modélisation et migrations de don...
Architecture de la bibliothèque numérique : Modélisation et migrations de don...Architecture de la bibliothèque numérique : Modélisation et migrations de don...
Architecture de la bibliothèque numérique : Modélisation et migrations de don...
 
Production BVH : Epistemon (éditions numériques TEI-Renaissance) - Assemblée ...
Production BVH : Epistemon (éditions numériques TEI-Renaissance) - Assemblée ...Production BVH : Epistemon (éditions numériques TEI-Renaissance) - Assemblée ...
Production BVH : Epistemon (éditions numériques TEI-Renaissance) - Assemblée ...
 
Production BVH : Fac-similés (Numérisations) - Assemblée générale 2021, Progr...
Production BVH : Fac-similés (Numérisations) - Assemblée générale 2021, Progr...Production BVH : Fac-similés (Numérisations) - Assemblée générale 2021, Progr...
Production BVH : Fac-similés (Numérisations) - Assemblée générale 2021, Progr...
 
Bilan 2020-2021 & perspectives 2022+ Assemblée générale 2021, Programme de re...
Bilan 2020-2021 & perspectives 2022+ Assemblée générale 2021, Programme de re...Bilan 2020-2021 & perspectives 2022+ Assemblée générale 2021, Programme de re...
Bilan 2020-2021 & perspectives 2022+ Assemblée générale 2021, Programme de re...
 

Dernier

JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)Sana REFAI
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 

Dernier (8)

JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
Algo II : les piles ( cours + exercices)
Algo II :  les piles ( cours + exercices)Algo II :  les piles ( cours + exercices)
Algo II : les piles ( cours + exercices)
 
CAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptxCAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptx
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 

Assemblée générale 2017 du programme de recherche BVH : Projet de machine à collationner numérique (CES