SlideShare une entreprise Scribd logo
Pourquoi Europeana 
Newspapers ? 
L’apport de la BnF dans le projet
Car Europeana Newspapers nous permet… 
• L’agrégation de journaux européens libres de droits issus 
des grands titres de la presse européenne. 
• La visibilité et l’accessibilité sur le portail Europeana et 
sur le portail des bibliothèques partenaires. 
• L’amélioration des fonctionnalités de recherche pour ce 
contenu grâce à l’enrichissement sémantique des 
données et des métadonnées relatives aux corpus traités. 
Journée d’information 
27 novembre 2014
Car Europeana nous propose un point centralisé pour 
explorer la diversité européenne… 
• Garantir un meilleur accès aux collections numérisées de 
presse existantes. 
• Donner accès en ligne à 18 millions de pages via 
Europeana et TEL. 
• Optimiser les processus de numérisation, dont l’OCR, ainsi 
que les dispositifs de reconnaissance des articles de presse 
(OLR). 
Journée d’information 
27 novembre 2014
Partenaires 
Journée d’information 
27 novembre 2014
Contenus de la BnF 
La Bibliothèque nationale de France participe avec 
environ 3 millions de pages 
(environ 2,4 M traitées en OCR/OLR) 
Journée d’information 
27 novembre 2014
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance optique de caractères (OCR) – 
Université d’Innsbruck, Autriche 
Recherche plein-texte sur corpus BnF sans OCR ou avec 
OCR non HQ (1,4 M pages)
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance optique de la structuration et de la 
segmentation des articles (OLR) – CCS, Allemagne. 
Consultation en mode Articles (1 M pages)
OLR : 
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
• Identification/reconnaissance des colonnes 
• Segmentation au niveau d’article (titres, 
sous-titres...) 
• Reconnaissance de classes de page/contenu 
(publicités, petites annonces, tableaux, illustrations, 
légendes) 
• Outils d’assurance qualité et de correction des résultats
OLR
OLR
OLR
OLR
OLR
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance des entités nommées (REN) 
• Sous-tâche de l’activité d’extraction d’information dans des corpus 
documentaires : 
• Rechercher et identifier un certain nombre d’objets textuels 
(un mot ou un groupe de mots) présents dans des corpus 
documentaires. 
• Catégorisables dans des classes telles 
que noms de personnes, noms 
d'organisations (institutions, 
entreprises, sociétés…) et noms 
de lieux (pays, ville, site…). 
• Eventuellement alignés sur des 
référentiels d’autorités. 
Partenaires scientifiques et techniques : 
• KB (GE, NE) 
• UPMC/LIP6 pour le français
REN et Europeana Newspapers 
REN appliquée sur 100-500 K pages) 
• Concevoir, développer et appliquer un modèle pour la REN 
en français. 
• Réfléchir aux cas d’usage pour l’amélioration des 
fonctionnalités de consultation et de présentation à 
l’intention des usagers d’Europeana et des bibliothèques 
nationales : 
• Moteur de recherche sémantique 
• Web sémantique 
• Alignement avec des référentiels internationaux 
pour la recherche d’information multilingue
•16 
Entités nommées : comment les décrire ? 
• Format externe (BIO, bases 
de données) 
• TEI 
• METS 
• ALTO 
• Europeana Newspapers a 
choisi d’utiliser le mécanisme 
d’étiquetage disponible dans 
ALTO v2.1.
Le format METS/ALTO nous offre… 
• Données descriptives et techniques. 
• Informations sur le contenu et la disposition 
physique de la page (segmentation). 
ALTO 
METS 
• Description de la publication globale : MD 
bibliographiques, techniques, administratives. 
• Informations/description de la structure 
logique du fascicule (TDM). 
• Liens logiques entre TDM et blocs ALTO 
de texte/articles
Europeana Newspapers : un profil METS/ALTO 
dédié à la numérisation de la presse (ENMAP) 
• Articulation autour de trois concepts : section, élément de contenu 
(« article »), élément de structure. 
• Modèle adapté aux contenus presse. 
• Classification des types de contenu 
(information, opinion, divertissement, 
publicité, métadonnée). 
Alimenter la réflexion sur la problématique 
structuration minimale (article = titre + texte) vs. structuration riche
Europeana Newspapers : un profil METS/ALTO 
dédié à la numérisation de la presse (ENMAP) 
Outillé par : 
• la documentation du modèle, 
• une application de structuration 
(UIBK) : 
• test et validation d’un modèle 
de structuration (lancement 
de projets de numérisation), 
• visualisation de contenus (QA) 
• conversion entre formats 
• production pour projets 
de petite taille 
Publication finale du format en fin de projet (janvier 2015)
Europeana Newspapers : valorisation 
Améliorer la recherche et l’accès au contenu 
• Profiter de la structuration en articles individuels, avec table de 
navigation 
• Utiliser le typage des contenus pour affiner la recherche (filtres) 
• Valoriser les entités nommées via des outils sémantiques (data.bnf.fr, 
Exalead) ou d’autres services spécialisés 
Enjeux autour du format et valorisation des contenus 
• Le profil METS/ALTO ENMAP fournit un modèle viable pour le partage et 
l’échange de contenus de presse. 
• La structuration avancée qu’il autorise facilite la réexploitation des 
contenus pour d’autres usages ou vers d’autres formats.
Europeana Newspapers : valorisation 
www.theeuropeanlibrary.org/tel4/newspapers
Les bénéfices pour la BnF… 
• Améliorer l’OCR et utiliser des outils d’évaluation/correction : 
définition de nouvelles recommandations (futurs marchés). 
• Contribuer aux travaux de convergence vers l’utilisation 
du profil ENMAP METS/ALTO. 
• Enrichir les fonctionnalités de recherche et de consultation en 
mode texte/article pour les journaux sur Gallica. 
• Attirer plus de visiteurs sur Gallica avec des contenus enrichis et liés 
à d’autres corpus. 
• Alimenter d’autres vecteurs de diffusion avec ces contenus enrichis : 
data.bnf.fr
merci de votre attention!

Contenu connexe

Tendances

Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?
AssociationAF
 
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Phonothèque MMSH
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
AssociationAF
 
Les licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemandeLes licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemande
Frederic Blin
 
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationaleJournées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
ABES
 
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
ABES
 
L1 Anglais - recherche documentaire
L1 Anglais - recherche documentaireL1 Anglais - recherche documentaire
L1 Anglais - recherche documentaire
Bibliotheque Université de Provence
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
ABES
 
M1 anglais 2015
M1 anglais 2015M1 anglais 2015
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
ACIM (Association pour la coopération des professionnels de l'information musicale)
 
Bibliographie
BibliographieBibliographie
Bibliographie
Bobette
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Equipex Biblissima
 
éVolution noffre demande2010 jps
éVolution noffre demande2010 jpséVolution noffre demande2010 jps
éVolution noffre demande2010 jpsBibliolab
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Equipex Biblissima
 
Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015
Université d'Angers
 
Le web sémantique - Sylvie Fayet
Le web sémantique - Sylvie FayetLe web sémantique - Sylvie Fayet
Le web sémantique - Sylvie Fayet
Association des Bibliothécaires de France
 
Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15
Université Aix-Marseille - Service commun de la documentation
 

Tendances (18)

Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?
 
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
 
Les licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemandeLes licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemande
 
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationaleJournées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
 
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
 
L1 Anglais - recherche documentaire
L1 Anglais - recherche documentaireL1 Anglais - recherche documentaire
L1 Anglais - recherche documentaire
 
Istex presentation courte-2
Istex presentation courte-2Istex presentation courte-2
Istex presentation courte-2
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
 
M1 anglais 2015
M1 anglais 2015M1 anglais 2015
M1 anglais 2015
 
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
 
Bibliographie
BibliographieBibliographie
Bibliographie
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
 
éVolution noffre demande2010 jps
éVolution noffre demande2010 jpséVolution noffre demande2010 jps
éVolution noffre demande2010 jps
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
 
Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015
 
Le web sémantique - Sylvie Fayet
Le web sémantique - Sylvie FayetLe web sémantique - Sylvie Fayet
Le web sémantique - Sylvie Fayet
 
Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15
 

En vedette

DocWorks Demo
DocWorks DemoDocWorks Demo
DocWorks Demo
Europeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
Europeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
Europeana Newspapers
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
Europeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
Europeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
Europeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
Europeana Newspapers
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
Europeana Newspapers
 

En vedette (8)

DocWorks Demo
DocWorks DemoDocWorks Demo
DocWorks Demo
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
 

Similaire à Presentation of Ioannis Anagnostopoulos at BnF Information Day

Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
Desconnets Jean-Christophe
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
ABES
 
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
ABES
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf
AssociationAF
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et édition
Equipex Biblissima
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimonialesABES
 
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
webassoc .fr
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
ABES
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeJulien Sicot
 
#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise
Vincent Biret
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliotheque
Julien Sicot
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Franck Cornu
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
lazoumi ouarfli
 
Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...
Aproged
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006
Guillaume Hatt
 
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
ABES
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail Biblissima
Equipex Biblissima
 

Similaire à Presentation of Ioannis Anagnostopoulos at BnF Information Day (20)

Ppt msh def.
Ppt msh def.Ppt msh def.
Ppt msh def.
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
 
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et édition
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
 
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliotheque
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006
 
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail Biblissima
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Erms partagé
Erms partagéErms partagé
Erms partagé
 

Plus de Europeana Newspapers

IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers
 
ENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillemsENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillems
Europeana Newspapers
 
ENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilmsENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilms
Europeana Newspapers
 
ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen
Europeana Newspapers
 
ENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizingaENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizinga
Europeana Newspapers
 

Plus de Europeana Newspapers (20)

IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday Bolioli
 
ENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillemsENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillems
 
ENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilmsENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilms
 
ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen
 
ENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizingaENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizinga
 

Dernier

Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
mrelmejri
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
M2i Formation
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
Txaruka
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
Friends of African Village Libraries
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
cristionobedi
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
Billy DEYLORD
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Oscar Smith
 
Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
WarlockeTamagafk
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Procédure consignation Lock Out Tag Out.pptx
Procédure consignation  Lock Out Tag Out.pptxProcédure consignation  Lock Out Tag Out.pptx
Procédure consignation Lock Out Tag Out.pptx
caggoune66
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
BenotGeorges3
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
Txaruka
 

Dernier (13)

Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
 
Iris et les hommes.pptx
Iris      et         les      hommes.pptxIris      et         les      hommes.pptx
Iris et les hommes.pptx
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
 
Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 
Procédure consignation Lock Out Tag Out.pptx
Procédure consignation  Lock Out Tag Out.pptxProcédure consignation  Lock Out Tag Out.pptx
Procédure consignation Lock Out Tag Out.pptx
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
 

Presentation of Ioannis Anagnostopoulos at BnF Information Day

  • 1. Pourquoi Europeana Newspapers ? L’apport de la BnF dans le projet
  • 2. Car Europeana Newspapers nous permet… • L’agrégation de journaux européens libres de droits issus des grands titres de la presse européenne. • La visibilité et l’accessibilité sur le portail Europeana et sur le portail des bibliothèques partenaires. • L’amélioration des fonctionnalités de recherche pour ce contenu grâce à l’enrichissement sémantique des données et des métadonnées relatives aux corpus traités. Journée d’information 27 novembre 2014
  • 3. Car Europeana nous propose un point centralisé pour explorer la diversité européenne… • Garantir un meilleur accès aux collections numérisées de presse existantes. • Donner accès en ligne à 18 millions de pages via Europeana et TEL. • Optimiser les processus de numérisation, dont l’OCR, ainsi que les dispositifs de reconnaissance des articles de presse (OLR). Journée d’information 27 novembre 2014
  • 5. Contenus de la BnF La Bibliothèque nationale de France participe avec environ 3 millions de pages (environ 2,4 M traitées en OCR/OLR) Journée d’information 27 novembre 2014
  • 6. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance optique de caractères (OCR) – Université d’Innsbruck, Autriche Recherche plein-texte sur corpus BnF sans OCR ou avec OCR non HQ (1,4 M pages)
  • 7. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance optique de la structuration et de la segmentation des articles (OLR) – CCS, Allemagne. Consultation en mode Articles (1 M pages)
  • 8. OLR : Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation • Identification/reconnaissance des colonnes • Segmentation au niveau d’article (titres, sous-titres...) • Reconnaissance de classes de page/contenu (publicités, petites annonces, tableaux, illustrations, légendes) • Outils d’assurance qualité et de correction des résultats
  • 9. OLR
  • 10. OLR
  • 11. OLR
  • 12. OLR
  • 13. OLR
  • 14. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance des entités nommées (REN) • Sous-tâche de l’activité d’extraction d’information dans des corpus documentaires : • Rechercher et identifier un certain nombre d’objets textuels (un mot ou un groupe de mots) présents dans des corpus documentaires. • Catégorisables dans des classes telles que noms de personnes, noms d'organisations (institutions, entreprises, sociétés…) et noms de lieux (pays, ville, site…). • Eventuellement alignés sur des référentiels d’autorités. Partenaires scientifiques et techniques : • KB (GE, NE) • UPMC/LIP6 pour le français
  • 15. REN et Europeana Newspapers REN appliquée sur 100-500 K pages) • Concevoir, développer et appliquer un modèle pour la REN en français. • Réfléchir aux cas d’usage pour l’amélioration des fonctionnalités de consultation et de présentation à l’intention des usagers d’Europeana et des bibliothèques nationales : • Moteur de recherche sémantique • Web sémantique • Alignement avec des référentiels internationaux pour la recherche d’information multilingue
  • 16. •16 Entités nommées : comment les décrire ? • Format externe (BIO, bases de données) • TEI • METS • ALTO • Europeana Newspapers a choisi d’utiliser le mécanisme d’étiquetage disponible dans ALTO v2.1.
  • 17. Le format METS/ALTO nous offre… • Données descriptives et techniques. • Informations sur le contenu et la disposition physique de la page (segmentation). ALTO METS • Description de la publication globale : MD bibliographiques, techniques, administratives. • Informations/description de la structure logique du fascicule (TDM). • Liens logiques entre TDM et blocs ALTO de texte/articles
  • 18. Europeana Newspapers : un profil METS/ALTO dédié à la numérisation de la presse (ENMAP) • Articulation autour de trois concepts : section, élément de contenu (« article »), élément de structure. • Modèle adapté aux contenus presse. • Classification des types de contenu (information, opinion, divertissement, publicité, métadonnée). Alimenter la réflexion sur la problématique structuration minimale (article = titre + texte) vs. structuration riche
  • 19. Europeana Newspapers : un profil METS/ALTO dédié à la numérisation de la presse (ENMAP) Outillé par : • la documentation du modèle, • une application de structuration (UIBK) : • test et validation d’un modèle de structuration (lancement de projets de numérisation), • visualisation de contenus (QA) • conversion entre formats • production pour projets de petite taille Publication finale du format en fin de projet (janvier 2015)
  • 20. Europeana Newspapers : valorisation Améliorer la recherche et l’accès au contenu • Profiter de la structuration en articles individuels, avec table de navigation • Utiliser le typage des contenus pour affiner la recherche (filtres) • Valoriser les entités nommées via des outils sémantiques (data.bnf.fr, Exalead) ou d’autres services spécialisés Enjeux autour du format et valorisation des contenus • Le profil METS/ALTO ENMAP fournit un modèle viable pour le partage et l’échange de contenus de presse. • La structuration avancée qu’il autorise facilite la réexploitation des contenus pour d’autres usages ou vers d’autres formats.
  • 21. Europeana Newspapers : valorisation www.theeuropeanlibrary.org/tel4/newspapers
  • 22. Les bénéfices pour la BnF… • Améliorer l’OCR et utiliser des outils d’évaluation/correction : définition de nouvelles recommandations (futurs marchés). • Contribuer aux travaux de convergence vers l’utilisation du profil ENMAP METS/ALTO. • Enrichir les fonctionnalités de recherche et de consultation en mode texte/article pour les journaux sur Gallica. • Attirer plus de visiteurs sur Gallica avec des contenus enrichis et liés à d’autres corpus. • Alimenter d’autres vecteurs de diffusion avec ces contenus enrichis : data.bnf.fr
  • 23. merci de votre attention!