SlideShare une entreprise Scribd logo
1  sur  81
Télécharger pour lire hors ligne
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

IMPACT implicación de la BNE-UA
(Universidad de Alicante) y resultados
preliminares del proyecto

 FESABID, XII Jornadas Españolas de Documentación- 26 mayo de 2011

                                                                                                                                                         TALLER FESABID 2011 26 MAYO
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

        El texto no digitalizado es “virtualmente” invisible

        Disponibilidad de material digitalizado                                                     demasiado lento, pequeñas cantidades y
        pocas fuentes

        Tecnología OCR (reconocimiento óptico de caracteres) no resultados satisfactorios
        para documentos históricos

        Falta de conocimiento institucional y especialización                                                                    ineficiencia y “reinventar la

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   2
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Texto histórico: típicos resultados OCR

VVt Venetien den 1.Junij, Anno 1618.
DJgn i f paffato te S' aö'Jifeert mo?üen/bah .)etgi'uotbciraetail)i.r/JtmelchontDecht te /
sbnbe bele btr felbrr geiufttceert baer bnber eeniglje jprant o^fen/bie ftcb .met
beSpaenfcbeu enbeeemgljen bifet Cbeiiupcen berbonbru befe

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   3
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Retos OCR: páginas dañadas, alabeadas, tintas traspasadas,
maquetación compleja, fuentes históricas…etc.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   4
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

   Retos lingüísticos: variantes ortográficas, variantes de
   grafía, formas conjugadas, declinadas…y más
Variantes históricas para la forma verbal hubo:
hubo, huvo, uvo, vuo, uuo, huuo…

Variantes históricas para la palabra holandesa ‘wereld’ (mundo):
werelt weerelt wereld weerelds wereldt werelden weereld werrelts waerelds weerlyt wereldts
vveerelts waereld weerelden waerelden weerlt werlt werelds sweerels zwerlys swarels swerelts
werelts swerrels weirelts tsweerelds werret vverelt werlts werrelt worreld werlden wareld weirelt
weireld waerelt werreld werld vvereld weerelts werlde tswerels werreldts weereldt wereldje
waereldje weurlt wald weëled
                                                                                                                                                            TALLER FESABID 2011 26 MAYO   5
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Reto institucional: falta de conocimiento y experiencia →

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   6
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Cómo afrontar estos retos: La visión de IMPACT

•       Digitalizar los textos impresos históricos en
        Europa mejor, más rápido , más barato

•       Proporcionar herramientas, servicios e
        instalaciones para continuar avanzando en
        este campo

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   7
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

El proyecto en cifras
        Apoyado por la Comunidad Europea a través de la línea ICT del FP7
        Coordinación Biblioteca Nacional de Países Bajos (KB)
        Tipo de proyecto: Proyecto de integración a Gran Escala
        Financiación de la UE : € 11 500 000
        Fecha de inicio: 1 enero 2008
        Duración: 48 meses
        A partir de 2012: Centro de competencia sostenible
        Sitio web:

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   8
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Consorcio IMPACT - Inicial
        Bibliotecas                                                                                         Universidades y Centros de Investigación
         – National Library of the Netherlands (KB)                                                          – Dutch Institute for Lexicology (INL)
         – The British Library (BL)                                                                          – National Centre for Scientific Research –
         – Bibliothèque nationale de France (BNF)                                                               Demokritos (NCSR)
         – German National Library (DNB)                                                                     – University of Salford (USAL)
         – Bavarian State Library (BSB)                                                                      – University of Munich (CIS group)
         – Göttingen State and University Library                                                            – University of Innsbruck (InfMath group)
             (UGOE)                                                                                          – University of Bath (UKOLN)
         – Austrian National Library (ONB)
         – University of Innsbruck Library (UIBK)                                                           Proveedores comerciales
                                                                                                             – IBM (Haifa Research Lab)
                                                                                                             – ABBYY (Moscow)

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   9
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Mejora significativa de la digitalización masiva del texto impreso históricos mediante:

        Innovación del software OCR y tecnologías en torno a los idiomas

        Compartir conocimientos y poner en pie habilidades a nivel europeo

        Garantizar existencia a largo plazo herramientas y servicios al finalizar el proyecto

        Conseguir el intercambio de procesos o datos entre sistemas heterogéneos

        Proporcionar una Guía de Mejores Prácticas en el ámbito de la digitalización

        Atender las necesidades de usuarios en diversos idiomas

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   10
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

 Inicio 2010 nuevos socios i.a.:
   …                                                                ...                                                                       …                         …

  23 Biblioteca Nacional de España                                                                                                          BNE                         ES

  24 Fundación Biblioteca Virtual Miguel de Cervantes                                                                                       BVC                         ES

  25 Poznań Supercomputing and Networking Center                                                                                           PSNC                         PL

   …                                                               …                                                                          …                         …

BNE/UA = marzo de 2010

                                                                                                                                                          TALLER FESABID 2011 26 MAYO   11
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   12
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Extensión de objetivos
Utilizar las herramientas de IMPACT para construir un léxico eficiente para idiomas
fuera de los objetivos iniciales de IMPACT
→ Inicialmente: inglés, alemán, holandés
→ Dp: lenguas romance y eslavas ej español
Demostrar y difundir los resultados del proyecto en Europa del Sur y del Este, y
apoyar la adquisición de conocimientos en digitalización en dichos países
Reforzar la cooperación y mejorar la explotación de las sinergias de I+D sobre ICT
a lo largo de la Unión Europea
Establecer vínculos estratégicos con el fin de avanzar en:
                  el acceso al conocimiento,
                  desarrollo de estándares y
                  soluciones interoperables

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   13
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Estructura del proyecto: 4 subproyectos
                                                            OPERATIONAL CONTEXT (OC)
                                                    Requisitos, documentación wfs y mediciones
                                                              Mejores prácticas y directrices
                                            Marco de trabajo e integración técnica - interoperabilidad

       TEXT RECOGNITION (TR) -5 WG                                                                           ENHANCEMENT & ENRICHMENT (EE)
       Pre-procesamiento y segmentación                                                                                  Corrección colaborativa
          OCR adaptativo y experimental                                                                               Lexica e índices geográficos
               Modelos y diccionarios                                                                                    Metadatos estructurales

                                                               CAPACITY BUILDING (CB)
                                                                    Publicación recursos
                                                                     Formación y apoyo

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   14
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Herramientas de OCR
Tecnologías para la extracción de texto en formato digital a partir de una página

        Motor de OCR adaptativo: Clave del proyecto IMPACT, software de primera línea
        adaptado específicamente a las necesidades de las bibliotecas y que se adapta durante el
        proceso de OCR, integrando otras herramientas:
                 Image enhancement toolkit
                 Segmentation toolkit
                 Módulos de post-corrección
                 Otros motores OCR

        Prototipos y herramientas experimentales
                 Prototipo OCR sobre textos escritos a máquina (Typewritten OCR prototype)

                                                                         TR                        EE

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   15
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Herramientas de enriquecimiento (tecnología
Conseguir que los resultados de OCR sean más precisos y accesibles
   Corrección colaborativa
   Sistema de corrección colaborativa a través de web: plataforma web, adecuada para
   participación voluntaria masiva, valida y corrige resultados OCR. La primera herramienta de
   este tipo que se relaciona directamente a un motor de OCR

        Lexicon e índices geográficos
            Léxicos generales y NER (nnll-uk-ger)
            Herramientas para proporcionar medios que permitan superar barrera lingüística

        Metadatos estructurales
        FEP: un conjunto de servicios web que pueden explotarse para detectar y etiquetar
        automáticamente metadatos estructurales del material escaneado

                                                                             TR                     EE

                                                                                        CB                                                               TALLER FESABID 2011 26 MAYO   16
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Herramientas y servicios estratégicos
        Sitio web proporciona acceso a todos los resultados del proyecto y constituye el núcleo de una red virtual formada
        por todos los centros de competencia europeos en materia de digitalización y las actividades de investigación

        Un conjunto de herramientas de Apoyo a la Toma de Decisiones que puede utilizarse para inciar,
        organizar, gestionar y evaluar el coste de los proyectos de digitalización masiva

        Recursos de aprendizaje (learning resource toolbox) con directrices de funcionamiento que sirvan
        de guía para la implementación real de todas las herramientas producidas en el proyecto.

        Formación y apoyo
                 Sistema Help Desk peticiones, ayuda entre usuarios, socios del proyecto, centros de competencia de
                 Programa de formación sobre temas y tecnologías en torno a la digitalización a gran escala con una amplia
                 gama de documentación de apoyo disponible a través del sitio web del proyecto

        Demos                                                                                OC

                                                                                 TR                       EE

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   17
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                         Herramientas del entorno de trabajo

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   18
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

  Repositorio de imágenes aportadas por las bibliotecas participantes que sirven de ejemplo
  para los diversos planes proyectados


                                                                                                                                                          TALLER FESABID 2011 26 MAYO   19
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

PRIMA: Groundtruth-formato PAGE

                                                                                                                                                          TALLER FESABID 2011 26 MAYO   20
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

    Plataforma o entorno de desarrollo donde investigadores intercambian ideas, desarrollos y


                                                                                                                                                          TALLER FESABID 2011 26 MAYO   21
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   22
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Herramienta creada por un Grupo de Trabajo (myGrid) , de código libre (JAVA), que permite el
diseño y ejecución de Flujos de Trabajos
                                                                                                                                 Servicio Web:
                                                                                                                                     Facilidad acceso

                                                                                                                                 Flujos simples & complejos

                                                                                                                                                           TALLER FESABID 2011 26 MAYO   23
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

TAVERNA: flujos simples o complejos

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   24
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Funcionamiento Taverna en Impact

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   25
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   26
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   27
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   28
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   29
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   30
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   31
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   32
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   33
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   34
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   35
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   36
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   37
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                     Visión general del proceso y algunas de las
                       herramientas desarrolladas en IMPACT

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   38
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                            Esquema del proceso OCR

             DE FICHEROS

          CORRECCIONES                                                                                                                POST-PROCESO
      GEOMÉTRICAS/ELIM.                                                  OCR                                                                +


                                                                                                                                                         TALLER FESABID 2011 26 MAYO   39
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Datos en el formato adecuado para cada aplicación

Módulos disponibles:

        GIMP , ImageMagick

             Basic IMPACT Abbyy FRE 9 PAGE Exporter Ir


                                                                                                                                                         TALLER FESABID 2011 26 MAYO   40
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Correcciones geométricas/Elim. márgenes
   rotadas, márgenes no deseados, ‘curvas’, páginas alabeadas …

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   41
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

     A.-Correcciones geométricas
             Basic IMPACT NCSR Geometric Correction Page Curl V3
             Módulos disponibles:
                ABBYY FineReader Engine
                NCSR Geometric Correction “Page Curl”
                NCSR Border Removal
                OCRopus Deskewing

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   42
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   43
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   44
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   45
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

     B.- Eliminación de márgenes
             Basic IMPACT NCSR BorderRemoval

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   46
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   47
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   48
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

‘Binarización’ de imágenes
   Tinta de una cara ha traspasado a la otra cara
   Sombras de la otra cara de la hoja

Módulos disponibles:
        ABBYY FineReader Engine
                      TAVERNA: basic_abbyy_fre_10_binarisation_936808.t2flow

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   49
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   50
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   51
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   52
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Reconocimiento Óptico de Caracteres (OCR)
    Segmentar el texto en las divisiones más sencillas (letras, caracteres)

                          Facilitar el análisis por la máquina.

                        Se identifica el carácter y se comprueban sus características o
                     propiedades con una BD interna hasta que encuentra con la que mejor

                                           texto editable a partir de una imagen.
     Módulos disponibles:
                ABBYY FineReader Engine
                IBM Adaptative OCR
                                                                                                                                                         TALLER FESABID 2011 26 MAYO   53
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Post-proceso / Evaluación
         – mejorar una vez más el rendimiento al corregir los documentos
         – Groundtruth, que viene a ser una réplica exacta análisis cuantitativo

Módulos disponibles i.a.:
    UIBK Functional Extension Parser
    NCSR Word Spotting (en fase de pruebas )

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   54
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

FEP (Functional Extension Parser)

   Web para identificar automáticamente la estructura ( número de página, encabezamientos,
   índice, tabla de contenido …) del material digitalizado       Segmentación jerárquica

   Puede reconocer el espacio de impresión y crear una tabla vinculada de contenidos, muy útil
   para la producción de libros electrónicos


                                                                                                                                                            TALLER FESABID 2011 26 MAYO   55
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

CONCERT (Cooperative Engine for Correction of Extracted Text)

                 Servicio Web como sistema para la corrección en colaboración o en convocatoria
                 Evita la instalación en ‘cliente’
                 3 pasos:
                       Carácter: presenta al usuario un listado con los caracteres identificados como la
                       misma letra
                       Palabra: las anteriores letras se presentan en el contexto de la palabra y el
                       usuario eligirá las válidas
                       Página: las anteriores selecciones se muestran a nivel de página

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   56
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.


                Aplicación multiuso para detectar palabras clave en los documentos utilizando una
                variedad de métodos de búsqueda
                Permite organización, gestión y administración de la colección de documentos
                Niveles: administradores y usuarios
                Uso de base de datos lo que proporciona un rapidez y fiabilidad en el
                almacenamiento y la recuperación.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   57
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                    Papel de la BNE y de la UA en IMPACT

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   58
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Biblioteca Nacional de España (CB)
            Entró a formar parte en marzo de 2010, II Fase del proyecto , en colaboración con
            la Universidad de Alicante

            Aportación de más de 60.000 imágenes (UA-BVMC) y subida a PRIMA (md):
                                  Escala grises, color, 300 dpi, TIFF
                                  Obras anteriores XIX ej: Teatro Siglo de Oro
                                  Obras cuyo OCR no está ofreciendo buenos resultados
                           – En 3 sets: Development (Lexicon Building) – Evaluation - Demonstration

            Probar las funcionalidades realizadas por los desarrolladores participantes
                                          Demonstration dataset
                                          Lotes, repositorio resultados

            Difundir el proyecto (presentaciones a nivel interno, FESABID, T4 2011)

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   59
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Universidad de Alicante (EE-CB)
        Colaboración en carga en el servidor de imágenes PRIMA

        Gestión de contrato GroundTruth (evaluación), control de calidad y subida a PRIMA

        Difundir el proyecto

        Creación de léxico español antiguo para conectar a las soluciones de OCR

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   60
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   61
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

   Resultados clave de IMPACT
1. Un Centro de Competencia en digitalización textual con un modelo de negocio que pueda
   sostenerse por sí mismo durante 3 años

2. Entorno de trabajo interoperable basado en sw Open Source con herramientas y recursos
   extensibles para evaluar y demostrar resultados

3. Serie de herramientas y recursos modulares para mejorar el reconocimiento textual, la
   implementación en workflows de digitalizaciones masivas

4. Prototipos que mejoran la investigación de 1ª línea en materia de reconocimiento textual.

5. Medios para poner en pie especialización en digitalización en Europa

                                                                                                                                                             TALLER FESABID 2011 26 MAYO   62
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

IMPACT productos y servicios

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   63
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Entorno de trabajo interoperable

Entorno de trabajo basado en Sw open
    Source y Libre que permiten:

        Ofrecer herramientas como
        servicios web,
        crear workflows con herramientas
        de IMPACT y externas
        instrumentos y recursos para
        deomostrar y evaluar resultados

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   64
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

 Ejemplo: Entorno para la evaluación del rendimiento
Escenarios de                                                                                                                            Mediciones
 Evaluación                                                                                                                              Evaluación


 Resultados                                            Compatibilidad a través de                                                     Ground Truth
                                                       un formato común

Herramientas                                                                                                                          Herramientas
    OCR                                                              Repositorio                                                           GT
                                                                      imágenes                                                                             TALLER FESABID 2011 26 MAYO   65
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Herramientas IMPACT: Ejemplos

                                                                                                                                                              CONCERT: OCR

                                                                                                                                      Extension Parser:

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   66
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

 Prototipos de Investigación: Ejemplo

Mejora de
imagen y
segmentación                                                                                                                                              TALLER FESABID 2011 26 MAYO   67
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Puesta en pie de especialización en digitalización:
                                                                                    Digitisation Health Check: expertos para evaluar y mejorar
                                                                                    workflows de digitalización actuales y recomendaciones para
                                                                                    poner en práctica nuevos flujos de trabajo.

                                                                                    Herramientas comunitarias. :
                                                                                       –     Helpdesk
                                                                                       –     Recursos de aprendizaje.
                                                                                       –     Comunidad web…

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   68
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Un único centro al que acudan todos los depositarios de contenido de Europa
Objetivo principal: digitalización más rápida, de mejor calidad y más barata
Plataforma adaptaple productos y servicios diferentes a clientes distintos
Modelo de negocio Freemium
  – Productos y servicios básicos gratuitos,
  – Pago por servicios, productos premium/especiales
  – Permitir generación de ingresos para posibilitar sostenibilidad

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   69
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Tres Segmentos de Clientes

institutiones                                       institutiones e                                       Tienen productos que
depositarias de textos                              individuos                                                deseen poner a
históricos que desean                               relacionadas con                                          disposición de
digitalizar.                                        investigación dentro                                      CH/Rr
                                                    del alcance de
                                                    IMPACT                                                Fundamentalmente
Sector público y                                                                                             sector privado
                                                    Sector público y
privado                                             privado

                                                                                                                                                             TALLER FESABID 2011 26 MAYO   70
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                IMPACT Centre of Competence in Text Digitisation

                                                                                                       Service & Product
                   Content Holders                               Researchers

                                                                      Registration (Free)

                              IMPACT Tools                              IMPACT Tools
                                                                                                                  IMPACT Tools
                         IMPACT KnowledgeBase                       Researcher Evaluation
                                                                                                       Training & Education (online tutorials)
                            Toolset Evaluation                         Research Dataset
                   Training & Education (online tutorials)   Training & Education (online tutorials)

                                                                      Subscription (fee)

                              IMPACT Tools
                          Reports & Publications                        IMPACT Tools
                                                                                                                  IMPACT Tools
                               Tools Online                         Reports & Publications
                                                                                                        Training & Education (Sponsorship)
                     Toolset Evaluation (configurable)               Training & Education
                                                                                                                 Community Tools
                           Training & Education                       Community Tools
                             Community Tools

                                                                  Premium (pay as you go)

                               IMPACT Tools
                         Digitisation Health Check           Training & Education (inc. Conference)
                                                                                                        Training & Education (Sponsorship)
                  Training & Education (inc. Conference)

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   71
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Tres niveles de acceso (propuestas)
        Registro (gratuito)
        Pay as you go

        3º trimestre 2011

date footertext                                                                                                                                          TALLER FESABID 2011 26 MAYO   72
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Cómo estar al día sobre IMPACT
    En Twitter

    Unión al LinkedIn group

    Visita el blog y el website

    Lista de correo del proyecto para recibir el boletín trimestral

    Canal Youtube

    Para cualquier pregunta ó feedback: contactar con IMPACT helpdesk

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   73
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Twitter: @impactocr, #impactproject

                                                                                                                                              Tweets sobre últimas
                                                                                                                                              noticias en IMPACT

                                                                                                                                              (Re)tweets de noticias
                                                                                                                                              en torno a la
                                                                                                                                              tecnología OCR y

                                                                                                                                              Tweets en vivo
                                                                                                                                              durante conferencias,

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   74
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

LinkedIn group: IMPACT Improving Access to Text

                                                                                                                                   Comunidad online

                                                                                                                                   Canal para obtener
                                                                                                                                   feedback sobre los
                                                                                                                                   entregables IMPACT
                                                                                                                                   (versiones posteriores)

                                                                                                                                   Discusiones sobre
                                                                                                                                   digitalización, tecnología
                                                                                                                                   OCR y lingüística

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   75
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

IMPACT blog:

                                                                                                                                         Utilizado para talleres
                                                                                                                                         y días de
                                                                                                                                         Incorporación de
                                                                                                                                          –        Presentaciones
                                                                                                                                          –        Vídeos

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   76
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.


                                                                                                                                                         TALLER FESABID 2011 26 MAYO   77
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

    Boletín trimestral IMPACT

   Especial en torno a una
   Fotos e informes sobre
   contribuciones de IMPACT
   a conferencias
   Entrevistas equipo humano

                                                                                                                                                             TALLER FESABID 2011 26 MAYO   78
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

Canal de IMPACT en Youtube
                                                                                                                                                           introducciones sobre
                                                                                                                                                           cada subproyecto y
                                                                                                                                                           cada uno de los
                                                                                                                                                           líderes de los
                                                                                                                                                           distintos work

                                                                                                                                                           Vídeo de
                                                                                                                                                           presentación de
                                                                                                                                                           IMPACT elaborado
                                                                                                                                                           por la KB

                                                                                                                                                           Video de IBM sobre

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   79
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

 IMPACT Helpdesk
                                                                                                                                                          TALLER FESABID 2011 26 MAYO   80
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

                                      GRACIAS POR SU ATENCIÓN
                                                          Isabel Bordes Cabrera
                                                Jefe de Servicio de Biblioteca Digital, BNE

                                                                                                                                                         TALLER FESABID 2011 26 MAYO   81

Contenu connexe


Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...
Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...
Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...Biblioteca Nacional de España
Bibliotecas nacionales y redes sociales. Mar Pérez Morillo
Bibliotecas nacionales y redes sociales. Mar Pérez MorilloBibliotecas nacionales y redes sociales. Mar Pérez Morillo
Bibliotecas nacionales y redes sociales. Mar Pérez MorilloBiblioteca Nacional de España
Archivos Web y Economía Digital. María Fernández Rancaño
Archivos Web y Economía Digital. María Fernández RancañoArchivos Web y Economía Digital. María Fernández Rancaño
Archivos Web y Economía Digital. María Fernández RancañoBiblioteca Nacional de España
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez Morillo
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez MorilloEl archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez Morillo
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez MorilloBiblioteca Nacional de España
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...Biblioteca Nacional de España
Bibliotecas pasado presente y futuro
Bibliotecas pasado presente y futuroBibliotecas pasado presente y futuro
Bibliotecas pasado presente y futuroLiz Pagan
María Luisa Alvite Díez: Information Science in Spain: Information Science at...
María Luisa Alvite Díez: Information Science in Spain: Information Science at...María Luisa Alvite Díez: Information Science in Spain: Information Science at...
María Luisa Alvite Díez: Information Science in Spain: Information Science at...ÚISK FF UK
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. Bivaldi
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. BivaldiNuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. Bivaldi
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. BivaldiNuria Martínez Fernández
Museos: las colecciones crean conexiones. Reyes Carrasco
Museos: las colecciones crean conexiones. Reyes CarrascoMuseos: las colecciones crean conexiones. Reyes Carrasco
Museos: las colecciones crean conexiones. Reyes CarrascoBiblioteca Nacional de España
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández Ros
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández RosPatrimonio Cultural en internet: retos y oportunidades. Javier Hernández Ros
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández RosBiblioteca Nacional de España
Upcommonsmurcia 121121063419-phpapp01 (1)
Upcommonsmurcia 121121063419-phpapp01 (1)Upcommonsmurcia 121121063419-phpapp01 (1)
Upcommonsmurcia 121121063419-phpapp01 (1)ArlethRamos15

Tendances (20)

Biblioteca Digital del Patrimonio Iberoamericano
Biblioteca Digital del Patrimonio IberoamericanoBiblioteca Digital del Patrimonio Iberoamericano
Biblioteca Digital del Patrimonio Iberoamericano
Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...
Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...
Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Inter...
Bibliotecas nacionales y redes sociales. Mar Pérez Morillo
Bibliotecas nacionales y redes sociales. Mar Pérez MorilloBibliotecas nacionales y redes sociales. Mar Pérez Morillo
Bibliotecas nacionales y redes sociales. Mar Pérez Morillo
Archivos Web y Economía Digital. María Fernández Rancaño
Archivos Web y Economía Digital. María Fernández RancañoArchivos Web y Economía Digital. María Fernández Rancaño
Archivos Web y Economía Digital. María Fernández Rancaño
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez Morillo
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez MorilloEl archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez Morillo
El archivo de Internet, bibliotecas que piensan en el futuro. Mar Pérez Morillo
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...
La Subdirección General de Coordinación Bibliotecaria y el acceso abierto en ...
Datos enlazados en la BNE. Mar Hernández Agustí
Datos enlazados en la BNE. Mar Hernández AgustíDatos enlazados en la BNE. Mar Hernández Agustí
Datos enlazados en la BNE. Mar Hernández Agustí Daniel Vila Suero Daniel Vila Daniel Vila Suero Daniel Vila Suero
World Digital Library. Michelle Rago
World Digital Library. Michelle RagoWorld Digital Library. Michelle Rago
World Digital Library. Michelle Rago
BUZ digital : Repositorio Zaguán
BUZ digital : Repositorio ZaguánBUZ digital : Repositorio Zaguán
BUZ digital : Repositorio Zaguán
Bibliotecas pasado presente y futuro
Bibliotecas pasado presente y futuroBibliotecas pasado presente y futuro
Bibliotecas pasado presente y futuro
María Luisa Alvite Díez: Information Science in Spain: Information Science at...
María Luisa Alvite Díez: Information Science in Spain: Information Science at...María Luisa Alvite Díez: Information Science in Spain: Information Science at...
María Luisa Alvite Díez: Information Science in Spain: Information Science at...
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. Bivaldi
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. BivaldiNuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. Bivaldi
Nuevas tecnologías en bibliotecas y archivos. Bibliotecas Digitales. Bivaldi
Conferencia Gloria Pérez Salmerón, Presidenta electa de la IFLA
Conferencia Gloria Pérez Salmerón, Presidenta electa de la IFLAConferencia Gloria Pérez Salmerón, Presidenta electa de la IFLA
Conferencia Gloria Pérez Salmerón, Presidenta electa de la IFLA
Buz digital libro-e
Buz digital   libro-eBuz digital   libro-e
Buz digital libro-e
Buz digital cooperacion tabla
Buz digital cooperacion tablaBuz digital cooperacion tabla
Buz digital cooperacion tabla
Museos: las colecciones crean conexiones. Reyes Carrasco
Museos: las colecciones crean conexiones. Reyes CarrascoMuseos: las colecciones crean conexiones. Reyes Carrasco
Museos: las colecciones crean conexiones. Reyes Carrasco
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández Ros
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández RosPatrimonio Cultural en internet: retos y oportunidades. Javier Hernández Ros
Patrimonio Cultural en internet: retos y oportunidades. Javier Hernández Ros
Upcommonsmurcia 121121063419-phpapp01 (1)
Upcommonsmurcia 121121063419-phpapp01 (1)Upcommonsmurcia 121121063419-phpapp01 (1)
Upcommonsmurcia 121121063419-phpapp01 (1)

Similaire à IMPACT implicación de la BNE-UA y resultados preliminares del proyecto. Isabel Bordes Cabrera

UA Spanish Language: presentación del trabajo lingüístico
UA Spanish Language: presentación del trabajo lingüísticoUA Spanish Language: presentación del trabajo lingüístico
UA Spanish Language: presentación del trabajo lingüísticoBiblioteca Nacional de España
Museo distrcyt upna-141203
Museo distrcyt upna-141203Museo distrcyt upna-141203
Museo distrcyt upna-141203Joaquín Sevilla
Proyectos de investigación educativa en europa
Proyectos de investigación educativa en europaProyectos de investigación educativa en europa
Proyectos de investigación educativa en europaximoneta_
Proyectos de investigación educativa en europa
Proyectos de investigación educativa en europaProyectos de investigación educativa en europa
Proyectos de investigación educativa en europaximoneta_
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero. Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero. Biblioteca Nacional de España
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...Julio Santillán-Aldana
Manifiesto de ifla unesco para b ibliotecas escolares
Manifiesto de ifla unesco para b ibliotecas escolaresManifiesto de ifla unesco para b ibliotecas escolares
Manifiesto de ifla unesco para b ibliotecas escolaresMaria Jose Vitorino
E-LIS E-prints in library and Information Science
E-LIS E-prints in library and Information ScienceE-LIS E-prints in library and Information Science
E-LIS E-prints in library and Information ScienceRIBDA 2009
Maykel Bermeo - Bibliotecas virtuales
Maykel Bermeo - Bibliotecas virtualesMaykel Bermeo - Bibliotecas virtuales
Maykel Bermeo - Bibliotecas virtuales. .
La voz de los visitantes
La voz de los visitantesLa voz de los visitantes
La voz de los visitantesMariana Salgado
Boletín Informativo N 4 JULIO 2010
Boletín Informativo N 4 JULIO 2010Boletín Informativo N 4 JULIO 2010
Boletín Informativo N 4 JULIO 2010jaimesnestor
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria.
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria. Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria.
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria. Mariana Salgado

Similaire à IMPACT implicación de la BNE-UA y resultados preliminares del proyecto. Isabel Bordes Cabrera (20)

UA Spanish Language: presentación del trabajo lingüístico
UA Spanish Language: presentación del trabajo lingüísticoUA Spanish Language: presentación del trabajo lingüístico
UA Spanish Language: presentación del trabajo lingüístico
Covcell Minerva
Covcell MinervaCovcell Minerva
Covcell Minerva
Citilab 2015
Citilab 2015Citilab 2015
Citilab 2015
I ntroduccion a_impact_051011
I ntroduccion a_impact_051011I ntroduccion a_impact_051011
I ntroduccion a_impact_051011
Museo distrcyt upna-141203
Museo distrcyt upna-141203Museo distrcyt upna-141203
Museo distrcyt upna-141203
Proyectos de investigación educativa en europa
Proyectos de investigación educativa en europaProyectos de investigación educativa en europa
Proyectos de investigación educativa en europa
Proyectos de investigación educativa en europa
Proyectos de investigación educativa en europaProyectos de investigación educativa en europa
Proyectos de investigación educativa en europa
Alcances y Desafios 2009 al 2010
Alcances y Desafios 2009 al 2010Alcances y Desafios 2009 al 2010
Alcances y Desafios 2009 al 2010
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero. Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.
Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...
La Open Archives Initiative en el ámbito de la Bibliotecología y las Ciencias...
Manifiesto de ifla unesco para b ibliotecas escolares
Manifiesto de ifla unesco para b ibliotecas escolaresManifiesto de ifla unesco para b ibliotecas escolares
Manifiesto de ifla unesco para b ibliotecas escolares
Taller etwinning 2.0 gadea sesión 1
Taller etwinning 2.0 gadea sesión 1Taller etwinning 2.0 gadea sesión 1
Taller etwinning 2.0 gadea sesión 1
E-LIS E-prints in library and Information Science
E-LIS E-prints in library and Information ScienceE-LIS E-prints in library and Information Science
E-LIS E-prints in library and Information Science
Maykel Bermeo - Bibliotecas virtuales
Maykel Bermeo - Bibliotecas virtualesMaykel Bermeo - Bibliotecas virtuales
Maykel Bermeo - Bibliotecas virtuales
Welcome to HUELVA Conference
Welcome to HUELVA ConferenceWelcome to HUELVA Conference
Welcome to HUELVA Conference
La voz de los visitantes
La voz de los visitantesLa voz de los visitantes
La voz de los visitantes
Boletín Informativo N 4 JULIO 2010
Boletín Informativo N 4 JULIO 2010Boletín Informativo N 4 JULIO 2010
Boletín Informativo N 4 JULIO 2010
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria.
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria. Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria.
Disen̂ar acceso al patrimonio audiovisual. El caso de la zanahoria.

Plus de Biblioteca Nacional de España

La colección de relaciones de sucesos en la Biblioteca Nacional de España
La colección de relaciones de sucesos en la Biblioteca Nacional de EspañaLa colección de relaciones de sucesos en la Biblioteca Nacional de España
La colección de relaciones de sucesos en la Biblioteca Nacional de EspañaBiblioteca Nacional de España
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos Aramburo
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos AramburoIdentidad común: las fuentes del patrimonio bibliográfico. Ana Santos Aramburo
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos AramburoBiblioteca Nacional de España
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...Biblioteca Nacional de España
RDA. Autoridades. Fundamentos. Identificación de entidades. Relaciones
RDA. Autoridades. Fundamentos. Identificación de entidades. RelacionesRDA. Autoridades. Fundamentos. Identificación de entidades. Relaciones
RDA. Autoridades. Fundamentos. Identificación de entidades. RelacionesBiblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de EspañaPleno del Real Patronato. Biblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de EspañaBiblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de EspañaObjetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de EspañaBiblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...Biblioteca Nacional de España
Evaluación actuaciones 2018. Planificación actuaciones 2019
Evaluación actuaciones 2018. Planificación actuaciones 2019Evaluación actuaciones 2018. Planificación actuaciones 2019
Evaluación actuaciones 2018. Planificación actuaciones 2019Biblioteca Nacional de España
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos Aramburo
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos AramburoPleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos Aramburo
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos AramburoBiblioteca Nacional de España
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...Biblioteca Nacional de España

Plus de Biblioteca Nacional de España (20)

La colección de relaciones de sucesos en la Biblioteca Nacional de España
La colección de relaciones de sucesos en la Biblioteca Nacional de EspañaLa colección de relaciones de sucesos en la Biblioteca Nacional de España
La colección de relaciones de sucesos en la Biblioteca Nacional de España
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos Aramburo
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos AramburoIdentidad común: las fuentes del patrimonio bibliográfico. Ana Santos Aramburo
Identidad común: las fuentes del patrimonio bibliográfico. Ana Santos Aramburo
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...
La Biblioteca Nacional de España como centro de apoyo a la investigación. Ana...
Data privacy in library authority files: a survey
Data privacy in library authority files: a surveyData privacy in library authority files: a survey
Data privacy in library authority files: a survey
Perfil de RDA de la BNE. Resumen de cambios
Perfil de RDA de la BNE. Resumen de cambiosPerfil de RDA de la BNE. Resumen de cambios
Perfil de RDA de la BNE. Resumen de cambios
RDA. Autoridades. Fundamentos. Identificación de entidades. Relaciones
RDA. Autoridades. Fundamentos. Identificación de entidades. RelacionesRDA. Autoridades. Fundamentos. Identificación de entidades. Relaciones
RDA. Autoridades. Fundamentos. Identificación de entidades. Relaciones
RDA: el nuevo texto
RDA: el nuevo textoRDA: el nuevo texto
RDA: el nuevo texto
Pleno del Real Patronato. Biblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de EspañaPleno del Real Patronato. Biblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de EspañaObjetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de España
Objetivos 2019. Pleno del Real Patronato. Biblioteca Nacional de España
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...
Pleno del Real Patronato. Biblioteca Nacional de España. Evaluación actuacion...
Evaluación actuaciones 2018. Planificación actuaciones 2019
Evaluación actuaciones 2018. Planificación actuaciones 2019Evaluación actuaciones 2018. Planificación actuaciones 2019
Evaluación actuaciones 2018. Planificación actuaciones 2019
Dirección Técnica. Objetivos 2019
Dirección Técnica. Objetivos 2019Dirección Técnica. Objetivos 2019
Dirección Técnica. Objetivos 2019
Evaluación 2018. Objetivos 2019
Evaluación 2018. Objetivos 2019Evaluación 2018. Objetivos 2019
Evaluación 2018. Objetivos 2019
Evaluación actuaciones 2018. Dirección Cultural
Evaluación actuaciones 2018. Dirección CulturalEvaluación actuaciones 2018. Dirección Cultural
Evaluación actuaciones 2018. Dirección Cultural
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos Aramburo
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos AramburoPleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos Aramburo
Pleno CCB. Consejo de Cooperación Bibliotecaria. Ana Santos Aramburo
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...
Descubrir, aprender, disfrutar en la Biblioteca Nacional de España. Ana Santo...
Renacer prensa historica
Renacer prensa historicaRenacer prensa historica
Renacer prensa historica
RDA y Linked data (Ricardo Santos Muñoz)
RDA y Linked data (Ricardo Santos Muñoz)RDA y Linked data (Ricardo Santos Muñoz)
RDA y Linked data (Ricardo Santos Muñoz)
Desarrollo actual de RDA (Pilar Tejero López)
Desarrollo actual de RDA (Pilar Tejero López)Desarrollo actual de RDA (Pilar Tejero López)
Desarrollo actual de RDA (Pilar Tejero López)


CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersIván López Martín
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Marketing BRANDING
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdfBetianaJuarez1
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerenciacubillannoly
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointValerioIvanDePazLoja
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosAlbanyMartinez7
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024u20211198540
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1ivanapaterninar
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armadob7fwtwtfxf
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfcristianrb0324
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
Análisis de Artefactos Tecnologicos (3) (1).pdf
Análisis de Artefactos Tecnologicos  (3) (1).pdfAnálisis de Artefactos Tecnologicos  (3) (1).pdf
Análisis de Artefactos Tecnologicos (3) (1).pdfsharitcalderon04
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1

Dernier (20)

CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 Testcontainers
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
Agencia Marketing Branding Google Workspace Deployment Services Credential Fe...
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerencia
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power Point
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos Juridicos
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
Viguetas Pretensadas en concreto armado
Viguetas Pretensadas  en concreto armadoViguetas Pretensadas  en concreto armado
Viguetas Pretensadas en concreto armado
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
Análisis de Artefactos Tecnologicos (3) (1).pdf
Análisis de Artefactos Tecnologicos  (3) (1).pdfAnálisis de Artefactos Tecnologicos  (3) (1).pdf
Análisis de Artefactos Tecnologicos (3) (1).pdf
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx

IMPACT implicación de la BNE-UA y resultados preliminares del proyecto. Isabel Bordes Cabrera

  • 1. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT implicación de la BNE-UA (Universidad de Alicante) y resultados preliminares del proyecto FESABID, XII Jornadas Españolas de Documentación- 26 mayo de 2011 TALLER FESABID 2011 26 MAYO
  • 2. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Antecedentes El texto no digitalizado es “virtualmente” invisible Disponibilidad de material digitalizado demasiado lento, pequeñas cantidades y pocas fuentes Tecnología OCR (reconocimiento óptico de caracteres) no resultados satisfactorios para documentos históricos Falta de conocimiento institucional y especialización ineficiencia y “reinventar la rueda” TALLER FESABID 2011 26 MAYO 2
  • 3. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Texto histórico: típicos resultados OCR VVt Venetien den 1.Junij, Anno 1618. DJgn i f paffato te S' aö'Jifeert mo?üen/bah .)etgi'uotbciraetail)i.r/JtmelchontDecht te / sbnbe bele btr felbrr geiufttceert baer bnber eeniglje jprant o^fen/bie ftcb .met beSpaenfcbeu enbeeemgljen bifet Cbeiiupcen berbonbru befe TALLER FESABID 2011 26 MAYO 3
  • 4. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Retos OCR: páginas dañadas, alabeadas, tintas traspasadas, maquetación compleja, fuentes históricas…etc. TALLER FESABID 2011 26 MAYO 4
  • 5. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Retos lingüísticos: variantes ortográficas, variantes de grafía, formas conjugadas, declinadas…y más Variantes históricas para la forma verbal hubo: hubo, huvo, uvo, vuo, uuo, huuo… Variantes históricas para la palabra holandesa ‘wereld’ (mundo): werelt weerelt wereld weerelds wereldt werelden weereld werrelts waerelds weerlyt wereldts vveerelts waereld weerelden waerelden weerlt werlt werelds sweerels zwerlys swarels swerelts werelts swerrels weirelts tsweerelds werret vverelt werlts werrelt worreld werlden wareld weirelt weireld waerelt werreld werld vvereld weerelts werlde tswerels werreldts weereldt wereldje waereldje weurlt wald weëled TALLER FESABID 2011 26 MAYO 5
  • 6. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Reto institucional: falta de conocimiento y experiencia → ineficiencia TALLER FESABID 2011 26 MAYO 6
  • 7. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Cómo afrontar estos retos: La visión de IMPACT • Digitalizar los textos impresos históricos en Europa mejor, más rápido , más barato • Proporcionar herramientas, servicios e instalaciones para continuar avanzando en este campo TALLER FESABID 2011 26 MAYO 7
  • 8. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. El proyecto en cifras Apoyado por la Comunidad Europea a través de la línea ICT del FP7 Coordinación Biblioteca Nacional de Países Bajos (KB) Tipo de proyecto: Proyecto de integración a Gran Escala Financiación de la UE : € 11 500 000 Fecha de inicio: 1 enero 2008 Duración: 48 meses A partir de 2012: Centro de competencia sostenible Contacto: Sitio web: TALLER FESABID 2011 26 MAYO 8
  • 9. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Consorcio IMPACT - Inicial Bibliotecas Universidades y Centros de Investigación – National Library of the Netherlands (KB) – Dutch Institute for Lexicology (INL) – The British Library (BL) – National Centre for Scientific Research – – Bibliothèque nationale de France (BNF) Demokritos (NCSR) – German National Library (DNB) – University of Salford (USAL) – Bavarian State Library (BSB) – University of Munich (CIS group) – Göttingen State and University Library – University of Innsbruck (InfMath group) (UGOE) – University of Bath (UKOLN) – Austrian National Library (ONB) – University of Innsbruck Library (UIBK) Proveedores comerciales – IBM (Haifa Research Lab) – ABBYY (Moscow) TALLER FESABID 2011 26 MAYO 9
  • 10. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. OBJETIVOS Mejora significativa de la digitalización masiva del texto impreso históricos mediante: Innovación del software OCR y tecnologías en torno a los idiomas Compartir conocimientos y poner en pie habilidades a nivel europeo Garantizar existencia a largo plazo herramientas y servicios al finalizar el proyecto Conseguir el intercambio de procesos o datos entre sistemas heterogéneos (‘interoperabilidad’) Proporcionar una Guía de Mejores Prácticas en el ámbito de la digitalización Atender las necesidades de usuarios en diversos idiomas TALLER FESABID 2011 26 MAYO 10
  • 11. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Inicio 2010 nuevos socios i.a.: … ... … … 23 Biblioteca Nacional de España BNE ES 24 Fundación Biblioteca Virtual Miguel de Cervantes BVC ES 25 Poznań Supercomputing and Networking Center PSNC PL … … … … BNE/UA = marzo de 2010 TALLER FESABID 2011 26 MAYO 11
  • 12. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 12
  • 13. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Extensión de objetivos Utilizar las herramientas de IMPACT para construir un léxico eficiente para idiomas fuera de los objetivos iniciales de IMPACT → Inicialmente: inglés, alemán, holandés → Dp: lenguas romance y eslavas ej español Demostrar y difundir los resultados del proyecto en Europa del Sur y del Este, y apoyar la adquisición de conocimientos en digitalización en dichos países Reforzar la cooperación y mejorar la explotación de las sinergias de I+D sobre ICT a lo largo de la Unión Europea Establecer vínculos estratégicos con el fin de avanzar en: el acceso al conocimiento, desarrollo de estándares y soluciones interoperables TALLER FESABID 2011 26 MAYO 13
  • 14. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Estructura del proyecto: 4 subproyectos OPERATIONAL CONTEXT (OC) Requisitos, documentación wfs y mediciones Mejores prácticas y directrices Marco de trabajo e integración técnica - interoperabilidad TEXT RECOGNITION (TR) -5 WG ENHANCEMENT & ENRICHMENT (EE) Pre-procesamiento y segmentación Corrección colaborativa OCR adaptativo y experimental Lexica e índices geográficos Modelos y diccionarios Metadatos estructurales CAPACITY BUILDING (CB) Publicación recursos Formación y apoyo Demostraciones TALLER FESABID 2011 26 MAYO 14
  • 15. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herramientas de OCR Tecnologías para la extracción de texto en formato digital a partir de una página Motor de OCR adaptativo: Clave del proyecto IMPACT, software de primera línea adaptado específicamente a las necesidades de las bibliotecas y que se adapta durante el proceso de OCR, integrando otras herramientas: Image enhancement toolkit Segmentation toolkit Módulos de post-corrección Otros motores OCR Prototipos y herramientas experimentales Prototipo OCR sobre textos escritos a máquina (Typewritten OCR prototype) Wordspotting… OC TR EE CB TALLER FESABID 2011 26 MAYO 15
  • 16. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herramientas de enriquecimiento (tecnología lingüística) Conseguir que los resultados de OCR sean más precisos y accesibles Corrección colaborativa Sistema de corrección colaborativa a través de web: plataforma web, adecuada para participación voluntaria masiva, valida y corrige resultados OCR. La primera herramienta de este tipo que se relaciona directamente a un motor de OCR Lexicon e índices geográficos Léxicos generales y NER (nnll-uk-ger) Herramientas para proporcionar medios que permitan superar barrera lingüística histórica Metadatos estructurales FEP: un conjunto de servicios web que pueden explotarse para detectar y etiquetar automáticamente metadatos estructurales del material escaneado OC TR EE CB TALLER FESABID 2011 26 MAYO 16
  • 17. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herramientas y servicios estratégicos Sitio web proporciona acceso a todos los resultados del proyecto y constituye el núcleo de una red virtual formada por todos los centros de competencia europeos en materia de digitalización y las actividades de investigación asociadas Un conjunto de herramientas de Apoyo a la Toma de Decisiones que puede utilizarse para inciar, organizar, gestionar y evaluar el coste de los proyectos de digitalización masiva Recursos de aprendizaje (learning resource toolbox) con directrices de funcionamiento que sirvan de guía para la implementación real de todas las herramientas producidas en el proyecto. Formación y apoyo Sistema Help Desk peticiones, ayuda entre usuarios, socios del proyecto, centros de competencia de digitalización. Programa de formación sobre temas y tecnologías en torno a la digitalización a gran escala con una amplia gama de documentación de apoyo disponible a través del sitio web del proyecto Demos OC TR EE CB TALLER FESABID 2011 26 MAYO 17
  • 18. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herramientas del entorno de trabajo TALLER FESABID 2011 26 MAYO 18
  • 19. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. PRIMA Repositorio de imágenes aportadas por las bibliotecas participantes que sirven de ejemplo para los diversos planes proyectados Home TALLER FESABID 2011 26 MAYO 19
  • 20. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. PRIMA: Groundtruth-formato PAGE TALLER FESABID 2011 26 MAYO 20
  • 21. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. MyExperiment Plataforma o entorno de desarrollo donde investigadores intercambian ideas, desarrollos y planes Home TALLER FESABID 2011 26 MAYO 21
  • 22. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 22
  • 23. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TAVERNA Herramienta creada por un Grupo de Trabajo (myGrid) , de código libre (JAVA), que permite el diseño y ejecución de Flujos de Trabajos Servicio Web: Interoperabilidad Facilidad acceso Dinamismo Flujos simples & complejos TALLER FESABID 2011 26 MAYO 23
  • 24. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TAVERNA: flujos simples o complejos TALLER FESABID 2011 26 MAYO 24
  • 25. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Funcionamiento Taverna en Impact TALLER FESABID 2011 26 MAYO 25
  • 26. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 26
  • 27. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 27
  • 28. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 28
  • 29. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 29
  • 30. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 30
  • 31. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 31
  • 32. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 32
  • 33. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 33
  • 34. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 34
  • 35. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 35
  • 36. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 36
  • 37. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 37
  • 38. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Visión general del proceso y algunas de las herramientas desarrolladas en IMPACT TALLER FESABID 2011 26 MAYO 38
  • 39. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Esquema del proceso OCR CONVERSIÓN DE FICHEROS CORRECCIONES POST-PROCESO GEOMÉTRICAS/ELIM. OCR + EVALUACIÓN MÁRGENES “BINARIZACIÓN” TALLER FESABID 2011 26 MAYO 39
  • 40. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Conversión Datos en el formato adecuado para cada aplicación Módulos disponibles: GIMP , ImageMagick impact_gimp_tif_to_png_conversion_202058.t2flow OpenJPEG XML Basic IMPACT Abbyy FRE 9 PAGE Exporter Ir basic_impact_abbyy_fre_9_page_xml_creator_392392.t2flow Iconv TALLER FESABID 2011 26 MAYO 40
  • 41. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Correcciones geométricas/Elim. márgenes ¿Porqué? rotadas, márgenes no deseados, ‘curvas’, páginas alabeadas … TALLER FESABID 2011 26 MAYO 41
  • 42. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. A.-Correcciones geométricas Basic IMPACT NCSR Geometric Correction Page Curl V3 Módulos disponibles: ABBYY FineReader Engine NCSR Geometric Correction “Page Curl” TAVERNA: basic_impact_ncsr_geometric_correction_page_curl_550389.t2flow NCSR Border Removal TAVERNA: basic_impact_ncsr_border_removal_v4_603318.t2flow OCRopus Deskewing TALLER FESABID 2011 26 MAYO 42
  • 43. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 43
  • 44. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 44
  • 45. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 45
  • 46. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. B.- Eliminación de márgenes Basic IMPACT NCSR BorderRemoval TALLER FESABID 2011 26 MAYO 46
  • 47. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 47
  • 48. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 48
  • 49. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. ‘Binarización’ de imágenes ¿Porqué? Tinta de una cara ha traspasado a la otra cara Sombras de la otra cara de la hoja Módulos disponibles: ABBYY FineReader Engine TAVERNA: basic_abbyy_fre_10_binarisation_936808.t2flow OCRopus TALLER FESABID 2011 26 MAYO 49
  • 50. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 50
  • 51. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 51
  • 52. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 52
  • 53. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Reconocimiento Óptico de Caracteres (OCR) Segmentar el texto en las divisiones más sencillas (letras, caracteres) Facilitar el análisis por la máquina. Se identifica el carácter y se comprueban sus características o propiedades con una BD interna hasta que encuentra con la que mejor “encaja” texto editable a partir de una imagen. Módulos disponibles: ABBYY FineReader Engine IBM Adaptative OCR Tesseract TALLER FESABID 2011 26 MAYO 53
  • 54. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Post-proceso / Evaluación – mejorar una vez más el rendimiento al corregir los documentos digitalizados. – Groundtruth, que viene a ser una réplica exacta análisis cuantitativo cualitativo. Módulos disponibles i.a.: UIBK Functional Extension Parser IBM CONCERT NCSR Word Spotting (en fase de pruebas ) TALLER FESABID 2011 26 MAYO 54
  • 55. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. FEP (Functional Extension Parser) Web para identificar automáticamente la estructura ( número de página, encabezamientos, índice, tabla de contenido …) del material digitalizado Segmentación jerárquica Puede reconocer el espacio de impresión y crear una tabla vinculada de contenidos, muy útil para la producción de libros electrónicos PROTOTIPO TALLER FESABID 2011 26 MAYO 55
  • 56. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. CONCERT (Cooperative Engine for Correction of Extracted Text) Servicio Web como sistema para la corrección en colaboración o en convocatoria abierta Evita la instalación en ‘cliente’ Intuitiva 3 pasos: Carácter: presenta al usuario un listado con los caracteres identificados como la misma letra Palabra: las anteriores letras se presentan en el contexto de la palabra y el usuario eligirá las válidas Página: las anteriores selecciones se muestran a nivel de página TALLER FESABID 2011 26 MAYO 56
  • 57. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. WORDSPOTTING Aplicación multiuso para detectar palabras clave en los documentos utilizando una variedad de métodos de búsqueda Permite organización, gestión y administración de la colección de documentos Niveles: administradores y usuarios Uso de base de datos lo que proporciona un rapidez y fiabilidad en el almacenamiento y la recuperación. TALLER FESABID 2011 26 MAYO 57
  • 58. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Papel de la BNE y de la UA en IMPACT TALLER FESABID 2011 26 MAYO 58
  • 59. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Biblioteca Nacional de España (CB) Entró a formar parte en marzo de 2010, II Fase del proyecto , en colaboración con la Universidad de Alicante Aportación de más de 60.000 imágenes (UA-BVMC) y subida a PRIMA (md): Escala grises, color, 300 dpi, TIFF Obras anteriores XIX ej: Teatro Siglo de Oro Obras cuyo OCR no está ofreciendo buenos resultados – En 3 sets: Development (Lexicon Building) – Evaluation - Demonstration Probar las funcionalidades realizadas por los desarrolladores participantes Demonstration dataset Lotes, repositorio resultados Difundir el proyecto (presentaciones a nivel interno, FESABID, T4 2011) TALLER FESABID 2011 26 MAYO 59
  • 60. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Universidad de Alicante (EE-CB) Colaboración en carga en el servidor de imágenes PRIMA Gestión de contrato GroundTruth (evaluación), control de calidad y subida a PRIMA Difundir el proyecto Creación de léxico español antiguo para conectar a las soluciones de OCR TALLER FESABID 2011 26 MAYO 60
  • 61. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 61
  • 62. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Resultados clave de IMPACT 1. Un Centro de Competencia en digitalización textual con un modelo de negocio que pueda sostenerse por sí mismo durante 3 años 2. Entorno de trabajo interoperable basado en sw Open Source con herramientas y recursos extensibles para evaluar y demostrar resultados 3. Serie de herramientas y recursos modulares para mejorar el reconocimiento textual, la implementación en workflows de digitalizaciones masivas 4. Prototipos que mejoran la investigación de 1ª línea en materia de reconocimiento textual. 5. Medios para poner en pie especialización en digitalización en Europa TALLER FESABID 2011 26 MAYO 62
  • 63. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT productos y servicios TALLER FESABID 2011 26 MAYO 63
  • 64. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Entorno de trabajo interoperable Entorno de trabajo basado en Sw open Source y Libre que permiten: Ofrecer herramientas como servicios web, crear workflows con herramientas de IMPACT y externas instrumentos y recursos para deomostrar y evaluar resultados TALLER FESABID 2011 26 MAYO 64
  • 65. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Ejemplo: Entorno para la evaluación del rendimiento Resultados Evaluación Escenarios de Mediciones Evaluación Evaluación Herramientas Evaluación Resultados Compatibilidad a través de Ground Truth un formato común Herramientas Herramientas OCR Repositorio GT de imágenes TALLER FESABID 2011 26 MAYO 65
  • 66. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herramientas IMPACT: Ejemplos CONCERT: OCR Corrección participación voluntaria Functional Extension Parser: metadatos estructurales TALLER FESABID 2011 26 MAYO 66
  • 67. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Prototipos de Investigación: Ejemplo Plataforma Mejora de imagen y segmentación TALLER FESABID 2011 26 MAYO 67
  • 68. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Puesta en pie de especialización en digitalización: ejemplos Digitisation Health Check: expertos para evaluar y mejorar workflows de digitalización actuales y recomendaciones para poner en práctica nuevos flujos de trabajo. Herramientas comunitarias. : – Helpdesk – Recursos de aprendizaje. – Comunidad web… TALLER FESABID 2011 26 MAYO 68
  • 69. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Un único centro al que acudan todos los depositarios de contenido de Europa Objetivo principal: digitalización más rápida, de mejor calidad y más barata Plataforma adaptaple productos y servicios diferentes a clientes distintos Modelo de negocio Freemium – Productos y servicios básicos gratuitos, – Pago por servicios, productos premium/especiales – Permitir generación de ingresos para posibilitar sostenibilidad TALLER FESABID 2011 26 MAYO 69
  • 70. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Tres Segmentos de Clientes institutiones institutiones e Tienen productos que depositarias de textos individuos deseen poner a históricos que desean relacionadas con disposición de digitalizar. investigación dentro CH/Rr del alcance de IMPACT Fundamentalmente Sector público y sector privado Sector público y privado privado TALLER FESABID 2011 26 MAYO 70
  • 71. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT Centre of Competence in Text Digitisation Service & Product Content Holders Researchers Providers Registration (Free) IMPACT Tools IMPACT Tools IMPACT Tools IMPACT KnowledgeBase Researcher Evaluation Training & Education (online tutorials) Toolset Evaluation Research Dataset Training & Education (online tutorials) Training & Education (online tutorials) Subscription (fee) IMPACT Tools Reports & Publications IMPACT Tools IMPACT Tools Tools Online Reports & Publications Training & Education (Sponsorship) Toolset Evaluation (configurable) Training & Education Community Tools Training & Education Community Tools Community Tools Premium (pay as you go) IMPACT Tools Digitisation Health Check Training & Education (inc. Conference) Training & Education (Sponsorship) Training & Education (inc. Conference) TALLER FESABID 2011 26 MAYO 71
  • 72. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Tres niveles de acceso (propuestas) Registro (gratuito) Suscripción Pay as you go 3º trimestre 2011 date footertext TALLER FESABID 2011 26 MAYO 72
  • 73. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Cómo estar al día sobre IMPACT En Twitter Unión al LinkedIn group Visita el blog y el website Lista de correo del proyecto para recibir el boletín trimestral Canal Youtube Para cualquier pregunta ó feedback: contactar con IMPACT helpdesk TALLER FESABID 2011 26 MAYO 73
  • 74. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Twitter: @impactocr, #impactproject Tweets sobre últimas noticias en IMPACT (Re)tweets de noticias en torno a la digitalización, tecnología OCR y lingüística Tweets en vivo durante conferencias, talleres TALLER FESABID 2011 26 MAYO 74
  • 75. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. LinkedIn group: IMPACT Improving Access to Text Comunidad online Canal para obtener feedback sobre los entregables IMPACT (versiones posteriores) Discusiones sobre digitalización, tecnología OCR y lingüística TALLER FESABID 2011 26 MAYO 75
  • 76. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT blog: Utilizado para talleres y días de demostración Incorporación de – Presentaciones – Vídeos TALLER FESABID 2011 26 MAYO 76
  • 77. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. TALLER FESABID 2011 26 MAYO 77
  • 78. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Boletín trimestral IMPACT Secciones: Novedades Especial en torno a una herramienta Fotos e informes sobre contribuciones de IMPACT a conferencias Entrevistas equipo humano IMPACT TALLER FESABID 2011 26 MAYO 78
  • 79. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Canal de IMPACT en Youtube Breves introducciones sobre cada subproyecto y cada uno de los líderes de los distintos work package Vídeo de presentación de IMPACT elaborado por la KB Video de IBM sobre CONCERT TALLER FESABID 2011 26 MAYO 79
  • 80. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT Helpdesk TALLER FESABID 2011 26 MAYO 80
  • 81. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. GRACIAS POR SU ATENCIÓN Isabel Bordes Cabrera Jefe de Servicio de Biblioteca Digital, BNE TALLER FESABID 2011 26 MAYO 81