SlideShare une entreprise Scribd logo
1  sur  12
Télécharger pour lire hors ligne
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Kollaborative Korrektur
Doris Škarić, Bayerische Staatsbibliothek, Münchener Digitalisierungszentrum/Digitale Bibliothek




11.10.2011
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Agenda
        Definition
        State-of-the-Art
        IMPACT-Tool zur Kollaborativen Korrektur
          – Demonstration des CONCERT-Tools
          – Erfahrungsbericht
          – Nutzen für Bibliotheken




11.10.2011                                                                                                                                               2
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Was ist kollaborative Korrektur?
        Kollaborativ: mehrere Personen arbeiten gemeinsam an einem Projekt, hier:
        Textkorrekturen
        Crowdsourcing: “kollaborative Leistungserbringung durch Freiwillige”
        Reihenfolge im Digitalisierungsprozess: nach automatischer Texterkennung




11.10.2011                                                                                                                                               3
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Wieso Textkorrekturen?
        V.a. bei historischen Material (keine normierte Rechtschreibung…) führt alleinige
        Anwendung von OCR-Software zu oft nicht ausreichender Erkennungsrate
        Fehlerhafte Erkennung von Fraktur, z.B. langes s wird als f erkannt, z.B. Bifchof,
        Befatzungen…
        einzelne fehlerhafte Buchstaben führen zu schlechter Worterkennung
        Buchstaben, „Signal-“wörter werden nicht erkannt




11.10.2011                                                                                                                                               4
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Andere Systeme zur kollaborativen Korrektur
        Australian Newspaper Digitisation
        Program
        ReCaptcha
        Mole Hunt




11.10.2011                                                                                                                                               5
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




IMPACT-Beitrag
        CONCERT
          –      Collaborative eNgine for the CorREction of Texts
          –      Web-basierte Plattform
          –      Geeignet für massenhafte Beteiligung von Freiweilligen (Crowdsourcing)
          –      Ergebnisse der Korrektur werden in den OCR-Prozess eingespeist („Adaptive OCR“)
          –      Korrektur auf drei Ebenen
          –      schnelle und effiziente Arbeitsweise




11.10.2011                                                                                                                                               6
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Funktionsweise
        https://bsbimpact2.bsb.lrz.de:8443/impact
        /Concert/Concert-Final.html




11.10.2011                                                                                                                                               7
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Pilotphase an der BSB
        1-wöchiger Test mit ca. 15 Teilnehmern
        Fragestellungen:
          –      Usability
          –      Annahme durch Nutzer
          –      Erkennungsergebnisse
          –      Einbindung in Digitalisierungsprozess




11.10.2011                                                                                                                                               8
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Nutzereindrücke
        Insgesamt sehr positiv
        Nutzerwünsche:
              mehr „Nutzermotivation“ und Rückmeldung
                 Fortschrittsanzeige, Vergleich mit anderen Freiwilligen
        manche Wörter werden von der Texterkennung falsch erkannt und dadurch nie zur
        manuellen Korrektur vorgelegt bzw. als fragwürdig erkannt
        Gothic und Antiqua in einem Text werden nicht erkannt
        mehr Metadaten für Bücher




11.10.2011                                                                                                                                               9
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Einsatzmöglichkeit für die Bibliotheken
        Verbesserung der Volltexte durch Nutzerbeteiligung
        Ermöglichung zeitintensiver Korrekturen
        schnellere Korrekturen (durch Bibliotheksnutzer oder Dienstleister)
        „Kundenbindung“
        Verknüpfung des Katalogtitels mit der Korrektursoftware, z.B.: helfen Sie uns den
        Volltext dieses Buchs zu verbessern




11.10.2011                                                                                                                                               10
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




Ausblick :

        Verbesserung des Bedienkomforts
        User Monitoring
        Motivierung der Nutzer

        Einbindung in Texterkennungs- und Bearbeitungsprozess
        Langzeitarchivierung




11.10.2011                                                                                                                                               11
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.




                 Vielen Dank für Ihre Aufmerksamkeit

                 Kontakt: doris.skaric@bsb-muenchen.de




11.10.2011                                                                                                                                               12

Contenu connexe

Similaire à BSB Demo Day - Skaric - Kollaborative Korrektur

BSB Demo Day - Reffle - Analyse und Nachkorrektur
BSB Demo Day - Reffle - Analyse und NachkorrekturBSB Demo Day - Reffle - Analyse und Nachkorrektur
BSB Demo Day - Reffle - Analyse und NachkorrekturIMPACT Centre of Competence
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTMax Kaiser
 
Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognitioncneudecker
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Patrick Peiffer
 
BSB Demo Day - Pletschacher - Evaluationswerkzeuge
BSB Demo Day - Pletschacher - EvaluationswerkzeugeBSB Demo Day - Pletschacher - Evaluationswerkzeuge
BSB Demo Day - Pletschacher - EvaluationswerkzeugeIMPACT Centre of Competence
 
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und ChancenDigitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancencneudecker
 
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...opendiscoveryspace
 
ODS Praxisbericht Infotag ffg
ODS Praxisbericht Infotag ffgODS Praxisbericht Infotag ffg
ODS Praxisbericht Infotag ffgMomonika
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...EuropeanaConnect
 
PUMEC Präsentation (deutsch)
PUMEC Präsentation (deutsch)PUMEC Präsentation (deutsch)
PUMEC Präsentation (deutsch)PUMEC
 
Neue Aufgaben für Bibliothekare
Neue Aufgaben für BibliothekareNeue Aufgaben für Bibliothekare
Neue Aufgaben für BibliothekareTIB Hannover
 
Europeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenEuropeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenMax Kaiser
 
icEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopicEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopClaudia Warth
 
icEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopicEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopClaudia Warth
 

Similaire à BSB Demo Day - Skaric - Kollaborative Korrektur (20)

BSB Demo Day - Reffle - Analyse und Nachkorrektur
BSB Demo Day - Reffle - Analyse und NachkorrekturBSB Demo Day - Reffle - Analyse und Nachkorrektur
BSB Demo Day - Reffle - Analyse und Nachkorrektur
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
 
BSB Demo Day - Gotscharek - Spezial-Lexika
BSB Demo Day - Gotscharek - Spezial-LexikaBSB Demo Day - Gotscharek - Spezial-Lexika
BSB Demo Day - Gotscharek - Spezial-Lexika
 
Meyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUCMeyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUC
 
Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognition
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
 
BSB Demo Day - Pletschacher - Evaluationswerkzeuge
BSB Demo Day - Pletschacher - EvaluationswerkzeugeBSB Demo Day - Pletschacher - Evaluationswerkzeuge
BSB Demo Day - Pletschacher - Evaluationswerkzeuge
 
ENP_ONB_infoday_Neudecker
ENP_ONB_infoday_NeudeckerENP_ONB_infoday_Neudecker
ENP_ONB_infoday_Neudecker
 
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und ChancenDigitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
 
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...
ODS presentation by BMUKK (Monika Moises) at the Austrian national informatio...
 
ODS Praxisbericht Infotag ffg
ODS Praxisbericht Infotag ffgODS Praxisbericht Infotag ffg
ODS Praxisbericht Infotag ffg
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...
Europeana - Digitale Bibliothek Europas. Fenster zur Welt für lokale, regiona...
 
PUMEC Präsentation (deutsch)
PUMEC Präsentation (deutsch)PUMEC Präsentation (deutsch)
PUMEC Präsentation (deutsch)
 
Neue Aufgaben für Bibliothekare
Neue Aufgaben für BibliothekareNeue Aufgaben für Bibliothekare
Neue Aufgaben für Bibliothekare
 
Europeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenEuropeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - Metadaten
 
icEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopicEurope - das Projekt - Workshop
icEurope - das Projekt - Workshop
 
icEurope - das Projekt - Workshop
icEurope - das Projekt - WorkshopicEurope - das Projekt - Workshop
icEurope - das Projekt - Workshop
 

Plus de IMPACT Centre of Competence

Plus de IMPACT Centre of Competence (20)

Session6 01.helmut schmid
Session6 01.helmut schmidSession6 01.helmut schmid
Session6 01.helmut schmid
 
Session1 03.hsian-an wang
Session1 03.hsian-an wangSession1 03.hsian-an wang
Session1 03.hsian-an wang
 
Session7 03.katrien depuydt
Session7 03.katrien depuydtSession7 03.katrien depuydt
Session7 03.katrien depuydt
 
Session7 02.peter kiraly
Session7 02.peter kiralySession7 02.peter kiraly
Session7 02.peter kiraly
 
Session6 04.giuseppe celano
Session6 04.giuseppe celanoSession6 04.giuseppe celano
Session6 04.giuseppe celano
 
Session6 03.sandra young
Session6 03.sandra youngSession6 03.sandra young
Session6 03.sandra young
 
Session6 02.jeremi ochab
Session6 02.jeremi ochabSession6 02.jeremi ochab
Session6 02.jeremi ochab
 
Session5 04.evangelos varthis
Session5 04.evangelos varthisSession5 04.evangelos varthis
Session5 04.evangelos varthis
 
Session5 03.george rehm
Session5 03.george rehmSession5 03.george rehm
Session5 03.george rehm
 
Session5 02.tom derrick
Session5 02.tom derrickSession5 02.tom derrick
Session5 02.tom derrick
 
Session5 01.rutger vankoert
Session5 01.rutger vankoertSession5 01.rutger vankoert
Session5 01.rutger vankoert
 
Session4 04.senka drobac
Session4 04.senka drobacSession4 04.senka drobac
Session4 04.senka drobac
 
Session3 04.arnau baro
Session3 04.arnau baroSession3 04.arnau baro
Session3 04.arnau baro
 
Session3 03.christian clausner
Session3 03.christian clausnerSession3 03.christian clausner
Session3 03.christian clausner
 
Session3 02.kimmo ketunnen
Session3 02.kimmo ketunnenSession3 02.kimmo ketunnen
Session3 02.kimmo ketunnen
 
Session3 01.clemens neudecker
Session3 01.clemens neudeckerSession3 01.clemens neudecker
Session3 01.clemens neudecker
 
Session2 04.ashkan ashkpour
Session2 04.ashkan ashkpourSession2 04.ashkan ashkpour
Session2 04.ashkan ashkpour
 
Session2 03.juri opitz
Session2 03.juri opitzSession2 03.juri opitz
Session2 03.juri opitz
 
Session2 02.christian reul
Session2 02.christian reulSession2 02.christian reul
Session2 02.christian reul
 
Session2 01.emad mohamed
Session2 01.emad mohamedSession2 01.emad mohamed
Session2 01.emad mohamed
 

BSB Demo Day - Skaric - Kollaborative Korrektur

  • 1. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Kollaborative Korrektur Doris Škarić, Bayerische Staatsbibliothek, Münchener Digitalisierungszentrum/Digitale Bibliothek 11.10.2011
  • 2. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Agenda Definition State-of-the-Art IMPACT-Tool zur Kollaborativen Korrektur – Demonstration des CONCERT-Tools – Erfahrungsbericht – Nutzen für Bibliotheken 11.10.2011 2
  • 3. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Was ist kollaborative Korrektur? Kollaborativ: mehrere Personen arbeiten gemeinsam an einem Projekt, hier: Textkorrekturen Crowdsourcing: “kollaborative Leistungserbringung durch Freiwillige” Reihenfolge im Digitalisierungsprozess: nach automatischer Texterkennung 11.10.2011 3
  • 4. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Wieso Textkorrekturen? V.a. bei historischen Material (keine normierte Rechtschreibung…) führt alleinige Anwendung von OCR-Software zu oft nicht ausreichender Erkennungsrate Fehlerhafte Erkennung von Fraktur, z.B. langes s wird als f erkannt, z.B. Bifchof, Befatzungen… einzelne fehlerhafte Buchstaben führen zu schlechter Worterkennung Buchstaben, „Signal-“wörter werden nicht erkannt 11.10.2011 4
  • 5. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Andere Systeme zur kollaborativen Korrektur Australian Newspaper Digitisation Program ReCaptcha Mole Hunt 11.10.2011 5
  • 6. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. IMPACT-Beitrag CONCERT – Collaborative eNgine for the CorREction of Texts – Web-basierte Plattform – Geeignet für massenhafte Beteiligung von Freiweilligen (Crowdsourcing) – Ergebnisse der Korrektur werden in den OCR-Prozess eingespeist („Adaptive OCR“) – Korrektur auf drei Ebenen – schnelle und effiziente Arbeitsweise 11.10.2011 6
  • 7. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Funktionsweise https://bsbimpact2.bsb.lrz.de:8443/impact /Concert/Concert-Final.html 11.10.2011 7
  • 8. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Pilotphase an der BSB 1-wöchiger Test mit ca. 15 Teilnehmern Fragestellungen: – Usability – Annahme durch Nutzer – Erkennungsergebnisse – Einbindung in Digitalisierungsprozess 11.10.2011 8
  • 9. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Nutzereindrücke Insgesamt sehr positiv Nutzerwünsche: mehr „Nutzermotivation“ und Rückmeldung Fortschrittsanzeige, Vergleich mit anderen Freiwilligen manche Wörter werden von der Texterkennung falsch erkannt und dadurch nie zur manuellen Korrektur vorgelegt bzw. als fragwürdig erkannt Gothic und Antiqua in einem Text werden nicht erkannt mehr Metadaten für Bücher 11.10.2011 9
  • 10. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Einsatzmöglichkeit für die Bibliotheken Verbesserung der Volltexte durch Nutzerbeteiligung Ermöglichung zeitintensiver Korrekturen schnellere Korrekturen (durch Bibliotheksnutzer oder Dienstleister) „Kundenbindung“ Verknüpfung des Katalogtitels mit der Korrektursoftware, z.B.: helfen Sie uns den Volltext dieses Buchs zu verbessern 11.10.2011 10
  • 11. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Ausblick : Verbesserung des Bedienkomforts User Monitoring Motivierung der Nutzer Einbindung in Texterkennungs- und Bearbeitungsprozess Langzeitarchivierung 11.10.2011 11
  • 12. IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Vielen Dank für Ihre Aufmerksamkeit Kontakt: doris.skaric@bsb-muenchen.de 11.10.2011 12