Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

R
Integration von Normdaten in
Bibliotheksanwendungen auf der Basis
von Webservices mit Semantic Web-
Technologie
Dr. Timo Borst

IT-Entwicklung
Deutsche Zentralbibliothek für Wirtschaftswissenschaften /
Leibniz-Informationszentrum Wirtschaft
Kiel/Hamburg

I-KNOW Praxisforum
1.-3. September 2010 in Graz

                                            Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Übersicht
1. Ausgangslage: Verteiltes Datenmanagement in
   Bibliotheksanswendungen

2. Bisherige Ansätze zur Aggregierung und Homogenisierung

3. Integration und Aggregation von Normdaten auf der Basis von
   Semantic Web-Technologien
         a) Grundidee
         b) Anwendungsfall_1: Verschlagwortung
         c) Anwendungsfall_2: Suche
         d) Anwendungsfall_3: Erfassung von Autoren

4. “Leichtgewichtige” Integration in bestehende Systeme

5. Zusammenfassung und Fazit

                                                                 Seite 2
Ausgangslage
•   Klassische Bibliotheksanwendungen erzeugen und verwalten
    jeweils idiosynkratische (Meta-)Datenbestände (“Datensilos”)…

•   …die dann im Web über jeweils eigene Frontends verfügbar
    gemacht werden

•   Wie können hinsichtlich

     •   Formate
     •   Schemata
     •   Vokabulare zur Erschließung
     •   Erschließungsregeln
     •   Vollständigkeit (Abstract ja/nein)
     •   Herkunft

    prinzipiell heterogene Metadaten zueinander in Beziehung
    gesetzt werden?
                                                                Seite 3
Ausgangslage

Beispiel Repositorien und ihre Vernetzung
•   Repositorien sind allgemein genutzte Erfassungs-/Retrieval-
    /Verbreitungssysteme („Data Provider“), zumeist OSS und Community-
    getrieben
•   Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren
•   Vernetzungsinitiativen, z.B. OA-Netzwerk
•   „OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI-
    zertifizierten Repositorien bereit […] u.a. vorgesehen: Aggregation,
    Harmonisierung und Ähnlichkeitsanalyse“
    http://www.dini.de/fileadmin/workshops/oa-statistik-was-zaehlt/02_gerlach-
    oas.pdf
•   Einschlägige OSS-Repositoriensoftware (DSpace, EPrints, OPUS)
    unterstützt derzeit noch nicht die Integration extern kontrollierter Normdaten

                                                                             Seite 4
Ausgangslage
„The major difficulty we have found is with DSpace’s handling of
metadata. While we feel that the number of fields in Dublin Core is
adequate for most if not all uses (DCMI Usage Board 2006), we are
troubled by the lack of authority control when completing its fields.
Without some control over uniform titles, authors and subjects
accessing the items in the future will very problematic.“
S. Chabot (http://subjectobject.net/2006/11/09/the-dspace-digital-
repository-a-project-analysis/)
       „Neither the standards nor the software unterlying
      institutional repositories anticipated performing naming
      authority control on widely disparate metadata from
      highly unreliable sources.“
      D. Salo (http://minds.wisconsin.edu/handle/1793/31735)


                                                                     Seite 5
Ausgangslage

Typische Mängel
•   Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber,
    Dokumenttypen etc.) werden ohne semantische und syntaktische
    Anleitungen und Restriktionen teilweise im Freitext erfasst
•   (Syntaktische) Suchen liefern nur eingeschränkte oder uneindeutige
    Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse
    (Trunkierung etc.) (Suche nach „Abbott, Philip“ liefert nur Treffer für Nr.
    2/3)
•   Namensänderungen sind praktisch nicht nachvollziehbar
•   Selbst wenn syntaktische und semantische Eindeutigkeit in einem
    Repository lokal erzielt werden können, erneuert und verschärft sich das
    Problem auf Seiten der Aggregatoren




                                                                             Seite 6
Bisherige Ansätze zur Aggregierung &
Homogenisierung




                                                                                Seite 7
   http://www.economistsonline.org/publications?page=3&q=thys-clement&lang=de
Bisherige Ansätze zur Aggregierung &
Homogenisierung




                                       Seite 8
Bisherige Lösungsansätze zur Aggregierung &
Homogenisierung
Homogenisierung im Vorhinein
• Festlegung eines relativ granularen Metadatenschemas
• Möglichst verbindliches und explizites Regelwerk, das auch von allen
  Beteiligten konsequent befolgt wird
• Verwendung einheitlicher Namen + Vokabulare
• Lokale Anpassungen
• Zentrales Harvesting bei minimierter Datenaufbereitung
Homogenisierung im Nachhinein
• Beibehaltung der lokalen Ausprägungen bei kleinstem gemeinsamen
  Nenner (etwa “Dublin Core”-Elemente)
• Nachträgliche Maßnahmen zur Homogenisierung, u.a. “Name
  Disambiguation”
• Zentrales Harvesting bei aufwändiger Datenaufbereitung
Beide Ansätze sind nicht optimal!

                                                                Seite 9
Integration und Aggregation von Normdaten -
Grundidee




                                              Seite 10
Integration und Aggregation von Normdaten -
Idee
Beispieldaten und -anfragen (zu Personen und Themen):




http://zbw.eu/beta/stw-ws/suggest?query=finanzkr
…liefert alle Terme, die mit “finanzkr” beginnen

http://zbw.eu/beta/stw-ws/stw-ws-wrapper.php?service=labels&
concept=http://zbw.eu/stw/descriptor/19664-4&lang=en
…liefert alle englischen Synonyme zu “Finanzkrise:

                                                               Seite 11
Anwendungsfall_1: Verschlagwortung mit
Normdaten
• DER Anwendungsfall für Bibliothekarinnen und Bibliothekare
• Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen (?)
    + BibliotheksnutzerInnen (?)
•   Vorgang: Eingabe von beschreibenden Metadaten, die häufig aus einem
    kontrollierten Vokabular stammen
•   Crosskonkordanzen herstellen zwischen verschiedenen kontrollierten
    Vokabularen
•   Bestandteil von Open Access relevanten Vorgängen wie das „self-publishing“,
    das „self-archiving“ oder das „social tagging“
•   Zielstellung: Den Vorgang der Verschlagwortung mit Hilfe von kontrollierten
    Vokabularen und Webservices unterstützen, so dass man einerseits zu
    „besseren“ im Sinne von normierten Metadaten kommt, die andererseits aber
    auch Flexibilität im Rahmen eines KOS erlauben („Lokalisierung“):
      • Alternative Schreibweisen bei Namen
      • Synonyme sowie Ober-/Unterbegriffe bei Schlagworten
                                                                       Seite 12
Anwendungsfall_1: Verschlagwortung

Erfassungsmaske unter https://econstor.eu




                                            Seite 13
Anwendungsfall_1: Verschlagwortung
Erfassungsmaske unter https://econstor.eu




                                            Seite 14
Anwendungsfall_2: Suche
•   Der häufigste Anwendungsfall in Bibliotheksanwendungen
•   Nutzergruppen: Bibliothekarinnen und Bibliothekare +
    WissenschaftlerInnen + BibliotheksnutzerInnen
•   Vorgang: Zumeist einfache Volltextsuche über
    Metadatenfelder (Titel/Abstract) und/oder Volltexte (soweit
    letztere verfügbar sind und im Suchmaschinenindex liegen)
•   Zielstellung: Den Vorgang der Suche mit Hilfe von
    kontrollierten Vokabularen und Webservices unterstützen,
    so so dass man zu besseren Suchergebnissen gelangt
    (Erhöhung von Recall + Precision)



                                                            Seite 15
Anwendungsfall_2: Suche

Erweiterte Suche unter http://econstor.eu nach „Finanzkrise“




                                                               Seite 16
Anwendungsfall_2: Suche




                          Seite 17
Anwendungsfall_2: Suche




                          Seite 18
“Leichtgewichtige” Integration in bestehende Systeme




                                                Seite 19
“Leichtgewichtige” Integration in bestehende Systeme

Vorteile
•   „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme

•   Strategie des „minimalen Eingriffs“

•   Keine Änderungen am Systemkern, minimale Änderungen am
    Datenmodell nötig (Erweiterung um eine Spalte für den Authority-Key)

•   Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise
    zwanglos erweitern ließen:
    •   Repositorien (zumeist OSS, Plugin-Architektur)
    •   Kataloge (zumeist proprietäre SW und monolithisch)
    •   Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) ->
        WebService zur Verbesserung des Retrievals und zur Erzeugung von Mash-
        Ups
    •   …sowie alle offenen Systeme mit kollaborativ-verteilter Verschlagwortung
        (z.B. Academic Linkshare)

                                                                                     Seite 20
Zusammenfassung und Fazit
• Bibliotheksanwendungen erzeugen und verwalten jeweils eigene
  idiosynkratische Datenbestände.
• Dies erschwert die Pflege, den Austausch, die Aggregation und die
  Homogenisierung der (Meta-)Daten für erweiterte Dienste.
• Vorgelagerte Webservices als Teil einer übergreifenden Normdaten-
  Infrastruktur können frühzeitig zur Homogenisierung der Metadaten
  beitragen (bei gleichzeitiger Lokalisierung).
• Wenn diese Webservices verbreitet entstehen und genutzt werden,
  besteht die Chance zu einer weitergehenden Vernetzung lokal
  gepflegter Metadaten bei gleichzeitiger Verbesserung der
  datenbasierten Services.
• Die Möglichkeit zur „leichtgewichtigen Integration“ ist ein Angebot an
  Betreiber von Bibliotheksanwendungen, diese Webservices mit
  möglichst minimalem Aufwand in ihre Anwendungen zu integrieren.
                                                                   Seite 21
Vielen Dank!


Dr. Timo Borst
Deutsche Zentralbibliothek für
Wirtschaftswissenschaften /
Leibniz-Informationszentrum
Wirtschaft (ZBW)

t.borst@zbw.eu



                                 Seite 22
Anwendungsfall_3: Erfassung von Autoren


  •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher
  der Ausnahmefall
  •Nutzergruppen: BibliothekarInnen + WissenschaftlerInnen (?) +
  BibliotheksnutzerInnen (?)
  •Vorgang: Eingabe von AutorInnen-Namen
  •Zielstellung: Den Vorgang der Autorenerfassung mit Hilfe von
  Normdaten zu verbessern, die durch Webservices bereit gestellt werden




                                                                          Seite 23
Anwendungsfall_3: Erfassung von Autoren
•Erfassungsmaske unter http://87.106.250.18/beta/econstor/




                                                             Seite 24
Bisherige Lösungsansätze zur Aggregierung &
Homogenisierung
  •Metadatensuche durch Aggregatoren
  •     Parallele Abfrage entfernt-verteilter Systeme
  •     Rückgabe und Aufbereitung des Suchergebnisses als
        zusammengesetzte Trefferliste
  •Harvesting
  •     Regelmäßiges Einsammeln von entfernt-verteilten
        Metadaten
  •     Homogenisierung ex ante oder ex post
  •Föderierte Suche
  •…

                                                            Seite 25
•[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_Values
Literatur
  •[2] http://minds.wisconsin.edu/handle/1793/31735
   •[3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3
   •[4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/
   •[5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn
   •[6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma-199/PDF/subirats.pdf
   •[7] http://www.jisc.ac.uk/media/documents/programmes/sharedservices/na
   mes-phase-one-final-report,.pdf
   •[8] http://idea.library.drexel.edu/bitstream/1860/3173/1/20070051011.pdf
   •[9] http://ptsefton.com/blog/2006/06/06/the_affiliation_issue_in
   _institutional_repository_software/
   •[10] http://library.ust.hk/info/nac/nac-technical.html
   •[11] http://www.seco.tkk.fi/publications/2009/kurki-hyvonen-onki-people-2009.pdf
   •[12] http://journals.sfu.ca/archivar/index.php/archivaria/article/download/11883/12836
   •[13] http://www.dini.de/fileadmin/workshops/oa-netzwerk-
   juni2009/vernetzungstage_2009_malitz.pdf




                                                                                    Seite 26
1 sur 26

Recommandé

Repositorieninhalte als Linked Data bereitstellen par
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenPascal-Nicolas Becker
701 vues16 diapositives
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de... par
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Felix Lohmeier
3.7K vues33 diapositives
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL) par
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Felix Lohmeier
4.2K vues30 diapositives
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data par
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataDer Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataAnne Christensen
3.4K vues44 diapositives
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N... par
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...ZBW - Leibniz-Informationszentrum Wirtschaft
549 vues20 diapositives
Einbindung von Linked Data in existierende Bibliotheksanswendungen par
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungenredsys
465 vues30 diapositives

Contenu connexe

Tendances

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe... par
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Felix Lohmeier
1.6K vues15 diapositives
Literaturverwaltung & Bibliotheken - Das zentrale Portal für Informationen ... par
Literaturverwaltung & Bibliotheken  - Das zentrale Portal  für Informationen ...Literaturverwaltung & Bibliotheken  - Das zentrale Portal  für Informationen ...
Literaturverwaltung & Bibliotheken - Das zentrale Portal für Informationen ...ZBW - Leibniz-Informationszentrum Wirtschaft
747 vues18 diapositives
Infotreff: Persistent Identifier par
Infotreff: Persistent IdentifierInfotreff: Persistent Identifier
Infotreff: Persistent IdentifierPascal-Nicolas Becker
2K vues17 diapositives
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch... par
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...ZBW - Leibniz-Informationszentrum Wirtschaft
1.1K vues21 diapositives
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi... par
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...GESIS - Leibniz-Institut für Sozialwissenschaften
1.2K vues25 diapositives
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per... par
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...TIB Hannover
961 vues7 diapositives

Tendances(20)

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe... par Felix Lohmeier
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Felix Lohmeier1.6K vues
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per... par TIB Hannover
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
TIB Hannover961 vues
Semantic Web in Bibliotheken mal praktisch par kostaedt
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
kostaedt1.4K vues
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ... par Felix Lohmeier
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Felix Lohmeier3K vues
DOI-Registrierung mit da|ra par Ralf Toepfer
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
Ralf Toepfer544 vues
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB par intranda GmbH
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
intranda GmbH836 vues
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite... par Matti Stöhr
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Matti Stöhr1.4K vues
Workshop für die LUH: Forschungsdatenmanagement par Frauke Ziedorn
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
Frauke Ziedorn2K vues
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich) par Martin Blenkle
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Martin Blenkle270 vues
Grundformen Digitaler Bibliotheken par Jakob .
Grundformen Digitaler BibliothekenGrundformen Digitaler Bibliotheken
Grundformen Digitaler Bibliotheken
Jakob .1.4K vues
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth... par Matti Stöhr
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Matti Stöhr1.8K vues
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat... par Pascal-Nicolas Becker
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
Die Zukunft der Portale - Kataloge der nächsten Generation par Martin Blenkle
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
Martin Blenkle1.5K vues

En vedette

Dios habla-con-las-personas par
Dios habla-con-las-personasDios habla-con-las-personas
Dios habla-con-las-personasParroquia La Purisima
474 vues31 diapositives
Avis Kustom Store Motorcycles sur les bagages par
Avis Kustom Store Motorcycles sur les bagagesAvis Kustom Store Motorcycles sur les bagages
Avis Kustom Store Motorcycles sur les bagagesKustom Store Motorcycles
604 vues10 diapositives
Asincar par
AsincarAsincar
AsincarJesús Amor
526 vues20 diapositives
Introducción par
IntroducciónIntroducción
Introduccióngonzalvo2
229 vues3 diapositives
Tic`s par
Tic`sTic`s
Tic`sFernandaMales
199 vues10 diapositives
Microsoft powert point par
Microsoft powert point Microsoft powert point
Microsoft powert point alexaaguilar
330 vues6 diapositives

En vedette(20)

Introducción par gonzalvo2
IntroducciónIntroducción
Introducción
gonzalvo2229 vues
Microsoft powert point par alexaaguilar
Microsoft powert point Microsoft powert point
Microsoft powert point
alexaaguilar330 vues
Donde nació el fast45 par guitarisk
Donde nació el fast45Donde nació el fast45
Donde nació el fast45
guitarisk246 vues
Brand kpi 5 - extra light sans club des annonceurs par yves Simeon
Brand kpi   5 - extra light sans club des annonceursBrand kpi   5 - extra light sans club des annonceurs
Brand kpi 5 - extra light sans club des annonceurs
yves Simeon363 vues
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina par ConectaDEL
Estudio de caso: Área Vitivinicola Norte de Mendoza, ArgentinaEstudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
ConectaDEL2.1K vues
Primera reunion consejo conectaDEL 10 dic. 2010 par ConectaDEL
Primera reunion consejo conectaDEL 10 dic. 2010 Primera reunion consejo conectaDEL 10 dic. 2010
Primera reunion consejo conectaDEL 10 dic. 2010
ConectaDEL168 vues
Presentacion 1 par Max LV
Presentacion 1Presentacion 1
Presentacion 1
Max LV331 vues
Primera reunion seminario par ultrapegaso
Primera reunion seminarioPrimera reunion seminario
Primera reunion seminario
ultrapegaso213 vues
Lazarillo par alex949
LazarilloLazarillo
Lazarillo
alex949181 vues

Similaire à Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ... par
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...TIB Hannover
4.9K vues1 diapositive
DSpace as publication platform par
DSpace as publication platformDSpace as publication platform
DSpace as publication platformredsys
550 vues24 diapositives
Anforderungen an Thesauri im Semantic Web par
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebJoachim Neubert
2K vues56 diapositives
Entscheidungsunterstützung im Semantic Web par
Entscheidungsunterstützung im Semantic WebEntscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic WebWirtschaftsinformatik an der TU Chemnitz
798 vues40 diapositives
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken par
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
680 vues31 diapositives

Similaire à Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices(20)

Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ... par TIB Hannover
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
TIB Hannover4.9K vues
DSpace as publication platform par redsys
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
redsys550 vues
Anforderungen an Thesauri im Semantic Web par Joachim Neubert
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
Joachim Neubert2K vues
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken par LydiaU
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
LydiaU680 vues
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken par Björn Muschall
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
Björn Muschall1.1K vues
Einführung in die Literaturverwaltung par TIB Hannover
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die Literaturverwaltung
TIB Hannover2.2K vues
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie... par Thomas Koch
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Thomas Koch1.8K vues
Wissensrepräsentation im Social Semantic Web par Katrin Weller
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
Katrin Weller277 vues
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi... par GESIS
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
GESIS560 vues
schema.org und Bibliotheken par Adrian Pohl
schema.org und Bibliothekenschema.org und Bibliotheken
schema.org und Bibliotheken
Adrian Pohl953 vues
Anforderungen an die Wissensrepräsentation im Social Semantic Web par Katrin Weller
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Katrin Weller1.1K vues
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional... par K15t
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
K15t3.3K vues
Anforderungen An Metadaten Ein Ausblick par guest32606b
Anforderungen An Metadaten Ein AusblickAnforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein Ausblick
guest32606b275 vues
2013-10-10 Semantic Web und (Linked) Open Data par kostaedt
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
kostaedt1K vues
Herausforderungen im Datenmanagement von Metadaten par ETH-Bibliothek
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
ETH-Bibliothek507 vues

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

  • 1. Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Webservices mit Semantic Web- Technologie Dr. Timo Borst IT-Entwicklung Deutsche Zentralbibliothek für Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft Kiel/Hamburg I-KNOW Praxisforum 1.-3. September 2010 in Graz Die ZBW ist Mitglied der Leibniz-Gemeinschaft
  • 2. Übersicht 1. Ausgangslage: Verteiltes Datenmanagement in Bibliotheksanswendungen 2. Bisherige Ansätze zur Aggregierung und Homogenisierung 3. Integration und Aggregation von Normdaten auf der Basis von Semantic Web-Technologien a) Grundidee b) Anwendungsfall_1: Verschlagwortung c) Anwendungsfall_2: Suche d) Anwendungsfall_3: Erfassung von Autoren 4. “Leichtgewichtige” Integration in bestehende Systeme 5. Zusammenfassung und Fazit Seite 2
  • 3. Ausgangslage • Klassische Bibliotheksanwendungen erzeugen und verwalten jeweils idiosynkratische (Meta-)Datenbestände (“Datensilos”)… • …die dann im Web über jeweils eigene Frontends verfügbar gemacht werden • Wie können hinsichtlich • Formate • Schemata • Vokabulare zur Erschließung • Erschließungsregeln • Vollständigkeit (Abstract ja/nein) • Herkunft prinzipiell heterogene Metadaten zueinander in Beziehung gesetzt werden? Seite 3
  • 4. Ausgangslage Beispiel Repositorien und ihre Vernetzung • Repositorien sind allgemein genutzte Erfassungs-/Retrieval- /Verbreitungssysteme („Data Provider“), zumeist OSS und Community- getrieben • Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren • Vernetzungsinitiativen, z.B. OA-Netzwerk • „OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI- zertifizierten Repositorien bereit […] u.a. vorgesehen: Aggregation, Harmonisierung und Ähnlichkeitsanalyse“ http://www.dini.de/fileadmin/workshops/oa-statistik-was-zaehlt/02_gerlach- oas.pdf • Einschlägige OSS-Repositoriensoftware (DSpace, EPrints, OPUS) unterstützt derzeit noch nicht die Integration extern kontrollierter Normdaten Seite 4
  • 5. Ausgangslage „The major difficulty we have found is with DSpace’s handling of metadata. While we feel that the number of fields in Dublin Core is adequate for most if not all uses (DCMI Usage Board 2006), we are troubled by the lack of authority control when completing its fields. Without some control over uniform titles, authors and subjects accessing the items in the future will very problematic.“ S. Chabot (http://subjectobject.net/2006/11/09/the-dspace-digital- repository-a-project-analysis/) „Neither the standards nor the software unterlying institutional repositories anticipated performing naming authority control on widely disparate metadata from highly unreliable sources.“ D. Salo (http://minds.wisconsin.edu/handle/1793/31735) Seite 5
  • 6. Ausgangslage Typische Mängel • Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber, Dokumenttypen etc.) werden ohne semantische und syntaktische Anleitungen und Restriktionen teilweise im Freitext erfasst • (Syntaktische) Suchen liefern nur eingeschränkte oder uneindeutige Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse (Trunkierung etc.) (Suche nach „Abbott, Philip“ liefert nur Treffer für Nr. 2/3) • Namensänderungen sind praktisch nicht nachvollziehbar • Selbst wenn syntaktische und semantische Eindeutigkeit in einem Repository lokal erzielt werden können, erneuert und verschärft sich das Problem auf Seiten der Aggregatoren Seite 6
  • 7. Bisherige Ansätze zur Aggregierung & Homogenisierung Seite 7 http://www.economistsonline.org/publications?page=3&q=thys-clement&lang=de
  • 8. Bisherige Ansätze zur Aggregierung & Homogenisierung Seite 8
  • 9. Bisherige Lösungsansätze zur Aggregierung & Homogenisierung Homogenisierung im Vorhinein • Festlegung eines relativ granularen Metadatenschemas • Möglichst verbindliches und explizites Regelwerk, das auch von allen Beteiligten konsequent befolgt wird • Verwendung einheitlicher Namen + Vokabulare • Lokale Anpassungen • Zentrales Harvesting bei minimierter Datenaufbereitung Homogenisierung im Nachhinein • Beibehaltung der lokalen Ausprägungen bei kleinstem gemeinsamen Nenner (etwa “Dublin Core”-Elemente) • Nachträgliche Maßnahmen zur Homogenisierung, u.a. “Name Disambiguation” • Zentrales Harvesting bei aufwändiger Datenaufbereitung Beide Ansätze sind nicht optimal! Seite 9
  • 10. Integration und Aggregation von Normdaten - Grundidee Seite 10
  • 11. Integration und Aggregation von Normdaten - Idee Beispieldaten und -anfragen (zu Personen und Themen): http://zbw.eu/beta/stw-ws/suggest?query=finanzkr …liefert alle Terme, die mit “finanzkr” beginnen http://zbw.eu/beta/stw-ws/stw-ws-wrapper.php?service=labels& concept=http://zbw.eu/stw/descriptor/19664-4&lang=en …liefert alle englischen Synonyme zu “Finanzkrise: Seite 11
  • 12. Anwendungsfall_1: Verschlagwortung mit Normdaten • DER Anwendungsfall für Bibliothekarinnen und Bibliothekare • Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?) • Vorgang: Eingabe von beschreibenden Metadaten, die häufig aus einem kontrollierten Vokabular stammen • Crosskonkordanzen herstellen zwischen verschiedenen kontrollierten Vokabularen • Bestandteil von Open Access relevanten Vorgängen wie das „self-publishing“, das „self-archiving“ oder das „social tagging“ • Zielstellung: Den Vorgang der Verschlagwortung mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so dass man einerseits zu „besseren“ im Sinne von normierten Metadaten kommt, die andererseits aber auch Flexibilität im Rahmen eines KOS erlauben („Lokalisierung“): • Alternative Schreibweisen bei Namen • Synonyme sowie Ober-/Unterbegriffe bei Schlagworten Seite 12
  • 15. Anwendungsfall_2: Suche • Der häufigste Anwendungsfall in Bibliotheksanwendungen • Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen + BibliotheksnutzerInnen • Vorgang: Zumeist einfache Volltextsuche über Metadatenfelder (Titel/Abstract) und/oder Volltexte (soweit letztere verfügbar sind und im Suchmaschinenindex liegen) • Zielstellung: Den Vorgang der Suche mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so so dass man zu besseren Suchergebnissen gelangt (Erhöhung von Recall + Precision) Seite 15
  • 16. Anwendungsfall_2: Suche Erweiterte Suche unter http://econstor.eu nach „Finanzkrise“ Seite 16
  • 19. “Leichtgewichtige” Integration in bestehende Systeme Seite 19
  • 20. “Leichtgewichtige” Integration in bestehende Systeme Vorteile • „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme • Strategie des „minimalen Eingriffs“ • Keine Änderungen am Systemkern, minimale Änderungen am Datenmodell nötig (Erweiterung um eine Spalte für den Authority-Key) • Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise zwanglos erweitern ließen: • Repositorien (zumeist OSS, Plugin-Architektur) • Kataloge (zumeist proprietäre SW und monolithisch) • Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) -> WebService zur Verbesserung des Retrievals und zur Erzeugung von Mash- Ups • …sowie alle offenen Systeme mit kollaborativ-verteilter Verschlagwortung (z.B. Academic Linkshare) Seite 20
  • 21. Zusammenfassung und Fazit • Bibliotheksanwendungen erzeugen und verwalten jeweils eigene idiosynkratische Datenbestände. • Dies erschwert die Pflege, den Austausch, die Aggregation und die Homogenisierung der (Meta-)Daten für erweiterte Dienste. • Vorgelagerte Webservices als Teil einer übergreifenden Normdaten- Infrastruktur können frühzeitig zur Homogenisierung der Metadaten beitragen (bei gleichzeitiger Lokalisierung). • Wenn diese Webservices verbreitet entstehen und genutzt werden, besteht die Chance zu einer weitergehenden Vernetzung lokal gepflegter Metadaten bei gleichzeitiger Verbesserung der datenbasierten Services. • Die Möglichkeit zur „leichtgewichtigen Integration“ ist ein Angebot an Betreiber von Bibliotheksanwendungen, diese Webservices mit möglichst minimalem Aufwand in ihre Anwendungen zu integrieren. Seite 21
  • 22. Vielen Dank! Dr. Timo Borst Deutsche Zentralbibliothek für Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft (ZBW) t.borst@zbw.eu Seite 22
  • 23. Anwendungsfall_3: Erfassung von Autoren •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher der Ausnahmefall •Nutzergruppen: BibliothekarInnen + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?) •Vorgang: Eingabe von AutorInnen-Namen •Zielstellung: Den Vorgang der Autorenerfassung mit Hilfe von Normdaten zu verbessern, die durch Webservices bereit gestellt werden Seite 23
  • 24. Anwendungsfall_3: Erfassung von Autoren •Erfassungsmaske unter http://87.106.250.18/beta/econstor/ Seite 24
  • 25. Bisherige Lösungsansätze zur Aggregierung & Homogenisierung •Metadatensuche durch Aggregatoren • Parallele Abfrage entfernt-verteilter Systeme • Rückgabe und Aufbereitung des Suchergebnisses als zusammengesetzte Trefferliste •Harvesting • Regelmäßiges Einsammeln von entfernt-verteilten Metadaten • Homogenisierung ex ante oder ex post •Föderierte Suche •… Seite 25
  • 26. •[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_Values Literatur •[2] http://minds.wisconsin.edu/handle/1793/31735 •[3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3 •[4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/ •[5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn •[6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma-199/PDF/subirats.pdf •[7] http://www.jisc.ac.uk/media/documents/programmes/sharedservices/na mes-phase-one-final-report,.pdf •[8] http://idea.library.drexel.edu/bitstream/1860/3173/1/20070051011.pdf •[9] http://ptsefton.com/blog/2006/06/06/the_affiliation_issue_in _institutional_repository_software/ •[10] http://library.ust.hk/info/nac/nac-technical.html •[11] http://www.seco.tkk.fi/publications/2009/kurki-hyvonen-onki-people-2009.pdf •[12] http://journals.sfu.ca/archivar/index.php/archivaria/article/download/11883/12836 •[13] http://www.dini.de/fileadmin/workshops/oa-netzwerk- juni2009/vernetzungstage_2009_malitz.pdf Seite 26