SlideShare une entreprise Scribd logo
1  sur  60
Télécharger pour lire hors ligne
Resource Discovery:
Sacherschließung am Ende?

       Prof. Magnus Pfeffer
  Hochschule der Medien, Stuttgart
   pfeffer@hdm-stuttgart.de
Überblick
   Vom Katalog zum Resource Discovery System
   Umsetzung durch kommerzielle Anbieter
   Herausforderungen und Probleme in der Suche
   Chancen für die Bibliotheken
   Ausblick




 12. April 2013       Fortbildung VdB, Braunschweig   2
Vom Katalog zum
                 Resource Discovery System




12. April 2013         Fortbildung VdB, Braunschweig   3
Kataloge
    Boolesche Suche
          Differenzierte Indexe
          Erweiterte Suche als Standard

    Langsame Suche
          Hardware/Software begrenzen die
           Suchgeschwindigkeit

    Begrenzte Datenmenge
          Für jeden Bestand eine eigene Datenbank


    12. April 2013          Fortbildung VdB, Braunschweig   4
Generation Google
    Einfache Suche
          Undifferenzierter „Google-Schlitz“
          Erweiterte Suchmöglichkeiten verborgen

    Schnelle Ergebnisse
          Suchgeschwindigkeit nur durch Bandbreite begrenzt

    Allumfassend
          Wenn Google es nicht findet, existiert es nicht




    12. April 2013          Fortbildung VdB, Braunschweig      5
Wissenschaftliche Suchmaschinen




 12. April 2013   Fortbildung VdB, Braunschweig   6
Resource Discovery
    Fokus für neue Entwicklungen
          Suchmaschinentechnologie
          Modernes und einheitliches User Interface
          Nutzung durch mobile Endgeräte

    Kein neuer Katalog
          Gleichberechtigter, einheitlicher Zugang zu allen
           Beständen der Bibliothek
          Volltext-Indexierung
          Web-Scale Discovery

                                                            Nach Breeding (2010)

    12. April 2013          Fortbildung VdB, Braunschweig                    7
Umsetzung durch kommerzielle Anbieter




12. April 2013         Fortbildung VdB, Braunschweig   8
Produkte
    Summon (Serial Solutions/Proquest)
          http://www.serialssolutions.com/en/services/summon
    Primo mit Primo Central (Ex Libris)
          http://www.exlibrisgroup.com/de/category/PrimoUeberblick
    EBSCO Discovery Service
          http://www.ebscohost.com/discovery/




                                                            Vgl. Jansen et. al. (2010)

    12. April 2013          Fortbildung VdB, Braunschweig                          9
Komponenten
    Suchoberfläche
          Rechercheportal im modernen Look
          Facettiertes Browsen der Ergebnisse
          Integration von Link Resolvern (Volltextzugang)
          Anbindung an Bibliothekssystem




    12. April 2013          Fortbildung VdB, Braunschweig    10
Oberfläche mit facettierter Suche
                                                                 Erweiterung des Suchraums
            Eingabemaske mit Stichwortsuche



          Trefferliste




                                                   Facetten zur
                                                  Einschränkung
                                                 der Treffermenge




 12. April 2013                  Fortbildung VdB, Braunschweig                         11
Kontointegration und Link Resolver




 12. April 2013   Fortbildung VdB, Braunschweig   12
Komponenten
    Zentraler Index
          Beim Anbieter gehostet
          Bibliografische Daten für alle Kunden
          Kunden können Ausschnitte wählen


    Lokaler Index
          Eigene bibliografische Daten




    12. April 2013          Fortbildung VdB, Braunschweig   13
Eigenschaften der Indexe
    „Megaindex“
          Mehrere 100 Millionen Datensätze
          Nicht nur Metadaten, oft auch Volltexte indexiert
          Hauptverkaufsargument der Anbieter

    Hetrogene Herkunft
          Verlage und Datenbankproduzenten
          Bibliothekskataloge
          Frei verfügbares Open Access Material



    12. April 2013          Fortbildung VdB, Braunschweig      14
Eigenschaften der Indexe
    Heterogene Inhalte
          Zeitschriften-/ Konferenzbeiträge
          Print- und E-Books
          Zeitungsartikel, Rezensionen, Working Papers, …


     Aber: sehr wenig deutsche/deutschsprachige Inhalte




    12. April 2013          Fortbildung VdB, Braunschweig    15
Unterschiede der Implementierung
    Installation
          Lokal auf eigenem Server
          Gehostet beim Anbieter: Software-as-a-service


    Komponenten
          Oberfläche + Index vom Anbieter
          Zentraler Index als Datenquelle für eigene Oberfläche




    12. April 2013          Fortbildung VdB, Braunschweig     16
Unterschiede der Implementierung
    Selektion des Suchraums
          Standardsuchraum
          Reduktion auf „klassischen“ Katalogbestand
          Erweiterung auf das „web scale discovery“


    Navigation
          Anordnung und Inhalte der Facetten
          Drill-down nach formalen und inhaltlichen Aspekten




    12. April 2013         Fortbildung VdB, Braunschweig        17
KonSearch


                                                 RDS der UB Konstanz
                                              Summon Oberfläche und Index
                                                 Beim Anbieter gehostet




 12. April 2013   Fortbildung VdB, Braunschweig                         18
Wissensportal Primo



                                                      RDS der TU Berlin
                                                  Primo Oberfläche und Index
                                                     Beim KOBV gehostet




 12. April 2013   Fortbildung VdB, Braunschweig                           19
HEIDI


                                                  RDS der UB Heidelberg
                                             Eigene Oberfläche + Summon Index
                                                     Lokale Installation




 12. April 2013   Fortbildung VdB, Braunschweig                         20
SULB Wissensportal



                                      RDS der Saarländischen Universitäts-
                                             und Landesbibliothek
                                  Ebsco Discovery Service Oberfläche und Index
                                            Beim Anbieter gehostet




 12. April 2013   Fortbildung VdB, Braunschweig                         21
Katalog Plus



                                                RDS der UB Freiburg
                                               Ebsco Discovery Service
                                        Eigene Oberfläche + Index vom Anbieter




 12. April 2013   Fortbildung VdB, Braunschweig                          22
Zusammenfassung RDS
    Einfache Suche
          Einheitlicher Zugang
          Modernes Interface
    Schnelle Ergebnisse
          Suchmaschinentechnologie
    Umfassend
          Zugang zu allen Beständen der Bibliothek
          Erweiterter Suchraum durch zentralen Index


     → Erwartungen werden erfüllt

    12. April 2013         Fortbildung VdB, Braunschweig   23
Herausforderungen und Probleme




12. April 2013           Fortbildung VdB, Braunschweig   24
Normierung
    Heterogene Quellen → Heterogene Inhalte
          Elemente der Titelaufnahmen
          Ansetzung von Personennamen
          Inhaltliche Erschließung


    Beobachtung
          Häufige Dubletten
                Titel
                Erschließungselemente
          Verweisungsformen sind nicht suchbar


    12. April 2013              Fortbildung VdB, Braunschweig   25
Heterogene Erschließung
    Suche nach „Linked Open Data“

    Schlagwortfacette
          EDS, UB Freiburg: 100(!) Einträge
          Darunter für das Konzept „Linked Open Data“
                Linked Data
                Linked Data (Ld)
                Linked Data (Semantic Web)
                Linked Open Data
                Linked Open Data (Lod)




    12. April 2013              Fortbildung VdB, Braunschweig   26
Ansetzung und Verweise




 12. April 2013   Fortbildung VdB, Braunschweig   27
Dubletten




 12. April 2013   Fortbildung VdB, Braunschweig   28
Nachvollziehbarkeit
    Inhalte der zentralen Indexe sind nicht dokumentiert
          Anbieter sehen den zentralen Index als Möglichkeit,
           sich von den Wettbewerbern abzugrenzen
          Oft nur allgemeine Angaben
                Verlage
                Fachgesellschaften
                Selten: Zeitschriften
          Keine Aussagen zum Umfang bestimmter Inhalte


    Inhalte des zentralen Index sind nicht stabil
          Entfernung von Inhalten aufgrund ausgelaufener
           Lizenzen
    12. April 2013                Fortbildung VdB, Braunschweig   29
Nachvollziehbarkeit
    Indexing und Retrieval ist nicht dokumentiert
          Indexbasis
                Metadaten
                Abstracts
                Volltext

          Normalisierung und linguistische Bearbeitung
                Umlaute
                Grammatische Reduktion (z.b. Plural)
                Synonymerweiterung

          Ranking

    12. April 2013               Fortbildung VdB, Braunschweig   30
Indexing und Ranking
    Konsearch
          Suche nach „Linked open data libraries“
          Treffer 1 bis 3




    12. April 2013           Fortbildung VdB, Braunschweig   31
Treffermengen
    Undifferenzierte Suche als Standard
          Metadaten und Volltext indexiert
          Auch spezifische Anfragen liefern riesige Mengen


                                                            TU Berlin
                                                                        UB Freiburg




    12. April 2013          Fortbildung VdB, Braunschweig                     32
Chancen




12. April 2013   Fortbildung VdB, Braunschweig   33
Traditionalle Stärken...
    Einheitliche Erschließung
          Formal
          Inhaltlich


    Strenge Normierung
          Gemeinsame Normdatei
          Zeitschriftendatenbank


    Relevanz der Inhalte
          Aktive Auswahl

    12. April 2013          Fortbildung VdB, Braunschweig   34
… für besseres Suchen und Finden
    Zusammenbringen und Differenzieren
          Alles zu einem bestimmten Thema finden
          Alles von einem Autor finden
          Klare Trennung von inhaltlich verschiedenem


    Nutzer nicht mit großen Treffermengen alleine lassen
          Sinnvolle Facettierung der Ergebnisse
          Nicht nur formal, sondern auch inhaltlich




    12. April 2013          Fortbildung VdB, Braunschweig   35
Transparenz
    Inhalte
          Was kann recherchiert werden? Was nicht?
          Und warum nicht?


    Suchprozess
          Wie wird indexiert?
          Welche Normalisierungen wurden verwendet?
          Wurde die Suche verändert?




    12. April 2013          Fortbildung VdB, Braunschweig   36
Fragestellung




                                                  Wiesenmüller (2012)
 12. April 2013   Fortbildung VdB, Braunschweig                 37
Ja!




                                                  Bild: Wikipedia / Public Domain
 12. April 2013   Fortbildung VdB, Braunschweig                             38
Systemaufbau



                  Präsentation
                                                    Oberfläche


                                                    Such- und
                     Logik                           Kontoverwaltung


                  Datenbank
                                                    Index




 12. April 2013                  Fortbildung VdB, Braunschweig         39
Präsentation
    Manipulation der Anzeige
          Anbieten von externen Informationen
          Anbieten von alternativen Sucheinstiegen


    Manipulation der Sucheingabe
          Erkennen von Personen
                Sucherweiterung um alternative Schreibweisen
          Erkennen von Konzepten
                Sucherweiterung um Synonyme
                Anbieten von Disambiguierung
                Anbieten von Ober- und Unterbegriffen für die Suche

    12. April 2013               Fortbildung VdB, Braunschweig         40
Mock-Up
                                              Name erkannt.

                                 Bekannte alternative Schreibeweisen:
                                              Gorbačëv
                                             Ghurbatshuf
                                           Gkormpatsoph
                                              Gorbačëv
                                              Gorbačev
 Gorbatschow                                  Gorbacëv
                                              Gorbachev
                                              Gorbachov
                                              Gorbaciov
                                              Gorbač'ov
                                              Gorbacsov
                                             Gorbaczow
                                             Gorbatchev
                                              Gorbatsjov
                                              Gorbats'ov
                                              Gorbatxov
                                              Горбачев

                                     Suche automatisch ergänzen?


 12. April 2013   Fortbildung VdB, Braunschweig                         41
Mock-Up




 Krebs

                    Meinen Sie:
                  Krebs <Medizin>
                  Krebs <Sterbild>




 12. April 2013   Fortbildung VdB, Braunschweig   42
Mock-Up




                                                      Mehr Infomationen

                                                       ●    GND Eintrag
                                                           ● Wikipedia

                                                             ● Lexika




                                                        Neue Suchen

                                                  ●Vom gleichen Autor
                                                  ● Über diesen Autor




 12. April 2013   Fortbildung VdB, Braunschweig                           43
Datenbankschicht
    Ziel: Homogenisierung der Daten
          Anpassen von Datenelementen
          Anreichern der Daten
          Anpassen der Indexierung
    Aber: Zentraler Index im „Besitz“ der Anbieter


     → Zugang zu den Daten existentiell




    12. April 2013         Fortbildung VdB, Braunschweig   44
Auswerten der Erschließung
    Inhaltiche Erschließung vielfach vorhanden
          Erschließungssysteme heterogen


    Ansatz: Abgleich zwischen Erschließungssystemen
          Manuell erstellte Konkordanzen
          Automatisch generierte Mappings




    12. April 2013         Fortbildung VdB, Braunschweig   45
Auswertung der Hierarchie
    Erschließung auf unterschiedlichen Ebenen
          Verlag / Reihe
          Zeitschrift / Sammelband
          Aufsatz


    Ansatz: Akkumulieren und Verteilen
          „von unten nach oben“
          „von oben nach unten“




    12. April 2013          Fortbildung VdB, Braunschweig   46
Auswertung der Redundanz
    „Echte“ Dubletten
    Sehr ähnliche Einträge
          Ausgaben
                Print, Elektronisch, Paperback, International
          Auflagen und Versionen
                Working Paper, Pre- / Postprint
          Übersetzungen


    Ansatz: Übertragung von inhaltlicher und formaler
     Erschließung aus Dubletten und anderen Ausgaben


    12. April 2013                Fortbildung VdB, Braunschweig   47
Forschungsprojekt
    Clustering von Katalogdaten zur Übertragung von
     Erschließungsinformationen
    Daten
         SWB
               Katalog des Südwestdeutschen Bibliotheksverbundes
         Hebis
               Katalog des Hessischen Bibliotheks- und Informationssystems
         HBZ
               Katalog des Hochschulbibliothekszentrum des Landes Nordrhein-
                Westfalen
         B3Kat
               Gemeinsamer Verbundkatalog von Bibliotheksverbund Bayern und
                dem Kooperativen Bibliotheksverbund Berlin-Brandenburg

    12. April 2013               Fortbildung VdB, Braunschweig                48
Ergebnisse

     Katalog Monografien     Anteil        Anteil              Zuwachs      Zuwachs
                             RVK           RSWK                RVK          RSWK

     SWB          13.330.743 4.217.226        4.083.113          581.780       957.275


     Hebis         8.844.188 1.933.081       2.237.659          1.097.992    1.308.581


     HBZ          13.271.840 1.018.298       3.322.100          2.272.558    1.080.162


     B3Kat        22.685.738 5.750.295       6.055.164          2.969.381    2.765.967




 12. April 2013                Fortbildung VdB, Braunschweig                             49
Ausblick




12. April 2013   Fortbildung VdB, Braunschweig   50
(Linked) Open Data
    Bereitstellung in offenen Formaten
    Bereitstellung unter freien Lizenzen


    Verfügbarkeit großer bibliografischer
     Datensammlungen
          Nationalbibliografien
          Kataloge von Bibliotheken und /-verbünden
          Fachbibliografien
          Open-Access Repositorien
          Verlagsdaten
          Normdaten
    12. April 2013             Fortbildung VdB, Braunschweig   51
Gemeinsame Infrastruktur
    Culturegraph.org
          Initiative von DNB und HBZ
          Ziel: Zusammenführen von bibliografischen
           Informationen, die als Linked Open Data zur Verfügung
           stehen
          Open Source Infrastruktur
               Parametrisierbare Metadatenverarbeitung
               Erweiterbar (Java)
               Skalierbar (Hadoop)


     → Ideale Ausgangsbasis zur Verarbeitung großer
     Datenmengen

    12. April 2013              Fortbildung VdB, Braunschweig   52
Freie Softwarelösung
    vufind
          Gemeinsame Entwicklung von Bibliotheken
          Leistungsfähige Softwarebasis
          Großer Anwenderkreis




    12. April 2013         Fortbildung VdB, Braunschweig   53
vufind Sucheinstieg




 12. April 2013   Fortbildung VdB, Braunschweig   54
vufind Layout




 12. April 2013   Fortbildung VdB, Braunschweig   55
Berufsfeld
    Metadatenmanagement als eine zentrale Aufgabe
          Damit auch künftiger Ausbildungsschwerpunkt

    Ziel: Zusammenführen von Metadaten in eigenem
     Index
          Homogenisierung der Daten
               Formal
               Inhaltlich
          Anreicherung mit externen Quellen
               Empfehlungen
               Verknüpfungen
               Zusatzinformationen

    12. April 2013              Fortbildung VdB, Braunschweig   56
Die Konkurrenz schläft nicht




                  Google analysiert die Nutzereingaben

                            Erkannt werden:
                               Personen
                              Kunstwerke
                                Bücher
                                 Filme
                            Computerspiele
                                  ….
                       (auch abstrakte Konzepte)

                  Angezeigt werden Kurzinformationen
                     und sinnvolle Verknüpfungen
                         zu anderen Entitäten


 12. April 2013                    Fortbildung VdB, Braunschweig   57
Danke für Ihre Aufmerksamkeit!



                                    Folien online unter
                         http://www.slideshare.net/MagnusPfeffer/



                                         Dieses Werk bzw. Inhalt steht unter einer
                 Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.




12. April 2013                               Fortbildung VdB, Braunschweig                                     58
Links
    Wissensportal Primo
         http://portal.ub.tu-berlin.de/
    HEIDI
         http://heidi.ub.uni-heidelberg.de/
    KonSearch
         http://konstanz.summon.serialssolutions.com/
    Katalog Plus
         http://www.ub.uni-freiburg.de/index.php?id=opac&no_cache=1
    SLUB Wissensportal
         http://www.sulb.uni-saarland.de/?id=115
    Culturegraph Infrastruktur
         http://sourceforge.net/projects/culturegraph/
    12. April 2013              Fortbildung VdB, Braunschweig      59
Quellen
    Marshall Breeding: The State of the Art in Library Discovery 2010, in:
     Computers in Libraries, 30 (1), 2010, S. 31
    Heiko Jansen, Kirstin Kemner-Heek, Roswitha Schweitzer:
     Konkurrenzanalyse ausgewählter kommerzieller Suchindizes, Online-
     Veröffentlichung, 2010
    Magnus Pfeffer: Using clustering across union catalogues to enrich entries
     with indexing information, in: Data Analysis, Machine Learning and
     Knowledge Discovery – Proceedings of the 36th Annual Conference of the
     German Classification Society, Springer, Heidelberg/Berlin, 2012 (noch
     nicht erschienen)
    Heidrun Wiesenmüller: Resource Discovery Systeme, Vortrag auf der 36.
     Jahrestagung der Gesellschaft für Klassifikation, 2012




    12. April 2013            Fortbildung VdB, Braunschweig                   60

Contenu connexe

Similaire à Resource Discovery - Sacherschließung am Ende?

Similaire à Resource Discovery - Sacherschließung am Ende? (9)

Automatisches Generieren von Konkordanzen
Automatisches Generieren von KonkordanzenAutomatisches Generieren von Konkordanzen
Automatisches Generieren von Konkordanzen
 
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
 
Bibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedBibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data Extended
 
Dynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open DataDynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open Data
 
Entwurf eines Wissensgraphen für die kollaborative Arbeit in Forschungsgruppe...
Entwurf eines Wissensgraphen für die kollaborative Arbeit in Forschungsgruppe...Entwurf eines Wissensgraphen für die kollaborative Arbeit in Forschungsgruppe...
Entwurf eines Wissensgraphen für die kollaborative Arbeit in Forschungsgruppe...
 
BIBFRAME und Sacherschließung
BIBFRAME und SacherschließungBIBFRAME und Sacherschließung
BIBFRAME und Sacherschließung
 
Linked Open Projects
Linked Open ProjectsLinked Open Projects
Linked Open Projects
 
BDIC Drupal-Modul
BDIC Drupal-ModulBDIC Drupal-Modul
BDIC Drupal-Modul
 
GfKl-Tagung 2012 LIS Wiesenmueller RDS
GfKl-Tagung 2012 LIS Wiesenmueller RDSGfKl-Tagung 2012 LIS Wiesenmueller RDS
GfKl-Tagung 2012 LIS Wiesenmueller RDS
 

Plus de Magnus Pfeffer

Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Magnus Pfeffer
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...
Magnus Pfeffer
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Magnus Pfeffer
 

Plus de Magnus Pfeffer (11)

Linked Data in der Lehre
Linked Data in der LehreLinked Data in der Lehre
Linked Data in der Lehre
 
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...
 
Automatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsAutomatic creation of mappings between classification systems
Automatic creation of mappings between classification systems
 
Bibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedBibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data Reduced
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
 
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
 

Resource Discovery - Sacherschließung am Ende?

  • 1. Resource Discovery: Sacherschließung am Ende? Prof. Magnus Pfeffer Hochschule der Medien, Stuttgart pfeffer@hdm-stuttgart.de
  • 2. Überblick  Vom Katalog zum Resource Discovery System  Umsetzung durch kommerzielle Anbieter  Herausforderungen und Probleme in der Suche  Chancen für die Bibliotheken  Ausblick 12. April 2013 Fortbildung VdB, Braunschweig 2
  • 3. Vom Katalog zum Resource Discovery System 12. April 2013 Fortbildung VdB, Braunschweig 3
  • 4. Kataloge  Boolesche Suche  Differenzierte Indexe  Erweiterte Suche als Standard  Langsame Suche  Hardware/Software begrenzen die Suchgeschwindigkeit  Begrenzte Datenmenge  Für jeden Bestand eine eigene Datenbank 12. April 2013 Fortbildung VdB, Braunschweig 4
  • 5. Generation Google  Einfache Suche  Undifferenzierter „Google-Schlitz“  Erweiterte Suchmöglichkeiten verborgen  Schnelle Ergebnisse  Suchgeschwindigkeit nur durch Bandbreite begrenzt  Allumfassend  Wenn Google es nicht findet, existiert es nicht 12. April 2013 Fortbildung VdB, Braunschweig 5
  • 6. Wissenschaftliche Suchmaschinen 12. April 2013 Fortbildung VdB, Braunschweig 6
  • 7. Resource Discovery  Fokus für neue Entwicklungen  Suchmaschinentechnologie  Modernes und einheitliches User Interface  Nutzung durch mobile Endgeräte  Kein neuer Katalog  Gleichberechtigter, einheitlicher Zugang zu allen Beständen der Bibliothek  Volltext-Indexierung  Web-Scale Discovery Nach Breeding (2010) 12. April 2013 Fortbildung VdB, Braunschweig 7
  • 8. Umsetzung durch kommerzielle Anbieter 12. April 2013 Fortbildung VdB, Braunschweig 8
  • 9. Produkte  Summon (Serial Solutions/Proquest)  http://www.serialssolutions.com/en/services/summon  Primo mit Primo Central (Ex Libris)  http://www.exlibrisgroup.com/de/category/PrimoUeberblick  EBSCO Discovery Service  http://www.ebscohost.com/discovery/ Vgl. Jansen et. al. (2010) 12. April 2013 Fortbildung VdB, Braunschweig 9
  • 10. Komponenten  Suchoberfläche  Rechercheportal im modernen Look  Facettiertes Browsen der Ergebnisse  Integration von Link Resolvern (Volltextzugang)  Anbindung an Bibliothekssystem 12. April 2013 Fortbildung VdB, Braunschweig 10
  • 11. Oberfläche mit facettierter Suche Erweiterung des Suchraums Eingabemaske mit Stichwortsuche Trefferliste Facetten zur Einschränkung der Treffermenge 12. April 2013 Fortbildung VdB, Braunschweig 11
  • 12. Kontointegration und Link Resolver 12. April 2013 Fortbildung VdB, Braunschweig 12
  • 13. Komponenten  Zentraler Index  Beim Anbieter gehostet  Bibliografische Daten für alle Kunden  Kunden können Ausschnitte wählen  Lokaler Index  Eigene bibliografische Daten 12. April 2013 Fortbildung VdB, Braunschweig 13
  • 14. Eigenschaften der Indexe  „Megaindex“  Mehrere 100 Millionen Datensätze  Nicht nur Metadaten, oft auch Volltexte indexiert  Hauptverkaufsargument der Anbieter  Hetrogene Herkunft  Verlage und Datenbankproduzenten  Bibliothekskataloge  Frei verfügbares Open Access Material 12. April 2013 Fortbildung VdB, Braunschweig 14
  • 15. Eigenschaften der Indexe  Heterogene Inhalte  Zeitschriften-/ Konferenzbeiträge  Print- und E-Books  Zeitungsartikel, Rezensionen, Working Papers, … Aber: sehr wenig deutsche/deutschsprachige Inhalte 12. April 2013 Fortbildung VdB, Braunschweig 15
  • 16. Unterschiede der Implementierung  Installation  Lokal auf eigenem Server  Gehostet beim Anbieter: Software-as-a-service  Komponenten  Oberfläche + Index vom Anbieter  Zentraler Index als Datenquelle für eigene Oberfläche 12. April 2013 Fortbildung VdB, Braunschweig 16
  • 17. Unterschiede der Implementierung  Selektion des Suchraums  Standardsuchraum  Reduktion auf „klassischen“ Katalogbestand  Erweiterung auf das „web scale discovery“  Navigation  Anordnung und Inhalte der Facetten  Drill-down nach formalen und inhaltlichen Aspekten 12. April 2013 Fortbildung VdB, Braunschweig 17
  • 18. KonSearch RDS der UB Konstanz Summon Oberfläche und Index Beim Anbieter gehostet 12. April 2013 Fortbildung VdB, Braunschweig 18
  • 19. Wissensportal Primo RDS der TU Berlin Primo Oberfläche und Index Beim KOBV gehostet 12. April 2013 Fortbildung VdB, Braunschweig 19
  • 20. HEIDI RDS der UB Heidelberg Eigene Oberfläche + Summon Index Lokale Installation 12. April 2013 Fortbildung VdB, Braunschweig 20
  • 21. SULB Wissensportal RDS der Saarländischen Universitäts- und Landesbibliothek Ebsco Discovery Service Oberfläche und Index Beim Anbieter gehostet 12. April 2013 Fortbildung VdB, Braunschweig 21
  • 22. Katalog Plus RDS der UB Freiburg Ebsco Discovery Service Eigene Oberfläche + Index vom Anbieter 12. April 2013 Fortbildung VdB, Braunschweig 22
  • 23. Zusammenfassung RDS  Einfache Suche  Einheitlicher Zugang  Modernes Interface  Schnelle Ergebnisse  Suchmaschinentechnologie  Umfassend  Zugang zu allen Beständen der Bibliothek  Erweiterter Suchraum durch zentralen Index → Erwartungen werden erfüllt 12. April 2013 Fortbildung VdB, Braunschweig 23
  • 24. Herausforderungen und Probleme 12. April 2013 Fortbildung VdB, Braunschweig 24
  • 25. Normierung  Heterogene Quellen → Heterogene Inhalte  Elemente der Titelaufnahmen  Ansetzung von Personennamen  Inhaltliche Erschließung  Beobachtung  Häufige Dubletten  Titel  Erschließungselemente  Verweisungsformen sind nicht suchbar 12. April 2013 Fortbildung VdB, Braunschweig 25
  • 26. Heterogene Erschließung  Suche nach „Linked Open Data“  Schlagwortfacette  EDS, UB Freiburg: 100(!) Einträge  Darunter für das Konzept „Linked Open Data“  Linked Data  Linked Data (Ld)  Linked Data (Semantic Web)  Linked Open Data  Linked Open Data (Lod) 12. April 2013 Fortbildung VdB, Braunschweig 26
  • 27. Ansetzung und Verweise 12. April 2013 Fortbildung VdB, Braunschweig 27
  • 28. Dubletten 12. April 2013 Fortbildung VdB, Braunschweig 28
  • 29. Nachvollziehbarkeit  Inhalte der zentralen Indexe sind nicht dokumentiert  Anbieter sehen den zentralen Index als Möglichkeit, sich von den Wettbewerbern abzugrenzen  Oft nur allgemeine Angaben  Verlage  Fachgesellschaften  Selten: Zeitschriften  Keine Aussagen zum Umfang bestimmter Inhalte  Inhalte des zentralen Index sind nicht stabil  Entfernung von Inhalten aufgrund ausgelaufener Lizenzen 12. April 2013 Fortbildung VdB, Braunschweig 29
  • 30. Nachvollziehbarkeit  Indexing und Retrieval ist nicht dokumentiert  Indexbasis  Metadaten  Abstracts  Volltext  Normalisierung und linguistische Bearbeitung  Umlaute  Grammatische Reduktion (z.b. Plural)  Synonymerweiterung  Ranking 12. April 2013 Fortbildung VdB, Braunschweig 30
  • 31. Indexing und Ranking  Konsearch  Suche nach „Linked open data libraries“  Treffer 1 bis 3 12. April 2013 Fortbildung VdB, Braunschweig 31
  • 32. Treffermengen  Undifferenzierte Suche als Standard  Metadaten und Volltext indexiert  Auch spezifische Anfragen liefern riesige Mengen TU Berlin UB Freiburg 12. April 2013 Fortbildung VdB, Braunschweig 32
  • 33. Chancen 12. April 2013 Fortbildung VdB, Braunschweig 33
  • 34. Traditionalle Stärken...  Einheitliche Erschließung  Formal  Inhaltlich  Strenge Normierung  Gemeinsame Normdatei  Zeitschriftendatenbank  Relevanz der Inhalte  Aktive Auswahl 12. April 2013 Fortbildung VdB, Braunschweig 34
  • 35. … für besseres Suchen und Finden  Zusammenbringen und Differenzieren  Alles zu einem bestimmten Thema finden  Alles von einem Autor finden  Klare Trennung von inhaltlich verschiedenem  Nutzer nicht mit großen Treffermengen alleine lassen  Sinnvolle Facettierung der Ergebnisse  Nicht nur formal, sondern auch inhaltlich 12. April 2013 Fortbildung VdB, Braunschweig 35
  • 36. Transparenz  Inhalte  Was kann recherchiert werden? Was nicht?  Und warum nicht?  Suchprozess  Wie wird indexiert?  Welche Normalisierungen wurden verwendet?  Wurde die Suche verändert? 12. April 2013 Fortbildung VdB, Braunschweig 36
  • 37. Fragestellung Wiesenmüller (2012) 12. April 2013 Fortbildung VdB, Braunschweig 37
  • 38. Ja! Bild: Wikipedia / Public Domain 12. April 2013 Fortbildung VdB, Braunschweig 38
  • 39. Systemaufbau Präsentation  Oberfläche  Such- und Logik Kontoverwaltung Datenbank  Index 12. April 2013 Fortbildung VdB, Braunschweig 39
  • 40. Präsentation  Manipulation der Anzeige  Anbieten von externen Informationen  Anbieten von alternativen Sucheinstiegen  Manipulation der Sucheingabe  Erkennen von Personen  Sucherweiterung um alternative Schreibweisen  Erkennen von Konzepten  Sucherweiterung um Synonyme  Anbieten von Disambiguierung  Anbieten von Ober- und Unterbegriffen für die Suche 12. April 2013 Fortbildung VdB, Braunschweig 40
  • 41. Mock-Up Name erkannt. Bekannte alternative Schreibeweisen: Gorbačëv Ghurbatshuf Gkormpatsoph Gorbačëv Gorbačev Gorbatschow Gorbacëv Gorbachev Gorbachov Gorbaciov Gorbač'ov Gorbacsov Gorbaczow Gorbatchev Gorbatsjov Gorbats'ov Gorbatxov Горбачев Suche automatisch ergänzen? 12. April 2013 Fortbildung VdB, Braunschweig 41
  • 42. Mock-Up Krebs Meinen Sie: Krebs <Medizin> Krebs <Sterbild> 12. April 2013 Fortbildung VdB, Braunschweig 42
  • 43. Mock-Up Mehr Infomationen ● GND Eintrag ● Wikipedia ● Lexika Neue Suchen ●Vom gleichen Autor ● Über diesen Autor 12. April 2013 Fortbildung VdB, Braunschweig 43
  • 44. Datenbankschicht  Ziel: Homogenisierung der Daten  Anpassen von Datenelementen  Anreichern der Daten  Anpassen der Indexierung  Aber: Zentraler Index im „Besitz“ der Anbieter → Zugang zu den Daten existentiell 12. April 2013 Fortbildung VdB, Braunschweig 44
  • 45. Auswerten der Erschließung  Inhaltiche Erschließung vielfach vorhanden  Erschließungssysteme heterogen  Ansatz: Abgleich zwischen Erschließungssystemen  Manuell erstellte Konkordanzen  Automatisch generierte Mappings 12. April 2013 Fortbildung VdB, Braunschweig 45
  • 46. Auswertung der Hierarchie  Erschließung auf unterschiedlichen Ebenen  Verlag / Reihe  Zeitschrift / Sammelband  Aufsatz  Ansatz: Akkumulieren und Verteilen  „von unten nach oben“  „von oben nach unten“ 12. April 2013 Fortbildung VdB, Braunschweig 46
  • 47. Auswertung der Redundanz  „Echte“ Dubletten  Sehr ähnliche Einträge  Ausgaben  Print, Elektronisch, Paperback, International  Auflagen und Versionen  Working Paper, Pre- / Postprint  Übersetzungen  Ansatz: Übertragung von inhaltlicher und formaler Erschließung aus Dubletten und anderen Ausgaben 12. April 2013 Fortbildung VdB, Braunschweig 47
  • 48. Forschungsprojekt  Clustering von Katalogdaten zur Übertragung von Erschließungsinformationen  Daten  SWB  Katalog des Südwestdeutschen Bibliotheksverbundes  Hebis  Katalog des Hessischen Bibliotheks- und Informationssystems  HBZ  Katalog des Hochschulbibliothekszentrum des Landes Nordrhein- Westfalen  B3Kat  Gemeinsamer Verbundkatalog von Bibliotheksverbund Bayern und dem Kooperativen Bibliotheksverbund Berlin-Brandenburg 12. April 2013 Fortbildung VdB, Braunschweig 48
  • 49. Ergebnisse Katalog Monografien Anteil Anteil Zuwachs Zuwachs RVK RSWK RVK RSWK SWB 13.330.743 4.217.226 4.083.113 581.780 957.275 Hebis 8.844.188 1.933.081 2.237.659 1.097.992 1.308.581 HBZ 13.271.840 1.018.298 3.322.100 2.272.558 1.080.162 B3Kat 22.685.738 5.750.295 6.055.164 2.969.381 2.765.967 12. April 2013 Fortbildung VdB, Braunschweig 49
  • 50. Ausblick 12. April 2013 Fortbildung VdB, Braunschweig 50
  • 51. (Linked) Open Data  Bereitstellung in offenen Formaten  Bereitstellung unter freien Lizenzen  Verfügbarkeit großer bibliografischer Datensammlungen  Nationalbibliografien  Kataloge von Bibliotheken und /-verbünden  Fachbibliografien  Open-Access Repositorien  Verlagsdaten  Normdaten 12. April 2013 Fortbildung VdB, Braunschweig 51
  • 52. Gemeinsame Infrastruktur  Culturegraph.org  Initiative von DNB und HBZ  Ziel: Zusammenführen von bibliografischen Informationen, die als Linked Open Data zur Verfügung stehen  Open Source Infrastruktur  Parametrisierbare Metadatenverarbeitung  Erweiterbar (Java)  Skalierbar (Hadoop) → Ideale Ausgangsbasis zur Verarbeitung großer Datenmengen 12. April 2013 Fortbildung VdB, Braunschweig 52
  • 53. Freie Softwarelösung  vufind  Gemeinsame Entwicklung von Bibliotheken  Leistungsfähige Softwarebasis  Großer Anwenderkreis 12. April 2013 Fortbildung VdB, Braunschweig 53
  • 54. vufind Sucheinstieg 12. April 2013 Fortbildung VdB, Braunschweig 54
  • 55. vufind Layout 12. April 2013 Fortbildung VdB, Braunschweig 55
  • 56. Berufsfeld  Metadatenmanagement als eine zentrale Aufgabe  Damit auch künftiger Ausbildungsschwerpunkt  Ziel: Zusammenführen von Metadaten in eigenem Index  Homogenisierung der Daten  Formal  Inhaltlich  Anreicherung mit externen Quellen  Empfehlungen  Verknüpfungen  Zusatzinformationen 12. April 2013 Fortbildung VdB, Braunschweig 56
  • 57. Die Konkurrenz schläft nicht Google analysiert die Nutzereingaben Erkannt werden: Personen Kunstwerke Bücher Filme Computerspiele …. (auch abstrakte Konzepte) Angezeigt werden Kurzinformationen und sinnvolle Verknüpfungen zu anderen Entitäten 12. April 2013 Fortbildung VdB, Braunschweig 57
  • 58. Danke für Ihre Aufmerksamkeit! Folien online unter http://www.slideshare.net/MagnusPfeffer/ Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz. 12. April 2013 Fortbildung VdB, Braunschweig 58
  • 59. Links  Wissensportal Primo  http://portal.ub.tu-berlin.de/  HEIDI  http://heidi.ub.uni-heidelberg.de/  KonSearch  http://konstanz.summon.serialssolutions.com/  Katalog Plus  http://www.ub.uni-freiburg.de/index.php?id=opac&no_cache=1  SLUB Wissensportal  http://www.sulb.uni-saarland.de/?id=115  Culturegraph Infrastruktur  http://sourceforge.net/projects/culturegraph/ 12. April 2013 Fortbildung VdB, Braunschweig 59
  • 60. Quellen  Marshall Breeding: The State of the Art in Library Discovery 2010, in: Computers in Libraries, 30 (1), 2010, S. 31  Heiko Jansen, Kirstin Kemner-Heek, Roswitha Schweitzer: Konkurrenzanalyse ausgewählter kommerzieller Suchindizes, Online- Veröffentlichung, 2010  Magnus Pfeffer: Using clustering across union catalogues to enrich entries with indexing information, in: Data Analysis, Machine Learning and Knowledge Discovery – Proceedings of the 36th Annual Conference of the German Classification Society, Springer, Heidelberg/Berlin, 2012 (noch nicht erschienen)  Heidrun Wiesenmüller: Resource Discovery Systeme, Vortrag auf der 36. Jahrestagung der Gesellschaft für Klassifikation, 2012 12. April 2013 Fortbildung VdB, Braunschweig 60