Autor: Tobias Viegener, Projekt swissbib, Universitätsbibliothek Basel.
Referat an der Fachtagung Resource Descripton and Acces (RDA) des BIS, der HTW Chur und der Schweizerischen Nationalbibliothek, 6. Mai 2010, Schweizerische Nationalbibliothek, Bern.
Welche Probleme stellen sich aus der Zusammenführung der bibliographsichen Daten der verschiedenen Bibliotheksverbünde und der Nationalbibliothek in der Schweiz für die Indexierung und Aufbereitung im Rahmen von swissbib? Anhand von Beispielen aus der Praxis zeigt der Beitrag das Spannungsfeld zwischen den verschiedenen Interpretatioen von Format und Katalogisierungsregeln.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Viegener_Swissbib
1. Metadatenstandards und moderne Suchoberflächen
Befunde aus dem Projekt swissbib
Tobias Viegener, Projektkoordinator swissbib
Öffentliche Bibliothek der Universität Basel
2. Projekt swissbib
Der Vortrag
1. Eckdaten zu swissbib
2. Suchoberfläche und Daten
3. Datenaufbereitung in swissbib
4. Probleme der heterogener Erfassung
5. Chancen einheitlicher Autoritätsdaten
2
3. Projekt swissbib
Eckdaten
Datenlage:
• 8 Bibliographische Datenbanken
• 20 Mio. Datensätze
• 3 Datenbanken mit Namensautoritäten
• Ein Institutional Repository (Zora)
• Metadaten von retro.seals
• Tägliches Update in MARCXML oder DC (pro Tag c.a. 40‘000 zu
verarbeiten)
3
Stand 2010 (Halbzeit):
• System läuft stabil und ist produktiv benutzbar
• Im Rahmen Projekts wird weiter an Funktionen und Qualität
gearbeitet – deshalb auch noch „beta“
4. Projekt swissbib
Eckdaten
Format und Regelwerk
• Format (drei Interpretationen von MARC21, die zwischen nahe an
der „amerikanischen“ Interpretation und eher eigenständig
anzusiedeln sind)
• Erfassungsrichtlinien (mit mehr oder weniger Abweichung von
AACR2 und mehr oder weniger lokalen Eigenheiten)
4
6. Projekt swissbib
6
Datenaufbereitung und -präsentation in Swissbib
... funktioniert, weil Vieles einfach sauber und gleichartig erledigt wird
... Und das in gut 80% der Fälle
... hat ihre Tücken, weil
• die bestehenden Regelwerke viele Interpretationen zulassen
• unter Gesichtspunkten der Zeitersparnis vereinfacht wird
• mit Blick auf lokale Gepflogenheiten und die eigene Datenbank gearbeitet
wird
• Kataloge historisch gewachsen sind
• Bereinigungen nicht kooperativ erfolgen können und so immer zu wenig
Personal vorhanden ist ;-)
Tour d‘horizon
8. Projekt swissbib
Facetten
8
=ldr cim a22 4u 4500
...
=007 sd z||g|||||||
=008 051222s2006 gw ||n ger|d
...
=016 7- $a 977875652 $2 GyFmDB
=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00
=035 -- $a (IDSLU)000498722
=040 -- $a DDB $d SzZuIDS LU LUZHB
=044 -- $a gw
=072 -7 $a 592 $2 IDS LU
=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8
AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT:
Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT:
Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT:
Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h
Ton $c Regie: Torsten Feuerstein
=246 10 $a Rheinsberg
=260 -- $a Berlin $b Argon-Verl $c 2006
=300 -- $a 2 Compact Discs (in 1 Behältnis)
=490 0- $a Argon-Hörbuch
=691 L6 $u 3.1.3 $a Lyrik, Epik
=695 L- $a CD
=695 L- $a Hörbuch
=700 1- $a Thalbach $D Anna
=700 1- $a Feuerstein $D Torsten
=898 -- $a MU030612001
=949 -- $b LUZHB $B IDSLU
9. Projekt swissbib
Facetten: Verfasser
Kleinster gemeinsamer Nenner: 100/700 $a
Einbindung von Namensautoritäten löst einige
Inkonsistenzen:
=100 1- $a Beethoven, L. van (Ludwig)
=>
=100 1- $a Beethoven, Ludwig van
9
=100 1- $a Beethoven $D Ludwig van
=100 1- $a Beethoven $D Ludwig van $d 1770-1827
=100 1- $a Beethoven $D Ludwig van $d 1770-
=700 1- $a Beethoven $D Ludwig van $c Komponist $d 1770 - 1827 $l
ger
=700 1- $a Beethoven $D Ludwig van $c Composer $d 1770 - 1827 $l eng
=700 1- $a Beethoven $D Ludwig van $c Compositeur $d 1770 - 1827 $l
fre
12. Projekt swissbib
Materialtypen
=LDR 01135nim 22002894u 4500
=007 sd z||g|||||||
=008 990202s1998gwnger|d
=245 10 $a Homo Faber $h Ton ...
=300 -- $a 2 Compact Discs + $e Booklet
=906 -- $e SR CD
=LDR 01229nim a2200361 a 4500
=007 s| |||||||||||
=008 000904s1998sz|||||||||0|0gerd
=245 10 $a Homo faber $h [Enregistrement sonore]...
=300 -- $a 2 Compact Discs in Behältnis (ca 120 Min.)
$b ADD $c 12 cm
=LDR 01112nim a22002774a 4500 a
=008 090223s1998gwnf0gerd
=245 14 $a Homo faber $h [Tonaufzeichnung] ...
=300 -- $a2 Compact Discs (120 Min.) $c 12 cm + $e 1
Booklet ([12] S.)
12
Für die Sortierung ein eigener Code:
MU-03-06-12-001
Für die Dedublierung ein
Mindeststandard:
Leader pos. 06 und 07
008 pos. 23/29 plus 245 $h
13. Projekt swissbib
245 $h
13
CD, CD-ROM, CD-Rom, CDR, Comic, Computerdiskette, Dia, Dias,
Diskette, Filmmmaterial, Folien, Kassette, Maschinenlesbare Daten;
Postenkarten, Poster,
Posters, Semesterarbeit, Spiele, Tonaufzeichnung, Tonbandkassette,
Video, von Dianna Aston ; ill. von Sylvia Long
SNL IDS RERO
Bild Bildmaterial Image fixe
Braille Braille
Elektronische Ressource Elektronische Daten Ressource électronique
Film Filmmaterial Film cinématographique
Hologramm
Kartei
Kartenmaterial Kartenmaterial Document cartographique
Medienkombination Medienpaket Ensemble multi-supports **
Mikroform Mikroform Microforme
Mikroskopisches Präparat
Musikdruck Noten Musique imprimée
Musikmanuskript
Objekt Objet
Projektionsbild Image projetée
Spiel
Tonaufzeichnung Ton Enregistrement sonore
Videoaufzeichnung Enregistrement vidéo
14. Projekt swissbib
Updatevorgang: Garbage in – Garbage out...
Update und Import – was wird nicht geladen?
• Aufnahmen mit strukturellen Fehlern (nicht XML-konform, nicht reparierbare
Unterfeldcodes...)
• Dummies: http://aleph.unibas.ch/F/?func=find-
b&find_code=SIN&request=ZB%20Hospes%20186
• Titelaufnahmen ohne Pflichtfelder (mit Ausnahmen und entsprechenden
Konsequenzen)
14
=LDR 01206nam 22003857u 4500
=008 920206s1975gw00gerd
=020 -- ‡a3-499-11603-0
...
=100 -- ‡aBöttger, Barbara
=240 -- ‡aSiebenhundert Millionen ohne Zukunft?
=245 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und
Bangladesh‡cBarbara Böttger
=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975
=300 -- ‡a254 S.‡c19 cm
=490 -- ‡aRororo‡v1603‡i1603
=490 -- ‡aRororo aktuell‡v680‡i680
=LDR 00824nam 2200205uu 4500
=008 000000s1975gw000ger
=020 -- ‡a3-499-11603-0
=100 -- ‡aBöttger, Barbara
...
=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975
=300 -- ‡a254 S.
=730 -- ‡aSiebenhundert Millionen ohne Zukunft?
=730 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und Bangladesh
15. Projekt swissbib
15
=ldr com a22 5u 4500
=005 20100408133900.0
=007 co |g ||||||||
=008 090126s2009 gw ||| b|ger|d
=015 -- $a GFR-DNB-09,N07,0137
=016 7- $a 992308224 $2 GyFmDB
=020 -- $a 978-3-8362-1308-0 $c ...
=040 -- $a DDB $d SzZuIDS BS/BE A100
=100 1- $a Scholz $D Michael
=245 10 $a Java und XML $b Grundlagen, Einsatz,
Referenz $c Michael Scholz, Stephan Niedermeier
=250 -- $a 2., aktualisierte und vollständig
überarb. Aufl
=260 -- $a Bonn $b Galileo Press $c 2009
=300 -- $a 702 S $b Ill + $e 1 CD-ROM
=490 0- $a Galileo Computing
=700 1- $a Niedermeier $D Stephan
=986 -- $a SWISSBIB $b 046212256
=ldr cam a22 5u 4500
=005 20100408181646.0
=007 co |g ||||||||
=008 091220s2009 gw |00 |ger|d
=020 -- $a 978-3-8362-1308-0
=040 -- $a SzZuIDS NEBIS ZHAW-T
=082 0- $a 005.133
=245 00 $a Java und XML $b Grundlagen, Einsatz,
Referenz $c Michael Scholz, Stephan Niedermeier
=250 -- $a 2., aktual. und vollst. überarb. Aufl
=260 -- $a Galileo Press $b Bonn $c 2009
=300 -- $a 702 S + $e 1 CD-ROM
=490 0- $a Galileo Computing
=700 1- $a Scholz $D Michael
=700 1- $a Niedermeier $D Stephan
=986 -- $a SWISSBIB $b 046212256
• Verwaltungsaufnahmen (Informationen zu ausgeschiedenen Beständen, stornierten
Materialien...)
• Daten ohne jede interne Verlinkung, ohne Holding oder Item und ohne externe URL
• Erwerbungsaufnahmen:
16. Projekt swissbib
Dedublierung
• Kontrollnr.: 020, 022, 024 035
• Titel: 245
• Verfasser: #00, #10, #11
• Jahr: 008 pos. 06/07-14
• Format: LDR, 008, 245$h
• Hauptsprache: 008 pos. 35-37
16
OK
nein
???
• Bestimmung eines Kandidaten
• Definitionsmöglichkeiten
• welche Felder angepasst
werden
• wie Felder angepasst
werden sollen
• Wie bereits bestehende
Dubletten angepasst
werden sollen
a b
a b
a
c
Definition von Schwellenwerten
0.0-0.77 = keine Dublette
0.77-0.9 = evtl. Dublette
0.9-1.0 = Dublette
17. Projekt swissbib
Beispiele für Dedublierung
=LDR 01152nas a2200289uu 4500
=008 811118c19619999gwm0muld
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen
=$bPublications universitaires
européennes.$nSérie 15, Philologie et
littérature classiques = European
university studies.$nSeries 15, Classics
…
=260 $aFrankfurt a.M. ;$aBern ;$aCirencester
:$bPeter D. Lang
=300 $c21 cm
…
=906 $bSchriftenreihe = Collection
=LDR 00743nas a22001694u 4500
=008 991129c19809999szm0ger
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$nReihe
15, Klassische Sprachen und Literaturen
=$bEuropean university studies. Series 15,
Classics = Publications universitaires
européennes. Série 15, Philologie et
littérature classique
…
=260 $aBern :$bLang
=906 $bSchriftenreihe = Collection
=LDR 01609nas a22003732i 4500
=007 ta
=008 940308cuuuu9999szxm00gerd
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$nReihe
15,$pKlassische Sprachen und Literaturen
=$bPublications universitaires européennes.
Série 15, Philologie et littérature
classiques = European university studies.
Series 15, Classics
…
=260 $aFrankfurt a.M. ;$aBern [etc.] :$bP. Lang
=300 $aBd. ;$c21 cm
=LDR 00843nas a22001937a 4500
=008 960525u|||m||||||00||0undd
=022 $a0721-3433
..
=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen
=$bPublications universitaires européennes.
Série 15, Philologie et littérature
classiques = European university studies.
Series 15, Classics
…
=260 $aFrankfurt am Main ;$aBern [etc.] :$bP.
Lang
Format als Killerkriterium: Revolution Zahlungsverkehrs Automation
19. Projekt swissbib
Linking
Verlinkung von Datensätzen
Aufgrund der Struktur und Ausrichtung von CBS problemlos möglich
• Indexbasiertes Verfahren
• Kontrollnummernbasierte Links
• Ausgabe von Hierarchieinformationen möglich
19
=490 0- $a Europäische Hochschulschriften. Reihe 3, Geschichte und ihre Hilfswissenschaften
$v Bd. 926 $w (NEBIS)000058577 $9 001756400
=780 00 $t Schweizerische Zeitschrift für Sozialversicherung $x 0036-7877 $w
(SNL)vtls001128805 $9 001320661
=710 2- $a Konferenz der kantonalen Stiftungsaufsichtsbehörden $9 140128638
=897 -- $a b $b 883
20. Projekt swissbib
Einstufig – Mehrstufig – auflagenneutral
Situation IDS:
• Bei Sibil und ETHICS
forciert mehrstufig
• Bei REKAT nach Kärtchen
forciert einstufig
• Grundsätzlich hierarchie-
betont
• Neuaufnahmen meist
einstufig
20
001 vtls001163063
003 RERO
035 -- ‡a 1272888
100 1- ‡a Shakespeare, William
245 14 ‡a The works of William Shakespeare / ‡c
ed. by William George Clark and William
Aldis Wright. ‡n Vol. 3
250 -- ‡a [2nd ed., reprinted]
260 -- ‡a London ; ‡a New York : ‡b Macmillan, ‡c
1923
300 -- ‡a VIII, 516 p. ; ‡c 24 cm
500 -- ‡a Contient: The taming of the shrew ;
All's well that ends well ; Twelfth night,
or, What you will ; The winter's tale
800 1- ‡a Shakespeare, William. - ‡t The works of
William Shakespeare ‡v 3
Situation RERO:
• Sibil-Erbe wurde nivelliert
• Neuaufnahmen einstufig
Situation SNL:
• Mehrheitlich einstufig
• Hierarchische Links für den
internen Gebrauch (990)
21. Projekt swissbib
Stratenwerth, Günter. - Schweizerisches Strafrecht. Besonderer Teil / Günter
Stratenwerth. - Bern : Stämpfli, 1973- [000097454]
Bd. 1: Straftaten gegen Individualinteressen
Bd. 2: Straftaten gegen Gemeininteressen
[Bd. 3]: Teilrevisionen 1987 bis 1990: Straftaten gegen Leib und Leben,
Insiderstrafrecht, Straftaten gegen die Familie, Geldwäscherei
Einstufig – auflagenneutral
• seit 1973 in 6 Auflagen erschienen und im IDS Basel/Bern bei 9
Bibliotheken in 183 Exemplaren vorhanden
• NEBIS: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 3
& 6) und mehrstufig (Aufl. 1, 2, 4 & 5)
• IDS SG: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 6)
und mehrstufig (Aufl. 1 - 5)
• SNL: dasselbe Werk ist nach Auflagen getrennt mehrstufig
aufgenommen
• RERO: auflagenneutral einstufig für Bde. 1 und 2 sowie eigene
Aufnahme für Bd. 3 – in 16 Bibliotheken vorhanden
21
...und in swissbib
24. Projekt swissbib
ETHICS Konsequenzen
NEBIS setzt weiter auf diese Praxis:
http://opac.nebis.ch/F?func=z103-set&doc_number=001624001
Und in swissbib: Suche nach "Jahr: 1981“ – Sortierung nach Titel A-Z
Probleme mit Verwaltungsaufnahmen: z.B. Fernleihe
26. Projekt swissbib
26
Autoritäten – Die Basis
=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt
Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym
von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=600 17 $a Tucholsky, Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt
Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym
von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky $2 ids zbz
Suche nach: Peter Panter schreiben
IDSBB
SNL
RERO
#00 VerfasserIn
#10 Körperschaft
#11 Kongress
Regelbasierte Zuordnung
bei String-Match von AUT
zu BIB
a)Es gewinnt jene mit den
meisten verworfenen
Formen
b)Ansonsten festgelegte
Reihenfolge
27. Projekt swissbib
27
Autoritäten – Was wäre wenn
Was können Autoritätsdateien neben der Anreicherung von Suchanfragen
bieten?
Verlinkung von Datenquellen
Aggregation von Informationen
http://www.worldcat.org/wcidentities/lccn-n50-81889
http://d-nb.info/gnd/11862444X
28. Projekt swissbib
28
Koordinaten
Projekt SwissBib
• Hannes Hug, Projektleiter
hannes.hug@unibas.ch
• Tobias Viegener, Projektkoordinator
tobias.viegener@unibas.ch
• Günter Hipler, Softwarearchitekt
guenter.hipler@unibas.ch
Der Service: www.swissbib.ch
Das Projekt: www.swissbib.org