SlideShare une entreprise Scribd logo
1  sur  28
Télécharger pour lire hors ligne
Metadatenstandards und moderne Suchoberflächen
Befunde aus dem Projekt swissbib
Tobias Viegener, Projektkoordinator swissbib
Öffentliche Bibliothek der Universität Basel
Projekt swissbib
Der Vortrag
1. Eckdaten zu swissbib
2. Suchoberfläche und Daten
3. Datenaufbereitung in swissbib
4. Probleme der heterogener Erfassung
5. Chancen einheitlicher Autoritätsdaten
2
Projekt swissbib
Eckdaten
Datenlage:
• 8 Bibliographische Datenbanken
• 20 Mio. Datensätze
• 3 Datenbanken mit Namensautoritäten
• Ein Institutional Repository (Zora)
• Metadaten von retro.seals
• Tägliches Update in MARCXML oder DC (pro Tag c.a. 40‘000 zu
verarbeiten)
3
Stand 2010 (Halbzeit):
• System läuft stabil und ist produktiv benutzbar
• Im Rahmen Projekts wird weiter an Funktionen und Qualität
gearbeitet – deshalb auch noch „beta“
Projekt swissbib
Eckdaten
Format und Regelwerk
• Format (drei Interpretationen von MARC21, die zwischen nahe an
der „amerikanischen“ Interpretation und eher eigenständig
anzusiedeln sind)
• Erfassungsrichtlinien (mit mehr oder weniger Abweichung von
AACR2 und mehr oder weniger lokalen Eigenheiten)
4
Projekt swissbib
SwissBib-Lösung
5
Datenquellen
CBS
Datenaufbe-
reitung
FAST
Indexierung &
Suche
TouchPoint
Oberfläche &
Anbindung
Tägliches Update der meisten Quellen
Korrektur/Import > Matching/Merging > Ver-
linkung > Gruppierung > Export/Anreicherung
Kontinuierliches Update
Import > Dedublierung „redundanter“ Strings >
Indexierung > Anreicherung > Verlinkung
1. Anzeige, Einbindung, Weiterleitung
2. SRU-Interface für andere Suchservices
Projekt swissbib
6
Datenaufbereitung und -präsentation in Swissbib
... funktioniert, weil Vieles einfach sauber und gleichartig erledigt wird
... Und das in gut 80% der Fälle
... hat ihre Tücken, weil
• die bestehenden Regelwerke viele Interpretationen zulassen
• unter Gesichtspunkten der Zeitersparnis vereinfacht wird
• mit Blick auf lokale Gepflogenheiten und die eigene Datenbank gearbeitet
wird
• Kataloge historisch gewachsen sind
• Bereinigungen nicht kooperativ erfolgen können und so immer zu wenig
Personal vorhanden ist ;-)
Tour d‘horizon
Projekt swissbib
7
Der aktuelle Stand: Was kann‘s?
Projekt swissbib
Facetten
8
=ldr cim a22 4u 4500
...
=007 sd z||g|||||||
=008 051222s2006 gw ||n ger|d
...
=016 7- $a 977875652 $2 GyFmDB
=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00
=035 -- $a (IDSLU)000498722
=040 -- $a DDB $d SzZuIDS LU LUZHB
=044 -- $a gw
=072 -7 $a 592 $2 IDS LU
=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8
AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT:
Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT:
Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT:
Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h
Ton $c Regie: Torsten Feuerstein
=246 10 $a Rheinsberg
=260 -- $a Berlin $b Argon-Verl $c 2006
=300 -- $a 2 Compact Discs (in 1 Behältnis)
=490 0- $a Argon-Hörbuch
=691 L6 $u 3.1.3 $a Lyrik, Epik
=695 L- $a CD
=695 L- $a Hörbuch
=700 1- $a Thalbach $D Anna
=700 1- $a Feuerstein $D Torsten
=898 -- $a MU030612001
=949 -- $b LUZHB $B IDSLU
Projekt swissbib
Facetten: Verfasser
Kleinster gemeinsamer Nenner: 100/700 $a
Einbindung von Namensautoritäten löst einige
Inkonsistenzen:
=100 1- $a Beethoven, L. van (Ludwig)
=>
=100 1- $a Beethoven, Ludwig van
9
=100 1- $a Beethoven $D Ludwig van
=100 1- $a Beethoven $D Ludwig van $d 1770-1827
=100 1- $a Beethoven $D Ludwig van $d 1770-
=700 1- $a Beethoven $D Ludwig van $c Komponist $d 1770 - 1827 $l
ger
=700 1- $a Beethoven $D Ludwig van $c Composer $d 1770 - 1827 $l eng
=700 1- $a Beethoven $D Ludwig van $c Compositeur $d 1770 - 1827 $l
fre
Projekt swissbib
Beschlagwortung - Facetten
http://www.worldcat.org/oclc/255145786
http://www.worldcat.org/oclc/560446115
10
Projekt swissbib
Titeldaten
11
=ldr cim a22 4u 4500
...
=007 sd z||g|||||||
=008 051222s2006 gw ||n ger|d
...
=016 7- $a 977875652 $2 GyFmDB
=020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00
=035 -- $a (IDSLU)000498722
...
=100 1- $a Tucholsky $D Kurt
=245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h
Ton $c Regie: Torsten Feuerstein
=246 10 $a Rheinsberg
=260 -- $a Berlin $b Argon-Verl $c 2006
=300 -- $a 2 Compact Discs (in 1 Behältnis)
=490 0- $a Argon-Hörbuch
=691 L6 $u 3.1.3 $a Lyrik, Epik
=695 L- $a CD
=695 L- $a Hörbuch
=700 1- $a Thalbach $D Anna
=700 1- $a Feuerstein $D Torsten
=898 -- $a MU030612001
=949 -- $b LUZHB $B IDSLU
Projekt swissbib
Materialtypen
=LDR 01135nim 22002894u 4500
=007 sd z||g|||||||
=008 990202s1998gwnger|d
=245 10 $a Homo Faber $h Ton ...
=300 -- $a 2 Compact Discs + $e Booklet
=906 -- $e SR CD
=LDR 01229nim a2200361 a 4500
=007 s| |||||||||||
=008 000904s1998sz|||||||||0|0gerd
=245 10 $a Homo faber $h [Enregistrement sonore]...
=300 -- $a 2 Compact Discs in Behältnis (ca 120 Min.)
$b ADD $c 12 cm
=LDR 01112nim a22002774a 4500 a
=008 090223s1998gwnf0gerd
=245 14 $a Homo faber $h [Tonaufzeichnung] ...
=300 -- $a2 Compact Discs (120 Min.) $c 12 cm + $e 1
Booklet ([12] S.)
12
Für die Sortierung ein eigener Code:
MU-03-06-12-001
Für die Dedublierung ein
Mindeststandard:
Leader pos. 06 und 07
008 pos. 23/29 plus 245 $h
Projekt swissbib
245 $h
13
CD, CD-ROM, CD-Rom, CDR, Comic, Computerdiskette, Dia, Dias,
Diskette, Filmmmaterial, Folien, Kassette, Maschinenlesbare Daten;
Postenkarten, Poster,
Posters, Semesterarbeit, Spiele, Tonaufzeichnung, Tonbandkassette,
Video, von Dianna Aston ; ill. von Sylvia Long
SNL IDS RERO
Bild Bildmaterial Image fixe
Braille Braille
Elektronische Ressource Elektronische Daten Ressource électronique
Film Filmmaterial Film cinématographique
Hologramm
Kartei
Kartenmaterial Kartenmaterial Document cartographique
Medienkombination Medienpaket Ensemble multi-supports **
Mikroform Mikroform Microforme
Mikroskopisches Präparat
Musikdruck Noten Musique imprimée
Musikmanuskript
Objekt Objet
Projektionsbild Image projetée
Spiel
Tonaufzeichnung Ton Enregistrement sonore
Videoaufzeichnung Enregistrement vidéo
Projekt swissbib
Updatevorgang: Garbage in – Garbage out...
Update und Import – was wird nicht geladen?
• Aufnahmen mit strukturellen Fehlern (nicht XML-konform, nicht reparierbare
Unterfeldcodes...)
• Dummies: http://aleph.unibas.ch/F/?func=find-
b&find_code=SIN&request=ZB%20Hospes%20186
• Titelaufnahmen ohne Pflichtfelder (mit Ausnahmen und entsprechenden
Konsequenzen)
14
=LDR 01206nam 22003857u 4500
=008 920206s1975gw00gerd
=020 -- ‡a3-499-11603-0
...
=100 -- ‡aBöttger, Barbara
=240 -- ‡aSiebenhundert Millionen ohne Zukunft?
=245 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und
Bangladesh‡cBarbara Böttger
=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975
=300 -- ‡a254 S.‡c19 cm
=490 -- ‡aRororo‡v1603‡i1603
=490 -- ‡aRororo aktuell‡v680‡i680
=LDR 00824nam 2200205uu 4500
=008 000000s1975gw000ger
=020 -- ‡a3-499-11603-0
=100 -- ‡aBöttger, Barbara
...
=260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975
=300 -- ‡a254 S.
=730 -- ‡aSiebenhundert Millionen ohne Zukunft?
=730 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus
oder Revolution in Indien und Bangladesh
Projekt swissbib
15
=ldr com a22 5u 4500
=005 20100408133900.0
=007 co |g ||||||||
=008 090126s2009 gw ||| b|ger|d
=015 -- $a GFR-DNB-09,N07,0137
=016 7- $a 992308224 $2 GyFmDB
=020 -- $a 978-3-8362-1308-0 $c ...
=040 -- $a DDB $d SzZuIDS BS/BE A100
=100 1- $a Scholz $D Michael
=245 10 $a Java und XML $b Grundlagen, Einsatz,
Referenz $c Michael Scholz, Stephan Niedermeier
=250 -- $a 2., aktualisierte und vollständig
überarb. Aufl
=260 -- $a Bonn $b Galileo Press $c 2009
=300 -- $a 702 S $b Ill + $e 1 CD-ROM
=490 0- $a Galileo Computing
=700 1- $a Niedermeier $D Stephan
=986 -- $a SWISSBIB $b 046212256
=ldr cam a22 5u 4500
=005 20100408181646.0
=007 co |g ||||||||
=008 091220s2009 gw |00 |ger|d
=020 -- $a 978-3-8362-1308-0
=040 -- $a SzZuIDS NEBIS ZHAW-T
=082 0- $a 005.133
=245 00 $a Java und XML $b Grundlagen, Einsatz,
Referenz $c Michael Scholz, Stephan Niedermeier
=250 -- $a 2., aktual. und vollst. überarb. Aufl
=260 -- $a Galileo Press $b Bonn $c 2009
=300 -- $a 702 S + $e 1 CD-ROM
=490 0- $a Galileo Computing
=700 1- $a Scholz $D Michael
=700 1- $a Niedermeier $D Stephan
=986 -- $a SWISSBIB $b 046212256
• Verwaltungsaufnahmen (Informationen zu ausgeschiedenen Beständen, stornierten
Materialien...)
• Daten ohne jede interne Verlinkung, ohne Holding oder Item und ohne externe URL
• Erwerbungsaufnahmen:
Projekt swissbib
Dedublierung
• Kontrollnr.: 020, 022, 024 035
• Titel: 245
• Verfasser: #00, #10, #11
• Jahr: 008 pos. 06/07-14
• Format: LDR, 008, 245$h
• Hauptsprache: 008 pos. 35-37
16
OK
nein
???
• Bestimmung eines Kandidaten
• Definitionsmöglichkeiten
• welche Felder angepasst
werden
• wie Felder angepasst
werden sollen
• Wie bereits bestehende
Dubletten angepasst
werden sollen
a b
a b
a
c
Definition von Schwellenwerten
0.0-0.77 = keine Dublette
0.77-0.9 = evtl. Dublette
0.9-1.0 = Dublette
Projekt swissbib
Beispiele für Dedublierung
=LDR 01152nas a2200289uu 4500
=008 811118c19619999gwm0muld
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen
=$bPublications universitaires
européennes.$nSérie 15, Philologie et
littérature classiques = European
university studies.$nSeries 15, Classics
…
=260 $aFrankfurt a.M. ;$aBern ;$aCirencester
:$bPeter D. Lang
=300 $c21 cm
…
=906 $bSchriftenreihe = Collection
=LDR 00743nas a22001694u 4500
=008 991129c19809999szm0ger
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$nReihe
15, Klassische Sprachen und Literaturen
=$bEuropean university studies. Series 15,
Classics = Publications universitaires
européennes. Série 15, Philologie et
littérature classique
…
=260 $aBern :$bLang
=906 $bSchriftenreihe = Collection
=LDR 01609nas a22003732i 4500
=007 ta
=008 940308cuuuu9999szxm00gerd
=022 $a0721-3433
…
=245 00$aEuropäische Hochschulschriften.$nReihe
15,$pKlassische Sprachen und Literaturen
=$bPublications universitaires européennes.
Série 15, Philologie et littérature
classiques = European university studies.
Series 15, Classics
…
=260 $aFrankfurt a.M. ;$aBern [etc.] :$bP. Lang
=300 $aBd. ;$c21 cm
=LDR 00843nas a22001937a 4500
=008 960525u|||m||||||00||0undd
=022 $a0721-3433
..
=245 00$aEuropäische Hochschulschriften.$pReihe
15, Klassische Sprachen und Literaturen
=$bPublications universitaires européennes.
Série 15, Philologie et littérature
classiques = European university studies.
Series 15, Classics
…
=260 $aFrankfurt am Main ;$aBern [etc.] :$bP.
Lang
Format als Killerkriterium: Revolution Zahlungsverkehrs Automation
Projekt swissbib
18
FRBR-Clustering
E
C
D
F
A
B
G
B
C
A
D
C D
B
A C
C
A B
A D
B D
A
praxiswis typo meye
B
Auswertung div.Felder
oder Feldelemente
=> FRBR-Faktor
...und in swissbib: Säntis
...und in swissbib: Meistersinger
Projekt swissbib
Linking
Verlinkung von Datensätzen
Aufgrund der Struktur und Ausrichtung von CBS problemlos möglich
• Indexbasiertes Verfahren
• Kontrollnummernbasierte Links
• Ausgabe von Hierarchieinformationen möglich
19
=490 0- $a Europäische Hochschulschriften. Reihe 3, Geschichte und ihre Hilfswissenschaften
$v Bd. 926 $w (NEBIS)000058577 $9 001756400
=780 00 $t Schweizerische Zeitschrift für Sozialversicherung $x 0036-7877 $w
(SNL)vtls001128805 $9 001320661
=710 2- $a Konferenz der kantonalen Stiftungsaufsichtsbehörden $9 140128638
=897 -- $a b $b 883
Projekt swissbib
Einstufig – Mehrstufig – auflagenneutral
Situation IDS:
• Bei Sibil und ETHICS
forciert mehrstufig
• Bei REKAT nach Kärtchen
forciert einstufig
• Grundsätzlich hierarchie-
betont
• Neuaufnahmen meist
einstufig
20
001 vtls001163063
003 RERO
035 -- ‡a 1272888
100 1- ‡a Shakespeare, William
245 14 ‡a The works of William Shakespeare / ‡c
ed. by William George Clark and William
Aldis Wright. ‡n Vol. 3
250 -- ‡a [2nd ed., reprinted]
260 -- ‡a London ; ‡a New York : ‡b Macmillan, ‡c
1923
300 -- ‡a VIII, 516 p. ; ‡c 24 cm
500 -- ‡a Contient: The taming of the shrew ;
All's well that ends well ; Twelfth night,
or, What you will ; The winter's tale
800 1- ‡a Shakespeare, William. - ‡t The works of
William Shakespeare ‡v 3
Situation RERO:
• Sibil-Erbe wurde nivelliert
• Neuaufnahmen einstufig
Situation SNL:
• Mehrheitlich einstufig
• Hierarchische Links für den
internen Gebrauch (990)
Projekt swissbib
Stratenwerth, Günter. - Schweizerisches Strafrecht. Besonderer Teil / Günter
Stratenwerth. - Bern : Stämpfli, 1973- [000097454]
Bd. 1: Straftaten gegen Individualinteressen
Bd. 2: Straftaten gegen Gemeininteressen
[Bd. 3]: Teilrevisionen 1987 bis 1990: Straftaten gegen Leib und Leben,
Insiderstrafrecht, Straftaten gegen die Familie, Geldwäscherei
Einstufig – auflagenneutral
• seit 1973 in 6 Auflagen erschienen und im IDS Basel/Bern bei 9
Bibliotheken in 183 Exemplaren vorhanden
• NEBIS: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 3
& 6) und mehrstufig (Aufl. 1, 2, 4 & 5)
• IDS SG: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 6)
und mehrstufig (Aufl. 1 - 5)
• SNL: dasselbe Werk ist nach Auflagen getrennt mehrstufig
aufgenommen
• RERO: auflagenneutral einstufig für Bde. 1 und 2 sowie eigene
Aufnahme für Bd. 3 – in 16 Bibliotheken vorhanden
21
...und in swissbib
Projekt swissbib
Altlasten: ETHICS
...und in swissbib
22
Projekt swissbib
Altlasten ETHICS
FRBR aus den 80ern
...und in swissbib
23
Projekt swissbib
ETHICS Konsequenzen
NEBIS setzt weiter auf diese Praxis:
http://opac.nebis.ch/F?func=z103-set&doc_number=001624001
Und in swissbib: Suche nach "Jahr: 1981“ – Sortierung nach Titel A-Z
Probleme mit Verwaltungsaufnahmen: z.B. Fernleihe
Projekt swissbib
Altlasten: Sibil - Hierarchie
...und in swissbib
Projekt swissbib
26
Autoritäten – Die Basis
=100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt
Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym
von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky
=600 17 $a Tucholsky, Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt
Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym
von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky $2 ids zbz
Suche nach: Peter Panter schreiben
IDSBB
SNL
RERO
#00 VerfasserIn
#10 Körperschaft
#11 Kongress
Regelbasierte Zuordnung
bei String-Match von AUT
zu BIB
a)Es gewinnt jene mit den
meisten verworfenen
Formen
b)Ansonsten festgelegte
Reihenfolge
Projekt swissbib
27
Autoritäten – Was wäre wenn
Was können Autoritätsdateien neben der Anreicherung von Suchanfragen
bieten?
Verlinkung von Datenquellen
Aggregation von Informationen
http://www.worldcat.org/wcidentities/lccn-n50-81889
http://d-nb.info/gnd/11862444X
Projekt swissbib
28
Koordinaten
Projekt SwissBib
• Hannes Hug, Projektleiter
hannes.hug@unibas.ch
• Tobias Viegener, Projektkoordinator
tobias.viegener@unibas.ch
• Günter Hipler, Softwarearchitekt
guenter.hipler@unibas.ch
Der Service: www.swissbib.ch
Das Projekt: www.swissbib.org

Contenu connexe

En vedette

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

En vedette (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Viegener_Swissbib

  • 1. Metadatenstandards und moderne Suchoberflächen Befunde aus dem Projekt swissbib Tobias Viegener, Projektkoordinator swissbib Öffentliche Bibliothek der Universität Basel
  • 2. Projekt swissbib Der Vortrag 1. Eckdaten zu swissbib 2. Suchoberfläche und Daten 3. Datenaufbereitung in swissbib 4. Probleme der heterogener Erfassung 5. Chancen einheitlicher Autoritätsdaten 2
  • 3. Projekt swissbib Eckdaten Datenlage: • 8 Bibliographische Datenbanken • 20 Mio. Datensätze • 3 Datenbanken mit Namensautoritäten • Ein Institutional Repository (Zora) • Metadaten von retro.seals • Tägliches Update in MARCXML oder DC (pro Tag c.a. 40‘000 zu verarbeiten) 3 Stand 2010 (Halbzeit): • System läuft stabil und ist produktiv benutzbar • Im Rahmen Projekts wird weiter an Funktionen und Qualität gearbeitet – deshalb auch noch „beta“
  • 4. Projekt swissbib Eckdaten Format und Regelwerk • Format (drei Interpretationen von MARC21, die zwischen nahe an der „amerikanischen“ Interpretation und eher eigenständig anzusiedeln sind) • Erfassungsrichtlinien (mit mehr oder weniger Abweichung von AACR2 und mehr oder weniger lokalen Eigenheiten) 4
  • 5. Projekt swissbib SwissBib-Lösung 5 Datenquellen CBS Datenaufbe- reitung FAST Indexierung & Suche TouchPoint Oberfläche & Anbindung Tägliches Update der meisten Quellen Korrektur/Import > Matching/Merging > Ver- linkung > Gruppierung > Export/Anreicherung Kontinuierliches Update Import > Dedublierung „redundanter“ Strings > Indexierung > Anreicherung > Verlinkung 1. Anzeige, Einbindung, Weiterleitung 2. SRU-Interface für andere Suchservices
  • 6. Projekt swissbib 6 Datenaufbereitung und -präsentation in Swissbib ... funktioniert, weil Vieles einfach sauber und gleichartig erledigt wird ... Und das in gut 80% der Fälle ... hat ihre Tücken, weil • die bestehenden Regelwerke viele Interpretationen zulassen • unter Gesichtspunkten der Zeitersparnis vereinfacht wird • mit Blick auf lokale Gepflogenheiten und die eigene Datenbank gearbeitet wird • Kataloge historisch gewachsen sind • Bereinigungen nicht kooperativ erfolgen können und so immer zu wenig Personal vorhanden ist ;-) Tour d‘horizon
  • 7. Projekt swissbib 7 Der aktuelle Stand: Was kann‘s?
  • 8. Projekt swissbib Facetten 8 =ldr cim a22 4u 4500 ... =007 sd z||g||||||| =008 051222s2006 gw ||n ger|d ... =016 7- $a 977875652 $2 GyFmDB =020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00 =035 -- $a (IDSLU)000498722 =040 -- $a DDB $d SzZuIDS LU LUZHB =044 -- $a gw =072 -7 $a 592 $2 IDS LU =100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky =245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h Ton $c Regie: Torsten Feuerstein =246 10 $a Rheinsberg =260 -- $a Berlin $b Argon-Verl $c 2006 =300 -- $a 2 Compact Discs (in 1 Behältnis) =490 0- $a Argon-Hörbuch =691 L6 $u 3.1.3 $a Lyrik, Epik =695 L- $a CD =695 L- $a Hörbuch =700 1- $a Thalbach $D Anna =700 1- $a Feuerstein $D Torsten =898 -- $a MU030612001 =949 -- $b LUZHB $B IDSLU
  • 9. Projekt swissbib Facetten: Verfasser Kleinster gemeinsamer Nenner: 100/700 $a Einbindung von Namensautoritäten löst einige Inkonsistenzen: =100 1- $a Beethoven, L. van (Ludwig) => =100 1- $a Beethoven, Ludwig van 9 =100 1- $a Beethoven $D Ludwig van =100 1- $a Beethoven $D Ludwig van $d 1770-1827 =100 1- $a Beethoven $D Ludwig van $d 1770- =700 1- $a Beethoven $D Ludwig van $c Komponist $d 1770 - 1827 $l ger =700 1- $a Beethoven $D Ludwig van $c Composer $d 1770 - 1827 $l eng =700 1- $a Beethoven $D Ludwig van $c Compositeur $d 1770 - 1827 $l fre
  • 10. Projekt swissbib Beschlagwortung - Facetten http://www.worldcat.org/oclc/255145786 http://www.worldcat.org/oclc/560446115 10
  • 11. Projekt swissbib Titeldaten 11 =ldr cim a22 4u 4500 ... =007 sd z||g||||||| =008 051222s2006 gw ||n ger|d ... =016 7- $a 977875652 $2 GyFmDB =020 -- $a 3-87024-063-6 $c EUR 7.50 (freier Pr.), sfr 70.00 =035 -- $a (IDSLU)000498722 ... =100 1- $a Tucholsky $D Kurt =245 10 $a Anna Thalbach liest Kurt Tucholsky "Rheinsberg" $h Ton $c Regie: Torsten Feuerstein =246 10 $a Rheinsberg =260 -- $a Berlin $b Argon-Verl $c 2006 =300 -- $a 2 Compact Discs (in 1 Behältnis) =490 0- $a Argon-Hörbuch =691 L6 $u 3.1.3 $a Lyrik, Epik =695 L- $a CD =695 L- $a Hörbuch =700 1- $a Thalbach $D Anna =700 1- $a Feuerstein $D Torsten =898 -- $a MU030612001 =949 -- $b LUZHB $B IDSLU
  • 12. Projekt swissbib Materialtypen =LDR 01135nim 22002894u 4500 =007 sd z||g||||||| =008 990202s1998gwnger|d =245 10 $a Homo Faber $h Ton ... =300 -- $a 2 Compact Discs + $e Booklet =906 -- $e SR CD =LDR 01229nim a2200361 a 4500 =007 s| ||||||||||| =008 000904s1998sz|||||||||0|0gerd =245 10 $a Homo faber $h [Enregistrement sonore]... =300 -- $a 2 Compact Discs in Behältnis (ca 120 Min.) $b ADD $c 12 cm =LDR 01112nim a22002774a 4500 a =008 090223s1998gwnf0gerd =245 14 $a Homo faber $h [Tonaufzeichnung] ... =300 -- $a2 Compact Discs (120 Min.) $c 12 cm + $e 1 Booklet ([12] S.) 12 Für die Sortierung ein eigener Code: MU-03-06-12-001 Für die Dedublierung ein Mindeststandard: Leader pos. 06 und 07 008 pos. 23/29 plus 245 $h
  • 13. Projekt swissbib 245 $h 13 CD, CD-ROM, CD-Rom, CDR, Comic, Computerdiskette, Dia, Dias, Diskette, Filmmmaterial, Folien, Kassette, Maschinenlesbare Daten; Postenkarten, Poster, Posters, Semesterarbeit, Spiele, Tonaufzeichnung, Tonbandkassette, Video, von Dianna Aston ; ill. von Sylvia Long SNL IDS RERO Bild Bildmaterial Image fixe Braille Braille Elektronische Ressource Elektronische Daten Ressource électronique Film Filmmaterial Film cinématographique Hologramm Kartei Kartenmaterial Kartenmaterial Document cartographique Medienkombination Medienpaket Ensemble multi-supports ** Mikroform Mikroform Microforme Mikroskopisches Präparat Musikdruck Noten Musique imprimée Musikmanuskript Objekt Objet Projektionsbild Image projetée Spiel Tonaufzeichnung Ton Enregistrement sonore Videoaufzeichnung Enregistrement vidéo
  • 14. Projekt swissbib Updatevorgang: Garbage in – Garbage out... Update und Import – was wird nicht geladen? • Aufnahmen mit strukturellen Fehlern (nicht XML-konform, nicht reparierbare Unterfeldcodes...) • Dummies: http://aleph.unibas.ch/F/?func=find- b&find_code=SIN&request=ZB%20Hospes%20186 • Titelaufnahmen ohne Pflichtfelder (mit Ausnahmen und entsprechenden Konsequenzen) 14 =LDR 01206nam 22003857u 4500 =008 920206s1975gw00gerd =020 -- ‡a3-499-11603-0 ... =100 -- ‡aBöttger, Barbara =240 -- ‡aSiebenhundert Millionen ohne Zukunft? =245 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus oder Revolution in Indien und Bangladesh‡cBarbara Böttger =260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975 =300 -- ‡a254 S.‡c19 cm =490 -- ‡aRororo‡v1603‡i1603 =490 -- ‡aRororo aktuell‡v680‡i680 =LDR 00824nam 2200205uu 4500 =008 000000s1975gw000ger =020 -- ‡a3-499-11603-0 =100 -- ‡aBöttger, Barbara ... =260 -- ‡aReinbek b. Hamburg‡bRowohlt‡c1975 =300 -- ‡a254 S. =730 -- ‡aSiebenhundert Millionen ohne Zukunft? =730 -- ‡a700 Millionen ohne Zukunft?‡bFaschismus oder Revolution in Indien und Bangladesh
  • 15. Projekt swissbib 15 =ldr com a22 5u 4500 =005 20100408133900.0 =007 co |g |||||||| =008 090126s2009 gw ||| b|ger|d =015 -- $a GFR-DNB-09,N07,0137 =016 7- $a 992308224 $2 GyFmDB =020 -- $a 978-3-8362-1308-0 $c ... =040 -- $a DDB $d SzZuIDS BS/BE A100 =100 1- $a Scholz $D Michael =245 10 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier =250 -- $a 2., aktualisierte und vollständig überarb. Aufl =260 -- $a Bonn $b Galileo Press $c 2009 =300 -- $a 702 S $b Ill + $e 1 CD-ROM =490 0- $a Galileo Computing =700 1- $a Niedermeier $D Stephan =986 -- $a SWISSBIB $b 046212256 =ldr cam a22 5u 4500 =005 20100408181646.0 =007 co |g |||||||| =008 091220s2009 gw |00 |ger|d =020 -- $a 978-3-8362-1308-0 =040 -- $a SzZuIDS NEBIS ZHAW-T =082 0- $a 005.133 =245 00 $a Java und XML $b Grundlagen, Einsatz, Referenz $c Michael Scholz, Stephan Niedermeier =250 -- $a 2., aktual. und vollst. überarb. Aufl =260 -- $a Galileo Press $b Bonn $c 2009 =300 -- $a 702 S + $e 1 CD-ROM =490 0- $a Galileo Computing =700 1- $a Scholz $D Michael =700 1- $a Niedermeier $D Stephan =986 -- $a SWISSBIB $b 046212256 • Verwaltungsaufnahmen (Informationen zu ausgeschiedenen Beständen, stornierten Materialien...) • Daten ohne jede interne Verlinkung, ohne Holding oder Item und ohne externe URL • Erwerbungsaufnahmen:
  • 16. Projekt swissbib Dedublierung • Kontrollnr.: 020, 022, 024 035 • Titel: 245 • Verfasser: #00, #10, #11 • Jahr: 008 pos. 06/07-14 • Format: LDR, 008, 245$h • Hauptsprache: 008 pos. 35-37 16 OK nein ??? • Bestimmung eines Kandidaten • Definitionsmöglichkeiten • welche Felder angepasst werden • wie Felder angepasst werden sollen • Wie bereits bestehende Dubletten angepasst werden sollen a b a b a c Definition von Schwellenwerten 0.0-0.77 = keine Dublette 0.77-0.9 = evtl. Dublette 0.9-1.0 = Dublette
  • 17. Projekt swissbib Beispiele für Dedublierung =LDR 01152nas a2200289uu 4500 =008 811118c19619999gwm0muld =022 $a0721-3433 … =245 00$aEuropäische Hochschulschriften.$pReihe 15, Klassische Sprachen und Literaturen =$bPublications universitaires européennes.$nSérie 15, Philologie et littérature classiques = European university studies.$nSeries 15, Classics … =260 $aFrankfurt a.M. ;$aBern ;$aCirencester :$bPeter D. Lang =300 $c21 cm … =906 $bSchriftenreihe = Collection =LDR 00743nas a22001694u 4500 =008 991129c19809999szm0ger =022 $a0721-3433 … =245 00$aEuropäische Hochschulschriften.$nReihe 15, Klassische Sprachen und Literaturen =$bEuropean university studies. Series 15, Classics = Publications universitaires européennes. Série 15, Philologie et littérature classique … =260 $aBern :$bLang =906 $bSchriftenreihe = Collection =LDR 01609nas a22003732i 4500 =007 ta =008 940308cuuuu9999szxm00gerd =022 $a0721-3433 … =245 00$aEuropäische Hochschulschriften.$nReihe 15,$pKlassische Sprachen und Literaturen =$bPublications universitaires européennes. Série 15, Philologie et littérature classiques = European university studies. Series 15, Classics … =260 $aFrankfurt a.M. ;$aBern [etc.] :$bP. Lang =300 $aBd. ;$c21 cm =LDR 00843nas a22001937a 4500 =008 960525u|||m||||||00||0undd =022 $a0721-3433 .. =245 00$aEuropäische Hochschulschriften.$pReihe 15, Klassische Sprachen und Literaturen =$bPublications universitaires européennes. Série 15, Philologie et littérature classiques = European university studies. Series 15, Classics … =260 $aFrankfurt am Main ;$aBern [etc.] :$bP. Lang Format als Killerkriterium: Revolution Zahlungsverkehrs Automation
  • 18. Projekt swissbib 18 FRBR-Clustering E C D F A B G B C A D C D B A C C A B A D B D A praxiswis typo meye B Auswertung div.Felder oder Feldelemente => FRBR-Faktor ...und in swissbib: Säntis ...und in swissbib: Meistersinger
  • 19. Projekt swissbib Linking Verlinkung von Datensätzen Aufgrund der Struktur und Ausrichtung von CBS problemlos möglich • Indexbasiertes Verfahren • Kontrollnummernbasierte Links • Ausgabe von Hierarchieinformationen möglich 19 =490 0- $a Europäische Hochschulschriften. Reihe 3, Geschichte und ihre Hilfswissenschaften $v Bd. 926 $w (NEBIS)000058577 $9 001756400 =780 00 $t Schweizerische Zeitschrift für Sozialversicherung $x 0036-7877 $w (SNL)vtls001128805 $9 001320661 =710 2- $a Konferenz der kantonalen Stiftungsaufsichtsbehörden $9 140128638 =897 -- $a b $b 883
  • 20. Projekt swissbib Einstufig – Mehrstufig – auflagenneutral Situation IDS: • Bei Sibil und ETHICS forciert mehrstufig • Bei REKAT nach Kärtchen forciert einstufig • Grundsätzlich hierarchie- betont • Neuaufnahmen meist einstufig 20 001 vtls001163063 003 RERO 035 -- ‡a 1272888 100 1- ‡a Shakespeare, William 245 14 ‡a The works of William Shakespeare / ‡c ed. by William George Clark and William Aldis Wright. ‡n Vol. 3 250 -- ‡a [2nd ed., reprinted] 260 -- ‡a London ; ‡a New York : ‡b Macmillan, ‡c 1923 300 -- ‡a VIII, 516 p. ; ‡c 24 cm 500 -- ‡a Contient: The taming of the shrew ; All's well that ends well ; Twelfth night, or, What you will ; The winter's tale 800 1- ‡a Shakespeare, William. - ‡t The works of William Shakespeare ‡v 3 Situation RERO: • Sibil-Erbe wurde nivelliert • Neuaufnahmen einstufig Situation SNL: • Mehrheitlich einstufig • Hierarchische Links für den internen Gebrauch (990)
  • 21. Projekt swissbib Stratenwerth, Günter. - Schweizerisches Strafrecht. Besonderer Teil / Günter Stratenwerth. - Bern : Stämpfli, 1973- [000097454] Bd. 1: Straftaten gegen Individualinteressen Bd. 2: Straftaten gegen Gemeininteressen [Bd. 3]: Teilrevisionen 1987 bis 1990: Straftaten gegen Leib und Leben, Insiderstrafrecht, Straftaten gegen die Familie, Geldwäscherei Einstufig – auflagenneutral • seit 1973 in 6 Auflagen erschienen und im IDS Basel/Bern bei 9 Bibliotheken in 183 Exemplaren vorhanden • NEBIS: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 3 & 6) und mehrstufig (Aufl. 1, 2, 4 & 5) • IDS SG: dasselbe Werk ist nach Auflagen getrennt einstufig (Aufl. 6) und mehrstufig (Aufl. 1 - 5) • SNL: dasselbe Werk ist nach Auflagen getrennt mehrstufig aufgenommen • RERO: auflagenneutral einstufig für Bde. 1 und 2 sowie eigene Aufnahme für Bd. 3 – in 16 Bibliotheken vorhanden 21 ...und in swissbib
  • 23. Projekt swissbib Altlasten ETHICS FRBR aus den 80ern ...und in swissbib 23
  • 24. Projekt swissbib ETHICS Konsequenzen NEBIS setzt weiter auf diese Praxis: http://opac.nebis.ch/F?func=z103-set&doc_number=001624001 Und in swissbib: Suche nach "Jahr: 1981“ – Sortierung nach Titel A-Z Probleme mit Verwaltungsaufnahmen: z.B. Fernleihe
  • 25. Projekt swissbib Altlasten: Sibil - Hierarchie ...und in swissbib
  • 26. Projekt swissbib 26 Autoritäten – Die Basis =100 1- $a Tucholsky $D Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky =600 17 $a Tucholsky, Kurt $9 141256591 $8 Tucholsky, Kurt $8 AT: Wrobel, Ignaz. Pseudonym von Kurt Tucholsky $8 AT: Tiger, Theobald. Pseudonym von Kurt Tucholsky $8 AT: Panter, Peter. Pseudonym von Kurt Tucholsky $8 AT: Hauser, Kaspar. Pseudonym von Kurt Tucholsky $2 ids zbz Suche nach: Peter Panter schreiben IDSBB SNL RERO #00 VerfasserIn #10 Körperschaft #11 Kongress Regelbasierte Zuordnung bei String-Match von AUT zu BIB a)Es gewinnt jene mit den meisten verworfenen Formen b)Ansonsten festgelegte Reihenfolge
  • 27. Projekt swissbib 27 Autoritäten – Was wäre wenn Was können Autoritätsdateien neben der Anreicherung von Suchanfragen bieten? Verlinkung von Datenquellen Aggregation von Informationen http://www.worldcat.org/wcidentities/lccn-n50-81889 http://d-nb.info/gnd/11862444X
  • 28. Projekt swissbib 28 Koordinaten Projekt SwissBib • Hannes Hug, Projektleiter hannes.hug@unibas.ch • Tobias Viegener, Projektkoordinator tobias.viegener@unibas.ch • Günter Hipler, Softwarearchitekt guenter.hipler@unibas.ch Der Service: www.swissbib.ch Das Projekt: www.swissbib.org