Rask gjennomgang av hvorfor MARC bør byttes ut med andre standarder for bibliografiske metadata. Foredraget holdes på Kunnskapsorganisasjonsdagene på HiO, 28. januar 2011.
4. Mine kriterier for kritikk
● Effektiv utnyttelse av ressurser
● Gjenbruk av data
● Bruk av bibliotekdata for ikke-bibliotekarer
● Behov for entydige identifikatorer
5. Generell kritikk
● Før eller siden må vi kunne fri oss fra
begrensninger som skyldes foreldede
teknologier – hvorfor ikke gjøre det nå?
● Å bruke formater som bare brukes av bibliotek
medfører at all teknisk utvikling må skje
innenfor bibliotekfeltet
● «De smarteste folka vil alltid befinne seg utenfor din
egen institusjon» (eller profesjon) – vi kan ha mye å
tjene på å legge forholdene til rette for dem
6. MARC = ?
● Format-standardene: MARC21, UNIMARC,
NORMARC et al
● ISO 2709
● MARCXML
● AACR2 og RDA
7. En flora av «standarder»
● MARC21
● UNIMARC
● DANMARC, BISMARC
● NORMARC, BIBSYS-MARC, BS-MARC
● Hvert system, sin tolkning
● Hvert bibliotek, sin tolkning
● Ulike tolkninger til ulike tider
8. Standardfloraen medfører...
● Vanskelig utveksling av data
● Vanskelig å ta i bruk programvare som er
utviklet andre steder
● Før man kan ta noe i bruk må man tilpasse det
lokale «dialekter» av MARC
● Gjelder ikke minst fri programvare!
9. 245^^$a
● Hvorfor bruke slike kryptiske betegnelser på
elementene i en bibliografisk post?
● MARC er gjennomsyret av hensyn til
magnetbåndformatet + behovet for å spare plass – i
dag er plass billig og vi kan prioritere andre hensyn
● MARC ble skapt for å lette produksjonen av fysiske
katalogkort – det er vel et tilbakelagt stadium?
Hvorfor la oss begrense av det?
10. I MARC er alt tekst
● Årstall
● Kan være [1993] eller 199?
● Sidetall
● Angis med «s.» eller «p.» el.l. Som en del av feltet
● Navn på personer og korporasjoner er enkle
tekst-strenger («Ola Nordmann»), som alltid vil
kunne være flertydige
● Vi trenger unike identifikatorer for identifisering på
tvers av systemer
12. ISO 2709
● Uleselig, men det gjør kanskje ikke så mye...
● Legger en kunstig begrensning på postenes
størrelse
● Trekker med seg begrensninger fra
magnetbånd-teknologien – når så du sist et
magnetbånd?
13. MARCXML
● Unngår den kunstige begrensningen på
poststørrelse
● Så lenge man ikke må ta høyde for at postene på ett
eller annet tidspunkt skal (kunne) transformeres til
ISO 2709
● Viderefører de ikke meningsbærende felt-
betegnelsene
● Reglene for innhold i de ulike feltene er de
samme
● «Same shit, new wrapping»
15. Eksempel: 300$a
● 300 ^^ $a230 s.
● Hvordan lage et grensesnitt som lar brukeren
avgrense søket til «bøker med færre enn 300
sider»?
● Hvordan lage grensesnitt på flere språk?
● Og det store nye med RDA er at man kan
skrive «sider» i stedet for «s.»?!?
● Hvorfor ikke ha et felt som bare brukes til
sidetall og la det inneholde et tall?
16. Hva må gjøres?
1) Bytt ut NORMARC med MARC21 i dagens
systemer!
2) Bytt ut MARC21 med noe mer hensiktmessig!
17. Hva kan vi bytte ut MARC med?
● RDF/Semantic Web/Linked Data fremstår som
en seriøs kandidat
● Desentralisert system for unike identifikatorer
gjennom bruk av URI/URLer
● Fleksibilitet gjennom kombinasjon av ontologier
● Vi kan dra nytte av fremskritt som gjøres på andre
felt enn vårt eget
– Gjenfinning
– Søk
– Grensesnitt
18. “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”