Met dit project wil Design Museum Gent de tweede fase realiseren van een noodzakelijke inhaalbeweging rond het aanvullen en opschonen van de digitale data over zijn collectie. Door het maken en schonen van
(hiërarchische) woordenlijsten en het correct wegschrijven van de bestaande data willen we de vervuiling in onze databank wegwerken. Het doel van deze fase is tweeledig: de bestaande data aanzienlijk beter doorzoekbaar maken en ze systematisch verder klaarmaken voor ontsluiting.
Inhaalbeweging voor het opschonen en het verrijken van de collectiedata van Design Museum Gent
1. Korte beschrijving van het project
• tweede fase van inhaalbeweging rond het aanvullen en
opschonen van de digitale data over onze collectie
• maken en schonen van woordenlijsten
• de bestaande ‘platte lijsten’ indien mogelijk/wenselijk omvormen
tot hiërarchische lijsten
• de vervuiling wegwerken
• de termen afstemmen met de AAT en andere thesauri zoals
RKDArtist&, de Getty Thesaurus of Geographic Names (TGN) en
Wikidata, en indien mogelijk te koppelen aan persistente URI’s
• per dataset of op te schonen veld de juiste
werkmethode/strategie bepalen
• het correct wegschrijven van de bestaande data
• twee doelen:
• bestaande data aanzienlijk beter doorzoekbaar maken
• bestaande data systematisch verder klaarmaken voor ontsluiting
2.
3.
4.
5. Verwachte resultaten van het
project
• foutloze data die zijn weggeschreven in de juiste velden in de
databank en daardoor beter opzoekbaar zijn
• correcte al dan niet hiërarchische woordenlijsten die sluitend
doorzoekbaar en beter beheersbaar zijn om nieuwe vervuiling
tegen te gaan
• persistente uri’s voor bepaalde woordenlijsten, om (linked)
open data / uitwisselbaarheid van data in de toekomst mogelijk
te maken
• metadata over ‘vervaardigers’ verrijken (geslacht, nationaliteit,
rol) beter zicht op spreiding binnen collectie en groeien naar
volwaardige databank van vervaardigers
• het verstrijken van auteursrechten beter opvolgen door
toevoegen van sterfdata van vervaardigers ifv open databeleid
• betere kennis van/zicht op de inzetbaarheid van programma’s
zoals OpenRefine en Fuzzy Lookup voor het opschonen van data
6. Deze ervaringen willen we delen
met de collegagroep
• de gehanteerde werkwijzen voor datacleaning
• onze ervaringen rond de inzetbaarheid van programma’s
zoals OpenRefine en Fuzzy Lookup voor het opschonen
van data (in combinatie met Adlib/Erfgoedinzicht)
7. Verwachte moeilijkheden waarvoor
we ondersteuning wensen in
coachingtraject
• import/export opgeschoonde trefwoordenlijsten via
OpenRefine, Fuzzy Lookup in Adlib
• mogelijkheden op vlak van open data