9. Netwerk Oorlogsbronnen (NOB)
• Sinds 2010
• Samenwerkingsverband van instellingen met WO2-collecties
• Onderwerp: Tweede Wereldoorlog
• Doel: vergroten gebruik Collectie WO2 Nederland
• Perspectief: archieven, musea, instituten, etc (+- 400)
• Programma 2016-2019
• Digitaal: verbinden van collecties
10.
11.
12. Tien geboden
1. Gij zult uw collectie gestructureerd ontsluiten
2. Gij zult uw collectiedata als open data delen
3. Gij zult persistent identifiers gebruiken
4. Gij zult standaardiseren
5. Gij zult uw kennis delen als digitale data
6. Gij zult de computer als klant waarderen
7. Gij zult uw digitale gebruikers respecteren
8. Gij zult samenwerken met vriendjes
9. Gij zult uw publiek benutten
10. Gij zult deze geboden in acht nemen
16. Googlen door archieven?
Naam en voornamen: #achternaam#, #voornaam# Geboortep!aats en-datum: Zaandam,
29 October 1897 Echtgenoote van / Beroep: voorheen agent van Politie, t Laatste
woonptaats en adres: Kanaalstraat 25 II Amsterdam Persoonsbewijs-no.:z 2 01239
afgegeven te Leeuwarden Nationaiiteit (evt. vroeger) Nederlander die ervan verdacht
wordt: joodsche personen in macht van den vijand te hebben gebracht,terwijl hij in dienst
was van de S.D. Terzake gehoord, verkiaarde verdachte mij het votgende: dat hij in dienst
was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche
goederen,vervolgens overgegaan naar de S.D.,afdeeling joodsche zaken te Amsterdam
Verdachte heb ik, optastvan den Chef Opsporingsdienst D.P.M. op 28 Mei 1945 bewaring ,
togesteid, in het Huis van Bewaring I te Amsterdam P.O.D. Amsterdam. Mode! A
Domeinspecifieke woorden: bewaring, agent van Politie, Persoonsbewijs, vijand, joodsche goederen, verdachte,
verdacht, Mode! A, in dienst was getreden
Personen: #achternaam#, #voornaam#, joodsche personen, Nederlander, Chef Opsporingsdienst D.P.M.
Organisaties: S.D., Opsporingsdienst D.P.M., Lippmann en Rosenthal, afdeeling joodsche zaken te Amsterdam, P.O.D.
Geografische lokatie: Zaandam, Kanaalstraat 25 II Amsterdam, Amsterdam, Huis van Bewaring, Leeuwarden
Datum : 29 October 1897, 28 Mei 1945
40. Tot slot
Netwerk Oorlogsbronnen bouwt geen website maar infrastructuur.
Bronnen houden niet op bij de muren van de instellingen.
Delen en verbinden maakt het gezamenlijke aanbod sterker.
Gemeenschappelijke, verbonden, open terminologie doet wonderen.
Digitaal is vooral ook: mensenwerk!
Vrienden zijn belangrijk.
Geheugen van Nederland
Notes de l'éditeur
Fallschirmabsprung: Aktionsaufnahme.Vor dem Einsatz der Fallschirmspringer wird auf Grund der Landkarte genaueste Instruktion gegeben. Je eine Gruppe von 18 Springern wird von einem Leutnant geführt, der die gestellte Aufgabe erläutert.
Fallschirmabsprung: Aktionsaufnahme.Vor dem Einsatz der Fallschirmspringer wird auf Grund der Landkarte genaueste Instruktion gegeben. Je eine Gruppe von 18 Springern wird von einem Leutnant geführt, der die gestellte Aufgabe erläutert.
Standaard slide
Standaard slide
Test met aantal collecties waaronder Fries Verzetsmuseum, Brabant Cloud, OCLC en De Ree.
Het doel van dit project is ervoor te zorgen dat er meer kwalitatief hoogwaardige digitale bronnen rondom het thema Tweede Wereldoorlog ter beschikking worden gesteld aan het brede publiek. We doen dit door:
voor een selecte set digitale collectiedata de rechten te onderzoeken en dit materiaal via een open licentie voor vrijelijk hergebruik door derden beschikbaar te stellen.
via een aantal erkende en al goed zichtbare publiekskanalen (Wikipidia, WikiCommons, Wikidata, Tweedewereldoorlog.nl, Oorlogsbronnen.nl, OpenBeelden.nl, liberationroute.com, Youtube, Flickr, Instagram) de digitale collectiedata beschikbaar te stellen.
Het verzamelde materiaal kan vrijelijk worden gebruikt door particulieren op eigen websites, door scholieren in hun werkstuk, door media in kranten, tijdschriften of anderszins, door documentairemakers in hun producties, door leraren in de klas, door conservatoren en curatoren in tentoonstellingen, door bedrijven in apps of games, etc.
We bouwen niet de zoveelste website, maar het WO2 open data depot is een duurzaam reservoir met voorgeselecteerd, rechtenvrij, aantrekkelijk bronnenmateriaal rondom een dertigtal kernthema’s en gebeurtenissen. We werken actief samen met platforms waar het grote publiek al is, zoals bijvoorbeeld Wikipedia, WikiCommons en WikiData.
Het project beoogt hiermee:
het digitale bronnenaanbod in het publieke domein kwalitatief te versterken
de zichtbaarheid van bronnenmateriaal te vergroten
het vrijgeven van collectiedata als ‘open data’ onder erfgoedinstellingen te promoten
de kennis rondom het “clearen” van de rechten van digitaal bronnenmateriaal te vergroten
bronnen en publiek dichter bij elkaar te brengen
Met “open data” wordt bedoeld: gegevens die je vrij mag (her)gebruiken en verspreiden, zie DEN, http://www.den.nl/thema/134/
zullen er 30 onderwerpen worden vastgesteld waarvan op voorhand kan worden aangenomen dat hier een breed publiek voor is. Als startpunt gelden de onderwerpen, die zijn benoemd in het kader van de Canon van de Duitse bezetting in 2010. De lijst zal worden aangescherpt op basis van een inventarisatie van de specifieke behoeften onder de leden van de SMH 40-45 en het Collectieoverleg Oorlogsmusea, Nationaal Comité 4 en 5 mei en de Stichting Liberation Route Europe. Deze leden zullen ook worden geraadpleegd over de algemene selectiecriteria voor het bronnenmateriaal. Om praktische redenen zal er een mix worden gemaakt tussen materiaal dat eenvoudig open gedeeld kan worden en lastigere, maar inhoudelijk prominente bronnen.
David Barnouw, Geschiedenis van Nederland 1940-1945. De canon van de Duitse Bezetting (Zutphen 2010):
Waar draait dit project om: hoe kun je van een een ongestructureerd analoog archief bruikbare digitale data maken? Uitleggen dat veel archieven slechts beschreven zijn op metadataniveau, collectie of deelcollectie (correspondentie 33-39, het dossier van meneer Jansen, etc.) Dit gaat erom om losse documenten machineleesbaar te maken.
Standaard slide
Geocoderen is het scriptsgewijs aan een geocoder vragen of er een locatie bekend is bij een bepaalde naam. Soms levert dat onverwachte resultaten op. Als je die naam met Named Entity Recognition uit een tekst hebt gehaald, dan denkt een geocoder al snel de Duitstalige boeken 'Retter in Uniform' en 'Statisten in Uniform' in het Amerikaanse plaatsje 'Uniform' te moeten situeren.
Anne Frank is een straat in Bunschoten-Spakenburg (flink inzoomen, ligt wat verstopt achter Grebbelinie!) en elders in het land vindt je de straten Bevrijding, Zuidfront, Veldpost, Luchtvaart, Genie, Kampement en Spitfire. In Friesland liggen de plaatsen Moskou en War.
Bij het geocoderen van Oorlogsbronnen bleken veel collecties gelukkig over een apart veld voor geografische termen te beschikken. Maar dat je zeker weet dat het niet om een persoons- of andere naam gaat wil niet zeggen dat je problemen verdwenen zijn. Zo'n naam hoeft namelijk helemaal niet eenduidig te zijn. In Suriname ligt ook een Berlijn.
Als je zoals ik eerst de Historische Geocoder gebruikt en de GeoNames API pas als je daarmee niets vindt, dan ligt Bali zo in een Purmerends wijkje. Sowieso halen straatnaamcommissies hun inspiratie nogal eens uit een atlas: Atlantische Oceaan, Westfriesland, Sudeten, Normandië, Saksen, Javazee, Sicilië. En als je daar 'straat', 'weg' of 'laan' achter plakt gaat het er maar raar uit zien (Javazeestraat).
Soms is de valse positief veroorzaakt door de strategie die je bij geocoderen kiest. Als je aan GeoNames vraagt naar Brussel en je accepteert alleen plaatsen met precies dezelfde naam, dan mis je Brussels en eindig je in het Zuid-Afrikaanse Brussel. Maar welke strategie je ook kiest, bij elke loop je kans op vals positieven.
Nu zijn de vals positieven op de kaart hierboven op de vingers van een hand of achtendertig te tellen. En het aantal correct gegeocodeerde locaties bedroeg meer dan tienduizend! Ik zeg het maar even, dat u op basis van dit blogbericht niet besluit dat u voor geocodeerprojecten maar beter iemand anders in kunt huren.
Collectie-eigenaren zouden een hoop gedoe kunnen voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. GeoNames of TGN URI's bijvoorbeeld, of BAG id's. Dat scheelt vals positieven, vals negatieven en uiteindelijk ook geld. Want dan zijn geocodeerprojecten naderhand niet meer nodig.
Menno den Engelse / Islands of Meaning
De plaatsen Agenda, Social, Library, of Teheran, Sicily en Darfur in Amerika. Ze bestaan echt. Zoals ook Afrika in Rusland, Parijs in België en Borneo in ons eigen land. Nederland is zelfs behept met de straten Verzet, Plateau, Randstad, Contact, maar ook Vrouwenkamp, Zieken en Onrust. Deze plaats- en straatnamen maken het geocoderen van oorlogsbronnen niet makkelijk. Dat bleek tijdens de uitvoering van het pilotproject Geocoding van Netwerk Oorlogsbronnen (NOB). Een onderzoek naar het verbeteren van ‘zoeken op locatie’ door grote hoeveelheden data automatisch van geografische informatie te voorzien. In dit geval de ruim 8,6 miljoen Oorlogsbronnen.
Project Geocoding is begin juli afgerond en bestaat uit meerdere aspecten: (1) Onderzoek van de kwaliteit van bestaande geografische metadata van bronnen uit de NOB-portal. (2) Daarop volgend hoe geografische locaties automatisch aan de metadata gekoppeld kunnen worden door gebruik van verschillende databases van unieke geocodes (thesauri). (3) Tot slot de ontwikkeling van een kaart voor toegang tot collecties.
Toekomstbestendig
Waarom unieke geocodes? Omdat standaardisatie uitwisseling en koppeling van data mogelijk maakt. En om toekomstbestendige metadata te gebruiken. Pilotuitvoerder Menno den Engelse pleit bij het georefereren dan ook voor uniform resource identifiers, ofwel URI’s. Dit zijn permanente unieke codes (persistent identifiers) van in dit geval geografische locaties. Een URI blijft door de tijd heen hetzelfde, ongeacht of de naam van een plaats verandert. Zo kan de geografische locatie altijd worden terug gevonden op het internet. Er is geen afhankelijkheid meer van spelling of hiërarchie (Sicily de plaats in Nebraska, Amerika of het Italiaanse eiland?).
Projectuitvoerder Menno den Engelse: “Collectiebeheerders kunnen een hoop gedoe voorkomen door unieke identifiers te gebruiken in plaats van (of naast) plaatsnamen. Het scheelt de verwerking van vals positieven en vals negatieven!”. Vals positieven zijn termen die worden herkend als plaatsnaam, maar geen geografische locatie zijn. Zoals een inventarisnummer met de beschrijving ‘Voedselverstrekking aan zieken’, die geen geografische koppeling aan de straat ‘Zieken’ in Den Haag behoeft. En een tekening met belevenissen uit de agenda van een verpleegster op Bandoeng, die uiteraard niet gesitueerd is in de plaats Agenda in Amerika. Maar ook vals negatieven resultaten zijn gevonden: plaatsen die wel bestaan maar nog geen geocode hebben, zoals Kamp Westerbork.
Gegeocodeerd, en dan?
Wat kunnen we met de gegeocodeerde metadata? Koppelen! Gestandaardiseerde metadata kan worden uitgewisseld en aan elkaar verbonden. Collecties van verschillende instellingen, die fysiek op verschillende locaties zijn geborgen, worden digitaal gelinkt op basis van overeenkomstige locatie. Zo kunnen uit een grote hoeveelheid data alle bronnen geselecteerd worden over een provincie, gebied of plaats. De geografische code is leidend in de ontsluiting. Een verrijking voor lokale en regionale oorlogerfgoedbeheerders!
Aan de metadata van alle oorlogsbronnen zijn in het project – waar mogelijk – een geocode en coördinaten toegevoegd. Collectiebeherende instellingen kunnen de verrijkte data downloaden en in hun eigen collectiebeheersystemen opnemen. Zo wordt ‘zoeken op locatie’ binnen de eigen systemen verbeterd, kan de metadata worden uitgewisseld en gekoppeld én is er de mogelijkheid tot het maken van een kaart. Ter illustratie is dit gedaan met de collectie van De Gelderlander en per provincie. Let op! Dit zijn tijdelijke, ongecorrigeerde websites. We willen middels deze sites onder meer de records met vals positieve geocodes identificeren. Een interessante onderzoeksbron is de gegeocodeerde De Gelderlander, die nu laat zien waar de krant in de oorlogsperiode over schreef. Want in tegenstelling tot de rest van de oorlogsbronnen, waarvan de metadata is gegeocodeerd, is deze krant OCR-gescand en hangen de geografische codes aan de inhoud van de krant. Met name de advertenties, veelal met adresgegevens, geven een mooi beeld van het dagelijks leven in de oorlog.
Standaard slide
Standaard slide
Het doel van dit project is ervoor te zorgen dat er meer kwalitatief hoogwaardige digitale bronnen rondom het thema Tweede Wereldoorlog ter beschikking worden gesteld aan het brede publiek. We doen dit door:
voor een selecte set digitale collectiedata de rechten te onderzoeken en dit materiaal via een open licentie voor vrijelijk hergebruik door derden beschikbaar te stellen.
via een aantal erkende en al goed zichtbare publiekskanalen (Wikipidia, WikiCommons, Wikidata, Tweedewereldoorlog.nl, Oorlogsbronnen.nl, OpenBeelden.nl, liberationroute.com, Youtube, Flickr, Instagram) de digitale collectiedata beschikbaar te stellen.
Het verzamelde materiaal kan vrijelijk worden gebruikt door particulieren op eigen websites, door scholieren in hun werkstuk, door media in kranten, tijdschriften of anderszins, door documentairemakers in hun producties, door leraren in de klas, door conservatoren en curatoren in tentoonstellingen, door bedrijven in apps of games, etc.
We bouwen niet de zoveelste website, maar het WO2 open data depot is een duurzaam reservoir met voorgeselecteerd, rechtenvrij, aantrekkelijk bronnenmateriaal rondom een dertigtal kernthema’s en gebeurtenissen. We werken actief samen met platforms waar het grote publiek al is, zoals bijvoorbeeld Wikipedia, WikiCommons en WikiData.
Het project beoogt hiermee:
het digitale bronnenaanbod in het publieke domein kwalitatief te versterken
de zichtbaarheid van bronnenmateriaal te vergroten
het vrijgeven van collectiedata als ‘open data’ onder erfgoedinstellingen te promoten
de kennis rondom het “clearen” van de rechten van digitaal bronnenmateriaal te vergroten
bronnen en publiek dichter bij elkaar te brengen
Met “open data” wordt bedoeld: gegevens die je vrij mag (her)gebruiken en verspreiden, zie DEN, http://www.den.nl/thema/134/
zullen er 30 onderwerpen worden vastgesteld waarvan op voorhand kan worden aangenomen dat hier een breed publiek voor is. Als startpunt gelden de onderwerpen, die zijn benoemd in het kader van de Canon van de Duitse bezetting in 2010. De lijst zal worden aangescherpt op basis van een inventarisatie van de specifieke behoeften onder de leden van de SMH 40-45 en het Collectieoverleg Oorlogsmusea, Nationaal Comité 4 en 5 mei en de Stichting Liberation Route Europe. Deze leden zullen ook worden geraadpleegd over de algemene selectiecriteria voor het bronnenmateriaal. Om praktische redenen zal er een mix worden gemaakt tussen materiaal dat eenvoudig open gedeeld kan worden en lastigere, maar inhoudelijk prominente bronnen.
David Barnouw, Geschiedenis van Nederland 1940-1945. De canon van de Duitse Bezetting (Zutphen 2010):
Het doel van dit project is ervoor te zorgen dat er meer kwalitatief hoogwaardige digitale bronnen rondom het thema Tweede Wereldoorlog ter beschikking worden gesteld aan het brede publiek. We doen dit door:
voor een selecte set digitale collectiedata de rechten te onderzoeken en dit materiaal via een open licentie voor vrijelijk hergebruik door derden beschikbaar te stellen.
via een aantal erkende en al goed zichtbare publiekskanalen (Wikipidia, WikiCommons, Wikidata, Tweedewereldoorlog.nl, Oorlogsbronnen.nl, OpenBeelden.nl, liberationroute.com, Youtube, Flickr, Instagram) de digitale collectiedata beschikbaar te stellen.
Het verzamelde materiaal kan vrijelijk worden gebruikt door particulieren op eigen websites, door scholieren in hun werkstuk, door media in kranten, tijdschriften of anderszins, door documentairemakers in hun producties, door leraren in de klas, door conservatoren en curatoren in tentoonstellingen, door bedrijven in apps of games, etc.
We bouwen niet de zoveelste website, maar het WO2 open data depot is een duurzaam reservoir met voorgeselecteerd, rechtenvrij, aantrekkelijk bronnenmateriaal rondom een dertigtal kernthema’s en gebeurtenissen. We werken actief samen met platforms waar het grote publiek al is, zoals bijvoorbeeld Wikipedia, WikiCommons en WikiData.
Het project beoogt hiermee:
het digitale bronnenaanbod in het publieke domein kwalitatief te versterken
de zichtbaarheid van bronnenmateriaal te vergroten
het vrijgeven van collectiedata als ‘open data’ onder erfgoedinstellingen te promoten
de kennis rondom het “clearen” van de rechten van digitaal bronnenmateriaal te vergroten
bronnen en publiek dichter bij elkaar te brengen
Met “open data” wordt bedoeld: gegevens die je vrij mag (her)gebruiken en verspreiden, zie DEN, http://www.den.nl/thema/134/
zullen er 30 onderwerpen worden vastgesteld waarvan op voorhand kan worden aangenomen dat hier een breed publiek voor is. Als startpunt gelden de onderwerpen, die zijn benoemd in het kader van de Canon van de Duitse bezetting in 2010. De lijst zal worden aangescherpt op basis van een inventarisatie van de specifieke behoeften onder de leden van de SMH 40-45 en het Collectieoverleg Oorlogsmusea, Nationaal Comité 4 en 5 mei en de Stichting Liberation Route Europe. Deze leden zullen ook worden geraadpleegd over de algemene selectiecriteria voor het bronnenmateriaal. Om praktische redenen zal er een mix worden gemaakt tussen materiaal dat eenvoudig open gedeeld kan worden en lastigere, maar inhoudelijk prominente bronnen.
David Barnouw, Geschiedenis van Nederland 1940-1945. De canon van de Duitse Bezetting (Zutphen 2010):
Het netwerk oorlogsbronnen is afgelopen zomer gestart om alle eenzame bronnen in Nederland te digitaliseren en digitaal samen te brengen op vier stam gegevens: wie/wat/waar/wanneer
In 1942 interneerden de Duitsers 460 vooraanstaande Nederlanders.
In 1940 namen de Duitsers een groot aantal Nederlanders in Gijzeling.
Het kamp is onder veel verschillende namen bekend waardoor iedere zoektocht verschillende resultaten oplevert…. En sommige objecten nooit gevonden worden…
Het kamp is onder veel verschillende namen bekend waardoor iedere zoektocht verschillende resultaten oplevert…. En sommige objecten nooit gevonden worden…