SlideShare une entreprise Scribd logo
1  sur  23
Nederlab
Een laboratorium voor onderzoek naar de
veranderingspatronen in de Nederlandse
taal en cultuur
3,2 miljoen subsidie van NWO-groot, KNAW, CLARIN, CLARIAH
Prof. dr. Nicoline van der Sijs, projectleider Nederlab
Radboud universiteit Nijmegen / Meertens Instituut, Amsterdam
Doel
Inrichting van een gebruikersvriendelijke
webinterface van waaruit geesteswetenschappers
alle bestaande digitale historische teksten van
wetenschappelijke bibliotheken vanuit één portaal
kunnen doorzoeken en analyseren.
Onderzoek
Taal, cultuur en letterkunde veranderen
voortdurend
Geesteswetenschappers willen traceren welke
veranderingen er hebben plaatsgevonden, en of
daarin patronen en wetmatigheden zijn te
onderkennen.
Onderzoek
Achterhalen welke interactie er bestaat tussen
veranderingen in de maatschappij en die in de
cultuur, letteren en taal.
Onderzoek
Taalcontact is een drijvende kracht achter
taalveranderingen
De Nederlandse taal is beïnvloed door de talen van
nieuwkomers, maar tot nu toe was systematisch
onderzoek naar de gevolgen van taalcontact onmogelijk
Historische teksten
belangrijkste onderzoeksobject historische
geesteswetenschappen = de neerslag van
de Nederlandse taal en cultuur
Het gedrukte erfgoed
in het Nederlands, 1000-2000
(schatting)
Van Middeleeuwen tot 1800: 200 000 000 pag.
19e eeuw 100 000 000 pag.
20e eeuw 200 000 000 pag.
------------------- +
500 000 000 pag.
Wat is gedigitaliseerd?
(schatting)
Van Middeleeuwen tot 1800: 200 000 000 pag. (10%)
19e eeuw 100 000 000 pag. (25%)
20e eeuw 200 000 000 pag. (15%)
------------------- +
500 000 000 pag. (15%)
Dus: hoewel relatief weinig digitaal:
nieuwe onderzoeksmethode
e-humanities of digitale geesteswetenschappen
Nederlab
Backbone zijn de metadata: auteursgegevens en
titelgegevens
- Diachroon perspectief: teksten van 800 tot heden
- Geografisch perspectief: teksten gelokaliseerd
Zoeken in data en metadata
Spellingvarianten regering
13
kwantitatieve vergelijkingen
Visualisering van resultaten
Subcorpora automatisch vergelijken
Voor taalcontactonderzoek:
de inhoud van kranten uit Nederland en Indië vergelijken
1. Nieuwe woorden detecteren, die in Indië zijn
ontstaan of daar een specifieke betekenis gekregen:
breidel haatzaaien
ontvang-avonden vervaldagen
pandgoederen postsluiting(en)
voorkinderen scheepsberichten
sluitdagen spreekdagen
vendulocaal vendutie(n)
2. Grammaticale bijzonderheden automatisch
detecteren:
• vereenvoudigingen grammaticale regels: lidwoord de bij onzijdige
zelfstandige naamwoorden:
de gordijn, de karwei, vergelijk Marokkaans-Nederlands de mooie meisje
• onregelmatige verleden tijd van sterke werkwoorden wordt regelmatig
(zwak):
blijkte, draagde, buigde, meette, helpte
Toekomst
Door systematisch onderzoek naar taalcontact door
de eeuwen heen achterhalen:
- De gevolgen van taalcontact voor de Nederlandse taal
- De wetmatigheden van taalcontact
- De voorwaarden voor blijvende taalveranderingen
Toekomst
Gegevens over taalveranderingen koppelen aan databases
met gegevens over sociaal-economische status van
(im)migranten en hun status
Hypothese: taalverschijnselen van sprekers met hoge status
worden eerder overgenomen (Franse leenwoorden,
Surinaams-Nederlands onder jongeren)
Voorwaarde
Gedigitaliseerde teksten in betrouwbare
transcriptie (dus niet ongecorrigeerde ocr)
Taak voor archivarissen:
1. selectie van relevante teksten en handschriften
2. waarborgen van kwaliteit van metadata en data
Nederlab
Loop van 2014: lancering
http://www.nederlab.nl/onderzoeksportaal/
st
Nicoline van der Sijs
post@nicolinevdsijs.nl

Contenu connexe

Similaire à Nederlab (10)

Let's do the turtle
Let's do the turtleLet's do the turtle
Let's do the turtle
 
Let's do the turtle
Let's do the turtleLet's do the turtle
Let's do the turtle
 
Auto ingest demo-werklunch 2013-11-05
Auto ingest demo-werklunch 2013-11-05Auto ingest demo-werklunch 2013-11-05
Auto ingest demo-werklunch 2013-11-05
 
'Digital Scholarship in the Humanities' met Artes (KU Leuven) - Tom Willaert
 'Digital Scholarship in the Humanities' met Artes (KU Leuven) - Tom Willaert 'Digital Scholarship in the Humanities' met Artes (KU Leuven) - Tom Willaert
'Digital Scholarship in the Humanities' met Artes (KU Leuven) - Tom Willaert
 
Im Tagging It
Im Tagging ItIm Tagging It
Im Tagging It
 
MASLA project overview (5-5-2008)
MASLA project overview (5-5-2008)MASLA project overview (5-5-2008)
MASLA project overview (5-5-2008)
 
Webarchief & Wetenschap (Dutch)
Webarchief & Wetenschap (Dutch)Webarchief & Wetenschap (Dutch)
Webarchief & Wetenschap (Dutch)
 
Biebsearch Bibliotheek En School 121109
Biebsearch Bibliotheek En School 121109Biebsearch Bibliotheek En School 121109
Biebsearch Bibliotheek En School 121109
 
16 depuydt inl
16 depuydt inl16 depuydt inl
16 depuydt inl
 
VIAA SoTA wetenschappelijk onderzoek
VIAA SoTA wetenschappelijk onderzoekVIAA SoTA wetenschappelijk onderzoek
VIAA SoTA wetenschappelijk onderzoek
 

Plus de KVANdagen

Jonge documenten aan hun lot overgelaten
Jonge documenten aan hun lot overgelatenJonge documenten aan hun lot overgelaten
Jonge documenten aan hun lot overgelatenKVANdagen
 
Erfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieErfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieKVANdagen
 
De kracht van open data
De kracht van open dataDe kracht van open data
De kracht van open dataKVANdagen
 
Workshop persoonlijk leiderschap: zelfkennis is kracht
Workshop persoonlijk leiderschap: zelfkennis is krachtWorkshop persoonlijk leiderschap: zelfkennis is kracht
Workshop persoonlijk leiderschap: zelfkennis is krachtKVANdagen
 
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?KVANdagen
 
Kracht van archieven de noordelijke lustwarande als resultaat van een nieuw...
Kracht van archieven   de noordelijke lustwarande als resultaat van een nieuw...Kracht van archieven   de noordelijke lustwarande als resultaat van een nieuw...
Kracht van archieven de noordelijke lustwarande als resultaat van een nieuw...KVANdagen
 
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...KVANdagen
 
The voice in the wilderness? Archivists, their knowledge and the public
The voice in the wilderness? Archivists, their knowledge and the public The voice in the wilderness? Archivists, their knowledge and the public
The voice in the wilderness? Archivists, their knowledge and the public KVANdagen
 
Praktische linked data voor archieven
Praktische linked data voor archievenPraktische linked data voor archieven
Praktische linked data voor archievenKVANdagen
 
Werken aan je toekomst
Werken aan je toekomstWerken aan je toekomst
Werken aan je toekomstKVANdagen
 
Big data x big archives = great opportunities
Big data x big archives = great opportunitiesBig data x big archives = great opportunities
Big data x big archives = great opportunitiesKVANdagen
 
Informatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthInformatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthKVANdagen
 
Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?KVANdagen
 
The Big Picture
The Big PictureThe Big Picture
The Big PictureKVANdagen
 
Rhc eindhoven&promines
Rhc eindhoven&prominesRhc eindhoven&promines
Rhc eindhoven&prominesKVANdagen
 
Kvan dagen 2014 nha
Kvan dagen 2014 nhaKvan dagen 2014 nha
Kvan dagen 2014 nhaKVANdagen
 
Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2KVANdagen
 
Big Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceBig Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceKVANdagen
 
20140617 kvan def
20140617 kvan def20140617 kvan def
20140617 kvan defKVANdagen
 

Plus de KVANdagen (20)

Jonge documenten aan hun lot overgelaten
Jonge documenten aan hun lot overgelatenJonge documenten aan hun lot overgelaten
Jonge documenten aan hun lot overgelaten
 
Erfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieErfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectie
 
De kracht van open data
De kracht van open dataDe kracht van open data
De kracht van open data
 
Workshop persoonlijk leiderschap: zelfkennis is kracht
Workshop persoonlijk leiderschap: zelfkennis is krachtWorkshop persoonlijk leiderschap: zelfkennis is kracht
Workshop persoonlijk leiderschap: zelfkennis is kracht
 
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?
Eerste hulp bij informatievrijheid- hoe informatievrij ben jij?
 
Kracht van archieven de noordelijke lustwarande als resultaat van een nieuw...
Kracht van archieven   de noordelijke lustwarande als resultaat van een nieuw...Kracht van archieven   de noordelijke lustwarande als resultaat van een nieuw...
Kracht van archieven de noordelijke lustwarande als resultaat van een nieuw...
 
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...
Het hobbelige pad naar duurzame toegankelijkheid van Vlaamse digitale overhei...
 
The voice in the wilderness? Archivists, their knowledge and the public
The voice in the wilderness? Archivists, their knowledge and the public The voice in the wilderness? Archivists, their knowledge and the public
The voice in the wilderness? Archivists, their knowledge and the public
 
Praktische linked data voor archieven
Praktische linked data voor archievenPraktische linked data voor archieven
Praktische linked data voor archieven
 
Werken aan je toekomst
Werken aan je toekomstWerken aan je toekomst
Werken aan je toekomst
 
Big data x big archives = great opportunities
Big data x big archives = great opportunitiesBig data x big archives = great opportunities
Big data x big archives = great opportunities
 
Informatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthInformatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinth
 
Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?
 
The Big Picture
The Big PictureThe Big Picture
The Big Picture
 
Rhc eindhoven&promines
Rhc eindhoven&prominesRhc eindhoven&promines
Rhc eindhoven&promines
 
Kvan dagen 2014 nha
Kvan dagen 2014 nhaKvan dagen 2014 nha
Kvan dagen 2014 nha
 
Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2
 
Big Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceBig Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest Difference
 
APEx
APExAPEx
APEx
 
20140617 kvan def
20140617 kvan def20140617 kvan def
20140617 kvan def
 

Nederlab

  • 1. Nederlab Een laboratorium voor onderzoek naar de veranderingspatronen in de Nederlandse taal en cultuur 3,2 miljoen subsidie van NWO-groot, KNAW, CLARIN, CLARIAH Prof. dr. Nicoline van der Sijs, projectleider Nederlab Radboud universiteit Nijmegen / Meertens Instituut, Amsterdam
  • 2. Doel Inrichting van een gebruikersvriendelijke webinterface van waaruit geesteswetenschappers alle bestaande digitale historische teksten van wetenschappelijke bibliotheken vanuit één portaal kunnen doorzoeken en analyseren.
  • 3. Onderzoek Taal, cultuur en letterkunde veranderen voortdurend Geesteswetenschappers willen traceren welke veranderingen er hebben plaatsgevonden, en of daarin patronen en wetmatigheden zijn te onderkennen.
  • 4. Onderzoek Achterhalen welke interactie er bestaat tussen veranderingen in de maatschappij en die in de cultuur, letteren en taal.
  • 5. Onderzoek Taalcontact is een drijvende kracht achter taalveranderingen De Nederlandse taal is beïnvloed door de talen van nieuwkomers, maar tot nu toe was systematisch onderzoek naar de gevolgen van taalcontact onmogelijk
  • 6. Historische teksten belangrijkste onderzoeksobject historische geesteswetenschappen = de neerslag van de Nederlandse taal en cultuur
  • 7. Het gedrukte erfgoed in het Nederlands, 1000-2000 (schatting) Van Middeleeuwen tot 1800: 200 000 000 pag. 19e eeuw 100 000 000 pag. 20e eeuw 200 000 000 pag. ------------------- + 500 000 000 pag.
  • 8. Wat is gedigitaliseerd? (schatting) Van Middeleeuwen tot 1800: 200 000 000 pag. (10%) 19e eeuw 100 000 000 pag. (25%) 20e eeuw 200 000 000 pag. (15%) ------------------- + 500 000 000 pag. (15%)
  • 9. Dus: hoewel relatief weinig digitaal: nieuwe onderzoeksmethode e-humanities of digitale geesteswetenschappen
  • 10. Nederlab Backbone zijn de metadata: auteursgegevens en titelgegevens - Diachroon perspectief: teksten van 800 tot heden - Geografisch perspectief: teksten gelokaliseerd
  • 11.
  • 12. Zoeken in data en metadata
  • 16. Subcorpora automatisch vergelijken Voor taalcontactonderzoek: de inhoud van kranten uit Nederland en Indië vergelijken
  • 17. 1. Nieuwe woorden detecteren, die in Indië zijn ontstaan of daar een specifieke betekenis gekregen: breidel haatzaaien ontvang-avonden vervaldagen pandgoederen postsluiting(en) voorkinderen scheepsberichten sluitdagen spreekdagen vendulocaal vendutie(n)
  • 18. 2. Grammaticale bijzonderheden automatisch detecteren: • vereenvoudigingen grammaticale regels: lidwoord de bij onzijdige zelfstandige naamwoorden: de gordijn, de karwei, vergelijk Marokkaans-Nederlands de mooie meisje • onregelmatige verleden tijd van sterke werkwoorden wordt regelmatig (zwak): blijkte, draagde, buigde, meette, helpte
  • 19. Toekomst Door systematisch onderzoek naar taalcontact door de eeuwen heen achterhalen: - De gevolgen van taalcontact voor de Nederlandse taal - De wetmatigheden van taalcontact - De voorwaarden voor blijvende taalveranderingen
  • 20. Toekomst Gegevens over taalveranderingen koppelen aan databases met gegevens over sociaal-economische status van (im)migranten en hun status Hypothese: taalverschijnselen van sprekers met hoge status worden eerder overgenomen (Franse leenwoorden, Surinaams-Nederlands onder jongeren)
  • 21. Voorwaarde Gedigitaliseerde teksten in betrouwbare transcriptie (dus niet ongecorrigeerde ocr) Taak voor archivarissen: 1. selectie van relevante teksten en handschriften 2. waarborgen van kwaliteit van metadata en data
  • 22. Nederlab Loop van 2014: lancering http://www.nederlab.nl/onderzoeksportaal/
  • 23. st Nicoline van der Sijs post@nicolinevdsijs.nl