• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Open dialectendata

13 mei 2013 door Redactie Neder-L Reageer

Door Nicoline van der Sijs
Rond 1900 groef de Engelse archeoloog Sir Arthur Evans bij Knossos op Kreta kleitabletten op met teksten in twee onbekende schriften, die hij Lineair A en B noemde. Toen het hem niet lukte Lineair B te ontcijferen, hield hij de kleitabletten moedwillig weg van andere onderzoekers. Pas tien jaar na zijn dood ontcijferde Michael Ventris het schrift, nadat hij had bewezen dat de teksten Grieks waren.
De Münchense onderzoekster Annelies Kammenhuber hamsterde decennialang kleitabletten met teksten in Hettitisch spijkerschrift, nadat zij rond 1965 was begonnen aan een uitgebreid woordenboek van het Hettitisch: een taal die van 1700 tot 1200 voor Chr. werd gesproken in Turkije en die een verre verwant is van de Germaanse talen.
Erg opschieten deed het woordenboek niet: bij haar dood in 1995 was zij gevorderd tot de G. Ondertussen was het materiaal al die tijd onbereikbaar voor haar Engelse collega’s. Die schermden op hun beurt hun Hettitische teksten in hiërogliefenschrift voor de Duitse onderzoekers af.
Dit zijn slechts een paar van de vele verhalen over geesteswetenschappers die hun gegevens weghielden van anderen.

Evans en Kammenhuber zijn nog positieve uitzonderingen omdat ze daadwerkelijk over hun onderwerp publiceerden. Er zijn ook verzamelaars die het stadium van verzamelen niet overstijgen. Een notoir voorbeeld is de Vlaming Jef Sprankenis, die zich beschouwde als dé kenner van Jacob Israël de Haan. Tot zijn dood begin deze eeuw verstopte hij jarenlang boeken en tijdschriften over De Haan in zijn kamertje in de  Amsterdamse universiteitsbibliotheek.

Over dergelijke hamsterwoedes werd vroeger wel geroddeld, maar veel meer konden onderzoekers er niet aan doen. Tegenwoordig ligt dat anders: de academische wereld stelt steeds meer regels op om te garanderen dat data toegankelijk zijn of komen voor andere onderzoekers. Zo pleit de Koninklijke Nederlandse Akademie van Wetenschappen in het vorig jaar verschenen advies Zorgvuldigenintegeromgaanmetwetenschappelijkeonderzoeksgegevensvoor vrije toegang tot wetenschappelijk materiaal, dus open data.
In de geesteswetenschappen blijven gegevens lange tijd waardevol. Dit in tegenstelling tot veel bètaonderzoek: daar zijn resultaten vaak bouwstenen waarop onmiddellijk wordt voortgebouwd, waardoor onderzoekers niet meer teruggrijpen naar oorspronkelijke gegevens. In de geesteswetenschappen gaat het vaker over nieuwe interpretaties van oude gegevens. Geesteswetenschappers hoef je niet te vertellen dat ze dwergen zijn op de schouders van reuzen.
Die wijsheid uit de twaalfde eeuw is actueler dan ooit. In deze digitale tijd wordt het voortbouwen op eerder onderzoek steeds gemakkelijker. Grote hoeveelheden oude en nieuwe gegevens kunnen semi-automatisch aan elkaar worden gekoppeld. Juist deze aanpak zal leiden tot allerlei nieuwe vondsten en inzichten binnen de geesteswetenschappen. Een concreet voorbeeld hiervan, waaraan we momenteel hard werken, is de inrichting van een elektronische Woordenbank van de Nederlandse Dialecten.
In de loop van de tijd zijn er veel woordenboeken van Nederlandse dialecten gepubliceerd. Die dialectwoordenboeken zijn vervaardigd door professionele dialectlexicografen en amateurs, en ze beschrijven de woordenschat van een enkele plaats, zoals Weerts, of van grotere gebieden, zoals het Limburgs, Brabants, Vlaams of Overijssels. De gegevens van deze woordenboeken zijn – laat ik het voorzichtig zeggen – niet optimaal toegankelijk. Als er digitale bestanden van bestaan, zwerven die meestal bij particulieren. De oudere gedrukte woordenboeken, daterend vanaf begin 19e eeuw, liggen in bibliotheken te verstoffen.
Onze kennis van de Nederlandse dialecten, en de veranderingen die deze sinds de 19e eeuw hebben doorgemaakt, zal sterk toenemen als we alle beschikbare gegevens uit de dialectwoordenboeken aan elkaar koppelen: op die manier ontstaat een compleet nieuw onderzoeksinstrumentarium voor dialectonderzoek. Om dit te verwezenlijken heb ik vorig jaar aan de Nederlandse dialectlexicografen en streektaalfunctionarissen gevraagd of ze hun digitale dialectwoordenboeken aan het Meertens Instituut willen overdragen. Vlaamse en Friese collega’s verzamelen de woordenboekbestanden uit hun taalgebied. Vrijwilligers zijn inmiddels begonnen met het corrigeren van gescande oudere dialectwoordenboeken en het overtikken van manuscripten. De Data Curation Service van de Radboud Universiteit Nijmegen (bekostigd door het nationale infrastructuurprogramma CLARIN) zal straks alle digitale bestanden omzetten naar een eenvormig computerformaat.
Om de verschillende dialectwoordenboeken aan elkaar te kunnen koppelen, worden ze verrijkt met extra gegevens: vrijwilligers en studenten voegen aan alle dialecttrefwoorden de Standaardnederlandse vormen toe. De Standaardnederlandse vorm kan dienen als input voor karteringssoftware. Die software tekent automatisch kaarten met de verbreiding van woorden, klanken, vervoegingen en verbuigingen over het Nederlandse taalgebied. Dat zal veel nieuwe inzichten opleveren. Veel dialectsprekers menen bijvoorbeeld dat in hun dialect unieke woorden of uitdrukkingen voorkomen – of dat waar is, zal nu aan het licht komen, en ik voorzie veel lange gezichten… Ook kan uit de kaarten blijken hoe de verbreiding van een dialectverschijnsel in de loop van de tijd is veranderd.
Het aan elkaar verbinden van zoveel mogelijk dialectwoorden biedt nog veel meer spannende mogelijkheden. Dat zal in de toekomst blijken, als de elektronische Woordenbank van de Nederlandse Dialecten is gelanceerd. Vooruitlopend daarop vraag ik lezers van deze krant die een digitaal dialectwoordenboek of ongepubliceerd manuscript op de plank hebben liggen, dit naar me op te sturen, zodat het opgenomen kan worden in het grote net van open dialectdata.

Deze column verscheen op zaterdag 11 mei jl. in NRC Handelsblad.

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: dialecten, dialectologie, Gastcolumns, lexicografie, sociolinguïstiek, woordenboeken

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Liesbeth D’Hoker • sneeuwdroom

we gronden ons in rituelen,
articuleren in voorbedachte
klank, planten hart in woord,
langs uitgesleten wegen
kiemt honger stil als huid

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

Als vlindervleugels trilt onder de regen
het donkergroene wateroppervlak.
De mensen zonderen zich op de wegen
snel af, chinees onder hun regendak.

Bron: datering: 1948-1955; Tijdrovertje, postuum gepubliceerd, 1992

➔ Bekijk hier alle citaten

Agenda

Vanaf 28 november 2025: De Sint-Nikolaasavond

Vanaf 28 november 2025: De Sint-Nikolaasavond

22 september 2025

➔ Lees meer
26 september 2025: Avond van de Talen

26 september 2025: Avond van de Talen

21 september 2025

➔ Lees meer
7 november 2025: Studiedag meertalige leesbevordering

7 november 2025: Studiedag meertalige leesbevordering

20 september 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1911 Henk Wage
sterfdag
1778 Balthazar Huydecoper
➔ Neerlandicikalender

Media

Daan Heerma van Voss: Heute kein Abschied

Daan Heerma van Voss: Heute kein Abschied

21 september 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De stem van Jeroen Mettes 2 – Een tekst terugbrengen tot de auteur, een buitengewoon treurige exercitie

De stem van Jeroen Mettes 2 – Een tekst terugbrengen tot de auteur, een buitengewoon treurige exercitie

19 september 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
De stem van Jeroen Mettes 1 – Ik zou soms willen dat hij een bouwvakker was geweest

De stem van Jeroen Mettes 1 – Ik zou soms willen dat hij een bouwvakker was geweest

17 september 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d