Een schitterend lexicon: DiaMaNT

Door Roland de Bonth

Wat is de overeenkomst tussen een adamant, een briljant en een juweel? Het antwoord op deze vraag is dat in het verleden diamant een synoniem was voor deze drie woorden. Kun je daar met één simpele zoekopdracht achterkomen? Jazeker, dat is mogelijk met DiaMaNT.

Wat is DiaMaNT?

Begin vorig jaar heeft het Instituut voor de Nederlandse Taal (INT) de webapplicatie DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) beschikbaar gesteld voor onderzoekers en andere belangstellenden. Dit lexicon bevat in totaal meer dan 300.000 synoniemen. Die synoniemen zijn afkomstig uit de definities van woordenboekartikelen uit het Middelnederlandsch Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT). Met de huidige versie van DiaMaNT is het mogelijk om van een woord uit de periode 1250-1976 synoniemen te vinden. In plaats van slager konden en kunnen bijvoorbeeld ook de woorden beenhouwerbeenhakker en vleeshouwer worden gebruikt.

Voorbeelden van het gebruik van DiaMaNT

DiaMaNT is beslist niet alleen interessant voor onderzoek door taalkundigen. Integendeel, alle geesteswetenschappers die bij hun onderzoek gebruik maken van historische teksten kunnen er hun voordeel mee doen. Met DiaMaNT kun je namelijk zoeken naar begrippen in historische teksten waarvoor je alleen een modern Nederlands woord kent. Ik zal dit laten zien aan de hand van twee voorbeelden.

De cultuurhistoricus die geïnteresseerd is in de haarmode van de achttiende eeuw – vroeger enigszins denigrerend aangeduid als de pruikentijd – vindt met het modern lemma kapsel, filter 1699-1799 en POS NOUN (= woordsoort zelfstandig naamwoord) als synoniemen het nog altijd bekende coiffure – aangetroffen in bronnen vanaf het midden van de achttiende eeuw – en het veel minder bekende hulsel – al voorkomend bij de zeventiende-eeuwse literatoren Bredero, Cats en Vondel, maar een eeuw later ook bij Le Francq van Berkhey. DiaMaNT kan er dus voor zorgen dat een onderzoeker meer (contemporaine) zoektermen tot zijn beschikking krijgt.

Een ander voorbeeld. Hoogleraar vroegmoderne Nederlandse letterkunde (1550-1800) Els Stronks deed enkele jaren geleden onderzoek naar het ontstaan van denkbeelden over jongeren in Nederlandse teksten geschreven tussen 1500 en 1800. Voor dat onderzoek werd de DBNL n-gramviewer ontwikkeld. In deze korte video benadrukt zij het belang van het kennen van de juiste termen om optimaal gebruik te kunnen maken van dit onderzoeksmiddel. Zo was Stronks geïnteresseerd in ‘jeugdige overmoed’. Volgens de n-gramviewer kwam het woord overmoed pas voor in de negentiende eeuw.

Maar het verschijnsel zelf is al vele eeuwen ouder. Vondel duidt het in de ondertitel van zijn toneelstuk Faetonbijvoorbeeld aan als reuckeloze [‘roekeloze’] stoutheit. Met DiaMaNT is het een fluitje van een cent om synoniemen voor overmoed te vinden. In de door Stronks onderzochte periode zijn daarvoor de volgende woorden in gebruik geweest: alwaardigheidbehagelheiddartelheidgroenigheidhoogmoedhovaardijhovaartkoenheidonbescheidoverdaadoverdwaalsheidoverwanigheidpreutsheidvermetelheidvermetenheidwrevelmoedwulpsheid. Deze termen kunnen een aanknopingspunt vormen voor nader onderzoek in andere teksten. 

Aandachtspunten

Zoals gezegd is dit de eerste versie van DiaMaNT. De komende tijd zal er nog volop gewerkt worden aan het verfijnen van de applicatie. Bij homoniemen is nu nog voorzichtigheid geboden. Voeren we bijvoorbeeld bij een onderzoek naar onze trouwe viervoeter als modern lemma hond in, dan vinden we vier lemmata waarvoor hond een synoniem is: hondkefferkorre en reu. Bij elk van die vier woorden staat in de betekenisomschrijving dus het woord hond. Scrollen we vervolgens omlaag, dan komen we vijf andere woorden tegen waarvoor hond een synoniem is: tonbooswichtellendelingbeest en dier. In deze opsomming is ton de vreemde eend in de bijt. De inhoudsmaat ton verwijst namelijk naar een oude lands- en inhoudsmaat (origineel lemma honti (MNW) en hondII (WNT)) en niet naar het door ons gewenste huisdier (hontii (MNW) en hondI (WNT)). Op termijn moet dit opgelost worden door aan DiaMaNT een laag van overkoepelende begrippen toe te voegen, waardoor er een koppeling op betekenisniveau is tussen de verschillende woorden.

De synoniemen uit de definities van het Middelnederlandsch Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT) zijn automatisch opgespoord. Dit leverde een resultaat op met een nauwkeurigheid van rond de 80%. Vervolgens zijn deze resultaten handmatig gecorrigeerd. Voor het MNW zijn alle definities nagelopen, om alle aanwezige synoniemen eruit te halen. Voor het WNT zijn alleen de betekenissen nagelopen met een automatisch gedetecteerd synoniem. Daarom kan het gebeuren dat het modern lemma haarwrong in DiaMaNT twee treffers oplevert: boreel en chapeel, beide uit het MNW. Maar in de online Historische Woordenboeken vind je met haarwrong bij ‘Woord in betekenis’ als zoekterm daarnaast – uit het WNT – nog chignonkluitkondee en tuit.

Verder is het belangrijk er rekening mee te houden dat deze versie van DiaMaNT gebaseerd is op de definities en betekenisomschrijvingen die in de woordenboeken zijn gegeven. Als een bepaald synoniem daarbij niet wordt genoemd, zal DiaMaNT deze relatie niet kunnen leggen. Zo wordt bij vorstin het voor de hand liggende koningin niet genoemd, simpelweg omdat het woord koningin ontbreekt in de omschrijving. Overigens geldt het omgekeerde ook: bij koningin is de vorstin de grote afwezige. Ook dit probleem kan worden opgelost door consequent een laag van overkoepelende begrippen toe te voegen.

Tot slot

Het belangrijkste doel van dit lexicon is het verbeteren van de toegankelijkheid van historische teksten voor een verscheidenheid aan geesteswetenschappers (taalkundigen, letterkundigen, historici, cultuurwetenschappers) en het bevorderen van onderzoek in de ontwikkeling van begrippen. Maar eigenlijk is DiaMaNT voor iedereen om te grasduinen in de woordenschat van de Nederlandse taal. Hoeveel synoniemen zouden er bijvoorbeeld zijn voor liefde? En zouden dat er meer of minder zijn dan voor haat

DiaMaNT is in de huidige vorm beslist geen onbewerkte steen meer, maar werkelijk stralen zal ze pas als het slijpproces volledig is afgerond.

Verder lezenVoor de achtergronden technische details van DiaMaNT zie Katrien Depuydt & Jesse de Does, ‘DiaMaNT, een diachroon semantisch van de Nederlandse Taal’. In: DIXIT, tijdschrift over taal- en spraaktechnologie, jaargang 17, december 2020, pp. 27-30. 

Hoe zoek je in DiaMaNT?

Zoeken in DiaMaNT is zeer eenvoudig. Vul in de zoekbox ‘Modern lemma’ een woord in – bijvoorbeeld hond – en druk op Enter of klik op de knop Search. 

Views

Er zijn drie manieren waarop de resultaten van een zoekopdracht zichtbaar kunnen worden gemaakt. Deze drie opties kunnen naar believen aan- en uitgevinkt onder het kopje Views.

Show temporal overview

In de standaardinstelling van DiaMaNT wordt als resultaat van de zoekopdracht een temporal overviewgetoond met op de horizontale as een tijdlijn van 1200 tot 2020 en op de verticale as in alfabetische volgorde een overzicht van de lemmata waarin hond wordt genoemd in de betekenisomschrijvingen van het MNW en WNT (Lemmas for which hond is a synonym). 

Voor het modern lemma hond dat wij als voorbeeld hebben genomen, levert dat vier treffers op: hond (MNW), keffer (WNT), korre (WNT), reu (MNW). Op het eerste gezicht lijkt het laatste woord niet in dit rijtje te passen. Voor de hedendaagse gebruiker is een reu immers specifiek een mannetjeshond, als antoniem van teef. Maar wie in de Results list kijkt naar de betekenisomschrijving (Meaning) ziet dat in het Middelnederlands reu ook in gebruik was als benaming voor grote hond in het algemeen. 

Door vervolgens op de link Go to dictionary entry te drukken kom je in een nieuw scherm terecht bij het betreffende lemma in de online Historische woordenboeken. De betekenisomschrijving waarin het synoniem gevonden is, heeft een zwart kader; hier zijn ook de (gedateerde) citaten te vinden die bij deze betekenis horen. Zo blijkt korre in de betekenis ‘hond’ alleen voor te komen in het woordenboek van de 16e-eeuwse lexicograaf Kiliaan.

Daarnaast levert hond als zoekterm ook treffers op van woorden waarin het moderne lemma in een specifieke betekenis voorkomt. Zo is hond in het MNW – te weten hont – een inhoudsmaat en daarmee een synoniem voor ton. En bij het lemma hont blijkt dat het woord hond ook als scheldwoord wordt gebruikt voor booswicht of ellendeling.

Show citations

Standaard worden in de resultatenlijst van DiaMaNT ook citations getoond, eigenlijk de periodes waarin citaten met de synoniemen zijn aangetroffen. Deze enigszins ruwe periodeaanduiding wordt nader visueel uitgewerkt in de Citations per year

De frequentie van het aantal citaten is ook zichtbaar gemaakt in de kleur van de blokjes in het Temporal overview. Hoe donkerder het blauw is, des te meer attestaties er aangetroffen zijn. Door met de muis over deze blokjes te bewegen, wordt per periode van 50 jaar informatie verkregen over het aantal citaten.

Show network graph

Een bijzonder fraaie manier om de synoniemen van een zoekterm zichtbaar te maken geeft show networkgraph. Door deze optie aan te vinken wordt een graaf geproduceerd, dat is een visuele representatie van gegevens waarbij gebruik gemaakt wordt van knooppunten en onderlinge verbindingen. Door te draaien aan het scrollwiel van de muis kan de graaf vergroot of verkleind worden. 

Het is mogelijk te navigeren in de graaf door te klikken op een synonieme definitie (lichtblauw knooppunt) of op een betekenis (oranje knooppunt), die als pop-up getoond wordt wanneer de muis op het oranje knooppunt of net ernaast woord geplaatst wordt. 

Als er veel synoniemen zijn, kan het enige tijd duren voordat de graaf zich gevormd heeft. Daarom kun je er ook voor kiezen een lichtere versie van deze visualisatie te laden. Het belangrijkste verschil met de oorspronkelijke graaf is dat de woorden en verbindingslijnen meer overlap vertonen. Door de optie Lightweight graph visualization aan te klikken verdwijnt de originele graaf. Na een druk op de knop Search verschijnt vervolgens een visueel iets minder geoptimaliseerde versie van de graaf. 

Verfijnen van de zoekmogelijkheden

Er zijn twee manieren om een zoekopdracht te verfijnen. Ten eerste is er de mogelijkheid die temporeel te begrenzen. Door de blauwe bolletjes op de schuifbalk bij Date naar links of rechts te verplaatsen kan een specifieke periode worden gekozen waarin gezocht moet worden. Ten tweede is het mogelijk om de woordsoort (POS, part of speech) van het modern lemma aan te geven. Wie onderzoek doet naar voornaamwoorden in het Middelnederlands kan dan aangeven dat hij wil zoeken in de periode 1200-1499 en dat zijn als woordsoortaanduiding voornaamwoord (PRON) moet hebben en niet werkwoord (VERB). Deze zoekactie levert overigens twee keer het moderne lemma zijn op, waarbij respectievelijk de woordenboekingangen si en sijnII horen. Hieronder volgt een lijst van de woordsoorten die in DiaMaNT worden onderscheiden. 

Woordsoortenoverzicht

  • ALL
  • ADJ (adjective; bijvoeglijk naamwoord)
  • ADP (adposition; prepositie (voorzetsel) en postpositie (achterzetsel)
  • ADV (adverb; bijwoord)
  • AUX (auxiliary; hulpwerkwoord)
  • CCONJ (coordinating conjunction; nevenschikkend voegwoord)
  • DET (determiner; determinator, bijvoorbeeld lidwoord)
  • INT (interjection; tussenwerpsel)
  • NOUN (noun; zelfstandig naamwoord)
  • NUM (numeral; telwoord)
  • PART (participle; deelwoord)
  • PRON (pronoun; voornaamwoord)
  • PROPN (proper noun; eigennaam)
  • PUNCT (punctuation; interpunctie) 
  • SCONJ (subordinating conjunction; onderschikkend voegwoord)
  • SYM (sym, symbool)
  • VERB (verb; zelfstandig en koppelwerkwoord)
  • X

External links

Bij de meeste zoektermen zullen de resultaten bestaan uit Lemmas for which [zoekterm] is a synonym of. In enkele gevallen levert de zoekopdracht ook External links op. Voor het modern lemma domoor is dikkop een van de lemmata die daarmee als synoniem worden aangeduid: “In toepassing op personen, in oneigenlijken zin: dwarskop, dwarsdrijver, daarnaast ook: domoor.” (WNT, s.v. DIKKOP). Het woord dikkop wordt echter ook gebruikt als benaming voor dieren met als uiterlijk kenmerk een groot hoofd – denk aan de larve van kikkers. Het is dikkop in deze specifieke betekenis die zorgt voor een verwijzing naar het Nederlands Soortenregister

Afbeelding: “Diamond Age” by jurvetson is licensed under CC BY 2.0