Hoeveel Nederlands hebben we al gebruikt?

Onverwachte taalvragen in de Nationale Wetenschapsagenda (2)

Door Marc van Oostendorp

 

Er zijn voor een taalkundige soms verrassende vragen ingediend bij de Nationale Wetenschapsagenda. Zoals:

  • Hoeveel Nederlands hebben we al gebruikt? ‘Banket’ en ‘stoet’ zijn Nederlandse woorden, ‘stulika’ en ‘oproom’ zijn (waarschijnlijk) geen Nederlandse woorden, maar zouden het kunnen zijn, ‘hglsko’ en ‘salptjr’ kunnen geen Nederlandse woorden zijn. Hoeveel van het potentieel hebben we gebruikt, en verschilt het Nederlands daarin van andere talen?

Het antwoord op die vraag valt wel bij benadering te geven.
We moeten daarvoor eerst even aannemen dat ‘het Nederlands’ (hier wordt duidelijk bedoeld: de Nederlandse woordenschat) een eindige omvang heeft. We moeten dan dus afzien van hottentottententententoonstelling-achtige woorden.

Drie stukjes

Laten we ons beperken tot die woorden waarin we geen onderdelen meer kunnen herkennen die zelf ook weer woorden zijn (zoals tent of stel). De volgende vraag is dan: hoe lang kan zo’n woord zijn. Encyclopedie heeft vijf lettergrepen en er is geen reden om aan te nemen dat er geen woorden zouden kunnen zijn met honderd, of duizend lettergrepen, ook al bestaan die (nog) niet. Hier hebben we dus alweer snel een bron van oneindigheid te pakken, maar laten we voor het gemak het maximale aantal lettergrepen op 7 stellen.

Nu wordt de vraag dus: hoeveel verschillende lettergrepen zijn er? We delen daarvoor de lettergreep op in drie stukjes:

  • Voor de klinker kunnen staan (we tellen alleen klanken): p, t, k, b, d, f, s, ch, v, z, g, m, n, l, r, j, w, pr, tr, kr, br, dr, fr, chr, vr, gr, pl, kl, kw, tw, bl, fl, sl, chl, vl, zl, gl, pn, kn, sp, st, sch, sm, sn, sl, sj, spr, str, schr, spl (50 mogelijkheden)
  • Het Nederlands heeft de volgende klinkers: aa, ee, eu, oo, ie, uu, oe, a, e, u, o, i, stomme e, ei, ui, au (16 mogelijkheden)
  • Na die klinkers kunnen de volgende medeklinkers staan: p, t, k, s, ch, m, n, l, r, j, w, mp, lp, rp, nt, lt, rt, nk, lk, rk, mf, lf, rf, ns, ls, rs, rch, lch, cht, ng, ngst (31 mogelijkheden)

Struil

Dat geeft dus 50x16x31 = 24.800 mogelijkheden. Dit is een wat grove schatting want enerzijds kunnen bijvoorbeeld niet alle klinkers met alle mogelijke (combinaties) van slotmedeklinkers worden samengevoegd, en anderzijds kunnen slotlettergrepen meer dan andere lettergrepen. Maar het betekent dat er ongeveer 2000.000.000.000.000.000.000.000.000.000 mogelijke ongelede zevenlettergrepige woorden zijn.

Maar hoeveel van dat potentieel hebben we eigenlijk gebruikt? We hebben waarschijnlijk wel veel verschillende ongelede woorden, in ieder geval als we allerlei technische en wetenschappelijke termen gaan meetellen, maar daarmee bezetten we toch maar een klein deel van de totale mogelijke ruimte.

Dat komt doordat we tegelijkertijd allerlei woorden hebben die ambigu zijn, zoals bank: in plaats dat we die term reserveren voor het zitmeubel en de financiële instelling een ander deel van de ruimte laten bezetten (struil), kiezen we er kennelijk voor om in plaats daarvan een al bestaand deel te gebruiken.

Wonderlijk

Dit is een curieuze eigenschap die het Nederlands deelt met andere talen: de ruimte wordt helemaal niet gebruikt, ook al lijkt hij eigenlijk nodig. In plaats dat er steeds meer ruimte wordt gebruikt, wordt de gebruikte ruimte juist kleiner. Volgens sommige tellingen gebruikte het Chinees zo’n duizend jaar geleden ongeveer 3100 verschillende lettergrepen, en nu nog maar 1300. Woorden hebben kennelijk de neiging op elkaar te lijken.

De reden waarom taalkundigen zich niet met de vraag aan de Wetenschapsagenda bezighouden is dat hij op zich nergens toe leidt. Taalkundigen willen niet allerlei feitjes over taal weten, maar weten hoe taal in de hersenen of in de maatschappij werkt, hoe taal zich in het verleden ontwikkeld heeft, hoe je een computer taal zou kunnen leren, niet ‘hoeveel Nederlands we hebben gebruikt’. Maar in dit geval zit er onder die simpele vraag wel degelijk een verbazingwekkende kwestie: dat we de neiging hebben de mogelijkheden van onze talen onder te benutten. Ik weet niet waarom dat zo is of hoe je het zou kunnen onderzoeken. Maar het is een wonderlijk fenomeen.