Het wereldgemiddelde is geschreven in het Nederlands

Door Marc van Oostendorp

Het wereldgemiddelde is een van de intrigerende teksten die vorig jaar in het Nederlands geschreven zijn en ik was blij toen Jeroen van den Heuvel van OoteOote vroeg om er in een video in gesprek met Jeroen en met Ton van ’t Hof over te praten. Op Neerlandistiek verscheen in juli al een kort fragment van het gedicht. Hier is een fragment van dat fragment:

Winder Steeds Knipper Druk Knoest Inkt Jaren Meet Mist Krank Drom
Wot Tadus Mergen Moster Kap Netel Toem Wind Draam Over Snel
Wik Brood Op Treem Droemp Ai Lok Brim Zo Aap Vuur Iert Troes Ek
Of Neek Fed Valle Noi Mik Die Draai Tan Kik Drok En Humt Tum
Mening Treek Reist Pant Nuk Bezet Ni Drak Mok Jees Kram Vouw Dies
Fluk Meen Lut Braa Neek Werk Staak Morst Luk Ging Teet Zwep Toop
Lik Lost Meet Onzicht Wek Teter Oze Meest Nest Wek Teuter Lup Ost
Teken Wers Al Trip Lemer Fik Must Taanen Wuk Milst Pat Kit Oper Na
Ast Lak Umma Nik Lup Zakka Mecca Dien Nog Snoeps Ta Drosp Mun
Mur Drie Hoofd Das Most Nai Lak No Neur Emmie Took Teem Aander
Meest Tek Oom Eel Zee Te Doek Baais One Mee Trup Mur El Grote

Ik vertel in de video dat ik een aantal eenvoudige analyses op de tekst heb uitgevoerd. Het script waarmee ik dat heb gedaan en de resultaten staan hier op GitHub (het oorspronkelijke gedicht kan ik om voor de hand liggende redenen niet vrijgeven).

De analyses ondersteunen samen mijn idee dat dit, anders dan Van Doveren in zijn nawoord suggereert, toch echt een Nederlandstalig gedicht is. Hier is bijvoorbeeld een bestand van alle ‘echte’ Nederlandse woorden in het gedicht, in alfabetische volgorde.

Een ander belangrijk argument komt van de lettergreepstructuur. Dat heb ik vooral enigszins impressionistisch gedaan – het zou zinnig zijn het eens wat preciezer te analyseren. Het punt is dat een Nederlands begint met hooguit drie medeklinkers (als we niet tellen in letters maar in klanken), waarvan de eerste dan een s moet zijn, zoals in straat (schroom is geen tegenvoorbeeld omdat de twee letters ch staan voor één klank). Ook over het aantal medeklinkers aan het eind van een woord zijn er, wat ingewikkelder, regels te formuleren. Je zou voor een echt onderzoek van dit gedicht die regels ook in een script kunnen implementeren, maar ik heb vooral met mijn mensenoog de tekst doorgekeken. Wel heb ik een script gemaakt dat specifiek kijkt naar woorden met ui, au of ij/ei omdat wat er na die tweeklanken komt betrekkelijk beperkt is. Wie dat bestand bekijkt, kan zichzelf ervan vergewissen dat dit allemaal best woorden zouden kunnen zijn. Je vindt bijvoorbeeld wel woorden als tuimt maar niet zoals tuimk, wel fuils maar niet fuilg: de t en de s kunnen veel makkelijker voorkomen aan het eind van een woord dan andere klanken (denk aan herfst).

Ik heb ook een analyse gedaan van de de frequentie van individuele letters. Die staat hier. Hij lijkt in veel opzichten op die in het Nederlands (vooral als je in acht neemt dat in Wereldgemiddelde de hoogfrequente lidwoorden en vormen van zijn en persoonlijk voornaamwoorden, enz., ontbreken. Het verschil is dat met de lip gemaakte (labiale) klanken zoals p, b, m, f, o en u vaker voorkomen, net als de zogeheten vloeiklanken r en l. Ik interpreteer dit als een mogelijk onbewuste poging ‘mooie woorden’ te kiezen. Waarom ook de k dan vaker voorkomt, kan ik niet goed verklaren, maar de conclusie lijkt me onontkoombaar dat Wereldgemiddelde geschreven is in een wat ‘mooier’ Nederlands.