Waarom twittert Geert Wilders nooit over roze koeken?

Gisteren was het de dag van zeg mij welke woorden u gebruikt en ik zeg u wie u bent in NRC Handelsblad. Marjolijn Februari fantaseerde in haar wekelijkse column over de mogelijkheid om haar bijdragen door een computer te laten schrijven:

Een pakket software dat wekelijks op deze plek een politieke analyse genereert door tamelijk willekeurig een aantal zinnen achter elkaar te plakken. Op verzoek van de redacteur heeft de programmeur een vocabulaire gekozen waarin deftige woorden als ‘rechtsstaat’ en ‘liberalisme’ centraal staan, maar hij heeft er ‘roze koeken’ aan toegevoegd, opdat u het gevoel krijgt dat dit warm, levend proza is.

Op de achterpagina komt Ewoud Sanders terug op de opmerking van Mark Rutte over de volgende tweet van Geert Wilders:

Media-berichten Catshuis bijna allemaal prematuur. Kan nog alle kanten op gaan.

Rutte maakte in dit kader tijdens zijn wekelijkse persconferentie een taalkundige opmerking, namelijk dat het woord prematuur niet in Wilders’ taalgebruik past. Sanders onderzoekt dit een beetje, en komt tot dezelfde conclusie.

De methode die Sanders daarbij gebruikt, lijkt me enigszins dubieus. Zijn sterkste argument is dat het woord slechts zelden gebruikt wordt in een bestand dat hij heeft van ‘ruim duizend gedigitaliseerde, doorzoekbare streekromans’.

Het is niet helemaal duidelijk waarom de taal van dat soort romans precies representatief zou zijn voor de PVV-kiezer. Sanders wijst erop dat die boeken veel gelezen worden, maar dat betekent nog niet dat ze door iedereen gelezen worden, en in het bijzonder niet dat Henk en Ingrid ze lezen (misschien lezen zij wel niets, of Gerard Reve, of GeenStijl). De PVV-kiezers zijn immers uiteindelijk ook geen representatieve selectie van de Nederlandse lezer.

Wel weten we dat Wilders voor zijn lexicografische vondsten af en toe put uit extreem-rechtse bronnen op het internet: zoals blijkt uit een analyse van het weblog GeenCommentaar kwam het woord kopvod bijvoorbeeld voor het eerst voor op de extremistische website Stormfront.

Ook in dit geval blijkt de extreemrechtse link een vruchtbaarder spoor om Wilders’ keuze te begrijpen. Weliswaar komt prematuur op Stormfront ‘maar’ 8 keer voor, tegenover voorbarig 97 keer, maar dat verschil correspondeert ongeveer met de frequentieverschillen in de CELEX-database.

Opvallend is vooral dat over het geheel genomen de frequentie van prematuur toch betrekkelijk hoog uitvalt. Er zijn bijvoorbeeld twee woorden in CELEX die net als prematuur met pr beginnen en dezelfde frequentie hebben. Bij Stormfront worden deze woorden veel minder vaak gebruikt: prijsindicatie slechts één keer, en produktiecapaciteit (of productiecapaciteit) helemaal niet

Uiteindelijk is natuurlijk ook deze vergelijking onzin: er is geen reden om te denken dat de PVV-leider zoveel in de naargeestige discussieforums van Stormfront zit te grasduinen dat hij zich er in zoveel detail door zou laten leiden in zijn woordgebruik. Veel zekerder is wel er wordt in Wilders’ verzamelde tweets nergens van roze koeken gerept. Een computer die warm, levend proza genereert is hij dus in ieder geval niet.