De stijlcomputer

Door Marc van Oostendorp


Hoe moet je schrijven? Dat is de vraag die ik tot de vraag van het jaar heb uitgeroepen. Ik neem schrijfles, maar leg natuurlijk ook mijn oor te luisteren bij de wetenschap.

Nu opgelet, want in het kader van de leesbaarheid komt er een lange zin. Een aantal onderzoekers bij de afdeling informatica van de universiteit in Stony Brook hebben het probleem opgelost en zij hebben een computerprogramma ontwikkeld dat automatisch kan bepalen hoe ‘succesvol’ een tekst zal zijn aan de hand van een aantal stijlkenmerken en nu hoef je dus alleen maar ervoor te zorgen dat je die stijlkenmerken toepast om ervoor te zorgen dat je stijl voortaan succesvol is en ‘succesvol’ is door de onderzoekers gedefinieerd in termen van hoe vaak je gedownloaded wordt op de website van Gutenberg – en wie wil er nu niet vaak worden gedownloaded op de website van Gutenberg.

Een van de dingen die dus werkt, volgens die onderzoekers, is dat je vaak de woorden en, maar en of gebruikt. (Het echte artikel vind je door hier te klikken; het artikel begin op pagina 1745.)


De onderzoekers beweren dat zij de eersten zijn die ‘this unstudied and unexpected connection between stylistic elements and the literary success’ hebben bestudeerd. Zouden ze echt denken dat nog nooit iemand op het idee is gekomen dat het succes van een boek weleens met de stijl te maken zou kunnen hebben? Laten we hopen dat ze eigenlijk willen zeggen dat ze dit voor het eerst op deze manier hebben onderzocht. De methode is eenvoudig. Het succes van een roman wordt dus bepaald door hoe vaak hij geraadpleegd is op Gutenberg. De stijl wordt bepaald door allerlei telbare dingen: de frequentie van nevenschikkende voegwoorden en andere woordsoorten.

Zelfstandig naamwoorden zijn goed voor de downloadbaarheid, werkwoorden zijn slecht. En onder de werkwoorden zijn woorden die handelingen en gevoelens uitdrukken (vechten, huilen, afpakken) slechter dan woorden die gedachteprocessen uitdrukken (denken, peinzen).

Toch durf ik te voorspellen dat een willekeurige tekst niet ineens populairder wordt door hem naar hartelust met bijvoeglijk naamwoorden te larderen, zelfs niet als je de aller-allerbest werkende adjectieven neemt.Het is interessant om na te denken over wat er mis is: het team uit Stony Brook meent dat het feit dat zij correlaties gevonden hebben tussen de hoeveelheid naamwoorden en de dowyloadbaarheid, ook meteen een feit is. Teamleidster Choi praat in het interview aldus over haar bevindingen:

Previous work has attempted to gain insights into the ‘secret recipe’ of successful books. But most of these studies were qualitative, based on a dozen books, and focused primarily on high-level content — the personalities of protagonists and antagonists and the plots. Our work examines a considerably larger collection — 800 books — over multiple genres, providing insights into lexical, syntactic, and discourse patterns that characterize the writing styles commonly shared among the successful literature.

Het is zoals de onderzoeker die statistisch vaststelt dat de zon altijd opkomt nadat de haan heeft gekraaid en nu zegt voor het eerst wetenschappelijk, want op basis van heel veel meetpunten, te hebben vastgesteld dat de haan de zon doet opkomen. De feitelijke relatie is veel complexer, en wel op een manier die je misschien wel beter aan de oppervlakte kunt krijgen aan de hand van a dozen books.