Slechte tijden, droevige boeken

Door Marc van Oostendorp


Bron: PLOSOne

De financiële letterkunde bestaat echt! Voor mijn vervolgverhaal De verleden tijd van lijken hier op Neder-L, bedacht ik een hoogleraar Financiële Letterkunde, omdat ik dacht dat dit absurd genoeg was. Het blijkt niet absurd; het blijkt de toekomst.

In het online wetenschappelijke tijdschrift PLOS One verscheen vorige week een artikel met een voorbeeld van wat de combinatie van economie en literatuurwetenschap zou zijn: Books Average Previous Decade of Economic Misery. In het artikel laten de auteurs zien dat er een correlatie is tussen de economische stand van zaken in de wereld in een bepaalde periode en hoeveel droevige woorden schrijvers na afloop van die periode in hun boeken gebruiken.

Tja. Als de situatie in de wereld moeilijk wordt, worden de schrijvers ook somber, althans met een ‘time lag’: eigenlijk werden de boeken pas echt verdrietig na een periode van elf jaar. Maar wat moet je nu met zo’n resultaat?
Kraaien

Het probleem laat zich denk ik het makkelijkst illustreren aan de hand van de paragraaf Discussion. Daarin vragen de auteurs zich af of er sprake is van een causale relatie tussen de economische crises en de literaire misère die steeds een jaar of elf geleden begon.

Daar gaat het natuurlijk om, en tegelijkertijd is het altijd het moeilijke punt bij dit soort data: hoewel we kunnen laten zien dat twee zaken samenhangen, dat het een altijd gebeurt na het andere, kunnen we nog niet concluderen dat het ene het andere veroorzaakt. (Post hoc ergo propter hoc is een klassieke drogredenering. De zon komt altijd op nadat de haan begint de kraaien, maar daarmee is dat kraaien nog niet de oorzaak van de opkomst. )  Hun redeneringen daarover zijn vervolgens aanvechtbaar.

Finetunen

In de eerdere paragrafen hebben ze geprobeerd van alles en nog wat te variëren – over welke periode je precies de economische toestand meet, hoeveel afstand in tijd je legt tussen de economische en de literaire crisis, op welke manier je precies de treurnis in de letteren meet – en ze zijn vervolgens uitgekomen op het model dat de beste ‘fit’ geeft tussen de twee gegevens.

Je zou kunnen denken dat dit een zwakheid is van de analyse: ze hadden kennelijk tevoren geen precies idee wat ze moesten verwachten en hebben net zo lang zitten finetunen tot het juiste resultaat er uitkwam. Maar de auteurs zelf zien het juist als argumenten vóór hun causaliteit: “This implies a causal connection; it actually matters that we match the emotional index to the economic index (…)”

Narcisme

Vervolgens komt de aap uit de mouw, want ze zeggen dat de data hun oorspronkelijke gedachte ondersteunt, namelijk dat de literatuur in een bepaalde tijd op een bepaalde manier het collectieve onderbewuste weergeeft. De relatie is causaal omdat ze dit eerder bedacht hadden! Ze gebruiken die term ‘collectieve onderbewuste’ niet, maar de sociologische theorie die ze vervolgens gebruiken om een en ander te duiden bestaat uit een allegaartje van allerlei ad hoc-verklaringen. 

Zo zou de tijdsspanne van 11 jaar verklaard worden doordat pubers in hun jeugd allerlei indrukken opdoen en dan als ze vroeg in de twintig zijn beginnen te schrijven (dat het aandeel van beginnende schrijvers naar we moeten aannemen relatief klein moet zijn in zo’n corpus noemen ze niet), en wijten ze het feit dat de correlatie zich pas echt goed na 1929 voordoet aan het ‘narcisme’ dat sinds die tijd opgeld deed.

Hoewel iedere bewering keurig wordt voorzien van één of twee literatuurverwijzingen, doemt er geen coherent wereldbeeld op. Laat staan een wetenschappelijk model.

Woordkeuze

Je zou een precieze formule moeten hebben van wat zoiets als een economische crisis met de geestesgesteldheid van de mensen doet, én een model van hoe die geestesgesteldheid tot uitdrukking komt in de woordkeuze van schrijvers. Dan zou je een precieze voorspelling kunnen doen, die de gegevens uit dit artikel wel of niet zouden kunnen ondersteunen. Het idee blijkt nu zo vaag, dat het niet zo heel gek is dat er met voldoende manipulatie van de gegevens wel iets uitkomt.

We weten dus ook niet of de relatie die de schrijvers gevonden hebben, echt een causale is, of aan iets anders moet worden toegeschreven – zoals een andere factor (11 jaar na 1929 was het 1940, voorwaar op zich reden genoeg om sombere woorden te gebruiken), of zelfs aan het toeval.