Col: Een literaire succesformule

Iets wat ieder boek over technologiegeschiedenis enorm opfleurt: verhalen over domoren die in de tijd dat er een nieuwe uitvinding werd gedaan luidkeels begonnen te roepen dat zoiets toch echt niet kon: nooit zal de mens een voet op de maan zetten, nooit kan een auto harder rijden dan 20 km per uur, nooit wordt een computer wereldkampioen schaken.

Laat ik nu eens zo’n domoor worden. Wat mijn collega’s van onder meer het Huygens Instituut, onder leiding van Karina van Dalen-Oskam blijkens een persbericht willen, dat kan volgens mij helemaal niet.

Waar gaat het over? Van Dalen en de haren willen volgens het persbericht een computerprogramma bouwen dat literaire oordelen kan nabootsen. De computer gaat gevoed worden met allerlei teksten en daarbij de oordelen van een menselijk panel: is dit literatuur of niet? En is het goed of niet? De computer kijkt dan naar allerlei tekstenmerken — het persbericht noemt onder andere zinslengte en woordkeus — en probeert dan correlaties te vinden tussen het een en het ander.

Miljarden pagina’s

Volgens mij zal iedere gebruiker van Word inzien dat deze methode op korte termijn onmogelijk iets op kan leveren. De genoemde factoren zitten allang ingebouwd in wat vrijwel zeker de minst gebruikte functie van die tekstverwerker is: de leesbaarheidsfunctie, die zogenaamd bepaalt hoe goed verschillende doelgroepen zullen begrijpen wat u hebt opgeschreven. Ik heb nog nooit gehoord van iemand die vond dat deze functie nu inderdaad een bruikbare maat opleverde.

Ja, zal Van Dalen nu zeggen, maar toen die leesbaarheidsfuncties decennia geleden werden opgesteld, hadden we nog geen beschikking over al die miljarden pagina’s op internet en al die andere gegevens die we met een computer razendsnel en automatisch kunnen doorzoeken. Dat is natuurlijk waar en ik sluit ook niet uit dat de onderzoekers op deze manier zelfs een betere leesbaarheidsfunctie vinden.

Maar literaire kwaliteit lijkt me iets anders. Voor een deel is het afhankelijk van factoren die misschien deels wel meetbaar zijn, maar op geen enkele manier uit de tekst te halen vallen: sociale factoren bijvoorbeeld, waar volgens mij geen enkele lezer zich aan kan onttrekken. (Hypothese: het werk waarvan de lezer vermoedt dat het van een alom bejubelde auteur afkomstig is zal over het algemeen zelden gematigd beoordeeld worden: je deelt in de bewondering of zet je ertegen af,  maar het is heel moeilijk om te zeggen: ik vind het wel aardig.)

Daarnaast is mij volkomen onduidelijk waarom er gekozen is voor zoiets als zinslengte. Het lijkt mij een willekeurige keuze, meer ingegeven door het feit dat die zaken makkelijk te tellen zijn, niet door enigerlei aanwijzing dat ze inderdaad een rol spelen.

Het aantal mogelijke dimensies waarop je teksten zou kunnen ‘doormeten’ is eindeloos: wie kan er zeggen of er geen (negatieve) correlatie bestaat tussen literaire kwaliteit en het aantal keren dat op een bladzijde woorden gebruikt worden die anagrammen zijn van elkaar? Ik vermoed dat je door zomaar wat meetbare dingen te meten niet moet verwachten snel achter de waarheid te komen.

De meeste mensen

 Maar wat mij achteraf echt kenmerkt als een volkomen achterhaalde domoor: ik denk dat Van Dalen al geen goede standaard heeft om haar metingen tegen te verrichten: de literaire waarde van boeken. Het project neemt aan dat je deze kunt destilleren door mensen ernaar te vragen, maar ik vraag me af of dat zo is.

Er zijn geen twee mensen op de wereld die van precies dezelfde boeken houden (enige uitzondering zijn mogelijk de mensen die van geen enkel boek houden: die mensen hebben wel allemaal dezelfde smaak.) Als ik het goed begrijp, wordt in het project van Van Dalen een gemiddelde smaak als maat gebruikt: een boek is mooi als ‘de meeste mensen’ het mooi vinden. De kans is echter groot dat er geen enkel mens is die ooit precies die gemiddelde smaak heeft, met andere woorden dat er niemand is die precies alle boeken mooi vindt die ‘de meeste mensen’ mooi vinden (en geen enkel ander boek) en alle boeken lelijk die ‘de meeste mensen’ lelijk vinden. En misschien kán zo iemand niet eens bestaan. Smaken zijn heel ingewikkelde, maar waarschijnlijk wel samenhangende objecten die je niet zomaar kunt middelen.

Dat ik dit soort bedenkingen heb, betekent natuurlijk niet dat ik tegen het onderzoek van Van Dalen ben. Integendeel, ik vind het prachtig, leuk, spannend, dat mensen dingen proberen te doen die mij onmogelijk lijken, en ik ga Van Dalen op de voet volgen. Goed onderzoek is risicovol en experimenteel! En mijn plaatsje in de geschiedenisboeken is nu verzekerd – al is het dan maar als conservatieve domoor.

Op veler verzoek staat voortaan onder mijn opiniërende blogposts op Neder-L de mogelijkheid tot reageren aan. U kunt dus iets terugzeggen — ook over de vernieuwde vormgeving.

Over Marc van Oostendorp

Marc van Oostendorp is onderzoeker aan het Meertens Instituut (KNAW) en hoofdredacteur van Neerlandistiek. Hij heeft een website, een YouTube-kanaal en een Twitter-account.
Dit bericht is geplaatst in geen categorie. Bookmark de permalink.