Betrouwbare computers en onbetrouwbare romans

Door Marc van Oostendorp

Misschien is een van de problemen in de relatie tussen literatuurwetenschap en de computer dat veel letterkundigen niet van saai werk houden – zelfs niet al het door een apparaat wordt gedaan.

Maar misschien is het probleem ook dat het werk dat de computer doet echt té saai is om een interessante studie te kunnen opleveren.

Heel veel lezen dat de computer doet, wordt distant reading genoemd: in plaats dat je één tekst van dichtbij beschouwt – close reading, het tradionele stiel van de letterkundige – neem je een groot aantal boeken tegelijkertijd in beschouwing. Dat gebeurt dan noodzakelijkerwijs oppervlakkiger: je kunt van een computer niet verwachten dat hij met een diepgaande analyse de marxistische onderlaag in Pride and Prejudice aanwijst. In plaats daarvan kan hij bijvoorbeeld bepalen wat er kenmerkend is aan de woordkeus of de zinslengte van Jane Austen, en dan kun je dat weer knopen aan marxistische beschouwingen. Maar dat doe je dan wel als mens.

Alles wat een computer met boeken doet, is uiteindelijk: woorden tellen. Dat is wat het werk uiteindelijk saai maakt.

Interpretatie

In zijn boek Close Reading with Computers probeert de Londense literatuurwetenschapper Martin Paul Eve iets anders. Zoals de titel al zegt, gebruikt hij zijn computer niet om een lange lijst boeken te overzien, maar om één boek – de roman Cloud Atlas (2004) van de Britse schrijver David Mitchell – in detail te bestuderen. Hij laat zien dat je de computer juist kunt inzetten om het traditionele ambacht van een nieuwe dimensie te voorzien.

Zo kun je, laat hij zien, heel goed moderne filologie bedrijven en verschillende versies van dezelfde tekst reconstrueren. Dat lijkt iets van een verleden tijd, toen boeken werden overgeschreven of in de drukte van het zettersbedrijf op een aantal manieren werden verminkt. Het lijkt nu niet meer nodig: teksten leiden immers een belangrijk deel van hun leven digitaal, en daardoor zijn kopieën perfect. Maar door de Engelse en de Amerikaanse edities van Cloud Atlas met elkaar te vergelijken, laat Eve zien dat er aanzienlijke verschillen tussen de twee zijn, niet alleen op het niveau van spelling of woordkeus, maar zelfs op het niveau van de organisatie van een aantal hoofdstukken. En die verschillen hebben een effect op de interpretatie.

Eindversie

Bij navraag blijkt dat Mitchell indertijd aan de twee versies min of meer los van elkaar had gewerkt: zijn Amerikaanse redacteur viel een tijdje uit terwijl de Brite redacteur onderwijl doorwerkte; de verschillende redactiestappen werden door de verschillende redacties niet op elkaar afgestemd. In een interessant hoofdstuk laat Eve zien hoe je het gebeurde nu alsnog kunt reconstrueren. Je zou dat ook met de hand kunnen doen; het zou alleen enorm veel tijd kosten. Bovendien laat Eve zien hoe die reconstructie nieuw licht werpt op de interpretatie van de roman – hoe je kunt laten zien dat er een onderstroom in zit die gaat over de vraag hoe we documenten archiveren. (Knap is dat Eve nergens de ironie opmerkt dat je door met de computer verschillende versies te reconstrueren kunt laten zien hoe de roman gaat over reconstructie van het verleden – die conclusie laat hij aan de lezer.)

In een ander hoofdstuk laat Mitchell zien wat het probleem is met een van de belangrijkste dragers van de digitale literatuurwetenschap: de auteursherkenning. Op basis van het gebruik van met name functiewoorden als de, een, is en maar, zou je een auteur kunnen herkennen. De premisse is dat de relatieve frequentie van zulke woorden enerzijds kenmerkend is voor een auteur en anderzijds nauwelijks onder de bewuste controle van een auteur valt. Mitchell laat zien dat de verschillende hoofdstukken van Cloud Atlas verschillende ‘auteursprofielen’ hebben – en dat ‘genre’ (de verschillende hoofdstukken zijn vanuit verschillende personages geschreven, die in verschillende tijden leven) dus misschien wel belangrijker is voor dit soort profielen dan ‘de auteur’. Uit zijn reconstructie in het eerste hoofdstuk was natuurlijk al gebleken hoeveel verschil een redacteur maakt in de eindversie van de tekst.

Overtypen

Het laatste hoofdstuk gaat in zekere zin door op die stijl: in hoeverre weerspiegelt de taal in ieder hoofdstuk daadwerkelijk de taal uit de periode waarin het boek speelt. Een hoofdstuk speelt zich af in het Amerika van 1850 en Mitchell laat zien dat de taal ervan vrij goed klopt, behalve dat de racistische taal net iets sterker is aangezet dan in het gemiddelde boek uit die tijd – iets dat ook een betekenis lijkt te hebben.

Samen geven die analyses daadwerkelijk een inkijkje in het boek: de computer kan laten zien hoeveel onbetrouwbaarheid er zit in een boek dat gaat over de onbetrouwbaarheid van de archieven.

Eve’s methode lijkt mij een veelbelovende, interessanter dan veel distant reading die ik heb gezien. Hij wijst er overigens zelf op dat je ook in dit geval nog veel saai werk moet doen: omdat het in het Verenigd Koninkrijk verboden is om de DRM (digital rights managment, het watermerk van digitale boeken) te verbreken om het boek aan software te kunnen voeren, zelfs als auteur en uitgever toestemming geven, heeft hij het boek in verschillende versies zelf moeten overtypen.

Alleen daardoor al, zegt Eve, is hij dichter bij Cloud Atlas gekomen dan hem anders ooit was gelukt.

Eve, Martin Paul (2019) Close Reading with Computers: Textual Scholarship, Computational Formalism, and David Mitchell’s Cloud Atlas. Stanford, CA: Stanford University Press. Open Access.