Kopiisten aan de computer voeren

door Viorica Van der Roest

Kun je een computer leren om talige verschillen tussen kopiisten in Middelnederlandse handschriften te herkennen?

In het laatst verschenen nummer van Spiegel der Letteren (60, 3-4) staat een artikel van Mike Kestemont: Aan de taal kent men de hand. Talige kopiistherkenning en de scribenten van de Lancelotcompilatie. Kestemont, bekend vanwege zijn toepassingen van digital humanities-werkwijzen op de Middelnederlandse literatuur, richt zich in zijn onderzoek al jaren op de zogenaamde stylometrie: het proberen te bepalen van de auteur van een anoniem werk door de computer de stijl ervan te laten vergelijken met andere teksten, waarvoor wél een auteur bekend is. Dat is voor middeleeuwse literatuur nog niet zo eenvoudig, omdat we daarbij naast de auteur altijd te maken hebben met de kopiisten die het literaire werk tijdens de handschriftproductie hebben overgeschreven. Een standaardspelling bestond nog niet; een kopiist paste de spelling uit zijn voorbeeldtekst vaak naar eigen voorkeur of inzicht aan.

Wanneer we een computer een grote hoeveelheid tekst van Manon Uphoff zouden voeren, is de kans groot dat hij op den duur leert haar stijl te herkennen, maar wanneer je dat zelfde zou doen met bijvoorbeeld Maerlant, krijg je veel minder goede resultaten, omdat de computer dan ook de stijlkenmerken van alle verschillende kopiisten mee gaat nemen bij het vaststellen van een stijlprofiel. Dat is lastig wanneer het doel van het onderzoek auteursherkenning is, maar wat als je van de nood een deugd maakt en gaat kijken of de computer verschillen tussen kopiisten kan herkennen? Kestemont heeft zich hier al eerder mee beziggehouden (bijvoorbeeld in het derde hoofdstuk van Het gewicht van de auteur. Stylometrische auteursherkenning in Middelnederlandse literatuur uit 2013) en voegt met dit artikel weer iets toe aan zijn verkenningen.

Traditioneel wordt kopiistenherkenning vooral langs paleografische weg aangepakt: de kenmerken van het handschrift van een bepaalde kopiist kunnen in kaart worden gebracht, en zo kun je zijn kopieerwerk elders opsporen (zie voor een mooi voorbeeld van deze werkwijze bijvoorbeeld Kwakkel en Mulder over de Ferguut-kopiist). Maar, zegt Kestemont, wat als een kopiist in meerdere schriftstijlen kon werken? Of: wat als je geen toegang tot de handschriften hebt (of tot goede kwaliteit reproducties ervan), en je wilt toch weten aan welke manuscripten een kopiist allemaal geschreven heeft? Je kunt dan ook een orthografisch profiel van de kopiist maken, dat wil zeggen: je brengt nauwkeurig in kaart hoe hij bepaalde woorden of klanken spelt. Dat kun je handmatig doen, maar het is natuurlijk ook interessant om te kijken hoe goed een computer dat kan.

Kestemont heeft als casus voor dit artikel gekozen voor de Lancelotcompilatie. Hieraan werkten vijf kopiisten; van vier van hen zijn ook andere boeken of fragmenten bekend waaraan ze geschreven hebben – dit is al langs paleografische weg vastgesteld. De casus kan zo functioneren als test: zal de computer een werk aan de juiste kopiist toewijzen? Kestemont heeft de computer eerst getraind om alle vijf de kopiisten te herkennen aan hun orthografische kenmerken in de Lancelotcompilatie, en daarna heeft hij hem gevraagd de andere handschriften en fragmenten van vier van hen te bekijken en de kopiist ervan te bepalen.

Bij het voeren van teksten aan de computer zou het natuurlijk het mooist zijn wanneer je voor al die teksten de beschikking hebt over edities die de orthografie in het handschrift zo zuiver mogelijk weergeven, maar dat is helaas niet mogelijk voor de Lancelotcompilatie en veel van de andere teksten die door de kopiisten ervan geschreven zijn, omdat die er eenvoudigweg niet zijn. Kestemont gebruikt daarom de kritische edities die wel beschikbaar zijn, waarvan sommige al heel oud (voor de Lancelotcompilatie bijvoorbeeld de editie van Jonckbloet uit 1846-1849). Dat betekent helaas wel dat je bepaalde informatie al bij voorbaat mist (bijvoorbeeld hoe de kopiist bepaalde woorden meestal afkort).

Als je weet wat voor variatie er soms kan zitten in het werk van één kopiist, en vervolgens wat een negentiende-eeuwse editeur allemaal met de spelling in het handschrift kan hebben uitgehaald, houd je natuurlijk je hart vast. Maar de resultaten zijn eigenlijk erg goed! De computer heeft keurig het schrijfwerk van drie van de vier kopiisten herkend en aan de juiste persoon toegewezen. Het werk van één van hen (kopiist D van de Lancelotcompilatie) kan hij echter niet plaatsen. Nadere beschouwing leert dat die blijkbaar in het andere manuscript dat hij geschreven heeft, een Limborch-fragment, een heel andere spelling aanhoudt. Misschien is het resultaat ook nog iets vertroebeld doordat dit fragment wél in een moderne editie is uitgegeven, waarin de spelling minder ingrepen zal hebben ondergaan dan die in Jonckbloet’s uitgave van de Lancelotcompilatie.

Dat kun je zo’n computer dan ook weer niet kwalijk nemen dus. De spellingsverschillen in twee producten van dezelfde afschrijver laten wel zien dat ook kopiisten natuurlijk individuen waren die niet altijd logische keuzes maakten; net zo goed als een computer die de mensen van nú probeert te begrijpen weleens de plank flink mis slaat, kan dat ook gebeuren wanneer hij mensen uit het verleden probeert te begrijpen. We blijven complexe wezens.