Top-downprocessen bij het transcriberen van oude teksten

Door Wouter Taheij en Carmen Verhoeven

In het project Language Dynamics in the Dutch Golden Age wordt onderzoek gedaan naar de vernieuwingen die plaats vonden in de Nederlandse taal tijdens de Gouden Eeuw. Voor dit project werd ons, twee researchmasterstudenten, gevraagd een van de brieven uit het uitgebreide archief van Michiel De Ruyter te transcriberen; een schijnbaar simpele omzetting van handschrift naar digitale tekst. Zoals de meeste ervaren onderzoekers zullen weten was dit echter niet een eenvoudige taak. De oude paperassen zijn vaak beschadigd of uitgelopen, en natuurlijk geschreven in schrijfletters van het zeventiende-eeuwse Nederlands. Dit leidt in een aantal gevallen tot incomplete zinnen waarin letters of zelfs hele woorden ontbreken door onleesbaarheid. Voor analyse van de taalkundige eigenschappen zijn echter volzinnen nodig. Om dit op te lossen maken we gebruik van top-downprocessen.

Met top-downprocessen bedoelen we alle processen die taal- en wereldkennis toepassen om gaten op te vullen. Deze processen komen bijvoorbeeld van pas in een gesprek waarin de gesprekspartner slecht te verstaan is en onze hersenen de delen aanvullen die we gemist hebben. Deze kennis kan ook toegepast worden bij het lezen van onduidelijke brieven zoals bij het transcriberen van de brief van Michiel de Ruyter. Hieronder geven we enkele voorbeelden van top-downprocessen die ons geholpen hebben.

Laten we eerst kijken naar taalkennis. We nemen aan dat onze communicatiepartners hun best doen om zo duidelijk mogelijk hun boodschap over te brengen volgens de maximes van Grice. Dit geldt voor een gesprek met een vriend maar ook voor een brief van Michiel de Ruyter. Dit betekent dat we aannemen dat de Ruyter schreef in grammaticale zinnen die semantisch zinvol waren. Deze aanname kan ons helpen bij het ontcijferen van enkele onduidelijkheden. We dienen hierbij natuurlijk wel rekening te houden met het feit dat De Ruyters taal een ander Nederlands was dan dat van ons. Een goed voorbeeld hiervan vinden we in regel 36 op ‘t spoedigst soecken te vertrekken. Het woord soecken was hier onduidelijk omdat de betekenis niet in de zin lijkt te passen. Via een vergelijkbaar voorkomen in het Brabants (“iets niet zoeken” wil zeggen “ergens geen zin in hebben, ergens niet op zitten te wachten, iets niet van plan zijn”) kwamen we echter achter de betekenis van zoeken als nastreven. Het VNMW bevestigt deze betekenis.

Bovendien kunnen we voorspellingen maken op basis van onze wereldkennis. Hoe meer we leren over de wereld waarin Michiel de Ruyter zijn brief schreef, hoe beter we verschillende gaten in de tekst kunnen vullen. Zo lezen we in regel 5 over een baai waarvan de naam onduidelijk is. Met behulp van de geschiedenisboeken weten we dat Michiel de Ruyter zich tijdens het schrijven van deze brief in de Middellandse Zee bevond, zich gereedmakend voor een aanval op de Siciliaanse hoofdstad Messina. Deze stadsnaam vinden we ook terug in regel 6, samen met de naam Palermo in regel 2, een andere stad op Sicilië. Met wat zoekwerk in een atlas kunnen we beargumenteren dat De Ruyter in regel 5 de baai van Milazzo bedoeld, gelegen tussen Messina en Palermo in het noorden van Sicilië.

Aan de hand van deze processen is het ons gelukt een vrijwel volledige transcriptie te maken. Voor geïnteresseerden zijn de scans van de brief via deze url te vinden. Wilt u meer weten over het project Language Dynamics in the Dutch Golden Age dan kan dat via de projectwebsite.