Van annotatie naar nieuwe onderzoeksideeën

Door Laura Meijer

Als student binnen de RMA-opleiding Linguistics van de UU ben ik momenteel werkzaam binnen het project Language Dynamics in the Dutch Golden Age als student-assistent. Nederlab heeft dit project een subsidie gegeven om de brieven van Hooft te voorzien van morfo-syntactische annotaties. De belangrijkste taak van de student-assistenten: het controleren van de automatische annotatie die de automatische tagger Adelheid toekent aan de woorden in de brieven van P.C. Hooft.

 

 

 

 

 

Annoteren, annoteren, annoteren

In de praktijk betekent dit naar zinnen kijken en controleren of de toegekende annotatie klopt: controleren of een bepaald naamwoord wel daadwerkelijk de naamval nominativus heeft als Adelheid dat heeft toegekend; ervoor zorgen dat de e in het woord informatie niet geannoteerd wordt als naamvalsuitgang; nadenken over de vraag of om in een bepaalde context een voegwoord of een voorzetsel is. Dat klinkt misschien een beetje saai, maar het leidt ook tot mooie inzichten.

Tijdens het annoteren van de brieven komt de persoon P.C. Hooft tot leven. Ik lees bijvoorbeeld over problemen die hij heeft na de drooglegging van het ‘meerken’ Bijlmermeer (brief 861) en zijn vriendschappelijke brieven naar koopman Joost Baeck over allerlei internationale ontwikkelingen die zich afspelen in de zeventiende eeuw (o.a. brief 374). De leukste brief tot nu ging over Hoofts liefdesproblemen met Leonora Hellemans die, zo blijkt, pas na heel veel aandringen zijn vrouw zou worden (brief 264). De man die ik tijdens mijn bachelor Nederlandse Taal en Cultuur leerde kennen als het genie achter sonnetten zoals mijn lief, mijn lief, mijn lief, blijkt opeens een persoon van vlees en bloed, met zijn eigen problemen en verhalen.

Er is nog een ander groot voordeel aan het doen van dit werk: er gaat enorm veel zeventiende-eeuwse data door mijn handen. Het bekijken van al die data leidt tot ideeën voor onderzoeken, die ik kan gebruiken voor papers die ik moet schrijven binnen de research master.

Van data tot paper

Het idee voor de paper dat ik recentelijk heb uitgewerkt, kwam uit de eerste brief die ik moest annoteren, brief nummer 110, een werkgerelateerde brief over een groep opstandige Blaricummers. Het was een testbrief: alle studentassistenten moesten dezelfde brief annoteren om te testen of het annotatieprogramma het goed deed en om te kijken welke vragen er waren bij het controleren en aanvullen van de annotaties. In deze testbrief viel mij de volgende zin op (originele tekst gevolgd door letterlijke vertaling):

De reqe dan geexamineert, heb bevonden dat de supplianten haere doleancien funderen op drie grieven.

Het verzoekschrift toen geëxamineerd, heb bevonden dat de supplianten hun bezwaren baseren op drie redenen.

Deze zin moet woord voor woord worden nagelopen in het programma. Hij begint met een participiumconstructie die gelukkig redelijk goed herkend wordt door het programma, omdat (on)voltooide deelwoorden een specifieke morfologische opbouw hebben. Na een aantal keer op ‘verder’ klikken, verschijnt het woord heb, gevolgd door bevonden, gevolgd door de bijzin die ingeleid wordt met dat. Op dat punt aangeland, overviel mij de vraag: over wie gaat deze zin? Gezien de morfologische vorm van de persoonsvorm is er eigenlijk maar één mogelijkheid, namelijk ik (dus P.C. Hooft). Dit onderwerp is echter niet uitgedrukt in de hoofdzin, iets wat onmogelijk is in Modern Nederlands. Het weglaten van een onderwerp wordt ook wel pro-drop genoemd. Ik besloot dat dit het onderwerp werd van mijn paper.

De structuur van pro-drop zinnen

Dit was niet de enige zin zonder onderwerp in P.C. Hoofts brieven. Tijdens het schrijven van mijn paper kwam ik erachter dat alle zinnen die ik kon vinden met pro-drop er hetzelfde uitzien: ze beginnen met een zin met een (on)voltooid deelwoord, waarna in de hoofdzin het onderwerp ontbreekt. Vergelijk bijvoorbeeld de onderstaande zin, waarin het onderwerp ik ontbreekt, met de voorgaande zin (opnieuw originele tekst gevolgd door letterlijke vertaling, uit brief 374):

De Veerman hier gebleven  zijnde door ‘t harde weder  ende scheuren van zijn zeil,          heb tijdt gevonden om  de bijgaende overzetting ujt Tacitus te voltrekken.

De Veerman hier gebleven zijnde door ‘t harde weder en scheuren van zijn zeil, heb tijd gevonden om de bijgaande vertaling uit Tacitus te voltrekken.

Ook hier is het patroon te zien: voorop geplaatste participiumconstructie + hoofdzin met pro-drop. Opnieuw ontbreekt het voornaamwoord ik. Een opvallend verschil met de vorige constructie is dat het onderwerp van de participiumzin niet gelijk is aan het (niet uitgedrukte) onderwerp van de hoofdzin: in de participiumzin gaat het om de veerman, terwijl de hoofdzin gaat over ik, dus P.C. Hooft, die blijkbaar tijd heeft gevonden om een vertaling uit Tacitus af te maken.

Nieuwe vragen

Uiteraard roept het bestaan van dit type constructies een hoop vragen op. Niet alle hoofdzinnen met een participiumbijzin laten pro-drop zien; is er logica in wanneer Hooft dit wel gebruikt en wanneer niet? Maakt een bepaald type brief het waarschijnlijker dat Hooft kiest voor pro-drop? Dit soort vragen kunnen makkelijker beantwoord worden met een goed geannoteerd corpus van P.C. Hoofts brieven, wat het bijvoorbeeld mogelijk zou maken om te zoeken op (on)voltooide deelwoorden. Gelukkig is dat precies waar ik, samen met andere studentassistenten, op dit moment mee bezig ben.