Kun je stijl meten?

Door Marc van Oostendorp
Hoe hebben Agatha Wolff en Elisabeth Deken samengewerkt toen ze hun Historie van mejuffrouw Sara Burgherhart schreven? Wie schreef er precies wat? Hoe kan het eigenlijk dat de stijl van al hun gemeenschappelijke werk zo naadloos is, terwijl de vrouwen volgens tijdgenoten zo verschillend waren?

Er zijn in de afgelopen eeuwen allerlei pogingen gedaan om dit objectief vast te stellen De beroemde Wolff-en-Deken-deskundige P.J. Buijnsters had er in 1984 weinig fiducie in:

Veel energie is er gespendeerd – en met weinig resultaat – aan de vraag welk aandeel Betje of Aagje nu precies gehad heeft in het door hen samen uitgegeven werk. Men zou denken: dat moet niet moeilijk zijn om vast te stellen, aangezien we van beide schrijfsters een hele reeks eigen geschriften kennen, terwijl de jarenlange samenwerking het verschil in aanleg en temperament nooit heeft weggewist. Echter, het werk van Wolff en Deken is meer dan een simpele optelsom van twee individuele bijdragen. Om die reden is een positivistische sorteerproef even onmogelijk als zinloos.

Inmiddels krijgt het ‘positivisme’ in de geesteswetenschappen overal sterke nieuwe impulsen: je hoeft niet meer zelf te tellen, je kunt het je computer te laten doen. Dus haalde de nieuwe hoogleraar Computationele Letterkunde Karina van Dalen in haar oratie vorige week Buijnsters aan, en toonde vervolgens de resultaten van een nieuwe ‘sorteerproef’. Had zij nu wel resultaat?

Ik kon helaas niet bij de oratie aanwezig zijn, maar sinds gisteren staat hij online. Ik heb de tekst dus onmiddellijk gelezen. En ik ben niet erg overtuigd.

Van Dalen nam de tekst van Sara Burgerhart, net als die van enkele andere romans van de dames Wolff en Deken én van enkele tijdgenoten, en paste hier een soort automatische stilistische analyse toe. Die analyse bestaat grofweg uit het berekenen van de frequentie van functiewoorden als de, of, een en dat. We weten dat zo’n maat tamelijk goed werkt om auteurs aan te wijzen: het is een kenmerk van je stijl die je niet zo goed in de hand hebt – het is heel moeilijk om bewust je frequentie van lidwoorden of voorzetsels aan te passen – en die voor iedere auteur wel min of meer uniek is. Waaróm dit zo is, lijkt mij pas echt een interessante vraag, maar daarop bestaat bij mijn weten geen antwoord.

Wat blijkt: Van Dalen vond duidelijke verschillen tussen de personages in Sara Burgerhart. De stijl van de brieven van Sara is heel anders dan die van Abraham Blankaart, die weer significant verschilt van de naarling R. Maar de stijl van geen enkele persoon leek op opvallend veel op die van de persoonlijke brieven van Wolff óf die van Deken. Volgens Van Dalen:

Fig.  5  laat zien dat de persoonlijke brieven van Wolff en Deken wel van elkaar verschillen, maar dat zij bij vergelijking met de brieven en de personages in Sara Burgerhart meer op elkaar lijken dan op een of meer van hun personages. (…) De conclusie is vooralsnog dat we serieus kunnen nemen wat de auteurs zelf al stelden: de briefromans zijn het resultaat van intensieve samenwerking van twee vrouwen die ook ten tijde van hun debuut al voorbeeldig op elkaar waren ingespeeld.

Mij lijkt eigenlijk de vraag of dit inderdaad de conclusie is die we kunnen trekken. Vooral het feit dat de stijlen van de dames meer op elkaar leek dan op die van hun personages geeft te denken. Het betekent dat ze hoe dan ook zeer bedreven waren in het veranderen van hun stijl (dat wil zeggen, de frequentie van hun functiewoorden) wanneer ze zich in een personage verplaatsten.

Maar het feit dat Sara Burgerharts stijl meer verschilt van die van Wolff of van Deken dan de laatste twee van elkaar kan betekenen dat (1) ofwel Wolff Burgerharts brieven geschreven heeft, (2) ofwel Deken dat gedaan heeft, (3) ofwel dat de dames dat samen hebben gedaan.

Met andere woorden, ik zie niet in dat de ‘positivistische sorteerproef’ in dit geval veel heeft opgeleverd. Het is een klassiek probleem bij het interpreteren van statistische analyses: wanneer je geen significant verschil vindt, kun je daaruit niet concluderen dat er geen verschil is (zoals Van Dalen, zij het voorzichtig, lijkt te doen). Je kunt alleen concluderen dat je statistiek tekort schiet: dat je toch niet genoeg data hebt, of dat je de verkeerde dingen hebt geteld. Vervolgonderzoek kan altijd aantonen dat er ergens toch een verschil verborgen zit.

Je kunt, met andere woorden, op deze manier nooit bewijzen dat Wolff en Deken volledig in elkaar opgingen. Je kunt hoogstens ooit bewijzen op welk moment ze toch onafhankelijk van elkaar werkten. De kwestie is overigens wel heel interessant (stel dat ze zo intensief samenwerkten, schreven ze dan echt ieder woord samen, zonder dat een van de twee zelfs maar dominant was in bepalen wat het volgende woord zou zijn?) We wachten vervolgresultaten van de jonge hoogleraar met belangstelling af!