Uniek zijn, met naamvarianten

Voornamendrift 58

Door Gerrit Bloothooft

Mijn naam wordt wel als Bloothoofd geschreven in plaats van Bloothooft, wat met de huidige spelling begrijpelijk is. Maar is Bloothoofd een schrijffout en gaat het om mij, of is het een wezenlijk verschil en gaat het om iemand anders die echt Gerrit Bloothoofd heet? Voor historische persoonsreconstructie (als onderdeel van een individuele biografie of van de reconstructie van een hele bevolking) is dat een groot probleem, want dan moet iemand uniek geïdentificeerd kunnen worden.

In de vorige bijdrage liet ik zien dat in 3,9 miljoen huwelijksakten uit de burgerlijke stand tussen 1811 en 1930, 99,8% van de bruidsparen een unieke naamcombinatie hadden, terwijl de overige paren op basis van hun geboortejaren ook identificeerbaar zijn. Maar voor het vaststellen van het gezinsverband rond een echtpaar zijn de geboorte-, huwelijks- en overlijdensakten van hun kinderen en de overlijdensakten van henzelf nodig, en dan kan het voorkomen dat daarin naamvarianten gebruikt zijn. Dat moet dan wel herkend worden.

Daarvoor moeten we eerst vaststellen wat een naamvariant is. Bij spellingvarianten kan gedacht worden aan schrijfwijzen waarbij de uitspraak dezelfde is, bijvoorbeeld Cornelis en Kornelis. Een fonetische transcriptie als standaardvorm zou dan een mogelijke oplossing zijn, maar waar dat voor modern gespeld Nederlands al moeilijk is, blijkt dat voor historisch Nederlands met spel-, schrijf- en digitalisatiefouten onmogelijk. Daarom maken we met robuuste regels een semi-fonetische vorm die weliswaar geïnspireerd is door uitspraak maar die niet de pretentie heeft die ook precies te representeren. Zo wordt Elisabeth dan ELYSABET, Rijcklof wordt RYKLOF, Guillemine wordt WYLEMYNE.

Als we de analyse van de eerste voornaam en eerste achternaam van het bruidspaar in de huwelijksakten op de semi-fonetische vorm ervan uitvoeren dan daalt het aantal unieke naamparen van 99,5% naar 98,6%. Dat is een geringe teruggang, maar het aantal verschillende voornamen daalt daarbij voor vrouwen van 34.407 naar 19.466 in semi-fonetische vorm, voor mannen van 22.779 naar 13.416 en voor achternamen van 192.419 naar 103.765. Dat is ruim 1/3 van het totaal aantal namen minder.

Het accepteren van naamvarianten betekent ook dat meer naamparen niet uniek worden, ook al blijft die reductie beperkt. De meest voorkomende combinaties in semi-fonetische vorm zijn

Alle spellingvarianten van voornamen van mannen die voor de semi-fonetische vormen in bovenstaand lijstje in het hele corpus worden gevonden zijn

En voor de vrouwen zijn het

Deels zijn het spellingvarianten die in de originele akten zo geschreven zijn, deels zijn het typefouten tijdens de digitalisatie.

Voor de genoemde achternamen zijn de varianten: DE BUR (de Boer, 23359); DE FRYS (de Vries, 45050; de Fries, 23; de Vrijs, 20; de Vris, 2; de Vreis, 1; de Vriesz, 1), JAKOBS (Jacobs, 10304; Jakobs, 535; Jacobsz, 37), JANSEN (Jansen, 35961; Janssen, 24262; Janzen, 512; Janszen, 302; Jannsen, 5; Janhsen, 5; Jansssen, 2; IJansen, 2; Jancen, 1), DE JONG (de Jong, 45495; de Jongh, 3648; de Iongh, 2), PETERS (Peters, 12341; Peeters, 6144; Petters, 3; Petersz, 2).

De bovenstaande naamvarianten blijven nog dicht bij de voorkeurspelling, maar we kunnen verder gaan in het beschrijven als varianten, waarbij ook bijvoorbeeld Jan, Johannes, Joan, Joannis en 329 andere vormen onder één standaard johannes worden samengenomen. Dat komt in een volgende bijdrage over het NAMES project aan de orde. In de kop van deze bijdrage staat een deel (!) van de varianten van elisabeth als namenwolk.

Voor de achternaam vat bijvoorbeeld de standaard JANSEN dan Jan, Jannes, Jannessen, Jannette, Jannis, Jannisse, Jannissen, Jans, Janse, Jansen, Jansma, Jansse, Janssen, Janssens, Jansson, Jansz, Janszen, Jantson, Jantzon, Janze, Janzen, Jensen en Jonsen samen.

Deze verruiming van de naamvarianten die onder dezelfde standaard worden samengenomen gaat natuurlijk ten koste van het percentage unieke naamparen van echtelieden, dat daalt verder van 98,6% naar 97,7%. De naamparen die in standaardvorm het meest voorkomen staan hieronder. Toch komen we de naamcombinatie die in standaardvorm het meest voorkomt (johannes JANSEN en maria JANSEN) nog maar 33 keer tegen, en de kans is groot dat die door de analyse van de tijden en plaatsen van gebeurtenissen gedisambigueerd kunnen worden.

Dat betekent dat we door namen in standaardvorm te gieten, naamvariatie die niet relevant is voor de identiteit van een persoon kunnen ondervangen, zonder dat het ten koste gaat van het onderscheidend karakter van de naam – mits we met de namen van echtelieden kunnen werken.