De afstand tussen twee Nederlanders

Voornamendrift 53

Door Gerrit Bloothooft


Verdeling van de afstand tussen de geboorteplaatsen van twee willekeurige kinderen (blauw), en die tussen de 1e en 2e naamgeving (donkerbruin), de 1e en 3e naamgeving (middenbruin) en de 1e en 20ste naamgeving (lichtbruin).

In een 1,5 m samenleving ben je je bewust van de afstand tot de mensen om je heen. Maar hoeveel mensen zijn er nu eigenlijk in je directe omgeving en hoeveel zijn er die je eigenlijk nooit zult ontmoeten? Kortom, wat is de verdeling van de afstand tussen twee Nederlanders? Dat is niet alleen van belang voor de verspreiding van een virus, maar ook voor het begrijpen van de verspreiding van talige fenomenen, zoals een nieuwe voornaam.

De ontwikkeling van de populariteit van een voornaam in de tijd wordt in de voornamenbank getoond. Voor modenamen kun je zien wanneer de naam voor het eerst is gegeven, wanneer die maximaal populair was en daarna weer uit de gratie raakt. Maar hoe een nieuwe voornaam zich in de tijd geografisch over Nederland verspreidt heeft nog weinig aandacht gehad. Je zou kunnen denken dat er een innovatief ouderpaar is en dat de door hun bedachte nieuwe naam door andere ouders wordt overgenomen. Waarna ook die weer een inspiratiebron zijn voor andere ouders, enzovoort. Het idee is dat die betrokken ouders tot het sociale netwerk behoren (van familie, vrienden, buren, collega’s, vage kennissen) van de creatieve ouders. En dan zou je denken dat die ook wel in de buurt wonen.

Omdat we uit de basisregistratie personen de geboorteplaats van iedereen kennen is de afstand tussen geboorteplaatsen van kinderen te bepalen. Daar gaan we mee aan de slag.

Er zijn in de periode 1920-1960 26.440 nieuwe namen bedacht, die uiteindelijk samen 1,8 miljoen naamdragers hebben. Voor de helft van die nieuwe namen is het maar bij één kind gebleven. Die 13.049 namen, ook wel hapaxen genoemd, zijn helemaal niet verspreid en voor nu niet interessant. Voor de andere namen bepaalde ik de afstand tussen de geboortegemeente van de eerste naamdrager, en die van de 2e, 3e en 20ste naamdrager (dat is mogelijk voor respectievelijk 13.391, 9.880 en 3.227 verschillende namen). De verdeling van die afstanden (in 10 km intervallen) staat in de figuur. Om de verdeling beter te begrijpen is ook de distributie berekend van de afstanden tussen geboortegemeenten van elk paar geboorten in de 1,8 miljoen naamdragers (blauwe lijn in de figuur, gebaseerd op maar liefst 1012 combinaties). Dat is de verdeling die je verwacht als er geen relaties tussen geboorten zijn.

Dat er weinig kinderen zijn die meer dan 300 km van elkaar geboren worden (tussen Delfzijl en Sluis) zal geen verbazing wekken. Dat de verdeling pieken heeft bij 60 en 90 km misschien wel. Dat zijn afstanden tussen onze grote gemeenten, waar veel kinderen worden geboren die veel geboorteparen genereren. 3,3% van elk paar kinderen wordt in dezelfde gemeente geboren (afstand 0 km), en de dip bij 10 km komt omdat de centra van gemeenten niet heel dicht bij elkaar kunnen liggen.

De verdeling van de afstanden tussen de geboorteplaats van het eerste kind met een modenaam en die van een latere naamgeving wijkt maar weinig af van die tussen twee willekeurige kinderen, en dat is opmerkelijk. Alleen dezelfde geboorteplaats komt vaker voor, het meest voor de 2e naamgeving (11,4% ten opzichte van 3,3% willekeurig).  Bij de 3e is dat al gezakt tot 7,5%. Voor de 20e naamgeving zijn de verschillen met de verdeling van de afstanden tussen twee willekeurige geboorten klein geworden.

Dit resultaat zou je niet verwachten bij stapsgewijze imitatie vanuit een enkel innovatief ouderpaar. De tweede naamgeving verwacht je dan in de buurt, terwijl latere naamgevingen op steeds grotere afstand zouden plaatsvinden van de eerste. Voor de tweede naamgeving komen korte afstanden weliswaar wat vaker voor, maar verder bestrijkt die distributie toch al heel Nederland alsof de geografische verdeling van de tweede naamgeving willekeurig is. Dat suggereert dat niet één maar verschillende ouderparen verspreid over heel Nederland onafhankelijk van elkaar dezelfde modenaam kiezen. Mogelijk toevallig omdat de tijd er rijp voor was, mogelijk onder invloed van een buitenlandse naamdrager. En dat vanuit die verschillende startpunten over Nederland imitatie in de omgeving een rol gaat spelen. Dat gaan we in de volgende bijdrage dan maar eens voor de meest populaire naam in het bestand onderzoeken: Sandra.