Tag: corpus

Het NAMES corpus met 850.000 namen, gratis

Voornamendrift 59

Door Gerrit Bloothooft

Het CLARIAH project NAMES had tot doel om 189.707 verschillende enkelvoudige voornamen (61,9 miljoen voorkomens) en 562.676 verschillende enkelvoudige achternamen (54,5 miljoen voorkomens) uit de 19e eeuwse burgerlijke stand (wiewaswie.nl versie 2011) zoveel mogelijk te voorzien van een standaardvorm. Dat zijn praktische standaarden (dwz niet noodzakelijk met een etymologische basis die vaak niet is vast te stellen) die nuttig zijn voor de identificatie van personen. Daarnaast bevat het corpus frequentiegegevens, zowel van het voorkomen in de 19e eeuwse akten als in de basisregistratie van 2017, die kunnen helpen om een indruk te krijgen van de status van een naamvariant (als zeldzame schrijffout of echte variant). Het NAMES corpus is nu gratis te downloaden bij de taalmaterialen van het Instituut voor de Nederlandse Taal. Bestanden staan in tab-gescheiden vorm en zijn eenvoudig in te lezen.

Lees verder >>

Een corpus van roepnamen en voornamen

Voornamendrift (34)

Door Gerrit Bloothooft en David Onland

Niet iedereen heeft een voornaam die ook zo in de burgerlijke stand staat. Dat noemen we dan de roepnaam, terwijl de officiële naam ook wel de doopnaam wordt genoemd. Blijkbaar forceert de kerk in de doop een voornaam die ouders ook aan de staat doorgeven, maar die in de dagelijkse praktijk niet functioneert. ‘Wim, aan tafel’, roept toch een stuk gemakkelijker dan ‘Wilhelmus, aan tafel’. En soms heeft de roepnaam zelfs helemaal niets uitstaande met de officiële naam. Omdat roepnamen nergens systematisch worden genoteerd is onderzoek ernaar lastig. Dat is jammer omdat de roepnamen de dagelijkse praktijk vormen waaraan de laatste decennia veel is veranderd. Daarin komt nu verandering omdat we in staat zijn geweest om zowel de roepnaam als de officiële naam van 1,5 miljoen Nederlanders te verzamelen.

Lees verder >>