Gratis: heel veel plaatsnamen

Dagboek van een amateurprogrammeur

Door Marc van Oostendorp

Het onderzoekje dat ik begon naar namen in de 1100 streekromans die ik elektronisch van Ewoud Sanders had gekregen, is inmiddels officieel mislukt. Maar hij heeft misschien een aardige bijvangst opgeleverd: een databaseje met meer dan vijfduizend plaatsnamen (namen van gehuchten, dorpen en steden) in het Nederlandse taalgebied.

Dat zit zo: nadat ik in vorige afleveringen van deze reeks heb gekeken naar voornamen, en daar eigenlijk niet veel meer uitkwam dan dat er in Nederlandse streekromans vooral Nederlandse namen als Jan, Dirk en Anna voorkomen, dacht ik: misschien heeft het meer zin als ik naar plaatsnamen kijk.

Maar ook daar komt niet veel uit. Hier is de top-20 van gemeentenamen in Nederlandse streekromans (het getal achter iedere naam geeft het aantal voorkomens)

Amsterdam 5628
Rotterdam 1783
Utrecht 1671
Groningen 1162
Raalte 785
Leek 670
Leiden 656
Hoorn 640
Arnhem 620
Bergen 563
Haarlem 500
Alkmaar 495
Vianen 495
Wageningen 478
Delft 469
Leeuwarden 445
Kampen 415
Zwolle 393
Tiel 309
Houten 294

Amsterdam wint het dus verreweg van alle andere plaatsnamen. Dat zou verrassend kunnen zijn voor een corpus van streekromans, maar omdat die romans zich overal kunnen afspelen, worden kleine individuele plaatsen alleen in enkele boeken genoemd. Naar de hoofdstad reist of verwijst men echter gemiddeld zo’n vijf keer per boek. Ook de andere grote steden doen het goed (Den Haag viel buiten mijn manier van zoeken omdat het uit twee woorden bestaat, en ‘s-Gravenhage komt niet veel voor). Enigszins eigenaardig is het voorkomen van Raalte. Bij nadere inspectie blijkt het hier te gaan om de familienaam Van Raalte. Er zitten een aantal zogeheten ‘landverhuizersromans’ in de verzameling, over Nederlanders die in de negentiende eeuw naar Amerika trokken, en dominee Van Raalte was een groot voorman.

Ook als je de namen uitzet in de tijd, vind je weinig nieuws. Amsterdam (zie boven) wordt regelmatig genoemd, zonder dat er een duidelijke ontwikkeling in de tijd zit. Rotterdam (hieronder), de nummer 2, geeft een beeld dat je voor de andere plaatsen ziet: meestal komt de plaats niet voor, maar in een paar werken wordt hij ineens heel veel genoemd.

Conclusie: streekromans spelen in allerlei verschillende streken, als de personages buiten die streek verkeren gaan ze vaak naar de hoofstad.

Iets interessanter wordt het als we naar postcodes kijken. Hier is een overzicht als we alleen kijken naar het eerste cijfer van die postcodes:

1xxx YY 3834
7xxx YY 3809
9xxx YY 3596
3xxx YY 3302
8xxx YY 2772
6xxx YY 2535
2xxx YY 2534
5xxx YY 2368
4xxx YY 2137

Omdat de postcode van Amsterdam met een 1 begint, ligt die regio bovenaan. Daarna komen provincies uit het noorden en het oosten. Misschien is dat veelzeggend: de stereotype ‘regio’ ligt in Nederland daar.

Maar het kan ook een onevenwichtigheid zijn in deze verzameling boeken, en dat is de conclusie die ik nu trek: deze verzameling blijkt eigenlijk ongeschikt voor dit type naamkundig onderzoek omdat te onduidelijk is hoe representatief hij is voor het genre. Ik ga me dus nu richten op meer taalkundig onderzoek, waar die representativiteit er hopelijk minder toe doet. Daarover een volgende keer.

Maar dit onderzoek had dus ook een bijvangst: uit een paar bronnen die ik heb (je werkt op het Meertens Instituut of niet) heb ik een databaseje gemaakt met al die plaatsnamen: dat staat hier. Het is een zogeheten JSON-bestand dat voor veel database-programma’s leesbaar is. Bij iedere plaatsnaam is de volgende informatie opgenomen:

  • de postcodes die gelden voor deze plaats
  • de gemeente waar de plaats onder valt (dat is overigens verouderde informatie waarvoor ik niet insta)
  • de provincie waar de plaats onder valt
  • de zogeheten Kloeke-code, een geografisch coderingssysteem dat dialectologen van oudsher gebruiken