Programmeren voor taalkundigen

Door Marc van Oostendorp

Een van de interessante verschijnselen van deze wereld is dat er zoveel programmeertalen zijn. Met een programmeertaal kun je een computer laten doen wat je wil, en dat kan op een aantal manieren – en desalniettemin nadert het aantal programmeertalen inmiddels het aantal natuurlijke talen.

Toch is er een handjevol talen waar niemand omheen kan die zijn computer meer wil laten doen dan wat Word, Excel en Chrome kunnen. En daarvan is Python inmiddels voor taalkundigen misschien de meest logische keus: een programmeertaal die voor mensen betrekkelijk gemakkelijk te lezen is doordat programma’s overwegend uit (Engelse) woorden staan en weinig obscure tekens bevatten die andere programmeertalen ontsieren – een taal die in de basis betrekkelijk gemakkelijk te leren is en die tegelijkertijd beschikt over eindeloze pakketten die alles mogelijk maken wat je wil.

Dat geldt zeker voor taal- en letterkundig werk, want Python kan goed omgaan met tekst én het wordt veel gebruikt voor wat data science wordt genoemd.

Het is dus geen gek idee om een Python-cursus te maken voor taalkundigen. De bekende Amerikaanse fonoloog Michael Hammand maakte zo’n cursus nu voor Cambridge University Press. Eerder maakte hij een cursus over Perl, een taal die meer specifiek bedoeld was voor het werken met teksten – maar die minder gebruikt wordt en geloof ik ook niet meer mogelijkheden biedt dan Python.

Het is een aardig boek, al is het naar mijn smaak een beetje theoretisch. Het geeft een overzicht van allerlei vormen van programmeren en het legt sommige zaken uit op een manier die speciaal geschikt is voor taalkundigen, die sommige begrippen die in de buitenwereld als ingewikkeld gelden, zoals recursie of lambda-extractie, al kennen. Maar het grossiert niet echt in échte taalkundige toepassingen. Het bekende pakket voor natuurlijketaaltechnologie NLTK wordt in een appendix behandeld.

Je kunt het boek misschien het best samen gebruiken met de cursus Python Programming for the Humanities van Maarten van Gompel en Folgert Karsdorp. Dat is in veel opzichten complementair – het gaat wat minder over de elementaire programmeerkunde en gaat juist dieper in de op de specifieke mogelijkheden van de taal voor de geesteswetenschappen.

Maar samen geven die twee boeken een inzicht dat wat mij betreft bij iedere academische bachelor-opleiding in een talenstudie verplicht zou zijn.

Michael Hammond. Python for Linguists. Cambridge: Cambridge University Press, 2020.
Bestelinformatie bij de uitgever