Kun je na je kindertijd nog wel een nieuwe taal leren?

Door Freek Van de Velde

Kinderen pikken gemakkelijker nieuwe talen op dan volwassenen. Als je te laat begint met het leren van een taal kun je die eigenlijk nooit meer perfect leren: er zijn altijd kleine dingetjes in de uitspraak en de grammatica die je net even anders doet. Dat leerstuk heet ‘de kritische periode’, en er woedt al een halve eeuw een vinnig debat over in de taalkunde. Formele (ook wel: generatieve of Chomskyaanse) taalkundigen hechten er doorgaans veel geloof aan; gebruiksgebaseerde (ook wel: cognitieve) taalkundigen zijn er sceptischer over, al is dat onderscheid niet zwart-wit. Zelf ben ik ook een heel eind opgeschoven: door het werk te lezen van de Amsterdamse onderzoeksgroep rond Fred Weerman, en door het werk over leerbaarheid van Rick Dale en Gary Lupyan, ben ik er – van huis uit nochtans gebruiksgebaseerde taalkundige – de afgelopen jaren van overtuigd geraakt dat kinderen en volwassenen hun grammatica op een nogal verschillende manier verwerven. Al blijf ik natuurlijk wel van mening verschillen met mijn Chomskyaanse collega’s over de onderliggende verklaringen.

Meer dan een half miljoen proefpersonen

Een van de problemen is dat er eigenlijk niet zo veel experimenten zijn die duidelijke resultaten opleveren en waarop methodologisch niet heel veel aan te merken is. Daar hebben drie Amerikaanse onderzoekers recent verandering in proberen te brengen. In het vakblad Cognition is een paar maanden geleden een artikel verschenen van de hand van drie psychologen, Joshua Hartsthorne, Joshua Tenenbaum en Steven Pinker, die hebben proberen uit te zoeken hoe het nu eigenlijk zit. Ze doen in dat artikel drie dingen waar het in eerder onderzoek aan mangelt: ten eerste hebben ze een ontzaglijke hoeveelheid data: testgegevens van zeshonderdduizend proefpersonen. Ze laten zien dat je inderdaad zoveel gegevens nodig hebt, om betrouwbare uitspraken te kunnen doen over deze kwestie. Ten tweede: ze zetten gecompliceerde statistiek in om alle betrokken factoren goed uit elkaar te trekken. Zo kunnen ze het effect van leeftijd, periode van blootstelling aan de nieuwe taal, geslacht, en leerderssituatie nauwkeurig onderscheiden. Ten derde maken ze een belangrijk onderscheid tussen het vermogen om een nieuwe taal te leren en het succes waarmee hun proefpersonen de nieuwe taal leren. Dat laatste kun je rechtstreeks meten, maar dat eerste niet. In het artikel maken de auteurs een inzichtelijke vergelijking: als twee hardlopers gelijk aan de meet komen, kun je niet zeggen dat ze even hard gelopen hebben. De ene loper kan halverwege het traject begonnen zijn, en maar de helft van de afstand hebben gelopen, maar dan wel trager.

Voor hun onderzoek hebben ze een grammaticatest ontwikkeld voor het Engels met de meest uiteenlopende constructies. Om ervoor te zorgen dat die test als een lopend vuurtje onder Facebook-vrienden verspreid werd, hebben ze het zo aan boord gelegd dat een algoritme probeerde te raden waar je vandaan kwam als je de test aflegde: kan het artificiële-intelligentiealgoritme achterhalen dat je een IJslander, Turk, of Japanner bent die als volwassene Engels heeft geleerd? Dat bleek een gelukkige vondst, want de test was inderdaad razend populair op het internet. Leuk gevonden. En er zijn nog meer dingen die het artikel heel erg de moeite waard maken: de inleiding van het stuk is een pareltje van helderheid, en biedt een prachtig beknopt overzicht van de stand van het onderzoek, en verder is het ook een opluchting vast te stellen dat de auteurs in de discussie aan het einde dicht bij de resultaten blijven, en zich niet vergalopperen in hun conclusies, bijvoorbeeld door in hun resultaat een bewijs voor een ‘modulaire’, generatieve visie op het taalvermogen te zien, ook al kun je aan het feit dat de onderzoekers allemaal aan Amerikaanse universiteiten aan de oostkust werken wel vermoeden dat ze in die strekking zitten.

Dus toch een kritische periode

Wat is nu het verdict van dit omvangrijke onderzoek? Uit de analyse van de immense hoeveelheid gegevens bleek dat er wel degelijk een kritische periode is, maar dat die wat langer loopt dan traditioneel gedacht wordt, en dat het doek over de gemakkelijke taalverwerving pas valt op 18-jarige leeftijd.

De auteurs trekken die conclusie niet, maar eigenlijk is dat geweldig nieuws voor leerkrachten in het middelbaar onderwijs. De leerlingen die ze voor zich hebben, zijn dus best in staat talen te leren.

Bezwaren bij het onderzoek

Hoe omvangrijk en helder het artikel ook is, er is toch een en ander aan te merken op de aanpak van de onderzoekers. Sommige van die bezwaren geven de auteurs zelf ook ruiterlijk toe.

Het grootste bezwaar lijkt me te zijn dat hier een heel specifiek soort vaardigheid getest wordt: alleen grammatica, en niet de uitspraak, en alleen de receptieve kant, niet de productie. Nu is het juist de productiezijde, en vooral de klanken waarin een moedertaalspreker zich onderscheidt van een niet-moedertaalspreker, en het zou best kunnen dat de kritische periode voor die vaardigheden op wat jongere leeftijd afgesloten wordt.

Het tweede bezwaar is dat de test alleen over het Engels gaat. Nu is het Engels typologisch gezien een bijzondere taal, die al eeuwenlang diepgaand door taalcontact beïnvloed is, en daardoor heel ‘leerbaar’ is (wie daar meer over wil weten, leze het werk van John McWhorter).

Statistiek

Een derde bezwaar is de statistiek. Daar wordt een groot vertrouwen in gesteld, en dat is wellicht niet zonder gevaar. Er worden immers allerlei vereenvoudigende aannames gemaakt om statistische vergelijkingen op te stellen. De grammaticaverwerving wordt bijvoorbeeld als een ongecompliceerd exponentieel proces gezien, dat de volgende vorm heeft:

Vertaald: grammaticale beheersing g is een functie van leeftijd t en is het verschil tussen perfecte beheersing (1) minus Eulers constante (e) verheven tot een negatieve machtsfactor gevormd door de bepaalde integraal die loopt van het moment vanaf de eerste blootstelling aan de taal t_e tot de huidige leeftijd t van leersnelheid r vermenigvuldigd met een constante E, een wegingsfactor die verschilt naargelang de leercontext (immersie, tweedetaalverwerving of moedertaalverwerving). De r is zelf een functie van de leeftijd, die eerst constant blijft tot een parametrisch geschatte leeftijd, en vervolgens een s-curve doorloopt (traag – snel – traag), met opnieuw parameterschattingen voor de steilte van de curve en de asafsnede.

De hele vergelijking heeft een aannemelijke bouw: doordat de exponent negatief is, heeft een grotere leersnelheid en een grotere tijdsspanne van blootstelling tot gevolg dat de afstand tot perfecte beheersing kleiner wordt (de functie gaat asymptotisch naar 1). Dat ligt voor de hand. Dat er een soort exponentiële functie gebruikt wordt, ligt ook voor de hand: de redenering is hier dat het effect van langere blootstelling steeds kleiner wordt. Het verschil tussen 1 en 2 jaar blootstelling is groter dan tussen 40 en 41 jaar blootstelling. Maar je kunt je de vraag stellen of de curve werkelijk zo egaal moet verlopen als hier verondersteld wordt? Heb je juist niet van die enorme sprongen onderweg? Ik heb taalleerkrachten wel eens horen zeggen dat ze het gevoel hebben dat taalleerders door een eerste barrière moeten en dan plots een soort sprong maken. Je kunt die s-curve krijgen door aan de functie r(t) te morrelen, maar dat is niet de bedoeling voor het type effect waar die taaldocenten het over hebben: het gaat om sprongen onafhankelijk van een onderliggend veranderd leervermogen, bijvoorbeeld in één semester, met studenten die tijdens dat jaar min of meer dezelfde r-waarde hebben.

En dan die parameter E. Dat is dus een wegingsfactor die bedoeld is om de verschillende types taalverwerving te ondervangen, zoals gezegd: moedertaal, immersie of tweedetaalonderwijs. Maar waarom zou die parameter universeel verschillen volgens verwervingscontext? Is Chinese immersie in het Engels hetzelfde als immersieonderwijs in Noorwegen? Wat met moedertaalsprekers die maar één ouder hebben die Engels spreekt? Wat met kinderen die op internaat zitten waar een andere taal gesproken wordt?

Verdict

De beste stuurlui staan aan wal. Het zou flauw zijn om drie bezwaren aan te halen en de studie van tafel te vegen. De auteurs hebben een bewonderenswaardige ijver aan de dag gelegd om alle verschillende parameters te schatten (de E, de leeftijd waarop r overgaat van een constante naar een s-curve, en de parameters van de s-curve zelf), met een ingewikkeld zoekalgoritme (Differential Evolution). Tegelijkertijd zetten ze andere technieken in om het risico van wat statistici ‘overfitting’ noemen in te dijken, door de data herhaaldelijk te herverkavelen met een zogenoemde Monte Carlo techniek.

Bij de huidige stand van de wetenschap is dit een grote sprong voorwaarts in het debat. Er wordt weliswaar maar één stukje van de taalverwerving afgedekt, maar dit soort studies heeft op zijn minst het voordeel dat er minder gekrakeel is over de data zelf. En zelfs als deskundiger taalkundigen, psychologen of statistici later toch onoverkomelijke bezwaren zien in dit onderzoek, dan nog is het natuurlijk geen verloren moeite geweest. Dat is wetenschap. Om het met een bijbels beeld uit te drukken: moeizaam vooruit van statie tot statie op een kruisweg, onderweg een paar keer vallen, om uiteindelijk liefdevol ten grave gedragen te worden.