Perplexiteit als venster op de taal

Door Marc van Oostendorp

Een zin is een meerdimensionaal object. Hij bestaat uit woorden, die op hun beurt minstens twee dimensies hebben: een klankvorm (‘spruitje’) en een betekenis (‘klein groen koolachtig bolletje met een bittere smaak’). En die woorden staan ook nog eens in een bepaalde syntactische relatie tot elkaar. Als je naar een zin, een willekeurige zin, luistert, moeten je hersenen op al die verschillende niveaus – klank, betekenis, zinsbouw – aan de slag.

Daarover gaat een onderzoek van een groep Nijmeegse onderzoekers (full disclosure: een ervan is onze directeur op het Meertens Instituut) in het tijdschrift PLOS One.  De onderzoekers zeggen zelf in hun conclusie dat ze in dit artikel nieuwe bewijzen willen hebben laten zien voor een driedeling, maar in mijn ogen is dat helemaal het punt niet.  Dat die verschillende niveaus er zijn is nogal zó wiedes en al zo vaak gedemonstreerd dat het nauwelijks bewijs behoeft. Het artikel lijkt me vooral belangrijk als een demonstratie van een nieuw soort methode, waarin computermodellen en hersenscans worden gecombineerd.

Het probleem van hersenen is dat er sowieso de hele tijd van alles in gebeurt. Hoe weet je dan wat het betekent als bepaalde neuronen op een bepaald moment heel actief zijn? En vooral: hoe kom je er achter dat er inderdaad minstens drie verschillende informatiestromen verwerkt worden terwijl iemand naar een zin luistert?

Banaan

De onderzoekers bedachten hiervoor een slimme techniek: die van het meten van verrassing, of wat met een technische Engelstalige term perplexity wordt genoemd. Wanneer ik eerst sinaasappel en banaan heb gezegd, ben je verbaasder als ik vervolgens malversaties zeg, dan wanneer ik druiven zeg. In de informatietheorie is er een formule die dat kan uitdrukken (dat is die perplexity), en de onderzoekers in dit artikel zoeken dat uit door in een grote hoeveelheid teksten te kijken wat voor woorden relatief vaak bij elkaar in de buurt komen in teksten; en dan blijkt dat druiven vaker in de buurt van sinaasappel en banaan staat dan maleversaties.

Wanneer zoiets onverwachts gebeurt, veroorzaakt dat een schokje in je hoofd: er is even meer activiteit bij malversaties dan bij druiven.

Schokjes

Op die manier zijn de onderzoekers nu aan een tekstje gaan rekenen op drie manieren. Voor de semantiek namen ze de verschillende woorden. Hoe onverwacht is gegeven dat je deze klinkers en medeklinkers hebt gehoord de volgende klank? Hoe onverwacht is gegeven het feit dat je nu een voorzetsel en een bijvoeglijk naamwoord hebt gehoord het volgende werkwoord?

De schokjes komen op verschillende momenten in die drie dimensies wanneer iemand in een hersenscanner naar het tekstje zit te luisteren, en je kunt die vrij precies voorspellen. En zo konden de onderzoekers zien dat de drie informatiestromen die de tekst opleverde, in drie verschillende hersengebiedjes. Er was zelfs geen duidelijke overlap tussen de gebiedjes – uiteindelijk wordt al die informatie natuurlijk geïntegreerd, maar de schokjes van het onverwachte bereiken dat gebiedje kennelijk niet.

Relateren

Je luistert dus tegelijk naar de klank, naar de betekenis en naar de zinsbouw van een zin. Zoals gezegd: dat is op zich niet zo verrassend. Wél is de wijze fraai waarop de onderzoekers het hebben laten zien: door heel precies te rekenen aan de structuur van een tekst en die bevindingen te relateren aan wat ze zagen gebeuren in de hersenen van hun proefpersonen.