Postscriptum: is de gebruiksgebaseerde taalkunde een kaas met (parasitaire) gaten?


Riny Huijbregts (RH) heeft een reactie geschreven op een eerdere post op Neder-L van mijn hand. Dat stuk bevat een (wellicht ironische) beschuldiging van blasfemie in de titel, en heeft als ondertitel ‘Een Naschrift’, zodat het lijkt alsof hiermee de discussie gesloten is. ‘Roma locuta, causa finita’. Ik wil toch graag nog op een paar punten reageren. Ik ga alleen in op de punten waar ik het niet mee eens ben. Laat ik vooraf maar duidelijk zeggen dat er ook wat waars en treffends in het stuk zit. 

Allereerst iets over “Sterretjes en intuïties”. Een van de grootste bezwaren van gebruiksgebaseerde taalkundigen bij formeel-taalkundige stukken is het wankele karakter van de grammaticaliteitsoordelen. Volgens RH is een zin als Waar heeft hij zonder naar te kijken een mening over gevormd? helemaal goed. Vlekkeloos. Voor mij dus niet. Ik vind hem maar niks. En zeker ongrammaticaler dan ‘Waar heeft hij een mening over gevormd, zonder er nog maar naar te kijken?’. Ik denk dat RH het daar ook wel mee eens is. Maar waar komt dat verschil vandaan? Als ze allebei semantisch én syntactisch welgevormd zijn, zoals RH beweert, dan verwacht je onder een generatieve analyse toch ook dat ze even goed zijn? De uitweg is dat grammaticaliteitsoordelen gradueel zijn, en RH alludeert daar ook op, maar de graduele aard van grammaticaliteitsoordelen is juist een inzicht dat beter past in een gebruiksgebaseerde benadering. Er is ook onderzoek (van Maria Mos en Véronique Verhagen) dat laat zien dat oordelen van individuen niet stabiel zijn: vraag je iemand na enige tijd om dezelfde zinnen te beoordelen dan krijg je andere oordelen. Maar als je naar geaggregeerde oordelen kijkt, dan krijg je wel stabiliteit. 

Vandaar dat een corpus ook zo nuttig is. In dat verband kan ik wijzen op buitengewoon boeiend onderzoek van Joan Bresnan en collega’s waarin testsubjecten gevraagd wordt om 100 punten te verdelen over twee varianten van een constructie. Bijvoorbeeld 20 punten voor variant A en 80 punten voor variant B, of 50-50, of welke andere verdeling dan ook. Uit dat onderzoek blijkt dat de oordelen van mensen overeenkomen met de probabiliteit van de varianten die een regressiemodel op basis van corpusdata berekent. Het is alsof die mensen wéten wat de kans is dat constructie A en constructie B in een corpus verschijnen. Dat kan je alleen goed verklaren als je aanneemt dat mensen stochastische informatie opslaan in hun hoofd. Hoe je dat moet verklaren met een UG-aanpak is me, ook na de geduldige uitleg van RH, nog steeds een raadsel. Dat corpusonderzoek niet nodig is, omdat de intuïtieve oordelen van taalkundigen een hoge convergentie laten zien met corpusonderzoek, lijkt me om twee redenen een ongerechtvaardigde conclusie. Ten eerste moet er een onderscheid gemaakt worden tussen oordelen van zinnen die onderscheidend zijn voor verschillende theoretisch visies op taal, zoals Marc van Oostendorp in de commentaarsectie van mijn stuk opmerkte. Dat mensen en corpora convergeren in hun oordeel of het lidwoord voor of na het nomen komt in het Nederlands, is niet zo interessant. Ten tweede: misschien zijn intuïties wel convergent met corpusdata, maar hun bewijskracht is kleiner. Democritus had ook al het idee dat de fysieke wereld uit atomen bestond, maar omdat hij dat op intuïtie bedacht had, en niet met empirische data kon ondersteunen, wordt zijn theorie terecht weggezet als voorwetenschappelijk. Het is natuurlijk intrigerend, en je zou willen weten hoe Democritus überhaupt op dat idee gekomen is, maar dat vormt zelf het onderwerp van onderzoek. Net zo wil ik graag weten hoe het komt dat taalkundige intuïties sporen met corpusgegevens. Die interesse deel ik met RH, denk ik, alleen wil ik daarom niet blind varen op die grammaticaliteitsoordelen. Dan zou enigszins vergelijkbaar zijn met de aanpak dat je Democritus voortaan op zijn woord gelooft, waarover hij ook spreekt. Ik heb toch nog wat meer bewijs nodig dat die grammaticaliteitsoordelen voldoende onfeilbaar zijn, dan een paar papers van Sprouse en collega’s. Ik denk trouwens niet dat bijvoorbeeld psychologen plots zouden zeggen: mijn intuïties komen goed overeen met die van mijn testsubjecten, dus laat ik voortaan maar in mijn eigen hoofd kijken en daarover rapporteren in onderzoekspapers.


RH heeft het ook over “ingesnoerde ambiguïteit”, en verwijt mij dat ik geen verklaring zou hebben waarom “Wie verkocht zijn boek goed?” geen possessief-betekenis heeft. Mij lijkt hier inderdaad een voordehandliggender betekenis in de weg te zitten, maar er is geen reden om hem syntactisch onacceptabel te achten. Als je naar corpusdata kijkt, dan blijkt splitsing van de bezitter en het bezit met dat clitische possessiefpronomen – de constructie zelf draagt verschillende namen in de vakliteratuur: ‘genitief in de dop’, ‘resumptief-possessiefpronomen-constructie’ (RPP) en ‘semi-genitief’ – wel degelijk voor te komen: “Die wergever van de OM,die Tonino’s vrij sprak…die moeten ze ook z’n pc nakijken” (Van de Velde 2009: 71, waar trouwens nog meer voorbeelden uit hedendaags en vroeger Nederlands vermeld worden). Ook voor de andere zin “Waar heb je er gisteren over gesproken” geldt iets dergelijks. “Waar heb je er gisteren over gesproken?” kan volgens RH niet betekenen: “Waarover heb je er gisteren gesproken?”. Dat er hier preferentieel bij over hoort, wil ik niet betwisten. Maar hoe verklaar je in een generatieve aanpak dat “Je bent dus naar dat congres in Brussel geweest… en je hebt er een lezing gegeven… maar wáar heb je daar dan precíes over gesproken?” nog wel passabel is? Zelfs als je daar door er vervangt, kan die zin nog wel. RH zal misschien zeggen: nee hoor, met er is die zin helemaal niet goed, maar dan zijn we weer bij mijn vorige bezwaar (over sterretjes en intuïties). Dat neemt overigens niet weg dat ik niet geloof dat taal aan leerbaarheidsbeperkingen beantwoordt. Alleen denk ik, met Christiansen & Chater (2008) dat dat niet op een generatief UG-design wijst.

Vervolgens heeft RH het over analogie, dat in mijn stuk als een “rookgordijn” gebruikt wordt om de discussie uit de weg te gaan. Ik laat in mijn stuk zien dat analogie in de taal een werkzaam principe is, en doe dat aan de hand van een handig, want kort uit te leggen voorbeeldje (sterke werkwoorden), maar dat mag niet van RH, want de morfologie van sterke werkwoorden is iets heel anders dan parasitaire gaten (“geen familie van elkaar”, zegt RH). Dat verbaast me, want in eerdere stukken was RH net heel enthousiast over zijn omni-inzetbaar verklaringsprincipe van ‘merge’, dat in de fonologie, morfologie, en syntaxis voorkomt. Meer zelfs: dat dat principe kamerbreed werkt, is net een bewijs dat het een krachtig principe is. Dat komt op mij over als quod licet Jovi, non licet bovi. Helemaal gek wordt het wanneer RH mij aanwrijft dat analogie niet goed werkt, omdat er frequentie-effecten van het klasse-lidmaatschap meespelen bij de sterke werkwoorden. Dat is me bekend. Maar juist de frequentie-effecten op het token- en op het klasseniveau zijn prima verenigbaar met een analogisch model. De gebruiksgebaseerde benadering is dol op frequentie-effecten (Bybee 2010). Uit Leuvens onderzoek (Van de Velde & Kestmont 2015), blijkt dat in een regressiemodel beide effecten (token-frequentie en klasselidmaatschap) overeind blijven als je ze multivariaat bekijkt. Het idee van RH dat “kinderen (…) dus veeleer “regels” dan “exemplars” leren” blijft in onze analyse niet overeind, en wordt verder ook aangevochten door Oscar Strik (2015). 

RH gaat trouwens nog verder in op frequentie. Hij doet smalend over de in de literatuur waar ik naar verwijs gesignaleerde enorme opslagcapaciteit van het menselijk brein. Hij houdt vol dat je een aanzienlijk aantal keren blootgesteld moet worden aan een bepaalde constructie voor je die in je opneemt. Nu is het zeker zo dat je voor abstractere (RH spreekt van “recursieve”) patronen meer blootstelling nodig hebt dan voor concrete idiomen. Maar RH heeft geen verklaring hoe je uiterst zeldzame patronen zoals de constructie met ‘als’ + inversie verwerft, waar ik het in mijn stukje over had. Die woordvolgorde is toch ook syntaxis? Hij gaat ervan uit dat een kind geen moeite heeft met een zin als “Which documents did you file without reading before signing?”. Dat wil ik nog wel eens zien. 

Dan komt RH aan met het argument dat syntactische patronen in talen in verschillend tempo verworven worden afhankelijk van hoe vaak die voorkomen. Noors heeft meer OVS-patronen dan het Nederlands, en Noorse kinderen leren de constructie vroeger dan de Nederlandse. Nu breekt mijn klomp. Zo’n frequentie-afhankelijk verwervingsproces wijst toch op de cruciale rol van de Stimulus? Is het niet contradictoir dat RH eerst zegt: de grammaticaliteitsoordelen van parasitaire gaten is stabiel, en die dingen komen zo weinig voor in corpora dat je ervan uit moet gaan dat ze al van meet af aan in het taallerend kind zitten, maar dat je tegelijkertijd zegt: voor andere patronen is het juist wel van belang dat het kind ze vaak genoeg tegenkomt om uit te vissen hoe het zit? Ik vermoed dat RH hier zou zeggen dat OVS een parameter-instelling is, maar dat de schakelaar van die parameter, net zoals ‘merge’ al ingebakken zit in het brein van het kind, maar dat vind ik een circulaire redenering. 

Interessant is dat RH zegt dat de gebruiksgebaseerde verklaring voor de verwerving van parasitaire gaten leidt tot “de empirische predictie (…) dat parasitaire gaten “chaotisch” worden geleerd: het ene kind als kleuter, het andere kind als puber of misschien zelfs als volwassene afhankelijk van de eerste kennismaking”. Dat lijkt hem uitgesloten en hij stelt een andere verklaring voor: kinderen kennen de constructie uit zichzelf. Hiermee schiet RH een parasitair gat in z’n eigen voet, denk ik, want ik verwijs opnieuw graag naar Dąbrowska, voor bewijs dat allerlei syntactische patronen, inclusief langeafstandsafhankelijkheden inderdaad chaotisch verworven worden: sommige volwassenen hebben de constructie niet. Overigens zonder dat dat altijd rechtstreeks correleert met de kwantiteit van het taalaanbod. Dat is precies wat je onder een analogisch model verwacht: de ene taalgebruiker legt de ene analogie, de andere een andere. Dat geldt eigenlijk ook voor de sterke vs. zwakke werkwoorden.

RH wrijft me aan dat ik de discussie over parasitaire gaten ontwijk, en dat ik niet met een goede verklaring kom (lees: kan komen) van de geobserveerde feiten. Dat klopt natuurlijk, maar dat komt omdat ik de feiten zoals ze voorgesteld worden eenvoudigweg niet aanvaard. De grammaticaliteitsoordelen zijn wankel, en de assumpties uit de lucht gegrepen. Een groot stuk van de theorie wordt in de lucht gehouden door ‘skyhooks’, om Dennetts nuttige term maar eens te gebruiken. De alomverklarende kracht is daar juist een zwakte. Je kunt in de geobserveerde patronen die RH aanhaalt effecten aanwijzen van frequentie, analogie, horror aequi etc., maar dat het parasitaire gaten zijn en dat de geobserveerde asymmetrieën aan een ijzeren regelmaat beantwoorden, lijkt me aanvechtbaar.

Ik moet aan die tosti denken met een afbeelding van de maagd Maria. Als ik die zie dan denk ik: er is iets met de grilplaat van het tosti-ijzer. Toevallig vervormd, of er zit vuil op, zodat je inderdaad af en toe, of misschien zelfs elke keer, een tosti krijgt met een afbeelding van de maagd Maria. Maar om dan te proclameren dat élk tosti-ijzer onder normale omstandigheden maagden Maria genereert, en ook schroeiplekken op tosti’s, waar niet dan met veel moeite Onze Lieve Vrouw in herkend kan worden, als bewijsstuk voor die stelling te zien, dat gaat me wat ver.
Bresnan, Joan. 2007. ‘Is syntactic knowledge probabilistic? Experiments with the English dative alternation’. In: Sam Featherston & Wolfgang Sternefeld (eds.), Roots: Linguistics in search of its evidential base. Berlin: Mouton de Gruyter. 77-96.
Bybee, Joan. 2010. Language, usage, and cognition. Cambridge: Cambridge University Press.
Christiansen, M.H. & N. Chater. 2008. ‘Language as shaped by the brain’. Behavioral and Brain Sciences 31(5): 489-508.
Dąbrowska, Ewa. 2012. ‘Different speakers, different grammars. Individual differences in native language attainment’. Linguistic Approaches to Bilingualism 2(3): 219-253.
Van de Velde, Freek. 2009. De nominale constituent. Structuur en geschiedenis. Leuven: UPL.
Van de Velde, Freek. & Britta Kestemont. 2015. ‘Using mixed-effects logistic regression to assess the determinants of regularisation of strong inflection in Dutch’. SLE 48 Workshop Shifting classes: Germanic strong and weak preterites and participles, Leiden 3 September 2015.

Strik, Oscar. 2015. Modelling Analogical Change. A history of Swedish and Frisian verb inflection. PhD Dissertation, University of Groningen.