Godslasterlijk. Een Naschrift


In zijn bijdrage “Parasitaire gaten als godsbewijs” deelt Freek van de Velde (FvdV) met ons zijn kijk op God. Niet zijn kijk op parasitaire gaten. Die gaat hij zorgvuldig uit de weg. Maar met de keuze van zijn titel stelt hij Poverty of Stimulus gelijk aan God. Die vergelijking laat ik geheel voor zijn rekening. Ook heb ik het vermoeden dat Freek niet van God houdt.
1. Poverty of Stimulus algemeen. De discussie laat zowel het algemene als het specifieke probleem grotendeels onbesproken. Poverty of Stimulus kun je niet zo maar negeren. Elk biologisch systeem heeft zijn eigen Poverty of Stimulus. Dat is inherent aan genetisch bepaalde organismen. Alleen als omgevingsfactoren het organisme volledig determineren, is er geen reden voor een genetische component. Maar groei en ontwikkeling van een biologisch organisme volgen een intern programma waarbij de omgeving slechts een sturend en vormend effect heeft. Zo ook in het geval van taal als deel van de biologische wereld. De talige omgeving is ondergespecificeerd voor taal. De enige vraag is: is de “genetische” component hier uitsluitend domein-algemeen of gedeeltelijk domein-specifiek (Chomsky 2011)? Empirisme, behaviorisme, connectionisme, neural network systems, construction grammar, usage-based grammar, etc. of rationalisme, mentalisme, generatieve systemen, Principles & Parameters, SMT, etc.? Dit is de echte, principiële en conceptuele vraag. Ik denk dat we elkaar hier volledig vinden. Van de Velde sluit blij aan bij de eerste categorie, ik bij de laatste. Het lijkt vooralsnog prematuur om vruchtbaar over elkaars “gut feelings” voor onderzoeksprogramma’s te twisten. Als je neuzen telt wint het empirisme wereldwijd. Nooit anders geweest. Maar wat betekent dit?

2. Sterretjes en intuities. Van de Velde vindt het zinnetje Waar heb je zonder in —PG te lezen een boek over —RG gekocht? vreemd (vind ik ook), en denkt dat een “parasitaire gaten-expert” deze zin niet van een sterretje zou voorzien. En dat is dan weer problematisch in zijn ogen. Maar dit heeft niets met “ongrammaticaliteit” en alles met “degrees of grammaticalness” te maken. Het zinnetje is syntactisch welgevormd maar semantisch ongelukkig: PG moet iets tastbaars (bv. brochure) zijn en RG moet iets inhoudelijks zijn (bv. parasitaire gaten). Die twee dingen wringen. Je kunt niet antwoorden met “Die brochure” of “Parasitaire gaten.” Werk het semantische vlekje weg en het probleem verdwijnt. Een vergelijkbare zin als Waar heeft hij zonder naar te kijken een mening over gevormd? is welgevormd. 

Maar onder dit alles ligt natuurlijk een diepere en meer serieuze ergernis verscholen: het is algemeen bekend dat de generatieve linguïstiek slordig omgaat met data, intuïties en sterretjes. Is dat werkelijk zo? Nee dus. Experimenteel verzamelde welgevormdheidsoordelen (Phillips 2006) laten zien dat parasitaire gaten “genuinely acceptable” zijn. Een zeer uitgebreide en gedetailleerde studie (Sprouse et al. 2013) over informele en formele welgevormdheidsoordelen laat een “convergence rate” van 95% zien en weerlegt daarmee de conclusies van Gibson & Fedorenko. Blijkbaar heeft de keuze van methode geen substantiële invloed op de empirische basis van het syntactische onderzoek. Zachtjes uitgedrukt, het relatieve uitblijven van “echte experimenten” en statistische ondersteuning haalt niet per se de kernassumpties van het generatieve onderzoeksprogramma onderuit. 
3. Ingesnoerde ambiguïteit. De vraag hier was waarom zinnen als Waar heb je er gisteren over gesproken? (“waar” is hier NIET prepositioneel) of Wie verkocht z’n boek goed? (“wie” is hier NIET possessief) obligaat een interpretatie ontberen die je wel zou verwachten. Vergelijk verwante zinnen als Heb je er gisteren over parasitaire gaten gesproken? naast Heb je er gisteren in je stamkroeg over gesproken? in het eerste geval, en Jan z’n boek verkocht goed naast Jan verkocht z’n boek goed in het tweede geval. Deze vraag blijft onbeantwoord maar wel zegt Van de Velde het experiment niet te begrijpen dat moet laten zien dat deze obligate interpretaties irreversibel zijn. Gelukkig is de neurologische variant van dit type experiment al wel uitgevoerd (Musso et al. 2003). Een kunstmatig geconstrueerde taal met zinnen die universele condities op taal schenden werden niet (of totaal anders) geleerd dan een vergelijkbare taal die geheel in overeenstemming met deze condities was samengesteld. Een corpus dat UG-gebaseerde condities tegenspreekt wordt niet als taal maar (hooguit) als een puzzel geleerd. De stelling was dat ook Waar heb je er gisteren over gesproken? of Wie verkoopt z’n boek goed? nooit als antwoord zullen kunnen krijgen “Ik heb er gisteren over parasitaire gaten gesproken” of “Jan z’n boek verkoopt goed” om precies dezelfde reden: UG-gebaseerde principes worden geschonden en leerbaarheid wordt gecompromitteerd. Dit is een speciaal geval van een meer algemene conclusie die door Musso et al. (2003) experimenteel wordt bevestigd. Verder maken Berwick et al. (2011) en Legate & Yang (2002) duidelijk dat de structuur-afhankelijkheid van regels een domein-specifieke en geen statistische basis heeft. Dit geldt voor parasitaire gaten net zo zeer als voor subject-aux verplaatsing. Het onvermogen om “constrained ambiguity” aan te pakken neemt Van de Velde voor lief. Curieus.
4. Analogie. Ook de analogie-kwestie wordt royaal ontweken. De discussie hier ging over een “analoge” verklaring voor een PG contrast. Een subject-object asymmetrie en contrast in de welgevormdheid van twee PG-zinnen krijgen een “analoge verklaring” van Van de Velde. Maar die is incorrect. Dezelfde subject-object asymmetrie en hetzelfde contrast blijven immers onveranderlijk overeind wanneer het “analoge” deel in het argument wordt weggefilterd. De subject-object asymmetrie persisteert en wordt verklaard door meer algemene en onafhankelijk gemotiveerde eigenschappen van “internal merge” en binding van variabelen. Opgemerkt moet hier worden dat er geen gebruiksgebaseerde verantwoording is van de speciale eigenschappen van parasitaire gaten en uiteindelijk wordt de generatieve verklaring dan ook niet bestreden. Voor gebruiksgebaseerd taalonderzoek is er enerzijds het probleem om niet-frequente patronen te generaliseren en wezenlijke eigenschappen van natuurlijke taal zoals bindingseigenschappen van marginale PG constructies adequaat te vangen (Pearl & Sprouse 2013), en anderzijds is er het probleem om statistisch frequente patronen te negeren en eigenschappen te onderscheppen die niet werkzaam zijn in natuurlijke taal maar gestipuleerd kunnen worden in “onnatuurlijke” talen (cf. Musso et al. 2004). Ook dit deel van de discussie wordt virtuoos ontweken.
In plaats hiervan wordt een rookgordijn opgetrokken en wordt de discussie verlegd naar “analoge” overpeinzingen bij de verwerving van sterke werkwoorden. Maar wat hebben sterke woorden en parasitaire gaten met elkaar te maken? Recursieve structuren en sterke werkwoorden zijn geen familie van elkaar. Trouwens ook in de wereld van onregelmatige werkwoorden kunnen we de vage notie “analogie” achterwege laten. Lees het deelhoofdstuk “The failure of analogy” uit Yang’s boek uit 2002. De eigen frequentie van een specifiek sterk werkwoord is maar een deel van het antwoord. Minstens zo belangrijk is de frequentie van de klasse van onregelmatige werkwoorden waar het deel van uitmaakt. Alleen binnen deze door regels bepaalde klassen van werkwoorden wordt hun gedrag zonder uitzondering bepaald door input frequenties (“class-based frequency hierarchy ”). Een onregelmatig werkwoord met een relatief lage frequentie heeft een grotere kans om correct gebruikt te worden wanneer het deel uitmaakt van een werkwoordklasse met een hoge gebruiksfrequentie. Dit “free-rider effect” is mogelijk dank zij de regel die alle werkwoorden binnen een klasse delen. Een slide-slode “analogie” naar ride-rode is uitgesloten maar een “analogie” spit-spit naar hit-hit blijft mogelijk. Dit zou ook kunnen verklaren waarom we in een Vlaams dialect gevengegoven hebben naar “analogie” van nemen-genomen. De omgekeerde analogie zou dan uitgesloten zijn. Kinderen leren dus veeleer “regels” dan “exemplars.” Een grammaticaal concept wordt door Yang gekoppeld aan een leermodel (variational learning) dat een UG-georiënteerde statistische invulling (“tolerance principle”) geeft aan anders vage begrippen als “analogie” en “productiviteit” (zie ook zijn te verschijnen Price of Productivity).
5. Poverty of Stimulus. Parasitaire gaten zijn echter ook empirisch interessant omdat in dit geval Poverty of Stimulus een verrassend kwantitatief effect krijgt. Marc van Oostendorp rekent ons ruwweg voor dat verwerving van parasitaire gaten zo’n 125 jaar kan duren. Zijn argumentatie moet misschien wat verfijnd worden omdat parasitaire gaten van dit type onder meer dan één smaak voorkomen. Maar de kern van zijn betoog blijft overeind. Ik heb proberen duidelijk te maken dat alleen als je gelooft in “time travel” parasitaire gaten geleerd kunnen worden op basis van empirisch materiaal alleen. Per dag heb je meer input nodig dan je in een jaar aan evidentie kunt krijgen. Elke dag moet je weer een heel jaar verder in de tijd reizen om het correcte aantal input gegevens te krijgen dat voldoende is voor een succesvol leerproces in reële tijd. Je loopt zo “achter de feiten vooruit.” 
                         
Van de Velde heeft iets anders in petto. Een zeer lage frequentie kan volstaan (“oneindig geheugen”) en hij verwijst naar gebruiksgebaseerd (taalverwervings)onderzoek van Dąbrowska. UG is niet nodig. Maar hij ontwijkt het punt waar het om gaat: de frequentie van parasitaire gaten in het kind-gerichte taalaanbod. De verwijzingen betreffen statistische gegevens over woorden, idiomen en een paar vaste uitdrukkingen (“constructions” of “formulaic expressions”), en – cruciaal – niet over recursief gegenereerde structuren zoals bv. Which documents did you file [without reading [before signing]]? Het is bekend dat woorden in tegenstelling tot bv. telefoonnummers heel snel (soms met een eenmalig aanbod en ondanks een “noisy” en gebrekkige context) door kinderen geleerd kunnen worden (Medina et al. 2011). Maar dat ligt heel anders in het geval van een recursieve syntaxis. Het variational learning model van Yang (2004, 2011) toont dit demonstratief aan. Verschillende parameters voor verschillende doeltalen eisen specifieke evidentie, elk met een specifieke input frequentie die netjes correleert met een eigen verwervingstijd. Zo wordt V-Second in het Nederlands (1.2% OVS input frequentie) laat geleerd (3;0-3;2 jaar) maar in het Noors (10% OVS input frequentie) zeer vroeg (2;0 jaar). Meer relevant voor onze casus is dat ‘scope marking’ in het Engels een input frequentie eist van 0.2% lange-afstand wh-vragen in het kind-gerichte taalaanbod. En dit percentage correleert met een verwervingstijd van 4 jaar of iets meer. Ook de relevante bindingscondities worden op vier- en vijf-jarige leeftijd gerealiseerd. Parasitaire gaten (scope marking) zijn een compositie van lange-afstandsverplaatsing en bindingscondities. Van de Velde noemt 0.2% input frequentie voor parasitaire gaten een “gigantische overschatting” maar het betreft hier de verwerving van syntactische parameters door vier- of vijfjarigen. Het percentage volgt gewoon de uitkomst van statistisch onderzoek naar taalverwerving (Yang 2004, 2011; Crain 2012). Ten slotte laten Pearl & Sprouse (2013) zien dat een statistisch-gebaseerd verwervingsmodel niet in staat is parasitaire gaten te leren. Hoe zouden de eigenschappen van parasitaire gaten in Van de Veldes model verantwoord worden? 
Uitgaande van het NL Cow corpus (4.5 miljard woorden), een gemiddelde zinslengte van 15 woorden, een kind-gericht taalaanbod van 5000 zinnen per dag, en een marginale aanwezigheid van 300 parasitaire gaten in het totale corpus, hebben parasitaire gaten een gemiddelde frequentie van 1 op een miljoen zinnen. Elke 200 dagen komt er één parasitaire constructie langs. Maar met een 0.2% frequentie in het kind-gerichte taalaanbod zijn er voor een geslaagd leerproces niet minder dan 10 parasitaire gaten per dag nodig. Een onoverbrugbaar verschil van een factor 2000. Alleen een input frequentie van 0.0001% (één parasitair gat per 200 dagen) convergeert met de spreiding van de parasitaire gaten in het corpus. Als het feitelijk gevonden aanbod inderdaad zou afwijken van wat we op theoretische gronden (variational learning) mogen verwachten (en dit zou mij net als Van de Velde niet verbazen) dan betekent dit dat parasitaire gaten niet normaal worden geleerd. En dat was nu precies het punt van de hele exercitie.   
Hoeveel parasitaire gaten zijn “voldoende” om een succesvol leerproces af te dwingen? Nog steeds uitgaande van gemiddeld één parasitair gat per miljoen zinnen, niet meer dan 5 tot 10 als zesjarigen de constructie beheersen. Mij lijkt dit ongeloofwaardig weinig. Er zijn twee oplossingen: 
[A] Misschien volstaan één of twee exemplaren wanneer we beschikken over het niet falend “oneindig geheugen” dat Van de Velde suggereert. (De empirische predictie hier is dat parasitaire gaten “chaotisch” worden geleerd: het ene kind als kleuter, het andere kind pas als puber of misschien zelfs als volwassene afhankelijk van de eerste kennismaking.) 
[B] Misschien is er geen één voorbeeld nodig wanneer we beschikken over de UG-gebaseerde principes waar de eigenschappen van parasitaire gaten uit afleidbaar zijn. (De predictie hier is dat kinderen parasitaire gaten “uniform” kennen nog voordat ze deze zijn tegengekomen.) 
Ter afsluiting en voor de goede orde. Er is geen enkel a priori probleem met statistische benaderingen per se. UG en input staan elkaar niet in de weg. UG kan zelfs heel goed en nuttig gebruik maken van input-gestuurde, probabilistische en deels domein-algemene leerprocessen. Het onderzoek van Colin Phillips, Jon Sprouse, en Charles Yang, waar hier vaak naar verwezen wordt, laat dit zien. Maar het heeft ook duidelijk gemaakt dat gebruiksgebaseerd en statistisch taalonderzoek een domein-specifieke component heeft die de zoekruimte van een realistisch taalverwervingsmodel parametrisch inperkt. Als taal (en dus UG, de genetische component van taal) bestaat, dan bestaat ook Poverty of Stimulus. En hiervoor zijn parasitaire gaten exemplarisch.
Berwick R.C. et al. (2011) Poverty of the stimulus revisited. Cogn. Sci. 35, 1207–1242
Chomsky N. (2011) Language and other cognitive systems. What is special about language?  Lang. Learn. Dev. 7, 263–278
Crain S. (2012) The Emergence of Meaning, Cambridge University Press
Legate J.A. and Yang, C.D. (2002) Empirical reassessment of poverty of stimulus arguments.  Reply to Pullum and Scholz. Linguistic Rev. 19, 151–162
Medina T.N. et al. (2011) How words can and cannot be learned by observation. Proc. Natl. Acad. Sci. U.S.A. 108, 9014–9019
Musso M. et al (2003) Broca’s area and the language instinct. Nature Neuroscience 6, 774–781
Pearl L. & Sprouse J. (2013) Computational Models of Acquisition for Islands, In: J. Sprouse &  N. Hornstein (eds), Experimental Syntax and Islands Effects. Cambridge University Press, 109–131
Phillips C. (2006) The real-time status of island constraints. Language 82, 795–823
Sprouse J., Schütze C.T. & Almeida D. (2013) A comparison of informal and formal acceptability judgments using a random sample from Linguistic Inquiry 2001–2010. Lingua 134, 219–248
Yang C. (2002) Knowledge and Learning in Natural Language, Oxford University Press 
Yang C. (2004) Universal Grammar, statistics, or both? Trends in Cognitive Sciences 8(10), 451–456 
Yang C. (2011) Computational models of syntactic acquisition. WIREs Cogn Sci 2011. doi:10.1002/wcs.1154