Echte taaldata

Door Marc van Oostendorp


Af en toe kom ik ze tegen: onderzoekers die zeggen zich bezig te houden met ‘echte taaldata’. Ze zeggen dat zonder blikken of blozen, althans, ik heb er nog nooit een ontmoet die erbij blikte of bloosde.

Waarom niet? Zijn er ook ónechte taaldata, en zo ja, wie bestuderen die dan? En waarom?

Het probleem is dat onechte gegevens in ieder wetenschappelijk vakgebied door iemand verzonnen zijn. Taalgegevens zijn echter altijd per definitie door iemand verzonnen. Nog nooit is ergens een zin aangetroffen die spontaan uit de aarde kwam opgeweld.

Nu kun je natuurlijk taalkundige gegevens voorstellen die verzonnen zijn en dan betrekkelijk waardeloos worden. Iemand zou bijvoorbeeld kunnen beweren dat alle talen op de wereld de klinker a en de medeklinker t hebben en dan zou ik een taal kunnen verzinnen, Doepidoepi, die hierbij geen a heeft en ook geen t. Maar veel bewijskracht heeft zo’n taal dan natuurlijk niet.

Suzan

Dat is echter niet het soort onechte taaldata waar de liefhebbers van de echte zich tegen afzetten.
Het gaat eerder om data die mensen verzinnen over hun eigen taal. Zo schreef (ene) Suzan jaren geleden op het weblog van de Taalprof:

Ik ben benieuwd naar het nog te verschijnen artikel waar Helen naar verwijst. Ik heb namelijk erg de neiging om naar mijn eigen taalgevoel te kijken in plaats van kwantitatief naar echte taaldata. en dat is gevaarlijk.

Het is dus kennelijk gevaarlijk om als taalkundige (of in ieder geval als Suzan) naar je eigen taalgevoel te kijken. Maar waarom eigenlijk? Zijn de taaldata die een taalkundige produceert minder waard dan de taaldata die iemand produceert die niet heeft doorgeleerd.

Marjo

Een van de sleutelbegrippen zit in het woord kwantitatief. Een van de dingen die voor de echtetaaldatafanaten (ETDF) niet deugen aan onechte taaldata, is dat het er maar zo weinig zijn. Meten is weten, dus je hebt vooral heel veel data nodig om wetenschappelijke uitspraken te doen.

Maar daar stopt het niet mee. Ik geloof niet dat ETDF tevreden zouden zijn wanneer ik miljoenen keren het woord dropje zeg, en dan ga tellen en er mooie grafieken over teken. Er is ook nog iets mis met het feit dat het mijn eigen taaldata zijn. Ik kan het teveel manipuleren. Ik mag best de data van een taalkundige analyseren, maar dan moet dat wel bijvoorbeeld Pieter Muysken zijn, of Marjo van Koppen, of iemand anders die ik niet in mijn macht heb.

Er zit natuurlijk wel iets in, vooral in dat laatste. Je moet altijd een beetje uitkijken met het analyseren van je eigen gedrag en je eigen intuïties: voor je het weet pas je je onbewust aan de verwachte uitkomsten van je theorie aan. Ik zeg bijvoorbeeld dat mijn Nederlands eigenlijk geen a en t heeft, en dat staaf ik dan door te opperen dat ik rat en takje ook eigenlijk wat rare woorden vind.

Nadenken

Toch hebben de ETDF in mijn ogen niet helemaal gelijk. In de eerste plaats is het onduidelijk wat dan wél echte taaldata zijn. ETDF bestuderen zelf van alles en nog wat: grote verzamelingen geschreven teksten, gedrag van proefpersonen in laboratoria, geluidsopnamen, en ga zo maar door. Wat is daar werkelijk aan? Waar bevindt de ware taal zich eigenlijk? Zit die niet vooral in onze geest? Maar zelfs als je een hersenscan bestudeert zie je een plaatje waarvan je niet eens zeker weet wat het precies zegt over taal en wat over allerlei dingen die de hersenen noodzakelijkerwijs doen als je bezig bent met taal, zoals nadenken over de betekenis.

En in de tweede plaats: de intuïties die we hebben zijn wel degelijk reëel. Ik heb bijvoorbeeld de intuïtie dat je de n aan het eind van lopen best kunt weglaten, maar die aan het eind van christen niet. Iedereen die ik daarnaar gevraagd heb, is dat bovendien met me eens. Ik weet niet hoe ik dat moet tellen, omdat je daarvoor heel veel geluidsopnamen moet beluisteren; je zou natuurlijk wel een experiment kunnen doen. Ik denk alleen dat je daar niet veel mee opschiet: ofwel er komt uit wat ik toch wel dacht, of niet.

Maar in dat laatste geval blijft mijn intuïtie nog steeds écht, en iets dat een goede taaltheorie in mijn ogen moet verklaren.