2000 twijfelachtige stukjes

Door Marc van Oostendorp

Betekenis van verschillende (Engelse) statistische termen

Omdat ik deze week mijn 2000e stukje op Neerlandistiek heb geplaatst, heb ik eens door wat oudere blogs gebladerd. Sommige was ik vergeten en die zijn natuurlijk altijd het leukst, want mijn posts gaan onveranderlijk over onderwerpen die mij interesseren.

Ik schreef precies vijf jaar geleden bijvoorbeeld over de vraag hoe reëel een kans is die ‘meer dan reëel’ wordt genoemd. Bij wijze van privé-viering kondigde ik dat stukje opnieuw aan op Twitter. Toen bleek dat jullie je het stukje ook niet meer konden herinneren, want jullie kwamen met nieuwe reacties, zoals bijvoorbeeld een wiskundige reactie van K.P. Hart, die probeert na te gaan welk getallenstelsel het best gebruikt kan worden voor de meer dan reële getallen.

Hogere kansregionen

Ook bleek ondertussen de Volkskrant een grappig Engels onderzoekje te hebben overgedaan voor het Nederlands. Mensen werd gevraagd welke waarschijnlijkheid ze associeerden met een aantal begrippen. Helaas zat reëel daar niet bij, maar de resultaten waren toch interessant.

Dit is een verbeterde versie van de Volkskrant-grafiek, gemaakt door Merijn Coumans.

De meeste woorden hebben een vrij duidelijke betekenis: een duidelijk en niet zo groot gebied ergens op de schaal. De betekenis van hoogstwaarschijnlijk of hoogst onwaarschijnlijk is ook niet zo raar (grappig is dat sommige mensen bij hoogst onwaarschijnlijk een paar mensen hoge percentages aanklikten; dat liet zien dat de term voor sommige mensen ingewikkeld is). Wellicht heeft een soort normaalverdeling en betekent dus: niet hoogstwaarschijnlijk en niet hoogst onwaarschijnslijk.

Vagere term

De interessantste verdeling is die van twijfelachtig, dat lijkt te betekenen: niet hoogst onwaarschijnlijk en niet waarschijnlijk. Dat is dus een betekenis die lijkt op wellicht, maar met een lagere graad van waarschijnlijkheid. Je zou kunnen zeggen dat dit strikt logisch nergens uit volgt: als je twijfelt zou het alle kanten op moeten gaan, en dus ook in de hogere kansregionen.

Dat laat zien dat twijfelachtig geen wiskundig begrip is, maar een mensenwoord. Twijfel kan weliswaar alle kanten op gaan, maar als een mens zijn twijfel uitspreekt, gaat de ander ervan uit dat er een reden is om dat te doen.

Misschien heeft dat te maken met een afkeer om het negatieve te benoemen. We zeggen misschien liever dat het waarschijnlijk is dat we iets gaan doen, dan dat het niet zo waarschijnlijk is. Voor dat laatste is dus een andere, zogenaamd vagere term nodig, die in theorie van alles kan betekenen, maar in praktijk dus eigenlijk dat het onwaarschijnlijk is. Wanneer je wil benoemen dat iets waarschijnlijk is zou je dat dus wel benoemen.

 

Over Marc van Oostendorp

Marc van Oostendorp is onderzoeker aan het Meertens Instituut (KNAW). hoogleraar aan de Radboud Universiteit en hoofdredacteur van Neerlandistiek. Hij heeft een website, een YouTube-kanaal en een Twitter-account.
Dit bericht is geplaatst in column met de tags , , . Bookmark de permalink.

3 reacties op 2000 twijfelachtige stukjes

  1. Klaas schreef:

    ‘We zeggen misschien liever dat de kans dat we iets gaan doen waarschijnlijk is…’ Ik denk dat deze zin (en wat er na komt) een logische fout bevat: niet de ‘kans’ is (on)waarschijnlijk, maar ‘dat we iets gaan doen’. De term ‘kans’ is een andere manier om ‘de (on)waarschijnlijkheid dat we iets gaan doen’ te formuleren. In feite hetzelfde misverstand dat leidde tot het aanvinken van de hoge kanswaarden bij ‘hoogst onwaarschijnlijk’.

    • Zoals in het blog van Hart wordt aangestipt heeft ‘kans’ in de wiskunde een andere betekenis dan in het dagelijks taalgebruik. Dat betekent niet dat het laatste ‘fout’ is. Ik heb de zin wel een beetje aangepast om deze discussie verder uit de weg te gaan. Ik begrijp trouwens niet zo goed waarom je denkt dat dit een gevolg is van het kiezen van die hoge kanswoorden bij ‘hoogst onwaarschijnlijk’; mij lijkt dat vooral iets te maken te hebben met het feit dat negatie leidt tot interpretatieproblemen.

      • Klaas schreef:

        Wat heet ‘fout’… logisch gezien een fout, maar in taal kan er inderdaad veel! Wat betreft je tweede punt: volgens mij is de basis van het aanvinken van de hoge kanswaarden bij ‘hoogst onwaarschijnlijk’ het gevoel dat extreme kanswaarden (dichtbij 1 en dicht bij 0) minder vaak voorkomen dan die uit het middengebied. Dat is dus een andere interpretatie dan wat vermoedelijk bedoeld werd: de betekenis van een lage kanswaarde is ‘hoogst onwaarschijnlijk’. Ook hier werden dus de betekenis van een kanswaarde en het (vermoedelijke) voorkomen ervan verward.

Laat een reactie achter