Worden Engelstalige proefschriften meer geciteerd?

door Freek van de Velde

Eergisteren is op Neerlandistiek een stuk verschenen met als titel ‘Fnuikt een Nederlandstalig doctoraat je kansen op een academische carrière?’, waarin ik verslag deed van een mini-onderzoekje naar het lot van doctores Nederlandse taalkunde in Vlaanderen. Het verrassende resultaat was dat de kans op een academische carrière groter was met een Nederlands doctoraat (gecorrigeerd voor jaar van verdediging, uiteraard).

Er stond overigens nog een klein foutje in dat verslag: het totale aantal was niet 70, maar 62 (34 Engels, 28 Nederlands). Het waren er eerst 70, omdat ik aanvankelijk begonnen was in 1990, en pas later heb beslist om het te beperken tot de periode na 1999, omdat als je verder teruggaat, Nederlands in Vlaanderen de zo goed als ongecontesteerde norm leek te zijn voor een proefschrift op het domein van de Nederlandse taalkunde. Op de resultaten heeft dat geen enkel effect gehad. Die blijven overeind, ook als je verder teruggaat.

Ik ben nog eens teruggegaan naar de data, en heb nu iets anders bekeken: hoe vaak worden die proefschriften geciteerd? Opnieuw zijn er allerlei redenen waarom een werk wel of niet geciteerd wordt, naast de populariteit. Eerlijk gezegd heb ik zelf niet zoveel vertrouwen in die blinde citatie-tellingen, maar dat is een heel ander verhaal. Maar goed. Soms moet je je over je weerzin heen zetten. Ik heb het opgezocht met de applicatie Harzing’s Publish or Perish (Versie 6), en heb gekeken naar Google Scholar. Google Scholar vangt lang niet alle citaties, maar als er een ‘bias’ in zit, dan zal die de Engelstalige citaties wel bevoordelen, dus je vecht eigenlijk met één hand op de rug als je hypothese is dat Engelstalige proefschriften niet meer geciteerd worden dan Nederlandstalige.

De resultaten dan, want daar zit u op te wachten. Ik heb een negatief-binomiaal-regressiemodel gebouwd (een soort veralgemeende Poisson regressie, voor positieve gehele numerieke responsvariabelen), deze keer met als responsvariabele het aantal citaties op Google Scholar, en als verklarende variabele de taal van het doctoraat en opnieuw een controlevariabele voor hoe oud het doctoraat is. Oudere proefschriften hebben langer de tijd gehad om geciteerd te worden, en dat zou een oneerlijk voordeel in de telling kunnen opleveren.

Nederlandstalige proefschriften over Nederlandse taalkunde (althans de Vlaamse van de afgelopen twintig jaar) worden meer geciteerd dan hun Engelstalige tegenhangers, maar door het grote betrouwbaarheidsinterval is het verschil niet significant.

 Schatting95 % Betrouwbaarheidsintervalp-waarde
Taal: Engels(referentiewaarde)
Taal: Nederlands0,53[-0,09 ; 1,16]0.11
Jaar-0,09[-0,16 ; -0,03]< 0.01

Als je niet controleert voor ‘Jaar’, dan is het resultaat wel significant. Maar ik denk dat dat een effect is van de eerbiedwaardige ouderdom van die proefschriften. Ik weet ook dat ‘absence of evidence’ niet hetzelfde is als ‘evidence of absence’. Maar wie dacht dat overduidelijk zou blijken dat Engelstalige proefschriften veel geciteerd worden, vindt hier alvast geen ondersteuning.