Ontspecialisatie

Door Marc van Oostendorp


We gaan een tijdperk tegemoet van ontspecialisatie: het wordt steeds minder nodig dat een wetenschapper gedetailleerde kennis nodig heeft over een eigen ‘vakgebied’, zoals deeltjesfysica of de Nederlandse letterkunde van de negentiende eeuw. De opleiding voor die twee vakken zal steeds meer op elkaar gaan lijken tot er misschien ooit alleen nog maar ‘wetenschappers’ zijn.

Dat komt dan doordat alle wetenschappers hun onderzoeksmateriaal steeds meer als ‘big data’ gaat zien: grote verzamelingen gegevens waarin je door slim te programmeren en geavanceerde statistiek te bedrijven vanzelf patronen in ontdekt. Voor de computer zijn alle data uiteindelijk nullen en enen: het maakt daarbij niet uit of het observatiegegevens van een satelliet betreft, of een corpus van romans en gedichten. De hele wereld bestaat uit nullen en enen – vandaar dat het weinig zin heeft je nog te specialiseren.

Dat is de conclusie die je kunt trekken uit twee blogposts die ik deze week toevallig tegelijkertijd tegenkwam op het internet en die de situatie van verschillende kanten beschrijven: positief en kritisch, vanuit de astrofysica en de taalkunde.

De astrofysicus, een zekere Jake Vanderplas, is wat makkelijker te lezen. Vanderplas vraagt zich in de kop van zijn stuk weliswaar af ‘why science is in trouble’, maar zijn antwoord daarop is: omdat de universiteiten het nog niet doorhebben, en ijzerenheinig veel te gespecialiseerd bezig blijven, zodat briljante jonge onderzoekers massaal door bedrijven (als Google) worden weggekocht. Die bedrijven zien het namelijk wel. Over de ontwikkeling zelf is Vanderplas positief (mijn vertaling):

Wat we kunnen verwachten is een situatie waarin domeinspecifieke kennis meer en meer wordt vervangen door ‘naakte’ data-miningvaardigheden. Ik zou willen zeggen dat deze voorspelling al uit begint te komen: in heel veel academische gebieden, vervangt de vaardigheid om effectief data te verwerken andere, klassiekere, vormen van onderzoek.

De andere blogpost is van een jonge Amerikaanse wiskundig taalkundige. Misschien omdat hij juist wel in domeinspecifieke kennis gelooft is zijn blogpost misschien wat minder makkelijk te lezen voor de niet-specialist. Hij beweert het omgekeerde van wat Vanderplas zegt: ook de universiteiten hebben juist meer en meer voorkeur voor taalkundigen die ‘taalkunde met getallen’ ‘ doen, en dus in grote databestanden gaan kijken om te zien of er een relatie is tussen iemands geboortejaar en hoe vaak die persoon ik zegt. Zulke mensen krijgen, volgens Graf, in Amerika inmiddels makkelijker een baan dat deskundigen van (bijvoorbeeld) het soort werk dat hem interesseert: de wiskundige analyse van grammaticale theorieën, waarvoor specialistische kennis van die theorieën nodig is. (Overigens heeft hij zelf kennelijk wel net een baan gevonden.)

De reden daarvoor is, volgens Graf: taalkunde met getallen is makkelijker uit te leggen. De onderzoeker heeft een enorme hoeveelheid gegevens bestudeerd en kan dus nu met aan zekerheid grenzende waarschijnlijkheid vaststellen dat mensen die in een jaar van de geit geboren zijn vaker het woord ik gebruiken. Mensen die het soort werk doen dat Graf interesseert, zijn daarentegen jarenlang bezig en krijgen er hooguit ooit een abstract resultaat uit – dit is het soort rekenkracht dat de menselijke geest kennelijk moet hebben om met taal te kunnen omgaan. Ze krijgen dat nauwelijks gepubliceerd, ze kunnen er niet met collega’s over praten.

Geen van de twee schrijvers voorspelt overigens op korte termijn een radicaal verdwijnen van alle spcialistische kennis, zelfs Vanderbilt niet (‘de 15 terabyte aan ruwe beelddata die er iedere nacht wordt geproduceerd door de Large Synoptic Survey Telescope heeft ons weinig over kosmologie te vertellen buiten het theoretisch inzicht in de fysische processen die de expansie van het universum veroorzaken’).

Toch roepen de twee stukken samen de vraag op waar het stopt. Samen laten ze zien wat de attracties zijn van de big data-benadering: het is relatief makkelijk te begrijpen, in ieder geval voor andere big data-onderzoekers, ook al werken die in heel andere gebieden. Omdat computers nooit zo krachtig waren als nu, kun je er betrekkelijk makkelijk nieuwe ontdekkingen mee doen. Er zijn allerlei industriële toepassingen voor.

De ontspecialisatie komt als een vloed over ons heen gespoeld. Het is belangrijk om na te denken welke delen van de specialistische zandkastelen die we in de loop der tijd hebben gebouwd bewaard moeten blijven en welke we moeten prijsgeven aan de golven.