De EU maakt het moeilijk(er) om de taal van jongeren onderzoeken

Door Marc van Oostendorp

Het gaat de laatste tijd in de kringen waarin ik verkeer over bijna niets anders dan over GDPR, de General Data Projection Regulation van de EU die eind deze maand van kracht wordt en die u niet alleen moet vrijwaren van Mark Zuckerberg, maar ook van wetenschappelijk onderzoek.

Mijn Antwerpse collega Reinhild Vandekerckhove vertelde er onlangs een indrukwekkend verhaal over tijdens een workshop. Reinhild doet al geruime tijd onderzoek naar de taal van de jeugd in Vlaanderen. Wanneer je wil weten hoe het onder die mensen aan de hand is, wil je natuurlijk het liefst weten hoe zij praten onder elkaar zijn, en er geen volwassene in de buurt is. Al is het maar omdat je wil voorkomen dat ze zich bewust of onbewust aanpassen.Moeilijk

De laatste jaren lijkt dat gemakkelijker te worden: jongeren communiceren veel via WhatsApp, Messenger en andere apps met elkaar, en die apps slaan de gesprekken op. De jongeren hoeven ze alleen maar aan je door te geven, en je hebt zo bergen materiaal dat je eindeloos kunt bestuderen. Bovendien kun je dat materiaal bewaren om te vergelijken met hoe jongeren over tien of twintig jaar of honderd jaar zullen praten. Lang leve het digitale tijdperk.

Reinhild is dan al meer dan tien jaar bezig met dit onderzoek. Maar de GDPR, en de consequenties die haar universiteit eraan verbindt, gaan het haar enorm moeilijk maken.

Geen boodschap

Van het bewaren van gegevens kan in de eerste plaats geen sprake meer zijn. Je moet persoonlijke gegevens altijd op zeker moment vernietigen. Reinhild heeft dat in haar geval weten uit te stellen tot het moment van haar pensioen, en dat duurt gelukkig nog lang, maar toekomstige generaties zullen dus niet kunnen weten hoe Vlaamse jongeren met elkaar spraken in onze tijd.

Tot die tijd mogen alleen Reinhild en haar medewerkers naar de gegevens kijken. Dat is natuurlijk in tegenspraak met de wetenschappelijke wens om data zoveel mogelijk te delen, om onder collega’s te kunnen controleren of iemand wel de juiste conclusies uit de gegevens trekken. Maar daar heeft de EU geen boodschap aan.

Slot en grendel

Er zijn meer tegenstrijdigheden: zo moet alle data volkomen geanonimiseerd worden, maar tegelijkertijd moeten mensen die gegevens hebben bijgedragen op ieder moment hun eigen woorden uit de database kunnen laten verwijderen. Alleen: hoe vind je die data als ze helemaal anoniem zijn? En hoe anonimiseer je honderdduizenden woorden als jongeren namen op allerlei onvoorspelbaar expressieve manieren schrijven (Soooooffieeee!)

Het is al met al bijna onmogelijk om dit soort onderzoek nog te doen. Reinhild begrijpt dat het nodig is om gegevens die jongeren haar doodgemoedereerd geven – het gaat soms om intieme gesprekjes, ook over anderen. Maar moet dat nu allemaal echt helemaal achter slot en grendel?