Waarom is stilte in Zoom zo vervelend?

Door Lucas Seuren

We hebben dit jaar bijna allemaal fors meer met elkaar gepraat via videobellen: van vergaderingen tot verjaardagsfeestjes, en van workshops tot Tinder-dates. Dit gaat lang niet altijd soepel. De technologie laat redelijk vaak te wensen over, zelfs met een stabiele internetverbinding. Een van de voornaamste frustraties is dat er bij videobellen altijd een kleine vertraging optreedt: je gesprekspartner hoort je niet op het moment dat je praat, maar pas na iets van 100 milliseconden en soms iets meer. Dat is verdraaid irritant, maar waarom eigenlijk? De afgelopen jaren heeft mijn groep in Oxford uitgebreid onderzoek gedaan naar arts-patiëntgesprekken via video, en recent hebben we een artikel gepubliceerd waarin we in detail kijken hoe die kleine vertragingen van invloed zijn op onze gesprekken.

Als we met elkaar praten is het belangrijk dat we dit op een georganiseerde manier kunnen doen. Iedereen kan niet zomaar praten wanneer het ze uitkomt, want dan wordt het chaos, waarbij we continu door elkaar heen praten, en niks horen of begrijpen. We hebben een systeem nodig om te bepalen wie wanneer mag praten, een set regels waar we ons bewust of onbewust aan houden. Gelukkig bestaat zo’n systeem en het is verdraaid eenvoudig. Als je aan de beurt bent krijg je de ruimte om één bijdrage te doen, waarna iemand anders de beurt krijgt, ofwel omdat die persoon een reactie moet geven (je hebt bijvoorbeeld een vraag gesteld), dan wel om het gesprek op gang te houden.

Als je dit leest denk je wellicht, DUH, dat ligt enorm voor de hand. Maar dat is dan ook de crux. We weten allemaal hoe het werkt, maar we denken er nooit actief over na. Als we met iemand praten doen we het gewoon. Het is bijna als lopen: je leert het en eenmaal geleerd denk je er nooit meer over na – maar als het mis gaat zie je het direct.

Beurtwisseling

Laten we nu wat dieper ingaan op beurtwisselingen. We proberen de stilte tussen twee beurten, tussen bijvoorbeeld een vraag en een antwoord, zo kort mogelijk te houden. Een vergelijkend onderzoek uitgevoerd door collega’s van het Max Planck in Nijmegen liet in 2009 zien dat in het Nederlands we gemiddeld maar 100 milliseconden stilte laten vallen tussen twee beurten. In sommige talen is het iets meer, in andere iets minder.

We kunnen zo snel reageren, doordat we competente sprekers zijn. We kennen de grammatica van onze taal, waardoor we kunnen voorspellen wanneer iemand het einde van hun beurt gaat bereiken. Onze uitgebreide ervaring met gesprekken maakt het ook mogelijk om in te schatten wat voor taalhandeling die persoon doet: komt er een vraag, een belofte, een groet, etc.? Dit helpt ons met voorspellen hoe wij vervolgens moeten reageren. Anders gezegd, terwijl iemand aan het praten is, kunnen we onze reactie al vormgeven, waardoor we de stilte tot een minimum kunnen beperken.

Vertraging

Dat brengt ons tot de irritatie met videobellen: zodra er een korte vertraging optreedt worden we geconfrontreerd met stiltes op plekken waar normaal iemand zou praten. Oké, maar wat is daar nu vervelend aan? We kunnen toch gewoon wat langer wachten? Het probleem is dat stiltes niet neutraal zijn: stiltes hebben hun eigen betekenis. Als iemand niet direct reageert als je een vraag stelt, dan gaan de radartjes in je hoofd gelijk draaien: waarom reageert deze persoon niet? Hebben ze me niet gehoord of begrepen? Heb ik iets verkeerds gezegd?

Die irritatie is goed te zien in onze data. Zodra er korte stiltes vallen gaat de spreker verder. We zien vaak dat na een paar honderd milliseconden de arts bijvoorbeeld uitleg geeft. Op die manier laat ze zien dat ze uit de stilte afleidt dat de patiënt de vraag niet begrepen heeft, en geen antwoord kan geven, maar toelichting nodig heeft. Maar die korte stilte is, zoals gezegd, een gevolg van de gebruikte technologie: de patiënt is al bezig met reageren, maar de arts kan het nog niet horen. Het gevolg is dat we vaak zien dat arts en patiënt door elkaar heen gaan praten. En dat merken we allemaal elke dag opnieuw in onze videogesprekken: we praten veel meer door elkaar heen dan wanneer we gewoon bij elkaar zijn of de telefoon gebruiken.

De vertraging in videogesprekken maakt het kortom lastig voor ons om te voorspellen wanneer onze gesprekspartners klaar zijn met praten. Waar we gewend zijn aan ongeveer 100 milliseconden stilte tussen twee beurten, moeten we nu leren werken in een systeem waar we continu met 200-300 milliseconden stilte te maken hebben, of zelfs meer. Dat is nog altijd zo kort dat we het bijna niet merken, maar het is lang genoeg dat we er niet zomaar aan kunnen wennen. Zelfs als we ons er op bedacht zijn is het enorm moeilijk om een onderscheid te maken tussen een echte stilte en een technologische stilte. Dat is niet altijd een probleem: het lijkt erop dat 200 milliseconden stilte nog goed te doen is, maar zeker als het 500 milliseconden of meer is, gaat het continu mis. En dus vallen we elkaar in de rede en ergeren we ons aan de gesprekskwaliteit.

Hologrammen

Stilte is natuurlijk maar een van de vele ergernissen met videobellen. Het geluid kan wegvallen of verstoord raken, beeld loopt lang niet altijd synchroon, en soms valt het signaal gewoon volledig weg. Allemaal irritaties die ervoor zorgen dat we vaak niet gelukkig worden van een videogesprek. Het positieve nieuws is dat het tegenwoordig vele malen beter is dan vroeger door betere en stabielere internetverbindingen, en dat zal in de toekomst alleen nog maar beter worden. Wie weet dat we ooit nog als hologrammen met elkaar kunnen praten zoals in Star Wars, zonder enige vertraging, al moeten we dan weer leren werken met astroïden die ons signaal verstoren, maar je perfectie is wellicht nooit haalbaar.