Kunnen we mens van computer onderscheiden?

Door Lucas Seuren

Al decennia wordt ons voorgehouden dat computers beter worden in praten met mensen. En hoewel ik niet zal ontkennen dat er vooruitgang is geboekt in de vorm van assistenten zoals Siri, Alexa, en Google Now, hebben ze nog een lange weg te gaan. Halverwege de vorige eeuw werd dit probleem geformaliseerd door Alan Turing, de voorvader van de computerwetenschap. Hij vroeg zich af of computers kunnen denken en stelde dat als een computer net zo handelt als een mens het antwoord ja is. Om dat te testen ontwikkelde hij de naar hem vernoemde Turing Test. Het idee is simpel: kan een mens op basis van een gesprek raden of hij gesproken heeft met een computer of met een ander mens? Of in een iets andere vorm: kan een robot een mens foppen?

Op het oog lijkt deze test simpel. In de praktijk lopen we alleen tegen een belangrijk probleem aan: mensen rationaliseren op basis van wat ze weten van de wereld. Hoe gek een robot dus ook praat, we zullen in eerste instantie heel veel moeite doen om die rariteiten te verklaren als normaal menselijk gedrag. Met andere woorden, als we iets zien wat niet strookt met ons beeld van de wereld, dan passen we ons beeld van de wereld niet aan, maar zoeken we naar een manier waarop onze waarneming toch strookt met ons wereldbeeld.

Verklaringen

Een mooie illustratie van dit fenomeen werd door Harold Garfinkel besproken in zijn proefschrift in 1952. Hij liet mensen die medicijnen wilden studeren selectiegesprekken beluisteren. In sommige gesprekken kwam de kandidaat erg goed over, en in andere erg slecht. Vervolgens vroeg hij zijn proefpersonen wat ze van de kandidaat vonden. Niet geheel verrassend werden goede kandidaten ook goed beoordeeld. Maar nu komt de crux. Hij vertelde zijn proefpersonen vervolgens dat als de kandidaat goed was, deze niet was toegelaten, en als de kandidaat slecht was, deze wel was toegelaten, en vroeg toen opnieuw naar de mening van proefpersonen. De overweldigende meerderheid stelde hun oordeel bij. Als hij ze vroeg hun antwoord toe te lichten gaven ze vervolgens vergezochte verklaringen, maar op die manier brachten ze hun waarneming dus in overeenstemming met de werkelijkheid. Anders gezegd, mensen doen veel moeite om rare observaties toch te verklaren aan de hand van hun kennis over de wereld.

Deze neiging is een enorm probleem voor de Turing Test, want het betekent dat zelfs als robots zich vreemd gedragen, mensen bewust of onbewust proberen dat gedrag af te doen als normaal gedrag.

Wie is de robot

Ik zal dit iets verder toelichten. Je kunt de Turing Test op twee manieren uitvoeren: je vertelt proefpersonen op voorhand niet dat ze mogelijk met een robot te maken hebben, of je vertelt het ze wel. Als je het ze niet vertelt, dan komt de lat vrij laag te liggen. Onze aanname is immers dat we te maken hebben met een mens. Met andere woorden, ons wereldbeeld vertelt ons dat we met een ander mens in gesprek zijn. En hoe gek het gedrag is dat iemand mogelijk ook vertoont, we zijn goed in staat om dat te rationaliseren. Dus het is relatief eenvoudig voor een robot om ons te foppen, als we niet weten dat het mogelijk een robot is.

Maar wat nu als onze proefpersonen wel weten dat er mogelijk een robot is. We laten ze met twee mensen praten en ze moeten raden wie van de twee de robot is. De lat komt hiermee natuurlijk hoger te liggen, maar daarmee is het probleem nog niet de wereld uit. Mensen doen immers ook rare dingen, en we hebben geen flauw idee waar we op moeten letten als we mens van robot willen onderscheiden.

Een kort voorbeeldje om dit te illustreen. Google publiceerde een aantal gesprekken die Duplex had gevoerd om bijvoorbeeld restaurantreserveringen te maken. In een van deze gesprekken zit het volgende stukje dialoog dat voer was voor een uitgebreide Twitterdiscussie met een groep collega’s:

Duplex: I’d like to reserve a table for Wednesday the seventh. (‘Ik zou graag een tafel reserveren voor woensdag de zevende.’)
Restaurant: For seven people? (‘Voor zeven personen?’)
Duplex: Uhm, it’s for four people. (‘Uhm, het is voor vier personen.’)

Is hier iets bijzonders aan de hand? Duplex wil een reservering maken voor de zevende, maar de restaurantmedewerker lijkt te begrijpen dat het voor een groep van zeven is, waarna Duplex vertelt dat het om vier mensen gaat. Een klein misverstand, waarvan we er in het degelijks leven legio tegenkomen. Het lijkt me dus sterk dat iemand hier zou opmerken dat er iets vreemds aan de hand is.

Toch kan je speculeren dat Duplex zich hier niet menselijk gedraagt. De medewerker lijkt een ja/nee-vraag te stellen, maar Duplex reageert alsof het gaat om een vraagwoordvraag; ‘for how many people’ of iets dergelijks. Een beter antwoord was geweest ‘no for four people’. Waarom Duplex niet zo antwoordt weet ik niet, maar dat ligt ongetwijfeld aan hoe het systeem geprogrammeerd is.

Om het geheel nog lastiger te maken: je zou kunnen zeggen dat ik met deze analyse juist probeer om een afwijkende observatie in overeenstemming te brengen met mijn wereldbeeld. Ik denk dat ik in staat ben om robot van mens te onderscheiden, en dus zoek ik naar mogelijke rariteiten die aantonen dat robots niet praten zoals mensen. Dus de tegenhanger is dat ik extra slecht ben in het onderscheiden van robots van mensen…

Rationaliseren

En dat brengt me weer terug bij het probleem met de Turing Test: mensen zijn goed in rationaliseren. We proberen in eerste instantie onze waarnemingen te verklaren vanuit wat we weten van de wereld. Zelfs als de twee volstrekt met elkaar in tegenspraak zijn, dan nog zullen we ons wereldbeeld niet snel verwerpen. Dat is op zich natuurlijk handig; je wilt niet bij de eerste de beste zwarte zwaan alles wat je weet overboord gooien. (De keerzijde is dat we vasthouden aan complottheorieën, ook al is er meer dan genoeg bewijs tegen.) Mensen, of ze nu wetenschappers zijn of niet, hebben wat steviger bewijs nodig. Het nadeel is dat een Turing Test misschien helemaal geen goede indicator is van of computers kunnen denken: dat we niet doorhebben dat we met een computer praten zegt mogelijk meer over ons als mens dan over de intelligentie van de computer.