Mag Google Translate niet beter worden van Google?

Door Marc van Oostendorp


Op een dag de bijter gebeten,” schrijft de Britse krant The Guardian vanochtend, “een Braziliaanse WK dat thrillingly bewogen was geweest op het veld ontplofte dramatisch in het leven eraf. “

Althans, wanneer je Google Translate mag geloven, momenteel de beste automatische vertaler ter wereld.

Google is dit jaar tien jaar bezig met het ontwikkelen van de vertaalmachine: in 2004 kwam de Duitse informaticus Franz Josef Och er in dienst om de nieuwe afdeling ‘automatisch vertalen’ te leiden. Dit luidde er een periode in van ongekende aandacht en eerbied voor big data als een manier om met taal om te gaan: weg met alle ingewikkelde pogingen om de computer te laten begrijpen wat er stond! Om zinnen te laten ontleden! Om analyses te maken van de context! In plaats daarvan hoefde je alleen maar gebruik te maken van alle miljoenen of miljarden vertalingen die er al op het internet waren te vinden. Een nieuwe vertaling bestond alleen uit het elegant aan elkaar plakken van alle kleine stukjes vertalingen die er al waren.

Handgeschreven

Inmiddels biedt Google Translate vertaaldiensten aan tussen ongeveer 75 talen, waaronder Lao, Latijn, Lets en Litouws. Maar zijn de vertalingen ook in kwaliteit gestegen? Het is helaas moeilijk na te gaan: je zou willen weten hoe deze willekeurige zin uit The Guardian in 2005 of 2010 vertaald was – ik kan me nauwelijks voorstellen dat het veel slechter was dan dit, maar je weet maar nooit.

Enkele jaren geleden zocht de dienst ook nog af en toe het nieuws op. In 2011 interviewden Ewoud Sanders en ik Frans Josef Och voor NRC Handelsblad (betaalmuur). Maar ik kan van na die tijd eigenlijk geen substantiële interviews met Och meer vinden. Natuurlijk wordt nog af en toe het nieuws gezocht, maar dat gaat dan eigenlijk altijd over perifere zaken: dat het apparaat met spraaktechnologie werkt, of dat het tekst die op het beeld van je camera verschijnt kan vertalen, of met handgeschreven tekst.

Eeuwigdurende gloeilampen

Of er daadwerkelijk verbetering in de kern van de vertaalmachine zit, blijft daarbij onduidelijk. Voor de gebruiker is hij in ieder geval moeilijk waarneembaar.

Wie een beetje graaft op het internet, stuit op een interessante speculatie: dat Google intern wel degelijk een betere vertaalmachine heeft, die bijvoorbeeld wordt ingezet in sommige eigen commerciële diensten wordt ingezet, maar niet gratis aan het publiek wordt aangeboden. Nu is dat het soort gerucht dat je natuurlijk over ieder product hoort – veertig jaar geleden geloofden veel mensen dat Philips wel eeuwigdurende gloeilampen kon maken, maar dat expres niet deed om de markt niet te verstoren.

Blijven hangen

Maar in dit geval kan ik me er ook iets bij voorstellen. Het probleem is dat Google Translate het werk van Google soms verstoort: het maakt het namelijk heel gemakkelijk om moeiteloos zinloze pagina’s in allerlei talen aan te bieden, bijvoorbeeld om zo een beter zoekresultaat te krijgen bij Google zelf.

In het interview in de NRC meldde Och zelf nog een ander probleem, namelijk voor Google Translate zelf. Dat systeem leert van vertalingen die het op het internet vindt. Wanneer die vertalingen nu door Google Translate zelf gemaakt zijn, wordt het systeem nooit beter: het blijft hangen in de fouten die er nu eenmaal zijn.

Misschien is men dus achter de schermen wel degelijk een verbetering op het spoor – een die dan van ons wordt weggehouden om ervoor te zorgen dat hij niet weer onmiddellijk in zijn eigen fouten vastloopt. Maar misschien is men inmiddels ook bij Google Translate wel degelijk vastgelopen. Het zou niet de eerste keer zijn in de geschiedenis van het automatisch vertalen dat men zeer enthousiast raakt vanwege de eerste successen, maar uiteindelijk toch niet verder komt. Een tekst vertalen, echt, goed, vertalen, is niet gemakkelijk. “Translate a text, really, good, translate, is not easy”, zoals Google zegt.

Over Marc van Oostendorp

Marc van Oostendorp is onderzoeker aan het Meertens Instituut (KNAW) en hoofdredacteur van Neerlandistiek. Hij heeft een website, een YouTube-kanaal en een Twitter-account.
Dit bericht is geplaatst in geen categorie met de tags , . Bookmark de permalink.