• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Computer vindt tussentaal

25 november 2016 door Marc van Oostendorp Reageer

Door Marc van Oostendorp

image00Een van de problemen voor vertaalcomputers was tot nu toe altijd dat er zoveel talen zijn. Je kunt jaren besteden aan een computer die goede vertalingen maakt van het Frans in het Engels, en dan vele jaren voor een computer die Russisch in het Engels vertaalt, maar dan heb je het Frans en het Russisch nog niet aan elkaar gekoppeld. Dat probleem lijkt nu op een interessante manier te worden opgelost door het team achter Google Translate, die er deze week een artikel over publiceerden.

Bij iedere taal die je toevoegt wordt het probleem ingewikkelder. Drie talen (Frans, Russisch, Engels) betekent drie paren talen (Frans-Engels, Frans-Russisch, Engels-Russisch); maar als je een vierde aan de verzameling toevoegt (Nederlands) worden dat er ineens zes (Nederlands-Frans, Nederlands-Engels, Nederlands-Russisch komen erbij). En bij een vijfde taal komen er vier taalparen bij, enzovoort. Omdat vertalen van het Russisch naar het Nederlands nog iets anders is dan vertalen van het Nederlands naar het Russisch, moet je die aantallen eigenlijk nog verdubbelen. Hoe meer talen er al zijn, hoe meer werk het wordt om er nog een aan toe te voegen. 

Ontwerpen

In de lange geschiedenis van de vertaalcomputer is daar ook ooit wel een oplossing voor bedacht: de tussentaal (interlingua), een abstracte taal die ‘in het midden staat’ en die de betekenis van de zin op de een of andere manier opslaag. Je vertaalt van iedere taal alleen naar die interlingua en terug. Als je van het Engels naar het Frans vertaalt, vertaal je eigenlijk eerst van het Engels naar de interlingua en daarna van de interlingua naar het Frans. Het voordeel is: je hoeft als je een nieuwe taal toevoegt alleen een module toe te voegen om naar de interlingua te vertalen. Bij heel veel talen wordt dat efficiënt.

Het probleem van dat interlingua-systeem is echter altijd geweest: hoe moet die interlingua er dan uitzien? Wat moet dat voor magisch systeem zijn dat de ‘betekenis’ van een zin opslaat op een soort neutrale manier? Hoe kun je zoiets ontwerpen?

Daarop zijn dit soort pogingen altijd stukgelopen en het populairste automatische vertaalproject aller tijden, Google Translate, vertaalt enkele tientallen talen, maar doet dat steeds (min of meer) rechtstreeks, ook al betekent dat er met een groot aantal taalparen moet worden gewerkt. (Al schijnt er soms wel een weggetje te worden afgesneden en wordt sommige Jiddisj ‘via het Duits’ vertaald, omdat het Duits zoveel op Jiddisj lijkt en dus als een soort interlingua kan werken.)

Japans naar Koreaans

Maar sinds een paar maanden schakelt men over naar een nieuw systeem, waarin de computer zelf probeert uit te vinden hoe hij tussen twee talen moet vertalen: je voert hem een heleboel teksten met vertalingen en het systeem probeert daar zelf de patronen in te ontdekken. Ik schreef er hier eerder over.

In hun nieuwe artikelen beschrijven sommige van de makers van de ‘nieuwe’ Google Translate een nieuwe ontdekking die ze deden terwijl ze het systeem aan het maken waren: het toevoegen van talen blijkt een stuk eenvoudiger. Toen ze het systeem hadden getraind om van het Japans naar het Engels te vertalen, en daarna om van het Engels naar het Koreaans te vertalen. Toen de computer dat eenmaal kon bleek hij zonder enige aparte training ook redelijk van het Japans naar het Koreaans te kunnen vertalen.

De computer had zelf een tussentaal gevonden!

Kleine beetjes

De auteurs leggen uit dat het door de eigenzinnige en ingewikkelde manier waarop computers te werk gaan, nog niet gemakkelijk is om te bepalen wat die interlingua precies is (hoeveel hij, in dit geval, bijvoorbeeld lijkt op het Engels).

Maar het opent natuurlijk interessante perspectieven. Dat geldt vooral voor kleine talen, waarvoor automatisch vertalen misschien wel het nuttigst is, en waarvoor tegelijkertijd te weinig materiaal is om de computer te trainen: er zijn misschien wat vertalingen van en naar het Engels en nog een handjevol van en naar het Russisch, maar die zijn allebei niet genoeg om de taal echt te kunnen toevoegen. Maar als de computer echt een interlingua heeft gedefinieerd kun je die kleine beetjes misschien bij elkaar voegen om tot een goede vertaling te komen.

 

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: computertaalkunde, vertaalcomputer, vertalen

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

J.A. Dèr Mouw • Ik werd al aardig knap

Ik werd al aardig knap, want ‘k leerde fransch.
Blij was ‘k! Als je dat kende, ja, dan was je
Een eind op streek, begreep ik, want dan las je
Verne in ’t oorspronk’lijke en Aimard’s romans.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

Bloemen voor de honger,

de donkerste, de blauwe,
van as, van grijs graniet,
zwart ijs,
een kamer zonder raam,
een telraam zonder kralen,
een kamer zonder mens,
gegeten knaagt de tijd
voorbij,
de tanden uit de kam,
de grafkrans leeggeschranst,
een steen.

Bron: uit de reeks ‘Slaapwandelen’; Vrij Nederland, 22 december 1962

➔ Bekijk hier alle citaten

Agenda

28 november 2025: De Sint-Nikolaasavond

28 november 2025: De Sint-Nikolaasavond

10 oktober 2025

➔ Lees meer
21 november 2025: Tekstselectie in het Nederlandse literatuuronderwijs

21 november 2025: Tekstselectie in het Nederlandse literatuuronderwijs

8 oktober 2025

➔ Lees meer
21 januari – 8 april 2026: Postacademische cursus Recente Nederlandse en Vlaamse letterkunde

21 januari – 8 april 2026: Postacademische cursus Recente Nederlandse en Vlaamse letterkunde

7 oktober 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1847 Mathijs Koenen
sterfdag
2021 Anke van Reenen-Jongkind
2021 Wim Zaal
➔ Neerlandicikalender

Media

Docent Nederlands zijn als andertalige

Docent Nederlands zijn als andertalige

11 oktober 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Openingszitting Colloquium IVN

Openingszitting Colloquium IVN

8 oktober 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Wanneer is iets literatuur?

Wanneer is iets literatuur?

2 oktober 2025 Door Redactie Neerlandistiek 4 Reacties

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d