• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

Computer vindt tussentaal

25 november 2016 door Marc van Oostendorp Reageer

Door Marc van Oostendorp

image00Een van de problemen voor vertaalcomputers was tot nu toe altijd dat er zoveel talen zijn. Je kunt jaren besteden aan een computer die goede vertalingen maakt van het Frans in het Engels, en dan vele jaren voor een computer die Russisch in het Engels vertaalt, maar dan heb je het Frans en het Russisch nog niet aan elkaar gekoppeld. Dat probleem lijkt nu op een interessante manier te worden opgelost door het team achter Google Translate, die er deze week een artikel over publiceerden.

Bij iedere taal die je toevoegt wordt het probleem ingewikkelder. Drie talen (Frans, Russisch, Engels) betekent drie paren talen (Frans-Engels, Frans-Russisch, Engels-Russisch); maar als je een vierde aan de verzameling toevoegt (Nederlands) worden dat er ineens zes (Nederlands-Frans, Nederlands-Engels, Nederlands-Russisch komen erbij). En bij een vijfde taal komen er vier taalparen bij, enzovoort. Omdat vertalen van het Russisch naar het Nederlands nog iets anders is dan vertalen van het Nederlands naar het Russisch, moet je die aantallen eigenlijk nog verdubbelen. Hoe meer talen er al zijn, hoe meer werk het wordt om er nog een aan toe te voegen. 

Ontwerpen

In de lange geschiedenis van de vertaalcomputer is daar ook ooit wel een oplossing voor bedacht: de tussentaal (interlingua), een abstracte taal die ‘in het midden staat’ en die de betekenis van de zin op de een of andere manier opslaag. Je vertaalt van iedere taal alleen naar die interlingua en terug. Als je van het Engels naar het Frans vertaalt, vertaal je eigenlijk eerst van het Engels naar de interlingua en daarna van de interlingua naar het Frans. Het voordeel is: je hoeft als je een nieuwe taal toevoegt alleen een module toe te voegen om naar de interlingua te vertalen. Bij heel veel talen wordt dat efficiënt.

Het probleem van dat interlingua-systeem is echter altijd geweest: hoe moet die interlingua er dan uitzien? Wat moet dat voor magisch systeem zijn dat de ‘betekenis’ van een zin opslaat op een soort neutrale manier? Hoe kun je zoiets ontwerpen?

Daarop zijn dit soort pogingen altijd stukgelopen en het populairste automatische vertaalproject aller tijden, Google Translate, vertaalt enkele tientallen talen, maar doet dat steeds (min of meer) rechtstreeks, ook al betekent dat er met een groot aantal taalparen moet worden gewerkt. (Al schijnt er soms wel een weggetje te worden afgesneden en wordt sommige Jiddisj ‘via het Duits’ vertaald, omdat het Duits zoveel op Jiddisj lijkt en dus als een soort interlingua kan werken.)

Japans naar Koreaans

Maar sinds een paar maanden schakelt men over naar een nieuw systeem, waarin de computer zelf probeert uit te vinden hoe hij tussen twee talen moet vertalen: je voert hem een heleboel teksten met vertalingen en het systeem probeert daar zelf de patronen in te ontdekken. Ik schreef er hier eerder over.

In hun nieuwe artikelen beschrijven sommige van de makers van de ‘nieuwe’ Google Translate een nieuwe ontdekking die ze deden terwijl ze het systeem aan het maken waren: het toevoegen van talen blijkt een stuk eenvoudiger. Toen ze het systeem hadden getraind om van het Japans naar het Engels te vertalen, en daarna om van het Engels naar het Koreaans te vertalen. Toen de computer dat eenmaal kon bleek hij zonder enige aparte training ook redelijk van het Japans naar het Koreaans te kunnen vertalen.

De computer had zelf een tussentaal gevonden!

Kleine beetjes

De auteurs leggen uit dat het door de eigenzinnige en ingewikkelde manier waarop computers te werk gaan, nog niet gemakkelijk is om te bepalen wat die interlingua precies is (hoeveel hij, in dit geval, bijvoorbeeld lijkt op het Engels).

Maar het opent natuurlijk interessante perspectieven. Dat geldt vooral voor kleine talen, waarvoor automatisch vertalen misschien wel het nuttigst is, en waarvoor tegelijkertijd te weinig materiaal is om de computer te trainen: er zijn misschien wat vertalingen van en naar het Engels en nog een handjevol van en naar het Russisch, maar die zijn allebei niet genoeg om de taal echt te kunnen toevoegen. Maar als de computer echt een interlingua heeft gedefinieerd kun je die kleine beetjes misschien bij elkaar voegen om tot een goede vertaling te komen.

 

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: computertaalkunde, vertaalcomputer, vertalen

Lees Interacties

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

J. Slauerhoff • Morgen rijd ik met bedwelmende bloemen naar je toe

Morgen rijd ik met bedwelmende bloemen naar je toe.
Ik wil niet langer wachten, eindelijk weten hoe
Je bent; de bloemen zullen je verraden.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

OEUVRE

Het oeuvre van de dood is wel onmetelijk,
maar elke bladzij, blad na blad, is vastgeplakt
en ieder deel staat vastgespijkerd op de plank
en elke plank: nog in de boom onuitgehakt.

Bron: Barbarber, december 1969

➔ Bekijk hier alle citaten

Agenda

26 september 2025: Afscheid Peter-Arno Coppen

26 september 2025: Afscheid Peter-Arno Coppen

10 juli 2025

➔ Lees meer
Augustus: Eetvoorstelling ‘Muzikaal Feestmaal’ op Slot Zuylen en Muiderslot

Augustus: Eetvoorstelling ‘Muzikaal Feestmaal’ op Slot Zuylen en Muiderslot

8 juli 2025

➔ Lees meer
12 september 2025: Dag van de Nederlandse partikels

12 september 2025: Dag van de Nederlandse partikels

7 juli 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

geboortedag
1914 Karel Meeuwesse
1936 Mieke Smits
1939 Seth Gaaikema
sterfdag
1978 Sonja Witstein
2021 Mark de Haan
➔ Neerlandicikalender

Media

De laatste keuze van Rogi Wieg

De laatste keuze van Rogi Wieg

9 juli 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Van Lacarise den katijf die enen pape sach bruden zijn wijf

Van Lacarise den katijf die enen pape sach bruden zijn wijf

8 juli 2025 Door Vianne Cré Reageer

➔ Lees meer
‘Pipi, paradoxen en leermomenten’

‘Pipi, paradoxen en leermomenten’

5 juli 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
 

Reacties laden....
 

    %d