Tag: ANW

Teksten opschonen met Taalradar

Door Instituut voor de Nederlandse Taal

Taalradar is een crowdsourcingplatform dat het Instituut voor de Nederlandse Taal (INT) ontwikkelt in het kader van een Europees samenwerkingsproject. In het nieuwste Taalradaronderzoek kunt u helpen met het opschonen van onze tekstverzamelingen. 

Om het hedendaagse Nederlands te kunnen monitoren legt het INT grote tekstverzamelingen aan, ook wel corpora genoemd. Zo maken we onder andere een corpus van internetpagina’s. Zo’n corpus bevat veel informatie over hoe het Nederlands in de praktijk gebruikt wordt, en we kunnen er bijvoorbeeld automatisch voorbeeldzinnen uit halen om te gebruiken in het Algemeen Nederlands Woordenboek (ANW) en voor materialen voor taalleerders. Het nadeel van een verzameling webteksten is dat er ook ongepaste taal (bijv. obsceen taalgebruik) in kan voorkomen. Daarom kunt u in dit nieuwe onderzoek van Taalradar helpen onze tekstverzameling op te schonen, door zinnen met ongepaste taal aan te vinken. Doet u mee?

Lees verder >>