Limburgs als taal bij Microsoft

Door Leonie Cornips

Hoe een dialect in Limburg te spellen levert altijd discussie op. De ouderen schrijven en ondersteunen vaak de Veldeke 2003 of Raod veur ’t Limburgs-spelling in meer conventionele media. De jongeren vertonen veel variatie in hun schrijven op sociale media – Whatsapp, Snapchat, Twitter en Facebook. Hoe aan vele manieren van schrijven tegemoet te komen, inclusief die van Veldeke 2003, is vanaf eind augustus opgelost. Want dan is Microsoft voor nu het eerste grote IT bedrijf dat het Limburgs als taal toevoegt voor mobiele applicaties. Hun afdeling Swiftkey stelt de Beta (of test-)versie beschikbaar in de nacht van 17 op 18 augustus voor het Limburgse keyboard en spellingschecker voor alle mobiele Android applicaties. Bij elk Microsoft Swiftkey keyboard komt het Limburgs dan als taalkeuze voor. Uiteindelijk is het de bedoeling dat het intikken van de vele diakritische tekens zoals ë, ò, é, äö, oë, oeë, àè, ieë, ieè, eë, ië, aeë, èë, èw, àèë, àèw, aoë geen probleem meer oplevert. Gebruikers kunnen snel blijven tikken.Elke gebruiker kan vanaf 18 augustus gedurende twee weken deze testversie testen en feedback sturen aan Microsoft Swiftkey. Daarna wordt, waarschijnlijk begin september, de definitieve versie gelanceerd, die dan ook voor mobiele iOS (Apple) applicaties beschikbaar is (te downloaden via de App store).

Het Limburgse model voor het toetsenbord en de spellingschecker bij de Microsoft Swiftkey Beta app heeft een grote verzameling van Limburgse woorden. De woorden komen in de spelling van veel dialecten voor op basis van de Veldeke 2003-spelling, maar daarnaast zijn ook Limburgse spellingsvarianten van internet en sociale media toegevoegd. Niet alle spellingsvariatie kon worden opgenomen, maar de bestaande spellingsvariatie zal nog verruimen, omdat iedere individuele gebruiker altijd zijn/haar voorkeursspelling kan toevoegen.

De software dat het taalmodel levert, leert van de spellingsvoorkeur van de individuele gebruiker. Als deze gebruiker vaker een bepaalde spelling van een woord intikt, wordt zijn/haar spellingsvoorkeur na verloop van tijd aan de schrijver aangeboden. De software voegt ook nieuw toegevoegde woorden en spellingsvoorkeuren aan de collectieve woordenlijst voor het Limburgs toe. Hoe meer gebruikers een bepaald woord op een specifieke wijze spellen, hoe meer waarschijnlijk het wordt dat dit woord bij individuele gebruikers als mogelijkheid geopperd wordt.

Het voorspellingsmodel van het Limburgse toetsenbord en de spellingschecker werkt als volgt. Aan de hand van de eerste letters die getypt worden, voorspelt de software welk woord en in welke spelling de gebruiker typt. Het intikken van bijvoorbeeld sto roept stoon (staan) als voorspelling op of het intikken van sjta voorspelt sjtaon. Daarnaast voorspelt de software welk woord in alle waarschijnlijkheid op het vorige woord volgt en geeft hiervoor verschillende mogelijkheden aan.

Limburgs wordt dus ook als taal toegevoegd bij Microsoft. Je kunt bij Microsoft Swiftkey verschillende talen instellen. Op Android applicaties een maximum van 5 talen en op iOS applicaties een maximum van 2. Het toetsenbord zal weten in welke taal getypt wordt en woorden (en spellingen) uit die taal als mogelijkheden aanbieden.

De grote trekker achter dit resultaat is Dr. Yuri Michielsen-Tallman. Yuri is al heel lang actief als voorzitter van de Stichting Limburgse Academie en sinds de zomer projectcoördinator voor het Limburgs Corpus Woordenboek. Beide activiteiten vallen onder de Leerstoel Taalcultuur in Limburg bij de Universiteit Maastricht.​

Na Microsoft veroverd te hebben, is Yuri ook met de andere IT giganten bezig om hen zover te krijgen. Bij op zijn minst één andere lijkt dat te gaan lukken. Hierover op termijn meer. Dit resultaat is volledig tot stand gekomen door liefde voor het Limburgs, er is geen budget aan te pas gekomen maar wel internationale samenwerking met Dr. Ligeia Lugli (King’s College Londen), Michael Anthony Schuler, BA (Harvard) en Dr. Jean Robert Opgenort in San Francisco.

Wat deze digitale middelen voor het schrijven in het Limburgs voor gevolgen hebben, laat zich goed raden. Een nieuwe impuls om Limburgs vooral op digitale media te schrijven en veel spellingsvariatie. De norm van Veldeke 2003 zal bekender worden maar daarnaast zullen de gebruikers op het net ook zelf een consensusspelling weten te creëren. Microsoft goes Limburgs is voor deze regionale taal een revolutie.

Dit bericht is geplaatst in column met de tags , . Bookmark de permalink.

15 reacties op Limburgs als taal bij Microsoft

  1. Pieter Simons schreef:

    Mooi! Twijfel wel of je niet beter de veldeke spelling als enige standaard zou moeten aanhouden. Als het tegenzit kan die aardig uitgehold worden. Ben benieuwd. Vermoed dat trouwens voornamelijk mensen die al regelmatig in dialect schrijven, en dat zullen waarschijnlijk mensen uit de Veldeke kringen zijn, er gebruik van gaan maken.

    • leonie cornips schreef:

      Degenen die op sociale media schrijven zijn juist degenen die niet de Veldeke-spelling hanteren en er of geen weet van hebben, het te moeilijk vinden of zich er niet aan storen. Zij zijn meestal juist niet aan Veldeke kringen verbonden.

  2. Toos Evers-Dircks schreef:

    Dit is ’n erkinning veur oos Limburgse taal! Haopelik gaon noe nag mieë luuj in ’t plat sjrieve!

  3. Jack Jacobs schreef:

    Ik hanteer het AGL woordenboek, met als basis het Geleens, maar soms sluipt er een Maastrichts woord of Heerlens woord of zelfs een Roermonds woord in mijn teksten. Hangt ook een beetje af van hoe mooi dat woord oogt of klinkt. Sommige lokale woordenboeken schieten tekort, dan ben je gedwongen om een greep te doen in de woordenschat van een andere plaats.

    • leonie cornips schreef:

      Met wat Microsoft nu aanbiedt kan dat heel erg prima, tijdens het tikken zal het systeem voorspellen wat u probeert te tikken maar u kan uw eigen woord tikken zoals gewenst. Mooi om te lezen dat uw keuze bij het schrijven afhangt van hoe mooi een woord oogt of klinkt!

  4. lars schreef:

    Dus als de meerderheid het foutief schrijft wordt dit toch als juiste spelling gezien?

    • leonie cornips schreef:

      Limburgs schrijven leer je niet op school, dus hoe kan je dan over goed of fout spreken net alsof het de standaardtaal is? Dat kan alleen wanneer schrijvers jaren hebben kunnen oefenen net als op school, als er examens zijn in het Limburgs, als de overheid in geschreven Limburgs communiceert, als de musea geschreven Limburgs hanteren, als de massamedia en de kranten geschreven Limburgs afrdukken. Verwar hoe een regionale taal functioneert niet met een nationale taal.

      • Henk schreef:

        Het verschil is niet zo zeer dat tussen een regionale en een nationale taal, maar dat tussen een minder of meer gestandaardiseerde variëteit. Het Fries, Baskisch, Catalaans en nog heel wat andere talen zijn geen ‘nationale talen’, althans niet in de zin dat ze als vanzelfsprekend communicatiemiddel van een nationale overheid en een volledige landsbevolking worden gebruikt. De standaarden zijn misschien niet zo eenvormig en zo breed geaccepteerd als de Nederlandse, maar de standaardisering ervan gaat wel duidelijk verder dan die van het Limburgs.

        Het is dat de provincie Friesland in 2015 een nieuwe spelling heeft geïntroduceerd, terwijl de daarvoor door woordenboekmakers ontwikkelde spelling ook nog volop functioneert. Daardoor treden er sinds kort in de praktijk allerlei dubbelspellingen op. Tussen begin jaren 80 en 2015 was er in Friesland echter brede consensus over de juiste schrijfwijze van woorden, over de toegelaten syntactische variatie, over de aanvaardbaarheid van allerlei dialectvarianten in de schrijftaal, over de aanvaardbaarheid van veel Nederlandse ontleningen in de spreek- en schrijftaal etcetera, mede door een aantal van de factoren die je hierboven noemt (schoolexamens, overheidscommunicatie, massamedia). In Baskenland, Catalonië en Wales ziet het met de regionale taal niet heel veel anders uit.

  5. leonie cornips schreef:

    Dank voor de mooie inkijk bij de andere minderheidstalen!

  6. Jan Schuren schreef:

    Het probleem met het Limburgs is dat er ongeveer ongeveer 70 verschillende spellingregels bestaan die officieel gepubliceerd zijn. Het merendeel daarvan is terug te vinden in lokale woordenboeken, maar ook in andere publicaties zoals bijvoorbeeld in een aantal verschillende versies van de ‘Spelling 2003 voor de Limburgse dialecten’ die door de Raod veur ’t Limburgs is uitgegeven.

    Ik heb deze regels eens onder de loep genomen en kwam op een totaal van 419 verschillende tekens (zoals: è, a, ó, k, p) of combinaties van tekens (zoals: ui, ou, ieë, sch, ch, ao) om ‘het Limburgs’ op papier te krijgen.

    Zolang we er in Limburg van uitgaan dat elke plaatselijke variant een eigen spelling vereist, zal het aanmodderen blijven. En dat terwijl het schrijven van het Limburgs heel eenvoudig kan zijn, een ‘ao’ klinkt door heel Limburg hetzelfde, net als de ‘ae’ de ‘äö’, de ‘è’ de ‘ó’ of de ‘ö’. Als daarnaast eens alle naslagen die in Limburg veel gehoord worden, eens consequent met ‘ë’ geschreven zouden worden, is het schrijven van het Limburgs kinderspel.

    Het is een kwestie van alles toepassen wat vroeger op de lagere school geleerd is, een paar nieuwe tekens leren (en dat zijn er niet meer dan de 6 die ik hierboven benoemde), en elke lokale variant van het Limburgs dat binnen onze provinciegrenzen te beluisteren valt, is moeiteloos op papier te krijgen. In mijn boek ‘Limburgs: wie sjriefs se det?’ wordt deze methode uitgebreid behandeld.

    Het introduceren van een doolhof aan diakritische tekens zal voor de softwaretechneuten van Microsoft een peulenschilletje zijn, voor de gemiddelde lezer echter zal het geschreven Limburgs snel een kwestie van ontcijferen worden. Limburgs voor hiëroglifologen.

    In een reactie op het artikel ‘Limburgs als taal bij Microsoft’ schreef ene Lars op 12 augustus: “Dus als de meerderheid het foutief schrijft wordt dit toch als juiste spelling gezien?”. En daarmee slaat hij de spijker volledig op zijn kop. Of zoals we dat in ons Limburgs ‘zoeë sjoeën’ kunnen zeggen: “de kaeper vol oppe bölles”.

  7. leonie cornips schreef:

    Goed om uw bericht hier te lezen. Ik heb helaas uw boek nog niet kunnen lezen maar ik zou iedereen geinteresseerd in een eenvoudige spelling van het Limburgs daar dus naar willen verwijzen. Misschien is het iets om uw voorstel kort uiteen te zetten voor de liefhebbers?
    Foutief: nee dat hoort echt niet bij een regionale taal die niet gestandardiseerd is. Zolang er geen uniformering/standaardisering is, noem ik verschillen taalvariatie. Ook Veldeke onderling is het niet altijd eens over hoe te spellen. Zolang er geen algemeen geaccepteerde spellingswijze is in Limburg, is er ook geen goed/fout discours mogelijk.

  8. Koenraad Peeters schreef:

    Zouden we niet beter trachten correct Nederlands te communiceren? Er is nood aan een universele taal. Door de versnippering zullen we sneller moeten overschakelen op een vreemde taal om mekaar te begrijpen.

  9. leonie cornips schreef:

    Voor het Nederlands bestaat er eeuwenlang een norm hoe te schrijven en dat leren we allemaal op school. Dus in feite raakt iedereen gewend, krijgt iedereen geleerd hoe correct Nederlands te schrijven. Ook degenen die dialect spreken en schrijven, dus het Nederlands blijft de schrijftaal als we met iedereen in nederland willen communiceren. Willen we daarbuiten communiceren dan komen andere talen er weer aan te pas. Nederlands is dus ‘universeel’ in Nederland en daarnaast kunnen mensen ook in een andere taal schrijven.

  10. Jan Schuren schreef:

    De uitnodiging van mevrouw Cornips van 14 augustus om mijn voorstel van een dag eerder in het kort uiteen te zetten voor de liefhebbers, neem ik graag aan.

    Er zijn heel wat mensen die in het Limburgs willen schrijven. En eenieder mag dat doen zoals hem dat uitkomt en omdat er geen officiële Limburgse spelling bestaat, is er inderdaad geen foutief mogelijk.

    Het blijft echter vreemd dat het Limburgs dan wel een erkende Europese streektaal is, maar dat in tegenstelling tot elke andere zichzelf respecterende taal, het Limburgs er tot heden niet in is geslaagd een spelling te regelen die voor alle Limburgse dialecten gebruikt wordt. Er is dan weliswaar een door de Raod veur ’t Limburgs in 2003 uitgegeven spellinggids, die de goedkeuring draagt van Veldeke Limburg, maar in een aantal woordenboeken die door Veldekeleden zijn samengesteld en na het verschijnen van die gids zijn gepubliceerd, worden spellingen gepresenteerd die de regels van de gids uit 2003 met voeten treden. En dat terwijl in de doelstellingen die neergelegd zijn in de spellinggids te lezen valt dat het regel moet zijn dat Veldekeleden volgens die regeling spellen.

    Een eenvoudig voorbeeld om aan te geven hoe bedroevend het is gesteld, is het Limburgse woord voor het Nederlandse ‘bruid’. In heel Limburg wordt dit ‘broed’ uitgesproken met een duidelijk herkenbare sleeptoon. In sommige dialecten in Limburg kent men ook ‘broed’ dat uitgesproken wordt met een stoottoon en dan ‘brood’ betekent (bijvoorbeeld in het Maastrichts).

    Ook het Nederlands kent dit fenomeen van klinkers die kort of lang uitgesproken worden. Dit hoort men vooral bij de ‘ie’, de ‘oe’ en de ‘uu’ als die gevolgd worden door een ‘r’. De ‘uu’ in ‘buur’ en ‘zuur’ wordt duidelijk langer uitgesproken dan de ‘u’ in bijvoorbeeld ‘studie’. Vergelijk ook de ‘ie’ in ‘bier’ en ‘fiets’ of de ‘oe’ in ‘boer’ en ‘boek’. De Nederlandse spelling heeft gelukkig nooit de behoefte gehad om dit verschil in lengte van toon aan te geven.

    In Limburg echter bestaat die behoefte blijkbaar wel. Zo kwam ik in verschillende lokale woordenboeken de volgende spellingvoorschriften tegen voor het Nederlandse ‘bruid’: ‘broed’, ‘broèd’, ‘broéd’, ‘bróed’, ‘bróéd’, ‘broe.d’, ‘broe:d’, ‘broêd’, ‘brôêd’, ‘broeëd’, ‘broeed’ en ‘broet’.

    Lees ik de Limburgse zin: ‘de broed itj ’n broed’ (de bruid eet een brood) dan hoef ik geen diakritische tekens om aan te geven welke ‘oe’ gestoten en welke gesleept moet worden uitgesproken. Net zo min als ik diakritische tekens nodig heb om de zin ‘de boer leest een boek’ in voor eenieder verstaanbaar Nederlands uit te spreken.

    Zoals gezegd, eenieder mag spellen zoals hij wil. Wat mij betreft mag ‘broed’ ook gespeld worden als ‘hçsráîft’, maar realiseer je dan wel als schrijver dat je de enige lezer bent die dit kan ontcijferen.

    Naast het gegeven voorbeeld ‘broed’, is een boek te vullen met soortgelijke voorbeelden. Zoals ik een eerdere reactie aangaf, laat een zoektocht door plaatselijk uitgegeven spellingregels een niet te ontwarren doolhof van 419 tekens zien. Iemand die iets in het Limburgs gaat schrijven neemt de lokale regels ter hand. Als Microsoft alle hierboven genoemde varianten van het voorbeeld ‘broed’ gaat opnemen, zal het geschreven Limburgs er begin september na de lancering van de definitieve versie van het swiftkey keyboard niet veel beter op worden.

    Met excuses voor de lengte van deze reactie.

Laat een reactie achter