• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar
  • Spring naar de voettekst
Neerlandistiek. Online tijdschrift voor taal- en letterkunde

Neerlandistiek

Online tijdschrift voor taal- en letterkundig onderzoek

  • Over Neerlandistiek
  • Contact
  • Homepage
  • Categorie
    • Neerlandistiek voor de klas
    • Vertelcultuur
    • Naamkunde
  • E-books
  • Neerlandistische weblogs
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal

De stijlcomputer

8 februari 2014 door Marc van Oostendorp 8 Reacties

Door Marc van Oostendorp


Hoe moet je schrijven? Dat is de vraag die ik tot de vraag van het jaar heb uitgeroepen. Ik neem schrijfles, maar leg natuurlijk ook mijn oor te luisteren bij de wetenschap.

Nu opgelet, want in het kader van de leesbaarheid komt er een lange zin. Een aantal onderzoekers bij de afdeling informatica van de universiteit in Stony Brook hebben het probleem opgelost en zij hebben een computerprogramma ontwikkeld dat automatisch kan bepalen hoe ‘succesvol’ een tekst zal zijn aan de hand van een aantal stijlkenmerken en nu hoef je dus alleen maar ervoor te zorgen dat je die stijlkenmerken toepast om ervoor te zorgen dat je stijl voortaan succesvol is en ‘succesvol’ is door de onderzoekers gedefinieerd in termen van hoe vaak je gedownloaded wordt op de website van Gutenberg – en wie wil er nu niet vaak worden gedownloaded op de website van Gutenberg.

Een van de dingen die dus werkt, volgens die onderzoekers, is dat je vaak de woorden en, maar en of gebruikt. (Het echte artikel vind je door hier te klikken; het artikel begin op pagina 1745.)


De onderzoekers beweren dat zij de eersten zijn die ’this unstudied and unexpected connection between stylistic elements and the literary success’ hebben bestudeerd. Zouden ze echt denken dat nog nooit iemand op het idee is gekomen dat het succes van een boek weleens met de stijl te maken zou kunnen hebben? Laten we hopen dat ze eigenlijk willen zeggen dat ze dit voor het eerst op deze manier hebben onderzocht. De methode is eenvoudig. Het succes van een roman wordt dus bepaald door hoe vaak hij geraadpleegd is op Gutenberg. De stijl wordt bepaald door allerlei telbare dingen: de frequentie van nevenschikkende voegwoorden en andere woordsoorten.

Zelfstandig naamwoorden zijn goed voor de downloadbaarheid, werkwoorden zijn slecht. En onder de werkwoorden zijn woorden die handelingen en gevoelens uitdrukken (vechten, huilen, afpakken) slechter dan woorden die gedachteprocessen uitdrukken (denken, peinzen).

Toch durf ik te voorspellen dat een willekeurige tekst niet ineens populairder wordt door hem naar hartelust met bijvoeglijk naamwoorden te larderen, zelfs niet als je de aller-allerbest werkende adjectieven neemt.Het is interessant om na te denken over wat er mis is: het team uit Stony Brook meent dat het feit dat zij correlaties gevonden hebben tussen de hoeveelheid naamwoorden en de dowyloadbaarheid, ook meteen een feit is. Teamleidster Choi praat in het interview aldus over haar bevindingen:

Previous work has attempted to gain insights into the ‘secret recipe’ of successful books. But most of these studies were qualitative, based on a dozen books, and focused primarily on high-level content — the personalities of protagonists and antagonists and the plots. Our work examines a considerably larger collection — 800 books — over multiple genres, providing insights into lexical, syntactic, and discourse patterns that characterize the writing styles commonly shared among the successful literature.

Het is zoals de onderzoeker die statistisch vaststelt dat de zon altijd opkomt nadat de haan heeft gekraaid en nu zegt voor het eerst wetenschappelijk, want op basis van heel veel meetpunten, te hebben vastgesteld dat de haan de zon doet opkomen. De feitelijke relatie is veel complexer, en wel op een manier die je misschien wel beter aan de oppervlakte kunt krijgen aan de hand van a dozen books.  

Delen:

  • Klik om af te drukken (Wordt in een nieuw venster geopend) Print
  • Klik om dit te e-mailen naar een vriend (Wordt in een nieuw venster geopend) E-mail
  • Klik om te delen op Facebook (Wordt in een nieuw venster geopend) Facebook
  • Klik om te delen op WhatsApp (Wordt in een nieuw venster geopend) WhatsApp
  • Klik om te delen op Telegram (Wordt in een nieuw venster geopend) Telegram
  • Klik om op LinkedIn te delen (Wordt in een nieuw venster geopend) LinkedIn

Vind ik leuk:

Vind-ik-leuk Aan het laden...

Gerelateerd

Categorie: Artikel Tags: het jaar van de stijl, stijl, taalbeheersing

Lees Interacties

Reacties

  1. Anoniem zegt

    8 februari 2014 om 13:59

    ?
    1. Een aantal […] heeft
    2. Een van de dingen die dus werken

    Beantwoorden
  2. Marc van Oostendorp zegt

    8 februari 2014 om 15:42

    Dit is de mysterieuste reactie ooit! Nieuwe sport: anoniem zinsdelen citeren?

    Beantwoorden
  3. Kees vdStaak zegt

    9 februari 2014 om 10:37

    Nou, mysterieus, dat valt nogal mee vind ik. Anoniem heeft waarschijnlijk kritiek op een stijlkenmerk dat ook mij opviel, het afwijken van het gebruik om van een werkwoord dat bij een enkelvoudig onderwerp behoort ook de enkelvoudige werkwoordsvorm te bezigen zoals u doet in de zin waarvan u terecht waarschuwt voor de lengte en die begint met het naar ik meen dat het onderwerp is 'Een aantal onderzoekers' en waarbij 'een' een enkelvoud suggereert waarop een meervoudige werkwoordsvorm volgt 'hebben het probleem opgelost'. Dat u dit bewust toepast behoort zeker tot de mogelijkheden want in de alinea voor het lange zin citaat schrijft u 'het team uit Stony Brook meent dat het feit dat zij correlaties gevonden hebben' waarbij dit 'hebben' in combinatie met 'Het team' opvalt. Maar als voormalig tekstredacteur maak ik mij meer over die vergeten spatie, niet eens een fout, maar gewoon vergeten. Overigens ben ik van mening dat 2014 het jaar van de puntkomma moet worden, of het jaar van de lange zinnen.

    Beantwoorden
  4. Kim Jautze zegt

    9 februari 2014 om 11:01

    "Maar als voormalig tekstredacteur maak ik mij meer over die vergeten spatie, niet eens een fout, maar gewoon vergeten". Voormalig tekstredacteur, u bent uw zorgen in deze zin vergeten.

    Wat jammer dat er niet inhoudelijk op de blogpost van Marc van Oostendorp wordt gereageerd, die naar mijn mening een zeer interessante bespreking geeft van het artikel van Choi en Feng. Hun onderzoek is gerelateerd aan een project waaraan ik meewerk, waarin we ook op een computationele manier onderzoek doen naar literaire en goede (of niet zo literaire en slechte) stijl. De Sony Brook-onderzoekers hebben een interessante methode ontwikkeld voor het meten van een aantal stijlgerelateerde kenmerken in succesvolle boeken (waarbij de vraag is of het aantal downloads op Gutenberg de juiste maat voor succes is), maar inderdaad zijn zinsoverstijgende kenmerken van romans, zoals plot, pesonages en semantiek voor dit tekst-intrinsieke onderzoek van minstens zo groot belang. Deze laatstgenoemde kenmerken zijn helaas aan de hand van computationele methoden minder makkelijk "objectief" te onderzoeken dan de syntactische en lexicale kenmerken. Volgens mij presenteren de onderzoekers overigens geen causale relatie tussen de gevonden patronen en succesvolle boeken, maar een patroon dat lijkt te correleren met de maat die zij voor succes hebben vastgesteld.

    Beantwoorden
  5. Marc van Oostendorp zegt

    9 februari 2014 om 18:22

    Dank u wel. Ik vraag me altijd af waarom iemand anoniem zijn gebrek aan inzicht in de Nederlandse taal wil etaleren. U doet dit tenminste nog onder uw eigen naam. De gedachte dat goede stijl impliceert dat je je aan tot in het absurde gedreven regels van overgesplimplificeerde logica zouden moeten houden, is natuurlijk volkomen absurd. Uw streven naar meer puntkomma's en langere zinnen onderschrijf ik aan de andere kant volkomen.

    Beantwoorden
  6. Mark D. zegt

    9 februari 2014 om 23:15

    De vraag die Marc heel tactvol stelt zonder 'm te stellen is natuurlijk: wat hebben we er precies aan om een lijstje te hebben van woordgroepen die net iets vaker voorkomen in de meer gedownloade boeken, zeker als het gaat om zulke algemene dingen als de frequentie van "in" en het voorkomen van naamwoordgroepen.

    Hoewel de onderzoekers in het persbericht met de mond belijden dat correlatie nog geen causatie is, komt de taal van hun artikel er wel erg dichtbij: zo rept de samenvatting van een kwestie die van belang is voor "publishers and aspiring writers alike", wat duidelijk de gevolgtrekking uitnodigt dat de resultaten niet alleen betrekking hebben op al bestaande boeken (correlatie), maar ook op nog te schrijven boeken (causatie).

    Het grootste probleem, zoals altijd in dit soort studies, is dat er teveel 'degrees of freedom' zijn in de statistische analyse. Elke studie die een grote dataset combineert met eens veel variabelen is als een appelboom vol rijpe en bijna-rijpe appels: iedereen die schudt kan resultaat claimen, maar niet elk resultaat is significant.

    De kunst is om van tevoren te voorspellen welke appels rijp zouden moeten zijn volgens je theorie, en om dan heel voorzichtig te schudden, één keertje maar; en om dan heel eerlijk te kijken welke appels er vielen, en of dat degene zijn die je ook voorspelde.

    Net zo belangrijk is het om de verleiding te weerstaan om achteraf je voorspelling bij te stellen (= 'p-hacking'), of om nog een paar keer te schudden totdat de juiste appels gevallen zijn (= 'multiple testing'). Elke studie die niet dit soort maatregelen neemt verdient het behandeld te worden als een rotte appel.

    Beantwoorden
  7. Mark D. zegt

    9 februari 2014 om 23:32

    PS Hier is een directe link naar een PDF van het (proceedings-)artikel: http://aclweb.org/anthology//D/D13/D13-1181.pdf

    Beantwoorden
  8. Marc van Oostendorp zegt

    10 februari 2014 om 21:57

    Dank! Ook voor je reactie hierboven. Het heeft me veel tijd gekost om eerst die hele bundel te downloaden en dan dat artikel op te zoeken. Dat kon dus veel sneller!

    Beantwoorden

Laat een reactie achterReactie annuleren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.

Primaire Sidebar

Gedicht van de dag

Fred Portegies Zwart • Atlas

Bestaan vangt aan met woorden ademhalen
opdat wat om ons heen is wordt verstaan.
Wat is en schijnt laat zich pas gadeslaan
als chaos wordt ontbonden door vertalen.

➔ Lees meer

Bekijk alle gedichten

  • Facebook
  • YouTube

Chris van Geel

OKT. ’59

Een borstelige zee, schuim, regen slaat het schuine raam. [lees meer]

Bron: Tirade, juli-augustus 1961

➔ Bekijk hier alle citaten

Agenda

21 november 2025: Tekstselectie in het Nederlandse literatuuronderwijs

21 november 2025: Tekstselectie in het Nederlandse literatuuronderwijs

8 oktober 2025

➔ Lees meer
21 januari – 8 april 2025: Postacademische cursus Recente Nederlandse en Vlaamse letterkunde

21 januari – 8 april 2025: Postacademische cursus Recente Nederlandse en Vlaamse letterkunde

7 oktober 2025

➔ Lees meer
28 november 2025: Symposium Werkgroep Bilderdijk

28 november 2025: Symposium Werkgroep Bilderdijk

5 oktober 2025

➔ Lees meer
➔ Bekijk alle agendapunten

Neerlandici vandaag

sterfdag
1988 Cebus de Bruin
2007 Hugo Verdaasdonk
➔ Neerlandicikalender

Media

Openingszitting Colloquium IVN

Openingszitting Colloquium IVN

8 oktober 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
Wanneer is iets literatuur?

Wanneer is iets literatuur?

2 oktober 2025 Door Redactie Neerlandistiek 4 Reacties

➔ Lees meer
Webinar: vertaaltools en AI inzetten in een meertalige klas

Webinar: vertaaltools en AI inzetten in een meertalige klas

30 september 2025 Door Redactie Neerlandistiek Reageer

➔ Lees meer
➔ Bekijk alle video’s en podcasts

Footer

Elektronisch tijdschrift voor de Nederlandse taal en cultuur sinds 1992.

ISSN 0929-6514
Bijdragen zijn welkom op
redactie@neerlandistiek.nl
  • Homepage
  • E-books
  • Neerlandistische weblogs
  • Over Neerlandistiek
  • De archieven
  • Contact
  • Facebook
  • YouTube

Inschrijven voor de Dagpost

Controleer je inbox of spammap om je abonnement te bevestigen.

Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

  • Homepage
  • Categorie
    • Voor de klas
    • Vertelcultuur
    • Naamkunde
  • Archief
    • 10 jaar taalcanon
    • 100 jaar Willem Frederik Hermans
  • E-books
  • Neerlandistische weblogs
  • Jong Neerlandistiek
  • Frisistyk
  • Mondiaal Neerlandistiek
  • Over Neerlandistiek
  • Contact
%d