Tag: e-humanities

Een teken van literaire kwaliteit

Door Marc van Oostendorp

Als een voordeel van boeken lezen wordt wel genoemd dat je er je woordenschat mee uitbreidt, en ook wordt (geloof ik) weleens beweerd dat je beter literaire boeken kunt lezen dan bijvoorbeeld streekromans.

Maar klopt dat wel? Dat bestudeerde ik aan de hand van de collectie van 1100 streekromans die Ewoud Sanders onlangs in het kader van de algehele coronasolidariteit in het publieke domein ter beschikking stelde.

Lees verder >>

30 november 2018, Utrecht: Bijeenkomst over distant reading

Het onderzoeksplatform Datafied Society en Het Utrecht Data Science & Humanities Centre organiseren op 30 november een discussie bijeenkomst over Distant Reading. Aanleiding is de blogpost van Marc van Oostendorp waarin de vruchtbaarheid van de betreffende leeshouding wordt betwijfeld. De professor zal zijn twijfels in persoon komen toelichten, waarna sprekers van het Utrecht Data Science & Humanities Centre en Datafied Society, en ook de aanwezige deelnemers, kunnen reageren. Lees verder >>

Liever schone data dan veel data

Door Marten van der Meulen

Vorige week schreef ik een blogpost naar aanleiding van een stuk van Marc van Oostendorp (die weer reageerde op een tweet van Geert Wilders). In de post beschreef ik het gebruik van een bepaald woord, difficulteren, aan de hand van een aantal verschillende corpora van het Nederlands. Mijn post bleek op haar beurt aanleiding voor professor Jan Odijk om een post te schrijven over de structuur en interface achter de door mij gebruikte corpora. Het onderzoekje dat ik in twee uur op een dinsdagochtend had uitgevoerd leek daarmee plotseling te worden opgevoerd als rechtvaardiging voor meerdere miljoenenprojecten. Dat is al te veel eer: het was een alleszins triviaal onderzoekje. Maar dit geeft mij wel een mooi haakje om wat kritisch commentaar te geven op deze interface. Vooral op twee punten is er nog een enorme winst te behalen: de kwaliteit van de data is nog aan drastische verbetering toe, en over het type data kan beter worden nagedacht.

Schone data

Laat vooropstaan dat ik zeker niet ondankbaar wil lijken. Wat er al gebeurd is binnen Clariah (zo heet het project achter de interface) is fijn en handig. Zo is een grote hoeveelheid corpora makkelijk toegankelijk binnen Nederlab, en kunnen deze zowel apart als gezamenlijk worden doorzocht met verschillende tools. Je kunt inderdaad vrij complexe zoekfuncties bedenken. Ik was bijvoorbeeld laatst op zoek naar zelfstandig naamwoorden die in het meervoud staan, voorafgegaan door een woord dat eindigt op –tal maar dat níet aantal is (bv. vijftal, honderdtal), en gevolgd door een werkwoord. Dat gaat vrij eenvoudig. Lees verder >>

‘Difficulteren’ zoeken met digitale methoden

Door Jan Odijk

Clariah is een groot project dat de empirische basis voor digitaal geesteswetenschappelijk onderzoek wil faciliteren. In de CLARIAH-PLUS-aanvraag (p. 8) wordt gesteld: “The CLARIAH infrastructure will increase our empirical base, options for analysing […] data, and the efficiency of research by orders of magnitude (data-intensive science).
Maar is dat ook echt zo?

Een treffende illustratie van de correctheid van deze claims wordt geleverd door Marten van der Meulen in een recente bijdrage aan Neerlandistiek.nl. Binnen een dag testte hij een vermoeden van Marc van Oostendorp over het onlangs door Geert Wilders gebruikte woord ‘difficulteren’, door het op te zoeken in meerdere corpora die de CLARIAH onderzoeksinfrastructuur de afgelopen jaren beschikbaar heeft gesteld. Lees verder >>

Literaire stijl als een computerkunstje

(Persbericht Radhoud Universiteit)

Is de creatie van een uniek literair oeuvre voorbehouden aan zwoegende schrijvers of kan een computer de klassiekers imiteren? In het project ‘Writers in the Cloud’ schrijven bezoekers van het Erasmusgebouw van de universiteit met behulp van taaltechnologie een tekst in de trant van schrijvers als Couperus, Grunberg of Bervoets. Het project dat op 2 oktober van start gaat, is een samenwerking tussen taalwetenschappers van de Radboud Universiteit en kunstenaarscollectief KunstLAB Arnhem.

Het concept is vrij simpel. Projectleider Roel Willems: ‘De computer projecteert elke keer drie woorden uit het oeuvre van bijvoorbeeld  Couperus of Multatuli. Vervolgens stemmen de bezoekers van het Erasmusgebouw voor één van de woorden door over de projectie van hun favoriete woord te lopen.’ Het meest gekozen woord wordt opgenomen in een nieuw gegeneerde zin in de stijl van de auteur. Gezamenlijk schrijven de bezoekers op deze manier een week lang een tekst in de stijl van één bepaalde schrijver. Lees verder >>

Dialect App: Eèsjdes en Mestreechs

Door Leonie Cornips

Een wens is eindelijk in vervulling gegaan. Zo’n drie jaar geleden spraken Lukas van der Hijden (Bureau Interactieve Communicatie) en ik met elkaar af hoe we een Dialect App zouden kunnen realiseren, een idee dat al langer leefde bij streektaalfunctionaris Ton van de Wijngaard. Het ontwikkelen van zo’n (web)App door een bureau kost geld, er is technische kennis voor nodig en het moet zich lenen voor wetenschappelijk onderzoek. Het lukte niet om het benodigde budget bij elkaar te krijgen.
Na drie jaar overleg met veel diverse wisselende mensen, verzinnen van plannen en bureaucratische hobbels is de Dialect App er toch gekomen! Lees verder >>

Vacature Coördinator DARIAH en digital humanities VUB (20-30%)

De Vrije Universiteit Brussel stapt sinds dit jaar mee als partner in het DARIAH-Vlaanderen-project. DARIAH is een internationaal consortium dat gericht is op het verbeteren en ondersteunen van digitaal onderzoek en onderwijs binnen de geesteswetenschappen (zie bijv. http://be.dariah.eu, http://www.dariah.eu of deze presentatie voor meer achtergrond, of zie bijv. ook de activiteiten van het Ghent Centre for Digital Humanities of het Antwerpse DH-platform ter inspiratie).

Jij neemt als coördinator van DARIAH aan de VUB een sturende rol op je in de uitbouw van de VUB-deelname aan het DARIAH-verhaal: Lees verder >>

Taalkundigen: kom uit bed!

Door Marc van Oostendorp

Taalkunde kun je overal doen. In de bus onderweg van de boerderij waar je een mummelende boer hebt gevraagd of de klok even stil kon worden gezet om de opname niet te bederven. In het bezemhok dat op menige universiteit tevens dienst doet als ‘taalkundig laboratorium’ omdat er een laptop in staat met een koptelefoon. En ook in bed, waar je peinst over de vraag waarom je wel kunt zeggen ‘hij komt eerst en zij komt erna’ en niet ‘hij komt uit de stad en zij gaat ernaar’.

Een van de fijne dingen van de taalkunde is dat er enorm veel gegevens voor het opscheppen liggen. De zogeheten “big data-revolutie” levert in het geval van de taalwetenschap eigenlijk niet op dat er ineens veel meer data zijn dan vroeger, maar dat die data veel toegankelijker worden.

De Utrechtse hoogleraar Hugo Quené spreidt in zijn oratie een aanstekelijk enthousiame tentoon voor alle mogelijkheden die dat biedt voor de onderzoeker. Lees verder >>

24 maart 2017: Jaarvergadering ‘Het Bilderdijk-Museum’

INVITATIE voor een middag met lezingen over ‘Bilderdijk digitaal’ en ‘Helmers herdacht’

Vrijdag 24 maart 2017

Vrije Universiteit, De Boelelaan 1105, Amsterdam. Zaal Forum 2 (hoofdingang, 1e verdieping)

PROGRAMMA

13.00 inloop
13.30 ledenvergadering
14.00 lezing Joris van Eijnatten: ‘De dichter courant. Bilderdijks digitale afdruk in één miljoen kranten’
14.45 pauze
15.00 Boekpresentatie Rinus van Hattum, ‘Helmers herdacht’
ca. 15.30 sluiting

Bezoek ook www.facebook.com/BilderdijkMuseum

Radboud Digital Humanities Spring School 2017

This spring school at Radboud University offers courses into several widely-used techniques and tools in Digital Humanities. It will be held in three consecutive days, 29-31 March 2017, at the Faculty of Arts at Radboud University.

The Spring School will be given in two parallel strands. The first strand of will contain a three days fulltime basic Python course. Python is widely used within many scientific domains and the most popular choice within eHumanities. The only way to learn programming is by doing and therefore a large part of this 3-day course is spent on putting your new skills into practice.

In the parallel strand the other topics will be taught in courses of one day or a half day. These courses focus on advanced Python programming skills (addressing machine learning), social network analysis and visualisation, oral history and working with speech recordings, and much more. Lees verder >>

450 maal Roodkapje

Door Marc van Oostendorp

Onlangs promoveerde Folgert Karsdorp op een proefschrift waarin hij analyseerde hoe volksverhalen zoals sprookjes mondeling worden overgedragen, en hoe die sprookjes daarbij veranderde. Ik sprak in deze video met Folgert over de 450 versies van Roodkapje die er in omloop zijn en waarom het zin heeft die versies met de computer te analyseren.

Breid het bewaarbeleid voor tekstueel erfgoed uit!

Door Nicoline van der Sijs

De afgelopen tijd heb ik tweemaal ervaren dat het bewaren van tekstueel erfgoed bijzondere zorg vraagt. En dat in het beleid van de overheid lacunes bestaan die door particulier initiatief worden gedicht.

Zo bracht ik onlangs een bezoek aan het Medisch Leesmuseum dat prof.dr. Mart van Lieburg op een Urks bedrijventerrein heeft ingericht. Van Lieburg, hoogleraar Medische geschiedenis en bibliothecaris van de Koninklijke Nederlandse Maatschappij tot bevordering der Geneeskunde, verzamelt hier zoveel mogelijk medische literatuur die door bibliotheken en musea wordt afgestoten. Bibliotheken moeten bezuinigen. Ze gaan ervan uit dat de nieuwe wereld digitaal is en dat de werken wel via internet beschikbaar zijn of zullen komen. Dat is wishful thinking: onder de afgestoten vakliteratuur zitten complete verzamelingen oraties en dissertaties uit de 19de en 20ste eeuw, alle jaargangen van de belangrijkste medische tijdschriften, plus waardevolle 17de-, 18de- en 19de-eeuwse boeken. Veelal uniek of uiterst zeldzaam, en slechts een fractie ervan is digitaal beschikbaar. De bibliotheken hebben geen tijd en geld om voor ieder afgestoten exemplaar te onderzoeken of dit al is gedigitaliseerd of nog elders in Nederland aanwezig is, en zetten complete boekenkasten bij het oud papier. Lees verder >>

Hoe schrijf je een bestseller?

Door Marc van Oostendorp

9781250088277Gaat de wetenschap alle schrijvers rijk en beroemd maken? De literair redacteur Jodie Archer en de literatuurwetenschapper Matthew Jockers proberen de verwachtingen van hun lezers weliswaar wat te temperen, maar ze doen dat natuurlijk pas nadat ze die lezers eerst hun boek hebben binnengelokt met een titel (The Bestseller Code. Anatomy of the Blockbuster Novel) en een eerste zin (‘Back in the spring of 2010, Stieg Larson’s agent was having a good day’) die laten zien dat de auteurs zelf wel wat van hun onderzoek hebben geleerd.

Dat wil trouwens niet zeggen dat de aanschaf van The Bestseller Code een miskoop is. Het is een aanstekelijk geschreven boek, dat vertelt hoe je met een big data aanpak, gecombineerd met traditionelere literairkritische methodes, interessante nieuwe inzichten kunt opdoen over romans.  Lees verder >>

Call for proposals KB Researcher-in-residence 2017

The Koninklijke Bibliotheek (KB), National Library of the Netherlands is seeking proposals for its Researcher-in-residence program to start in 2017. This program offers a chance to early career researchers to work in the library with the Digital Humanities team and KB data. In return, we learn how researchers use the data of the KB. Together we will address your research question in a 6 month project using the digital collections of the KB and computational techniques. The output of the project will be incorporated in the KB Research Lab and is ideally beneficial for a larger (scholarly) community. Lees verder >>

Een man met dezelfde eigenschappen als iedereen

President Tsaar op Obama Beach op de voet gevolgd (5/60)

Door Marc van Oostendorp

Deze zomer publiceren nrc.next en NRC Handelsblad de roman President Tsaar op Obama Beach van A.F.Th. van der Heijden als feuilleton. De afleveringen verschijnen ’s ochtends <op de website van de krant>. In de loop van de dag blog ik een bespreking. Vandaag: aflevering 5.

obama5Natan Haandriksman is zo’n beetje het meest gemiddelde Nederlandse romanpersonage dat je kunt verzinnen. Dat blijk uit gisteren in het Journal of Dutch Literature gepubliceerd onderzoek.

Dat artikel laat zien dat niet alleen uitgevers, schrijvers, recensenten en academici nog steeds en tot ons aller schande overwegend blanke mannen van middelbare leeftijd zijn, maar dat dit ook geldt voor romanpersonages. De auteurs namen alle personages in alle 170 romans die werden ingezonden voor de Libris Literatuurprijs 2013: dat blijken er 1176 te zijn geweest. Een gemiddeld boek kent dus 7 karakters, en voor iedere 1445 werd er een romanpersonage bedacht in een boek dat in ieder geval iemand Libris-waardig vond. (Er zijn natuurlijk veel meer boeken geschreven en als we de vertaalde boeken erbij nemen is de verhouding tussen bestaande Nederlanders en verzonnen personen misschien wel 1 op 1!)

Lees verder >>

Nieuwe artikel Journal of Dutch Literature: Mapping the Demographic Landscape of Characters in Recent Dutch Prose

Mapping the Demographic Landscape of Characters in Recent Dutch Prose: A Quantitative Approach to Literary Representation / Het demografisch landschap van literaire personages in de recente Nederlandse roman: een kwantitatieve benadering van literaire representaties

Lucas van der Deijl; Saskia Pieterse; Marion Prinse; Roel Smeets

Abstract

The lack of ethnic and gender diversity in the Dutch literary domain has recently been subject to discussions in the public debate. In the academic context, questions regarding diversity are studied either on a literary-sociological level (institutional approaches) or on the level of the individual text (close readings). In this article we question the representation of gender, ethnic and class diversity on a larger scale than most qualitative studies address. This type of quantitative analysis of representation is commonly applied in media studies, but has not yet been utilised in literary studies. We provide an exploration of a quantitative approach to the representation of characters within the Dutch novel. Through ‘distant reading’ we collected identifying marks of 1,176 characters (gender, descent, education, profession, age) in 170 novels from the bulk list of the Libris Literatuurprijs 2013, a prestigious award for Dutch literature. Thus, we intended to map a ‘demographic landscape’ of characters in recent Dutch literature.

On the basis of our results, we argue (1) that a hierarchy of identities can be discerned in which certain categories dominate others; (2) that the emergence of literary norms becomes most visible through the intersections of different categories; and (3) that within matters of diversity in literature a quantitative approach can complement and enhance qualitative literary analyses.

Lees het artikel hier.

Waarom taalkundigen kaarten maken

Door Marc van Oostendorp

1-s2.0-S0024384115002211-fx6Wij van het Meertens Instituut, wij maken, zoals jullie weten, kaarten. Dat doen we al tientallen jaren tot ieders tevredenheid – vroeger met de hand, en tegenwoordig met de computer.

Maar nu opgelet, want hier volgt een goede vraag: waarom maken we eigenlijk die kaarten. Wat moet je ermee, behalve je eigen geboorteplaats opzoeken om te kijken of er wel een balletje staat in de juiste kleur.

Voorbeelden

Daarover gaat een nieuw artikel dat mijn collega’s Sjef Barbiers en Hans Bennis samen met twee Utrechtse collega’s (Norbert Corver en Marjo van Koppen) onlangs publiceerden, en dat gratis online staat. Ik noem ze voor het gemak vanaf nu Bakobeco

In het artikel presenteren Bakobeco een nieuw hulpmiddel waarmee je heel makkelijk kaarten met elkaar kunt vergelijken; dat hulpmiddel staat gratis online. En juist uit dat vergelijken kun je allerlei dingen leren, laten ze zien, aan de hand van een paar concrete voorbeelden.

Lees verder >>

Louis Peter Grijp-lezing online

De eerste Louis Peter Grijp-lezing werd op 10 mei 2016 gehouden door Mike Kestemont, en ging over computationale methoden waarmee het auteurschap van het Wilhelmus mogelijk te bepalen is.

De Louis Peter Grijp-lezing is een jaarlijks evenement dat wordt georganiseerd ter nagedachtenis van de recent overleden onderzoeker Louis Grijp, die internationale bekendheid verwierf als onderzoeker naar Nederlandse lied- en muziekcultuur en als musicus in het gezelschap Camerata Trajectina.

Louis Peter Grijp-lezing 10 mei 2016 from Meertens Instituut on Vimeo.

Toevallig op Petrus Datheen stuiten

Door Marc van Oostendorp

Mike KestemontWijlen Louis Peter Grijp was begrijpelijkerwijze trots toen er voor zijn dood een nieuw instituut werd ingericht – de Louis Peter Grijp-lezing, jaarlijks te houden rond 10 mei, de verjaardag van het Wilhelmus als Nederlands volkslied.

Hij was ook trots op de eerste spreker, de aanstormende Antwerpse literatuurwetenschapper Mike Kestemont. Gisteren liet Kestemont zien dat die trots volkomen gerechtvaardigd was: hij gaf een briljante, lezing, een onverwacht spannend verhaal over een op het eerste gezicht wat saai onderwerp: met de computer onderzoeken of Marnix van St. Aldegonde nu echt de auteur was van het Wilhelmus.

Sommige kranten (het Reformatorisch Dagblad bijvoorbeeld) brachten gisteren als nieuws dat Petrus Datheen misschien wel de auteur was van het Wilhelmus. Maar daar ging de lezing helemaal niet over!

Lees verder >>

KB-fellow Huub Wijfjes over ontzuiling en de rol van de media

Tot in de jaren zestig van de vorige eeuw was de Nederlandse samenleving sterk verzuild. Protestanten, katholieken, liberalen en socialisten hadden allemaal hun eigen verenigingen, scholen, tijdschriften en kranten. Daarna volgde een hevige periode van ontzuiling, waarin verschillende media een belangrijke rol speelden. Mediahistoricus Huub Wijfjes onderzoekt al jaren de relatie tussen de media en de processen van verzuiling en ontzuiling.

Oproep: lacunes in datasets voor neerlandistisch onderzoek

Binnen de geesteswetenschappen van de KNAW ontwikkelt een consortium momenteel plannen om een onderzoeksagenda voor de toekomst (2025) te formuleren, getiteld DESIDERIA (Dutch Extensible and Searchable Infrastructure for Digital Explorative Reading and Information Analysis). Die agenda is gericht op onderzoek aan de hand van grote tekstcorpora en sluit aan bij huidige (inter)nationale projecten als CLARIN en CLARIAH. De agenda bouwt voort op bestaande projecten door op drie cruciale punten naar vooruitgang in reeds aanwezige tekstuele digitale infrastructuren te streven. Het accent ligt hierbij op infrastructuren rond Nederlandstalig materiaal, materiaal dat zich voor een belangrijk deel in Nederland bevindt, en taalbeschrijvingen die door Nederlandse onderzoekers zijn gemaakt.

Een van de drie actiepunten betreft het onderzoeken welke lacunes er zijn in bestaande datasets die bias veroorzaken met betrekking tot de mogelijke representativiteit van de genereerde data waardoor vernieuwend onderzoek kan worden belemmerd, en hoe die lacunes met behulp van crowdsourcing kunnen worden opgelost. Daarvoor hebben we een enquête opgesteld. Wij zijn er erg mee geholpen als zoveel mogelijk onderzoekers en collectiebeheerders deze enquête invullen. De enquête is hier te vinden:

https://docs.google.com/forms/d/1LewrawQERiguWTF7kahcUq7gKiYRywRAdFeK5CuTr0E/viewform

Voor vragen en opmerkingen kunt u terecht bij coördinator Nicoline van der Sijs (post@nicolinevdsijs.nl) of onderzoeksassistente Anna Kirstein (anna.kirstein@meertens.knaw.nl).

Oproep: artikelen over Delpher

Voor een themanummer over Delpher (de online toegang tot gedigitaliseerd historisch tekstmateriaal) is TS> Tijdschrift voor Tijdschriftstudies op zoek naar bijdragen vanuit verschillende disciplines (zoals Nederlands, Cultuur- en Kunstgeschiedenis, Mediastudies, Tijdschriftstudies, Communicatiewetenschap en gerelateerde vakgebieden) die (voor een deel) gebaseerd zijn op, reflecteren op, of gebruik maken van Delphers digitale collecties.

Voorstellen (max. 400 woorden) voor artikelen en essays kunnen voor 1 JUNI 2015 (verruimde deadline) gestuurd worden naar tijdschriftstudies@let.ru.nl. Geaccepteerde voorstellen worden als onderzoeksartikel (6000 woorden) of reflectief essay (3000 woorden) verwacht in september 2015. Zie voor meer informatie en auteursrichtlijnen: http://www.tijdschriftstudies.nl

Lees de volledige Call for Papers (Engels en Nederlands).

Ondergronds


Voordracht gehouden op het symposium “Luid zingend op een ijsschots de zomer tegemoet”, ter gelegenheid van de 60ste verjaardag van Nicoline van der Sijs.
Waar gaat het heen met de geesteswetenschappen? Dat is een zeer grote vraag waar op velerlei manieren antwoord op te geven is. Ik ga me niet wagen aan voorspellingen, maar ik richt me in deze bijdrage op een methodologisch struikelblok waar we volgens mij eerst maar eens voorbij moeten.
Ik trap een open deur in als ik zeg dat digitalisering van onderzoeksgegevens tot nieuwe en veelbelovende manieren van onderzoek leidt. Ik sta daar zelf middenin als computationeel musicoloog. Tegelijk ben ik mij ervan bewust dat mijn horizon beperkt is. Ik zie voornamelijk wat er op computationeel gebied gebeurt in het onderzoek naar muziek. Mijn academisch thuis wordt gevormd door de Musical Information Retrieval gemeenschap. Het kan dus zo zijn dat de waarnemingen die ik doe, de conclusies die ik trek en de problemen die ik zie door u niet herkend worden, maar ik vermoed dat de kwestie die ik aan de orde wil stellen ook buiten het muziekonderzoek speelt. 
Dit gezegd hebbend…

Lees verder >>

Symposium: Digitale historische kranten als ‘big data’ – Methoden en technieken van wetenschappers


Dinsdag 24 maart 2015 organiseert de Koninklijke Bibliotheek (KB) een symposium over het gebruik van gedigitaliseerde kranten in Digital Humanities, geesteswetenschappelijk onderzoek met een computationele insteek. Verschillende onderzoekers presenteren hun tools en projecten.
Digital Humanities
De digitale geesteswetenschappen zijn sterk in opmars. Massadigitalisering van historische teksten heeft de weg vrijgemaakt voor nieuwe, digitale onderzoeksmethoden. Omvangrijke verzamelingen digitale teksten lenen zich bijvoorbeeld voor allerhande vormen van distant reading of text mining. De KB heeft een belangrijk aandeel geleverd in de digitalisering van historische kranten. De data stelt zij ter beschikking voor wetenschappelijk onderzoek. Tijdens dit symposium presenteren wetenschappers de Digital Humanities-projecten die zij uitvoeren met de historische kranten van de KB als basis.

Lees verder >>