Nederlab – voor al uw diachrone onderzoeksvragen

door Nicoline van der Sijs
Op 12 juniis in Neder-L gemeld dat het project ‘Nederlab – een laboratorium voor onderzoek naar de veranderingspatronen in de Nederlandse taal en cultuur’ 4 miljoen euro subsidie heeft ontvangen van NWO, KNAW, CLARIAH en CLARIN, inclusief matching van wetenschappelijke instituten en universiteiten. Inmiddels is er een projectwebsite in de lucht, http://www.nederlab.nl, waarop de oorspronkelijke aanvraag, de organisatiestructuur van het project en enkele persberichten zijn te vinden. Ik grijp de lancering van de website graag aan om wat achtergrondinformatie te geven over het project en een oproepje te doen.

Het doel van het project is een nieuw onderzoeksinstrumentarium voor de geesteswetenschappen te creëren. Nederlab zal de toegangspoort worden van waaruit studenten en onderzoekers een groot corpusaangedigitaliseerdetekstenonderhandbereikkrijgen.Opditmomentzijnerwelveelhistorische teksten gedigitaliseerd, maar ze worden door een groot aantal instellingen – DBNL, KB, universiteitsbibliotheken, onderzoeksinstituten – op verschillende plaatsen aangeboden. Iedere instelling biedt zijn eigen zoekinterfaces en zoekmogelijkheden, er bestaan aanzienlijke kwaliteitsverschillen tussen de verschillende corpora, en iedere instelling voegt zijn eigen metadata toe. Het gevolg hiervan is dat al deze tekstbestanden – en hun metadata – slechts naast elkaar, en niet tegelijkertijd en samen, kunnen worden doorzocht en geanalyseerd.
Nederlab wil aan die versnippering een eind maken, door het bouwen van een gebruiksvriendelijke, algemeen toegankelijke en met tools verrijkte gebruikersomgeving. Binnen die omgeving worden alle gedigitaliseerde teksten die relevant zijn voor de geschiedenis van de Nederlandse taal en cultuur bijeengebracht: vandeoudstegeschrevenperiode(circa800)totheden,representatiefoverdeheleperiodeverdeeld.Daarbijworden de metadata die de verschillende instellingen aan de teksten toevoegen, aan elkaar gelinkt en geharmoniseerd. Hierdoor wordt het voor het eerst mogelijk langetermijnveranderingen in de taal en de cultuur te traceren: zokandevisieopvreemdelingendoordeeeuwenheenwordenonderzocht,hetontstaan,deverbreidingenhetverdwijnenvanliterairegenres,deveranderendeoordelenoverliteraireschrijvers,geleerdenofhistorischegebeurtenissen,endeontwikkelingvanhetgebruikvanvoorzetselsofvoegwoorden.
Iedere onderzoeker krijgt een eigen virtuele werkruimte binnen Nederlab waar hij, alleen of met andere onderzoekers, data kan verzamelen en bewerken. Opbasisvandemetadatakaneenonderzoekerzelfkiezenwelkdeelvanhetenormecorpushijwilgebruikenvoorzijnonderzoek:aaniederetekstwordtinformatietoegevoegdoverdatering,lokalisering,auteurentekssoort.Eenonderzoekerkanopbasisvandiemetadatabijvoorbeeldonderzoekenoferregionaleverschillenbestaantussenrijmtekstenuitde14eeeuw,ofinhoeverrehettaalgebruikvanegodocumentenuitde18een19eeeuwverschiltvandegeschrevenstandaardtaaluitdiezelfdeperiode.Maarookeenonderzoekerdieinde20eeeuwisgespecialiseerd,zalmoeitelooseeneigengeschiktsubcorpuskunnensamenstellen(waarbijdeIPRuiteraardwordengerespecteerd).
Het project start officieel op 1 januari 2013. InheteerstejaarwordtdeNederlab-infrastructuurneergezet,enwordendetekstbestandenenmetadatavandeDBNLalsonderzoekscorpusingebracht.Begin2014wordt een eerste versie van de Nederlab-website gelanceerd.Indedaaropvolgendejaren, tot 1 januari 2018, wordendegegevensgestructureerduitgebreid:daarbijwordenbijvoorbeelddeauteursgegevensvandeKBenvanuniversiteitsbibliothekengekoppeldaandievandeDBNL.Datmoeteenmaligmetdehandgebeuren(iemandmoetbeslissenofJanJanssenuitdeKBdezelfdeisalsJanJanssenuitdeDBNL).Isdekoppelingeenmaalgelegd,danwordenvoortaanallewerkenvanJanJanssenautomatischaanelkaargekoppeld,ookwerkendiehijindetoekomstnogzalpubliceren.Ookwordengedurendehetprojectsteedsmeertools aangeboden: gebruikersvriendelijke computerprogrammaatjes waarmee teksten en metadata op verschillende manieren kunnen worden doorzocht en waarmee zoekresultaten inzichtelijk worden gemaakt in bijvoorbeeld de vorm van een lijndiagram, staafdiagram of puntenwolk.
Nederlab komt voort uit de wens van de geesteswetenschappelijke onderzoekers. Van begin af aan zullen die onderzoekers zeer nauw betrokken worden bij de inrichting van Nederlab. Onderzoekers, studenten, promovendi en postdocs worden uitgenodigd de infrastructuur te testen en te becommentariëren, en een bijdrage te leveren aan de invulling van de infrastructuur. Zonder data, metadata en tools is de infrastructuur immers niets meer dan een lege dop. Onderzoekers die gecorrigeerde transcripties, geannoteerde teksten of tools hebben gemaakt die geschikt lijken voor opname binnen Nederlab, worden van harte uitgenodigd contact op te nemen. En studenten kunnen overwegen via een stage mee te helpen, met bijvoorbeeld het bouwen van een specifiek subcorpus, het (semi-automatisch met aangepaste tools) corrigeren van leesfouten in ocr-bestanden, het werken aan metadata-schema’s, het taalkundig verrijken of annoteren van geselecteerde corpora, of het aanpassen of ontwikkelen van tools voor het doorzoeken, visualiseren en annoteren van historische teksten.
Laat het me vooral weten als u vragen of suggesties heeft: via e-mail (post@nicolinevdsijs.nl) of per slakkenpost: Nicoline van der Sijs, Meertens Instituut Postbus 94264, 1090 GG Amsterdam.
Dit bericht is geplaatst in geen categorie met de tags , , , . Bookmark de permalink.