Vacatures: stagiairs, student-assistent

Uiterlijk1 september 2012 wil het Meertens Instituut van start gaan met het zogenaamde TINPOT-project: een afstudeerproject van 6 maanden naar Taal, Identiteit, Netwerken en Produktgeruchten Op Twitter, dat moet resulteren in een module met analyse-software en één gezamenlijke of twee afzonderlijke master-scripties.
Het Meertens Instituut zoekt voor dit afstudeerproject TINPOT:
A. Een master-student/stagiair op het gebied van computer science met programmeer-ervaring en kennis van natural language processing
B. Een master-student/stagiair op het gebied van (socio)linguistiek, etnologie, antropologie of culturele studies
C. Een student-assistent in de geesteswetenschappen die kan annoteren en testgegevens kan evalueren

Omschrijving van het project TINPOT
(Taal, Identiteit, Netwerken en Produktgeruchten Op Twitter):
Veel onderzoek op het Meertens Instituut staat van oudsher in het teken van veranderlijkheid, zoals onderzoek naar dialectvariatie, jongerentaal en mondelinge overlevering van verhalen en liederen. Met de digitalisering van de samenleving wordt het steeds aantrekkelijker om analyses toe te passen op grote hoeveelheden digitale data die al voorhanden zijn. Twitter als sociaal medium herbergt een enorm reservoir aan talige data en informeert van seconde tot seconde over sociaal gedrag en meningen/oordelen. Het commerciële bureau Teezir, waarmee wordt samengewerkt, doet in opdracht van bedrijven reeds onderzoek naar produktreputaties in sociale media.
Er kan aan de hand van een grote hoeveelheid trainingsdata een module ontwikkeld worden die in staat is om op basis van associaties die taalgebruik oproepen uit te maken in welke leeftijdscategorie iemand valt, en of men een man of een vrouw is. Uit metadata valt op te maken hoe groot iemands netwerk is, en aan tweetgedrag of iemand een opinieleider of een trendvolger is. Vervolgens kunnen produktgeruchten gevolgd worden van begin tot eind. Produktgeruchten behoren ten dele tot de volksverhalen die we broodjeaapverhalen noemen (bijv. over beton in eikenhouten meubelen, kankerverwekkende toegevoegde E-stoffen, slachtafval in fricadellen, regenwormen in hamburgers van McDonald’s, schadelijke straling van mobiele telefoons of zendmasten etc.). De module kan dan analyseren in welke groepen bepaalde produktgeruchten circuleren (leeftijdsgroepen, mannen, vrouwen) en langs welke netwerken en kanalen. Er kan een sentimentanalyse worden losgelaten op de produktgeruchten: welke positieve of negatieve oordelen worden er geveld? Hoe stabiel blijven de geruchten? Is het steeds een kwestie van letterlijk retweeten, of veranderen mensen de boodschap of voegen ze een commentaar toe (bijv. lol of een mededeling met een #)? De variatie van mededelingen op Twitter vertoont zekere overeenkomsten met variatie in de mondelinge overlevering van geruchten.
De analyses bieden meer zicht op hoe produktgeruchten zich verspreiden, in welke groepen, wiens mening belangrijk gevonden wordt, welke imago’s er aan produkten verbonden zijn en hoe de geruchten kunnen veranderen. Het onderzoek kan leiden tot aanbevelingen hoe bedrijven zich kunnen/moeten wapenen tegen bepaalde negatieve geruchten.
Voor de module is nog geen voorwerk gedaan, maar er bestaan bij Teezir al wel technieken om produktgeruchten te monitoren.
Het project staat gepland als een stage en afstudeerproject voor 6 maanden. Er wordt een module ontwikkeld en getraind, die de volgende stappen kan maken op basis van een grote hoeveelheid Nederlandstalige tweets:
– analyse taal op leeftijdscategorie
– analyse taal op geslacht
– analyse op attitude: opinieleider of trendvolger
– analyse van het netwerk
– volgen van produktgeruchten (langs welke groepen en kanalen gaan de verhalen, welke sentimenten spelen er, welke variatie ontstaat er?)
De deliverable is een verrijkende module bij een bestaande commerciële tool van Teezir. De module kan gebruikt worden voor onderzoek aan de Universiteit Twente, het Meertens Instituut en bij Teezir.
Meer informatie over de gezochte studenten:
ad. A. De master-student op het gebied van computer science, met programmeer-ervaring en kennis van natural language processing, text miningen information retrieval, loopt voor 6 maanden stage op het Meertens Instituut, uiterlijk vanaf 1 september. De student ontwikkelt i.s.m. de begeleiders en de hierna genoemde student een analyse-module voor Twitter en schrijft daarover een master-scriptie. De stagevergoeding bedraagt 1000 euro bruto per maand bij een fulltime stage.
ad. B. De master-student op het gebied van (socio)linguistiek, etnologie, antropologie of culturele studies loopt voor 6 maanden stage op het Meertens Instituut, uiterlijk vanaf 1 september. De student helpt i.s.m. de begeleiders en de hiervoor genoemde student mee een analyse-module voor Twitter te ontwikkelen en schrijft over de onderzoeksresultaten een master-scriptie. De stagevergoeding bedraagt 1000 euro bruto per maand bij een fulltime stage.
ad. C. Een student-assistent in de geesteswetenschappen die kan annoteren en testgegevens kan evalueren, die uiterlijk 1 september kan beginnen. De module wordt getraind op een bestaand corpus aan tweets, en voert vervolgens analyses uit op nieuwe tweets. Voor 6 maanden zorgt de student voor annotaties bij de test-tweets (koppelen van tweets aan geslacht, leeftijd, volgers, retweets, produktgeruchten) en evalueert de resultaten van analyses op nieuw materiaal (kloppen de analyses van geslacht, leeftijd, volgers, retweets, produktgeruchten?). Het schrijven van een master-scriptie is in dit geval niet vereist. De verdiensten bedragen 1800 euro bruto per maand bij een fulltime aanstelling.
De begeleiders zijn:
Theo Meder (Meertens Instituut)
Dolf Trieschnigg (Meertens Instituut, Universiteit Twente)
Dong Nguyen (Meertens Instituut, Universiteit Twente)
Marc van Oostendorp (Meertens Instituut, Universiteit Leiden)
Leonie Cornips (Meertens Instituut, Universiteit Maastricht)
Thijs Westerveld (Teezir)
Dit team wordt desgewenst aangevuld met scriptiebegeleiders van de universiteit(en)
Voor meer informatie kan men contact opnemen met Theo Meder: 020-4628558 of Theo.Meder@Meertens.knaw.nl
Sollicitatiemails met motivatie, en CV inclusief specificatie van academische opleiding(en) en cursussen, kunnen ook naar Theo.Meder@Meertens.knaw.nl gestuurd worden.
Deadline: donderdag 12 juli 2012.