De STCN en boekhistorisch onderzoek

Door Paul Dijstelberge
Allereerst mijn excuses aan de lezers die naar een stuk op deze plaats werden doorverwezen en een andere inhoud aantreffen dan ze op basis van de verwijzingen verwachtten.

Ik heb het ingrijpend herschreven omdat twee eerdere versies wat onaardige en niet terzake doende opmerkingen bevatten. Ik heb Inger Leemans dan ook mijn verontschuldigingen aangeboden voor de toon. Ik ben af en toe geneigd te vergeten dat achter woorden mensen schuilgaan en dat vooral ironie kwetsend is.

Maar afgezien van de toon zijn er de feiten. En die spreken voor zich. Over meningen kan je discussiëren – maar feiten zijn feiten. Die kan je hoogstens verkeerd interpreteren. 
Het ging mij om een aanvraag bij de KNAW en het daaruit resulterende rapport. Die aanvraag staat hier:
En het gewraakte rapport kan hier worden gevonden:
Wie mijn verhaal wil verifiëren moet die twee maar eens grondig lezen. En de STCN raadplegen natuurlijk!
Ik zie een opmerkelijke discrepantie tussen wat er beloofd werd en wat er geleverd wordt.
Beloofd werd (onder meer) een digitale kaart:
‘… een onderzoeksinfrastructuur ontwikkelen waarbinnen documentatie over de verschillende locaties van de Amsterdamse boekhandel binnen een web based geografisch informatiesysteem bijeengebracht en beschikbaar kan worden gemaakt.’
Die kaart is er niet gekomen – althans niet binnen dit project. Inplaats daarvan is een ‘analyse’ gemaakt van de fictieve uitgever Pierre Marteau. Een onderwerp dat zo lastig is dat ik altijd dacht: dat bewaar ik voor de tijd dat ik echt oud en heel geleerd ben. Dat die gedachte terecht is, blijkt eens te meer uit het verhaal over Marteau. De auteur en haar begeleiders hadden blijkbaar nauwelijks een idee van hoe de STCN in elkaar zit, waar gegevens aan worden ontleend en wat de waarde is van die gegevens. 
Pierre Marteau leverde ruim 400 titels af, meestal over Franse onderwerpen en vaak in het Frans. Een interessante figuur en in het verleden heeft een aantal onderzoekers zich dan ook over hem gebogen. Je moet als je naar de STCN titels van Marteau kijkt, heel goed weten wat de waarde is van de bronnen die altijd door de STCN worden genoemd. Bij Marteau zijn dat er een stuk of wat en daarvan is er maar één redelijk betrouwbaar: Rahir. Die wordt 17 keer genoemd als bron voor een toeschrijving. Voor de rest is het Weller wat de klok slaat, Kleerkooper, Willems en nog een aantal onbekendere grootheden. Al die toeschrijvingen zijn onbetrouwbaar. Als ze het al bij het rechte eind hebben, is dat toeval. Met andere woorden: over 5% van de titels van Marteau kan je iets zinnigs zeggen, over 95% niet. Vandaar dat je, als je dit soort onderzoek wilt doen, alle boeken moet opvragen en de boekversiering en het zetsel, de opmaak en de wijze van signeren goed met elkaar moet vergelijken. 
Voor dit project werden de titels van de STCN geconverteerd en in een afzonderlijk bestand ondergebracht en daarna gelinkt danwel vergeleken met een aantal gedigitaliseerde boeken (Knuttel’s Verboden boeken, Weekhout over censuur en het standaardwerk van Van Eeghen over de Amsterdamse boekhandel). Ik heb hier eerder al mijn twijfels uitgesproken over de zin van dat soort activiteiten. En ik vind het oprecht jammer dat ik gelijk heb gekregen. Ik houd niet van een gelijk dat lijkt op het leedvermaak van de pessimist die blij is dat het regent omdat hij als enige een regenjas heeft meegebracht.
Het rapport over de STCN is goed geschreven en het is duidelijk dat de auteur zich grondig in de Umwelt heeft verdiept. Daardoor heb je – als leek – niet in de gaten dat de onderzoeksresultaten geen hout snijden en evenmin dat er eigenlijk geen enkel onderzoeksresultaat in staat dat je ook niet gewoon uit die STCN zelf kan halen. Al dat converteren – en dan niet weten dat er nog gewoon doorgewerkt wordt aan de STCN – al dat vergelijken van de lengte van titels en het voorkomen van bepaalde woorden. Waarom heb je ‘computational linguistics’ nodig om te zien of een woord in de loop der tijd verdwijnt uit een boektitel – als je het ook gewoon kan intikken in een zoekscherm en vervolgens turven wanneer en waar het voorkomt? En dan heb ik het nog niet eens over het gegeven dat de STCN een SHORT title catalogus is: de titels zijn vaak ingekort zodat je nooit zeker kan weten of het door jou gezochte woord werkelijk niet voorkomt.


Reactie Marieke van Delft van 
8 oktober 2013 12:38
Beste Paul, zondag stond hier een column, nu staat er een heel andere! Op zich prettig dat de toon wat milder is maar als boekwetenschapper had ik verwacht dat ook het origineel beschikbaar zou blijven. Het is vreemd als een tekst ineens ‘weg’ is, zeker een tendentieuze tekst die reacties opgeroepen heeft. Ik zou zeggen: zet het origineel terug en je mildheid eronder. Dan kan iedereen zien hoe het debat zich ontwikkelt.
Dan je bezwaren:
– Compleetheid van de STCN: de schrijfster gaat er geenszins van uit dat de STCN af is. Op p. 27 schrijft ze dat hun eerste experimenten gebaseerd zijn op een selectie van data van de STCN en: ” Also, although the STCN has been officially finished, it does get updated. This means our file from 2012 is not yet complete.’ In de paragraaf ‘Caution in using the STCN’ laat ze zien dat ze zich terdege verdiept heeft in het instrument. Ik ben het met je eens dat er meer input gevraagd had kunnen worden van analytisch bibliografen, dat wel. Overigens moet de tekst op de homepage van de STCN-database inderdaad veranderd worden: de STCN is niet af, het project is af! We zijn bezig om een en ander in de structuur van de STCN aan te pakken en nemen dit dan ook mee.
– Marteau: toeschrijven van drukwerk is lastig, dat weet jij als geen ander. Maar ik betwijfel dat slechts 17 van de 427 Marteau-titels goed toe geschreven zijn – de wetenschap gaat vooruit, maar onze voorgangers deden niet alles fout. En de STCN registreert bestaande kennis, maar past gegevens natuurlijk wel aan als er nieuwe informatie komt. Het zou mooi zijn als die informatie online beschikbaar zou komen, bijvoorbeeld het corpus waar jij op promoveerde of het apparaat Valkema Blouw. Dat zou een prachtige dataset zijn om te koppelen aan de STCN, eventueel via de geconverteerde RDF-set. Dan kan dat materiaal ook door anderen gebruikt worden om toeschrijvingen te controleren dan wel te verbeteren. Dat zou de wetenschap echt verder helpen.
– Geografische presentatie van drukkers / boekverkopers: zoals ik in mijn blog zeg bestaat er overleg met de ontwikkelaars van de Atlas of Early printing. Daarom zou ik denken: besteed je energie aan het online zetten van jouw typografisch apparaat, die atlas komt er wel op een andere manier.