Samenstelling

Beheerder

Vincent de Keijzer
afbeelding van Vdekeijzer

Terugvinden

Door
Vdekeijzer
Door
Vincent de Keijzer

De wens om de wereld om ons heen in kaart te brengen met een systeem van losse woorden is wijd verbreid. Gek genoeg komt het verschijnsel voor bij alle generaties; de hardcore bibliothecarissen van het eerste uur én de aanhangers van de hedendaagse tagcultuur. Er zijn natuurlijk verschillen in benadering. De taggers geloven in de kracht van de massa en het zelflerende vermogen van de IT, terwijl veel bibliothecarissen zweren bij zwaar geredigeerde lijsten van voorkeurstermen. Beiden zijn er echter van overtuigd dat een of meer losse termen voldoen om bijvoorbeeld een afbeelding of museumobject te duiden.

Als je het op de keper beschouwt zijn losse woorden armoedige en onvolledige aanduidingen. In onze dagelijkse communicatie  zouden we er geen genoegen mee nemen. We willen op z’n minst dat een gesprekspartner de woorden in een zinsverband zet zodat we context en samenhang van de begrippen kunnen afleiden. We hebben niet voor niets een rijke taal ter beschikking waarmee we ons zeer nauwkeurig kunnen uitdrukken. Het is vreemd dat we voor het zoeken van informatie denken te moeten teruggrijpen op een inefficiënte, uitgeklede taal. Bij vrije tags blijft de interpretatie van de term en de relatie met andere tags voor uiteenlopende interpretaties vatbaar. Gecontroleerde woordsystemen moeten kunstmatige constructies bouwen om de termen en hun onderlinge relaties te duiden en consequent gebruik te garanderen.

Voor de intrede van de computer dwong de kaartenbak deze taal van losse trefwoorden af. Om het onderwerp van een boek te benoemen werd een trefwoord vermeld op het bibliotheekfiche dat vervolgens alfabetisch in een kaartenbak werd opgeborgen. Om ervoor te zorgen dat iedereen dezelfde term voor dezelfde content gebruikte werden er lijsten aangelegd van termen die je wel en niet mocht gebruiken. Met de opkomst van de IT verviel de noodzaak van deze beperking. Slimme zoekmachines doorzoeken grote hoeveelheden tekst en presenteren ons wonderbaarlijk relevante resultaten. Je zou denken dat moderne toepassingen volop gebruik zou maken van deze nieuwe mogelijkheden. Niets is minder waar. Waar vroeger nog werd geformuleerd in zorgvuldig gekozen woorden uit een gecontroleerde lijst wordt nu de nog armoediger taal van tags gesproken.

De neiging om de wereld te vangen in woordsystemen is ook goed terug te vinden in onze collectieregistratiesoftware. Traditionele systemen kenmerken zich daarbij door een sterk geloof in de kneedbaarheid van de gebruiker. Zij schrijven voor dat een grote reeks velden consequent en zorgvuldig moet worden ingevuld. Als hulpmiddel bieden zij de  mogelijkheid om een thesaurus van gebruikte termen op te bouwen waarin via een apart redactieproces wordt aangegeven wat de voorkeurstermen zijn die moeten worden gebruikt. Ook de eindgebruiker wordt geacht deze termen te gebruiken bij het zoeken om er zeker van te zijn dat hij een volledig en relevant resultaat krijgt.

In de praktijk blijkt dat het bijhouden van een goede consequente woordenlijst van enige omvang naar verhouding erg veel (specialistisch) werk met zich meebrengt. De doorsnee invoerder en eindgebruiker zien vaak slechts  de nadelen van de strenge regels die worden voorgeschreven. Een conservator wil op zijn bijschrift gewoon Vincent van Gogh zien staan en voert in het veld vervaardiger die naamsvorm in. Ook de doorsnee bezoeker van de website zal niet vanzelf begrijpen dat alleen Gogh, Vincent van resultaat oplevert.

Het probleem is dat onze collectieregistratiesystemen zijn gebaseerd op een idee-fixe. Gebruikers zijn van nature wispelturig en zelfs voorbeeldige invoerders kunnen niet voorkomen dat vervuiling van het systeem optreedt. Zij vullen weliswaar zelf braaf Gogh, Vincent van in maar ze kunnen er niet helemaal zeker van zijn dat hun collega’s dat ook doen. Bij het zoeken naar alle werken van Vincent van Gogh moeten ze voor de zekerheid toch ook nog even bij andere naamsvarianten kijken. Misschien is het tijd om ons neer te leggen bij de onvolkomenheid van ons informatiesysteem. We moeten slim gebruik gaan maken van de beschikbare onvolledige, onzorgvuldige en inconsequente informatie in plaats van ons blind te staren op opschoning en nog striktere invoerdiscipline. We zullen methodes moeten ontwikkelen waarmee we in chaotische, vervuilde databases toch kunnen vinden wat we zoeken**.

Het wordt tijd om de bestaande software voor museale collectieregistratie en de bijbehorende zoekmethodiek grondig tegen het licht te houden. We hebben immers behoefte aan software die nauwer aansluit op de praktijk, slimmer gebruik maakt van de beschikbare middelen en beter inspeelt op de huidige wensen van brede toegankelijkheid en hergebruik van informatie. Misschien kunnen we met een verstandige doorstart besparen én moderniseren. Voorwaarde is wel dat we ditmaal bouwen vanuit een deugdelijke visie op de museale beschrijvingspraktijk, leren van onze fouten uit het verleden en objecten niet langer beschouwen als surrogaat boeken.

 

** Precies die opdracht stond centraal in het project Multiple Search Using Metadata (MuSeUM) dat het Gemeentemuseum Den Haag in de afgelopen jaren samen met onderzoekers van de Universiteit van Amsterdam (UvA) heeft uitgevoerd. Dit onderzoek was een onderdeel van het zgn. Catch programma. Catch staat voor Continous Access to Cultural Heritage en is een initiatief van het NWO (Nederlandse Organisatie voor Wetenschappelijk Onderzoek). In het project is het zoeken via de traditionele, gestructureerde zoekmethodiek vergeleken met een Google-achtige, ongestructureerde benadering die alle aanwezige tekst meeneemt. De eindconclusie was dat zowel specialistische gebruikers als doorsneegebruikers de beste resultaten krijgen uit een combinatie van vrije en gestructureerde zoekmethoden. In het vervolgproject MuSeUM-Plus zijn de resultaten van het onderzoek verder ontwikkeld tot bruikbare toepassingen.

 

 

Gebouwd met Drupal