Informatie 2020

Inloggen
Engels | Nederlands | Frans

Web archivering in Nederland

Laatst bijgewerkt op 219 dagen geleden door Marcel Ras

Het internet is niet meer weg te denken uit ons dagelijks leven. Maar het web is vluchtig en de informatie waarop je vandaag je beslissing baseert, kan morgen verdwenen zijn. Webarchivering is daarom van groot belang, maar vindt in Nederland nog te weinig en te versnipperd plaats. Voor een grote hoeveelheid online informatie geldt dat het wenselijk en soms zelfs noodzakelijk is dat deze toegankelijk blijft, ook nadat het offline wordt gehaald. De redenen hiervoor zijn divers: naast cultuurhistorische gronden (collecties van culturele instellingen, maar ook sociale media die veel inzicht geven over het tijdsbeeld) gaat het ook om archiefwettelijke plichten (overheidsinformatie), wetenschappelijke redenen, bedrijfsbelangen en juridische en journalistieke overwegingen. Deugdelijke archivering van het web voor de lange termijn is dus cruciaal, maar op dit moment worden naar schatting maar 0.2% van alle sites in het Nederlandse domein bewaard. Hoewel veel instellingen in Nederland van het belang van webarchivering overtuigd zijn en er een aantal goede initiatieven lopen, is er landelijk gezien dus nog veel te winnen op dit gebied.

Webarchivering in Nederland

De eerste Nederlandse website kwam in februari 1992 online. In de 25 jaar die volgden, explodeerde het web tot de 5.7 miljoen Nederlandse domeinnamen die het .nl-domein nu telt en een onbekend aantal Nederlandse sites met een andere extensie (variërend van .com, .eu tot .info of zelfs .amsterdam). Daarmee is het .nl-domein een van de grootste ter wereld.

Het archiveren van het Nederlandse web kwam echter pas relatief laat op gang. Het Internet Archive begon al in 1996 met het archiveren van websites wereldwijd en de nationale bibliotheken van onder andere Groot-Brittannië, Australië, Denemarken en IJsland volgden al snel met het harvesten van websites binnen hun respectievelijke domeinen. Zij zagen al gauw de noodzaak van samenwerking en richtten daarvoor in 2003 de International Internet Preservation Consortium (IIPC) op.

Het eerste Nederlandse webarchiveringsproject kwam pas in januari 2000 van de grond, bij het Documentatiecentrum Nederlandse Politieke Partijen (Archipol). Na een kort experiment in 2003 startte de Koninklijke Bibliotheek in 2006 met het archiveren van Nederlandse websites. Nu, tien jaar later, bevat die webcollectie een dwarsdoorsnede van het Nederlandse web met bijna 12.000 websites.

In de jaren daarna ontstonden andere initiatieven. Zo archiveert Beeld en Geluid media gerelateerde websites (van bijvoorbeeld omroepen, producenten of fan-forums) en richt het Stadsarchief Rotterdam zich op websites over het leven in de stad Rotterdam. De Groninger Archieven bewaren websites uit de provincie Groningen en het Nationaal Archief is gestart met het archiveren van de websites van de Rijksoverheid.

 

Meer dekking en meer coördinatie

Hoewel steeds meer gemeenten, overheidsinstellingen, musea en kennisinstituten starten met het archiveren van de delen van het internet die voor hen relevant zijn, vormen zij nog steeds een relatief kleine groep. Ook daar waar webarchivering verplicht is gesteld door de Archiefwet loopt de praktijk nog behoorlijk achter. De Erfgoedinspectie constateerde eind 2016 dat de honderden websites waarmee de centrale overheid de burger tegemoet treedt nauwelijks worden gearchiveerd. Slechts 2% van de betreffende organisaties archiveert de eigen websites. Het percentage organisatieonderdelen van de rijksoverheid dat de sociale media bewaart, is nog kleiner. De burger of het bedrijf dat zijn recht wil halen op basis van eerder verstrekte online informatie heeft dus een grote kans om achter het net te vissen.

Het daadwerkelijk doen van webarchivering in Nederland wordt belemmerd doordat organisaties niet over de benodigde kennis en kunde beschikken (hoe begin je, welke tools en technieken zijn er, kun je dit uitbesteden of moet je zelf aan de slag). Daarnaast ontbreekt het in Nederland ook aan samenwerking: een gecoördineerde aanpak waarbij organisaties kennis en ervaringen uitwisselen en taken verdelen of afstemmen. Ondanks dat webarchieven vaak verschillende beweegredenen en een verschillende aanpak hebben, zijn de problemen waar ze tegenaan lopen veelal hetzelfde. Door kennis te delen en werkzaamheden op elkaar af te stemmen, wordt het makkelijker om (technische of juridische) struikelblokken aan te pakken.

In sommige landen is er binnen een wettelijk kader een zogenaamde domaincrawl mogelijk, waarbij alle websites van het landelijke domein (in ons geval .nl) gearchiveerd worden. In Nederland is zo’n domaincrawl juridisch (maar ook technisch en financieel) onmogelijk, omdat er voorafgaand aan het archiveren van een website een bepaalde mate van toestemming nodig is van de rechthebbenden. Webarchivering is in ons land dus in alle gevallen gebaseerd op een specifiek selectiebeleid. Ieder initiatief bepaalt zelf welke websites er gearchiveerd worden, en dat werkt samenwerking en coördinatie niet in de hand.

Webarchivering in Nederland zou dus enorm geholpen zijn met enerzijds meer kennis en kunde bij de instellingen en anderzijds meer afstemming tussen die partijen. Veel instellingen in diverse sectoren hebben behoefte aan landelijke coördinatie op het gebied van webarchivering in Nederland. Hierdoor kunnen zij onderlinge samenwerking aangaan en kan kennis breder worden gedeeld. Daarom heeft de NCDD eind 2016 de expertgroep ‘Webarchivering in Nederland’ opgezet. Het doel van deze expertgroep is het bevorderen van samenwerking en professionalisering op het gebied van webarchivering in Nederland.

 

Reageren is alleen mogelijk voor aangemelde gebruikers