Informatie 2020

Inloggen
Engels | Nederlands | Frans

Blijf op de hoogte

Niemand volgt dit.

Concept Stappenplan webarchivering: reacties gevraagd

    Natasja Pels
    • iedereen (publiek zichtbaar)

    Concept Stappenplan webarchivering: reacties gevraagd

    Gestart door Natasja Pels 13 dagen geleden Reacties (23)

    Beste leden,

    Hierbij het concept Stappenplan voor de archivering van overheidswebsites.

    Graag ontvangen we jullie opmerkingen, aanvullingen, vragen enz. Naar aanleiding daarvan zullen we het stappenplan mogelijk nog aanpassen. We zouden graag eventuele reacties ontvangen voor 19 augustus.

    Concept Stappenplan voor de archivering van overheidswebsitesConcept Stappenplan voor de archivering van overheidswebsites 

    Reacties

      • Robin Lassche
        Robin Lassche 13 dagen geleden

        Beste Natasja,

        Ik heb het stappenplan met belangstelling gelezen. Waar ik nog mee zit is de methode die gesuggereerd wordt om een bewaartermijn toe te kennen aan de gearchiveerde websites (paragraaf3.3).

        Er wordt in het stappenplan gezegd dat de website in z'n geheel gearchiveerd moet worden en dat er één bewaartermijn aan gekoppeld wordt. De bewaartermijn gaat in nadat de website is gewijzigd of verwijderd. Hier rijst een aantal vragen: Wat is de gehele website? En: wanneer heeft een website een definitieve vorm aangenomen die archiefwaardig is? Daarnaast zal de aard van de informatie die op een overheidswebsite wordt gepubliceerd dusdanig uiteenlopend zijn, dat er vele bewaartermijnen aan zullen moeten worden gekoppeld. Als je van het standpunt uitgaat dat de langste termijn leidend is, zal in de praktijk de website steeds voor permanente bewaring in aanmerking komen. Dat lijkt me niet wenselijk.

        Mijns inziens wordt er een denkfout gemaakt. Om terug te komen op de vraag: wat is de gehele website is dat alles wat de desbetreffende overheidsinstantie binnen die domeinnaam publiceert. Vergelijk dat met de reguliere opvatting die we binnen ons vakgebied hebben ontwikkeld over de definitie van archief: alle administratieve neerslag die een organisatie genereert, ongeacht haar vorm. Als we de in het stappenplan gesuggereerde methode volgen, betekent dat we alles wat via het medium website is gepubliceerd tot in de eeuwigheid bewaren omdat de langste termijn leidend is. We kijken dan niet meer naar de inhoud, maar naar het medium dat de bewaartermijn bepaalt.

        Naar mijn idee moet je bij het toekennen van een bewaartermijn voor een overheidswebsite genuanceerder te werk gaan. Daarbij moet de aard van de informatie leidend zijn, niet het medium. (Zoals we dat volgens de reguliere opvatting ook doen bij het toekennen van bewaartermijnen aan alle andere archiefbescheiden.) E.e.a. impliceert dat overheidsinstellingen in feite van te voren zullen moeten nadenken over de manier waarop ze hun website inrichten. Idealiter moeten informatiebeheerders aan ieder afzonderlijke webpagina een éénduidige bewaartermijn kunnen geven op basis van de daar gepubliceerde informatie.

        Hoe dan ook, het is een ingewikkeld probleem, waarin we ons als informatiebeheerders wellicht nog te veel laten leiden vanuit ons conventionele denkkader dat we in een analoge wereld hebben gevormd.

        • Erik Saaman
          Erik Saaman 13 dagen geleden

          Het staat iets anders in het voorstel: "De bewaartermijn is de termijn dat een webpagina (of een bijlage waarna verwezen wordt) nog bewaard moet worden nadat hij in de website gewijzigd of verwijderd is." Vernietiging vindt dus per pagina plaats, niet per website als geheel.

          Wel is het voorstel om één bewaartermijn te hanteren per website. De reden daarvoor is dat het procedureel en technisch te ingewikkeld is om verschillende bewaartermijnen binnen een website te hanteren. O.a. omdat de bewaartermijnen dan per pagina bepaald en bijgehouden moeten worden. Dat lijkt me een heel gedoe. Daarnaast is het met de gegeven standaard voor webarchieven (WARC) volgens mij technisch lastig om individuele pagina's in een archief te vernietigen. Maar dat laat ik graag aan de experts over om uit te leggen.

          Als er op basis van de selectielijsten meerdere termijnen van toepassing zijn, dan geldt in het voorstel de langste termijn. Dat kan er inderdaad toe leiden dat veel websites blijvend te bewaren zijn. Is dat erg? Zo ja, dan kan een organisatie alsnog zijn selectielijst daarop aanpassen.

          Je hebt gelijk dat op deze manier de bewaartermijn mede bepaald wordt door het medium. Maar waarom niet? We moeten ook praktisch blijven. Elk medium heeft nu eenmaal zijn eigenaardigheden. Dat kunnen we niet negeren. Als de oplossingen die we aandragen theoretisch zuiver maar onpraktisch zijn, dan worden ze niet gebruikt. Bovendien staat er volgens mij niks in de Archiefwet dat verbiedt om het medium een rol te laten spelen bij het bepalen van de bewaartermijn.   

          • Yvonne Welings
            Yvonne Welings 13 dagen geleden

            De laatste redenering gaat voor gemeenten niet op. Op grond van de vigerende selectielijst geldend vanaf 1 januari 2017 is het volgende bepaald:

            Het op initiatief van het orgaan samenstellen en verspreiden van informatie over zaken van het orgaan die interne of externe derden aangaan

            De verstrekte of gepubliceerde informatie

            20.1.2

            Specifiek

            Uitgevoerd

            onlinecontent ten behoeve van externe communicatie

            Systeemanalyse

            Bewaren

             

            • Erik Saaman
              Erik Saaman 13 dagen geleden

              Yvonne, ik begrijp jouw punt niet. In jouw voorbeeld wordt er expliciet geselecteerd op basis van het medium, namelijk 'onlinecontent'. Dit is dus juist een voorbeeld die mijn redenering ondersteund. Wat mij betreft een prima oplossing. Er staat expliciet dat online content te bewaren is. Duidelijker kan het niet. 

              • Yvonne Welings
                Yvonne Welings 12 dagen geleden

                Wanneer zaken niet duidelijk zijn moeten ze verduidelijkt worden. In het stappenplan wordt genoemd dat er selectielijsten zouden zijn om een website te waarderen. Bij mijn weten, ik kan het mis hebben, is dat alleen recent voor gemeenten in een selectielijst opgenomen.
                Volgens mij moeten jullie als NA eerst met de selectielijsten aan de slag om dit ook geborgd te krijgen.
                Een gemeentelijke website heeft een andere functie dan die van de rijksoverheid omdat gemeneten het eerste aanspreekpunt zijn voor burgers en ondernemers. Burgers kunnen daar rechten aan ontlenen en doen dat ook. Wellicht dat daarom websitearchivering daar veel eerder is omarmd.
                Overigens vraagt de omschrijving in de selectielijst wel om een nadere uitleg, zeker gezien het aantal rechtszaken die nu worden gevoerd in verband met de Wet Hergebruik Overheidsinformatie.

                • Robin Lassche
                  Robin Lassche 12 dagen geleden

                  Beste Erik,

                  De verwarring die ontstaat vloeit voort uit de door mij vet gemarkeerde tekstgedeelten (onderstaand) uit de handreiking. het lijkt alsof er een onderscheid gemaakt wordt tussen het begrip Website en Webpagina. Onder website versta ik alle pagina's die behoren tot één domeinnaam. Onder webpagina versta ik één specifieke url binnen het domein.

                  3.3 Bewaartermijnen

                  Bepaal op basis van de geldende selectielijsten van de organisatie per website de bewaartermijn. Neem daarvoor contact op met de beheerder van de selectielijsten. Deze kan helpen bij de interpretatie van een selectielijst.

                  De bewaartermijn is de termijn dat een webpagina (of een bijlage waarna verwezen wordt) nog bewaard moet worden nadat hij in de website gewijzigd of verwijderd is. Een bewaartermijn van nul betekend dat een webpagina niet bewaard hoeft te worden na wijziging of verwijdering.

                  Elke website krijgt als geheel één bewaartermijn. Als er op basis van de selectielijsten meerdere termijnen van toepassing zijn, dan geldt de langste termijn. Als de selectielijst geen duidelijke uitspraak doet over de bewaartermijn van (een deel van) een website, dan is deze oneindig.

                  Websites veranderen voortdurend. Dagelijks kunnen webpagina’s (en bijlages) gemaakt, gewijzigd of verwijderd worden. Waarbij archiefwettelijk gezien verschillende versies van dezelfde webpagina verschillende informatieobjecten zijn. Alle versies van een websites moeten gearchiveerd worden, conform de selectielijst. In principe is het mogelijk om verschillende bewaartermijnen te hanteren voor verschillende versies van een website. Bijvoorbeeld, om de omvang van het archief te beperken, één versie per jaar blijvend te bewaren en alle tussenliggende versies slechts twee jaar (of zelfs nul). Dit kan alleen als de selectielijst dit expliciet aangeeft. Voor zover bekend zijn er geen selectielijsten waarbij dit nu het geval is. Gedifferentieerde bewaartermijnen worden afgeraden omdat hierdoor het maken en beheren van archieven ingewikkelder wordt.

                  • Erik Saaman
                    Erik Saaman 12 dagen geleden

                    Wat is precies de verwarring?

                    Inderdaad wordt er onderscheid gemaakt tussen website en webpagina. Een website is een verzameling webpagina's (meestal bepaald door een domein). In het voorstel is de bewaartermijn gekoppeld aan een website en vernietigen aan de webpagina's. Dus alle pagina's binnen één site krijgen dezelfde bewaartermijn, maar die termijn start per individuele pagina.

                    • Robin Lassche
                      Robin Lassche 12 dagen geleden

                      De verwarring wordt nu steeds groter bij mij ;-). Persoonlijk vind ik het erg onduidelijk geformuleerd, maar dat kan natuurlijk aan mij liggen. Volgens mij zou het zo moeten zijn dat je per webpagina kijkt wat de bewaartermijn zou moeten zijn en niet per website. (Dit even los van wat de sellectielijst daarvan zegt die Yvonne heeft aangehaald. Ook daar kun je het namelijk over oneens zijn natuurlijk.)

                      • Erik Saaman
                        Erik Saaman 12 dagen geleden

                        Het voorstel is om bewaartermijn per website te bepalen. De reden daarvoor is dat bewaartermijn per pagina procedureel en technisch veel ingewikkelder is. 

                        • Robin Lassche
                          Robin Lassche 12 dagen geleden

                          Ik vind dat persoonlijk geen goed idee. Aangezien je dan heel veel relatief waardeloze informatie gaat bewaren die wel op de lange termijn beheerd moet worden. Het argument dat het procedureel en technisch lastig is, vind ik niet zo sterk. Je laat je in dat geval leiden door de procedure en de techniek en niet door de inhoud. De inhoud moet naar mijn idee leidend zijn als het gaat om bewaren of vernietigen.

                          • André Plat KING
                            André Plat KING 12 dagen geleden

                            Er zijn grofweg 3 benaderingen:

                            a. selectie bepalen ahv het proces en dan is publiceren een processtap die dezelfde selectie B/V krijgt als het proces. Die werkwijze veronderstelt dat zaaksysteem, dms en publicatietool gekoppeld zijn. Veel gebruikte SIM bij gemeenten koppelt met meerdere van die systemen: toepassing raadsinformatie, veelal te bewaren. Dit is de benadering die we decenia hebben gevolgd.

                            b. selectie aan de hand van een gemiddelde per website of onderdeel daarvan, waarbij je globaal indiceert B/V en wellicht uitzonderingen zult hanteren

                            c. de nieuwe benadering, volgens de selectielijst gemeenten: alles bewaren op dit medium, omdat er tijdreizen en rechten aan ontleend kunnen worden. Boeiend dat we die benadering bij de 'brief', vijftig jaar geleden niet hebben gevolgd.

                            Ik vind methode a. nog steeds het meest recht doen aan de selectielijsten, die voorheen op actor/onderwerp en steeds meer op de procesbenadering zullen gaan werken.

                            Methode c. vind ik raken aan een ultiem moderne zienswijze: alles bewaren. Die gedachte bevalt mij ook wel, uitgaande dat maken en publiceren de methode is op weg naar enkelvoudige opslag en meervoudig gebruik. Dat is in ketens uiteindelijk ook slimmer dan ieder voor zich, dupliceren en hoge beheerkosten bij meerdere organisaties.

                            Ik ga nog even in het stappenplan op zoek naar relaties met andere containers van informatie, want website als silo bewaren, los van context, taak-zaak, financiële systemen en kantoorapplicaties zoals office mail, word en excel, adobe dms-en rma's e.d. lijkt mij nog wat te hoog gegrepen. De metadata is nog niet voldoende in één ontologie gevat om vanuit de verschillende systemen de zaak bijelkaar te vinden. Tuurlijk zou dat wel mooi zijn: dan graag binnen 10 minuten Enterprise search over binnen en buiten informatie.

                            Mooi aan web-archivering is dat je vanuit wat 'buiten' is gepubliceerd een kwaliteitscontrole kunt gaan doen op je bestaande informatiehuishouding. Per slot van rekening zal je in al de genoemde silo's informatie kunnen vinden rondom de gepubliceerde web-pagina's. Vervolgens raak je aan het punt om als functionele eis te willen stellen dat overzichten op informatieobjecten/onderwerpen/processen en verbindingen mogelijk worden met bestaande systemen.

                            Enfin ik begin door te draven.

                            Kern van benadering a. is dat je bij het ontwerp van website al vanuit een basis (DMS, ZAAKSYSTEEM OF WHATEVER), in context en als event publiceert. Als het zo ontwerpt zit je publicatie in je dms en kan je datum gepubliceerd en uit publicatie gehaald ook monitoren. Bewaren van websites is dan een non-issue geworden. Die benadering is technisch niet moeilijker, echter organisatorisch qua ontwerp te weinig toegepast.

                            Als je dan niet werkt zoals het hoort, dan ga je web-archiveren zoals je denkt dat het ook kan: volgens mij gaat het dan gewoon nooit goed komen. lastig verweer is, dat het bij benadering a. ook niet goed komt: want dat doen we ook niet, een enkele uitzondering daargelaten.

                            • Erik Saaman
                              Erik Saaman 12 dagen geleden

                              Laten we vooral een balans zoeken tussen hoe het theoretisch hoort en wat praktisch binnen handbereik ligt. Anders blijven we nog heel lang door praten, zonder dat er iets gebeurd. Het kan altijd beter, maar dat kan altijd nog.

                              • Yvonne Welings
                                Yvonne Welings 11 dagen geleden

                                Erik, dat vraagt dan om een nieuwe versie van de handreiking en stappenplan.

                                • Erik Saaman
                                  Erik Saaman 11 dagen geleden

                                  Yvonne, we voorzien dat de handreiking (met het stappenplan) geregeld verbeterd zal worden. We doen nu een eerste grote stap. Uitgaande van de best practices van dit moment. Zodra er betere inzichten en technieken beschikbaar zijn, dan moeten we daar natuurlijk gebruik van maken. Maar we willen nu niet in debat blijven steken.

                                  • Robin Lassche
                                    Robin Lassche 11 dagen geleden

                                    Ok, Erik, maar als je nu geen debat wilt voeren, waarom wordt dan de handreiking met het expliciete verzoek om te reageren hier online geplaatst? :-) 

                                    • Yvonne Welings
                                      Yvonne Welings 11 dagen geleden

                                      Robin, daar sluit ik me geheel bij aan. Wanneer je de ambitie hebt als Nationaal Archief om echt een kennisinstituut te worden hoort daar de inbreng van het 'veld' bij. Je kunt niet alleen zenden daar hoort ook ontvangen bij.

                                      • Erik Saaman
                                        Erik Saaman 10 dagen geleden

                                        Misschien heb ik me verkeerd uitgedrukt. Er is alle ruimte voor debat. Wat ik bedoelde is dat we niet eerst overal het definitieve antwoord op hoeven te hebben, voordat we de eerste versie van de handreiking publiceren. Want anders blijven we alleen in debat. Er moet ook snel wat uit komen. Er zijn mensen die daarop wachten. En dat is ook toegezegd aan de Tweede Kamer. De handreiking kunnen we later altijd aanpassen als er nieuwe betere inzichten zijn. Of als uit de praktijkcasussen blijkt dan het stappenplan niet werkt. 

                                        • Jeroen Geradts
                                          Jeroen Geradts 8 dagen geleden

                                          Hoe kunnen we dynamiek van een website waarin continu content wijzigt ondervangen bij het archiveren? Het stappenplan te beperkt zich tot harvesting als meest gangbare vorm van webarchivering, terwijl database archivering wellicht betere en goedkopere mogelijkheden biedt. (WikiPedia pagina over webarchivering)

                                          • Jeroen Geradts
                                            Jeroen Geradts 8 dagen geleden

                                            Hoe ga je om met verschillende archiveringstermijnen voor inhoudelijk verschillende onderwerpen op een website (of intranet) zijn vastgesteld? Het stappenplan gaat uit van datum wijziging of datum depublicatie, maar houdt er geen rekening mee dat voor sommige onderwerpen de actualiteitsdatum geldt als start van de bewaartermijn. En wat betekent het als de bewaartermijn oneindig is als voor een deel van een website geen bewaartermijn is vastgesteld?

                                            • Robin Lassche
                                              Robin Lassche 7 dagen geleden

                                              De vragen die Jeroen stelt, zijn essentieel. Hoewel je niet tot op detailniveau antwoorden hoeft te geven, moet je denk ik in een handreiking wel dieper ingaan op deze aspecten dan nu het geval is.

                                              • Jeroen van Luin
                                                Jeroen van Luin 7 dagen geleden

                                                Belangrijke vragen, dat ben ik zeker met jullie eens, maar ook vragen waarover niet 1-2-3 een consensus is. Zowel voor selectie binnen een website, als voor "is CMS-archivering niet beter dan harvesting" geldt dat het de hoogste tijd is om daar nu de discussie over te voeren.

                                                Tegelijkertijd verdwijnt er dagelijks informatie van websites, of verdwijnen complete websites omdat ze offline gaan of vervangen worden door compleet nieuwe versies met compleet nieuwe CMS'en. Harvesting is een tool die we nu hebben en die nu, hoe beperkt ook, werkt. En selecteren en verwijderen (of selectief beschikbaar stellen) binnen een geharveste website kan later nog worden uitgevoerd, een website die er helemaal niet meer is maar die we achteraf gezien wel hadden willen hebben, krijgen we niet meer terug.

                                                Dus mij lijkt 't het beste om het één te doen, en het ander niet te laten. Nu een handreiking met wat we nu weten en kunnen, inclusief duidelijk het besef van wat we daarmee allemaal buiten scope plaatsen zodat we zoveel mogelijk verlies proberen te voorkomen, en tegelijkertijd zorgen dat we het proces kunnen uitbreiden en verbeteren.

                                                • David Gerrits
                                                  David Gerrits 6 dagen geleden

                                                  In aanvulling op eerdere reacties vraag ik me bij het lezen van het pva de volgende zaken af:

                                                  • Waarom is selectiebeleid buiten scope?  Door het bijzonder dynamische karakter van websites zal er toch veel aandacht nodig zijn voor het kunnen selecteren van te archiveren materiaal (contenttype, benadering van dagelijks wijzigende content, archiveringsfrequentie etc.). De huidige selectielijsten zijn vaak abstract op het vlak van webarchivering.
                                                  • Hoe willen we omgaan met websites die gebruik maken van content en open data van anderen? Een goed voorbeeld is https://ondernemersplein.nl/. Hier wordt content door verschillende bronnen als KvK, RVO.nl e.a. gepubliceerd, maar ook hergebruikt vanuit andere rijksoverheid websites (open data). Vragen zijn dan wie is de eigenaar van welke content, wie archiveert wat, etc.
                                                  • Verder lees ik hier de vragen over de gekozen defenitie van een website. Ik denk dat dat de gekozen defenitie ook nog niet scherp genoeg is. Om een goede representatie te kunnen maken zal je niet alleen de html + plaatjes moeten archiveren. Je hebt dan veel meer nodig: de html met alle bestanden waarnaar gelinkt wordt zoals media, CSS, Javascript, gebruikte lettertypes. En vervolgens, in hoeverre zijn deze formaten duurzaam?
                                                  • T.a.v. de voorwaarde van 'voldoen aan de gangbare kwaliteitseisen voor websites' zou ik die wel degelijk als voorwaarde opnemen (aan NEN 301 549 moeten de betreffende sites immers al voldoen), en duurzame archivering van sites die dit niet toepassen lijkt technisch gezien heel erg lastig.
                                                  • Arjan Blom
                                                    Arjan Blom 4 dagen geleden

                                                    Ik heb het stappenplan en de discussie hierboven zojuist met veel interesse gelezen. Omdat vandaag de laatste dag is om te reageren wil ik liever geen grote discussies aanzwengelen, maar ik zou graag nog wel een aantal praktische concrete punten willen aandragen:

                                                    • In de 2e zin van alinea 2, zou ik graag zien dat 'op grond van de Archiefwet ...' iets wordt toegelicht. Ik vind het nu wat kort door de bocht.
                                                    • Aan het einde van alinea 2 staat dat 'Social media die geen website zijn maar een eigen applicatie gebruiken (zoals Whatsapp)' buiten de scope vallen. In mijn ogen impliceert dit dat Facebook en Twitter (die sterker met de website worden geassocieerd) wel worden meegenomen, terwijl ik begrepen had dat dit niet zou gebeuren. Dit zou ik persoonlijk dus aanscherpen.
                                                    • Onder het kopje 3.5 staat 'Meld alle websites uit de inventarisatie aan bij de archiveringsdienst'. Ik neem aan dat er wordt gedoeld op de harvestingsdienst? (Ook staat er in de zin daarna websites i.p.v. website)

                                                    Daarnaast heb ik net als anderen mijn vraagtekens rondom kopje 3.3 Bewaartermijnen. Zelf ben ik een voorstander voor het koppelen van de content met het proces en daarbij dus de bewaartermijn van het proces aan te houden. Maar hiervoor is het noodzakelijk dat de processen bij content-creatie goed op orde zijn en ik weet dat dit in veel gevallen een lastige zaak is... Dus ik begrijp wel waarom voor deze benadering is gekozen, maar in de toekomst zou ik dit graag anders zien. 

                                                    Ten slotte voorzie ik mogelijk nog wel wat moeilijkheden voor de eis dat de harvestingsdienst de metagegevens in TMLO vorm zou moeten aanleveren. Ik vraag me af in hoeverre deze metadata op dit moment aanwezig zijn bij websites (en of dit dan handmatig moet worden aangevuld), maar dit zal de toekomst moeten uitwijzen.