Het archief is gescand. En nu?
Digitaliseren is niet scannen. Het is beslissen op basis van gescande informatie en correcte metadata.
In de kelder staat honderd meter archiefkasten. Niemand weet precies wat erin zit. Kartonnen dozen met stickers als “HR 2003-2008” en “Projecten Noord - div.” De jaarlijkse opslagkosten zijn niet triviaal. De directeur vraagt: “Mag dat niet gewoon weg?” Het antwoord is complexer dan hij hoopt.
De Archiefwet 1995 schrijft voor dat overheidsorganisaties - en organisaties met publieke taken - informatie moeten bewaren volgens vastgestelde bewaartermijnen in een selectielijst. Pas als een bewaartermijn is verstreken mag én moet informatie worden vernietigd. Blijvend te bewaren stukken gaan naar een archiefdienst. De nieuwe Archiefwet ligt momenteel bij de Eerste Kamer met een beoogde inwerkingtreding in 2027; die gaat onder meer de overbrengingstermijn verkorten van 20 naar 10 jaar.
Cruciaal in beide versies: vernietiging mag alleen op basis van een gestructureerde registratie met metadata. Ongestructureerde informatie mag formeel niet worden vernietigd, omdat je niet kunt aantonen wát je vernietigt. Vertaal dat naar honderd meter dozen: je mag er niet zomaar een container voor bestellen. Je moet per doos, per dossier, soms per document bepalen wat het is, wanneer het is afgesloten, welke categorie uit de selectielijst geldt, en of de termijn is verstreken. En als er persoonsgegevens in zitten speelt óók de AVG mee, die zegt dat persoonsgegevens niet langer bewaard mogen worden dan nodig. Het tegenovergestelde is even vervelend: informatie die vernietigd had moeten zijn maar er nog ligt, moet bij een Woo-verzoek gewoon openbaar worden gemaakt.
De klassieke oplossing is een scanstraat: dozen uit de kelder, industrieel scannen, PDF’s terug op een server. Klaar, denkt iedereen. In werkelijkheid heb je nu honderd meter papier vervangen door terabytes ongestructureerde PDF’s - vindbaar noch juridisch verantwoord te vernietigen. Het probleem is verplaatst, niet opgelost. De échte uitdaging is de tweede stap: per document bepalen wát het is, welke bewaartermijn erop van toepassing is, en of het weg mag. Bij honderd meter archief, al gauw honderdduizenden documenten, is dat handmatig een kwestie van jaren werk.
Wij benaderen een fysiek archief als een pipeline van drie stappen in één doorloop. Eerst scannen met automatische rotatiecorrectie en kwaliteitscontrole, en OCR die ook werkt op oudere typemachine-brieven, carbonkopieën en handgeschreven aantekeningen. Daarna de intelligente laag: AI-classificatie herkent documenttypes (contract, brief, nota, personeelsdossier, bouwtekening, financiële rapportage), koppelt die aan de relevante categorieën uit je selectielijst, extraheert relevante metadata en rekent op basis hiervan de bewaartermijn door. Voor elk document volgt een advies: bewaren, overbrengen, of vernietigen, met de onderbouwing erbij. De derde stap is menselijke validatie waar het telt. Bij 95% nauwkeurigheid heb je bij 500.000 documenten nog steeds 25.000 potentiële fouten; twijfelgevallen gaan naar een archivaris die definitief beslist. 90-95% wordt geautomatiseerd, de gevoelige 5% krijgt juist extra aandacht.
Aan het einde zijn er drie dingen tegelijk bereikt. Het fysieke archief is weg - alleen wat écht fysiek moet blijven, blijft. Wat gedigitaliseerd is, is niet alleen gescand maar gestructureerd: doorzoekbaar, voorzien van metadata, gekoppeld aan de selectielijst. En er is een vernietigingsverklaring, zoals de Archiefwet die vereist, met een complete specificatie van wát is vernietigd, op grond van welke categorie, en wanneer. De directeur krijgt zijn kelder terug. De FG en archivaris krijgen een aantoonbaar rechtmatig vernietigingsproces. En de volgende Woo-vraag kan beantwoord worden vanuit een archief dat zichzelf kent, in plaats van honderd meter ‘hopen dat het niet vanmiddag relevant wordt’.