Op 1 april gaat de nieuwe Archiefregeling in, die voor het bewaren van digitale gegevens open bestandsformaten verplicht stelt. Daarbij komt er geen verplichting voor specifieke formaten. Woordvoerder Tjeerd Agema van het Nationaal Archief vertelt Webwereld dat voor documenten PDF/A de voorkeur heeft. "We adviseren PDF/A. En voor afbeeldingen Tiff." Ook Tiff is net als PDF in handen van Adobe.

Niet opleggen

Agema legt uit dat het opleggen van specifieke formaten niet goed kan. "Die worden in de regeling ook niet genoemd. Wel worden er normen gesteld, die zijn wel af te dwingen." Hij noemt als vergelijking een norm voor bouwmateriaal dat bijvoorbeeld twee uur brandwerend moet zijn. "Of je dat dan met beton doet of een ander materiaal maakt niet uit, zolang je maar voldoet aan de norm." Dit betreft dus de vereiste eigenschappen voor het te gebruiken middel (bouwmateriaal dan wel bestandsformaten).

De nieuwe regeling komt vanuit het ministerie van Onderwijs, Cultuur en Wetenschappen (OCW). De Directie Cultureel Erfgoed van OCW bevestigt dat een specifiek bestandsformaat opleggen niet aan de orde is. Dat zou niet zinnig zijn, zegt een woordvoerster. Zij verwijst naar de regeling die specifiek vermeldt: "Een evaluatiecommissie heeft enkele jaren geleden vastgesteld dat de technologie zo snel voortschrijdt dat exacte normen voorschrijven nauwelijks zinvol is." Met exacte normen wordt de specifieke (open) bestandsformaten bedoeld.

Toegankelijkheid

OCW wil met de nieuwe archiefregeling de toegankelijkheid van informatie waarborgen, onder meer in het Nationaal Archief. Digitale archieven moeten bij archiefinstanties worden aangedragen in een valideerbaar en volledig gedocumenteerd bestandsformaat dat voldoet aan een open standaard, stelt de regeling van OCW-minister Plasterk.

Verder adviseert het ministerie overheidsinstanties om data al van tevoren op te slaan in een open bestandsformaat. "Hoewel de eisen ten aanzien van het bestandsformaat gelden uiterlijk op het moment van overbrenging, hebben veel overheidsorganisaties er belang bij al in een eerder stadium aandacht te besteden aan het gebruik van standaarden", stelt OCW.

Eigenlijk is dat ook verplicht via het programmabureau NOiV (Nederland Open in Verbinding) van staatssecretaris Frank Heemskerk van Economische Zaken. EZ-woordvoerder Edwin van Scherrenburg verwijst naar het 'comply or explain'-principe van het NOiV waardoor overheden per definitie open standaarden moeten gebruiken, en afwijkingen moeten uitleggen.

Correcte aanlevering

Ook in de nieuwe archiefregeling is een uitzondering opgenomen voor de verplichting tot openheid. De regeling stelt: tenzij dit redelijkerwijs niet van de zorgdrager (de aanleverende instantie - red.) kan worden verlangd. Het is niet bekend wat dit omvat. In het geval dat digitale documenten niet in correcte vorm kunnen worden aangeleverd aan het archief, moet de beheerder van de 'archiefbewaarplaats' overleggen over een alternatief bestandsformaat.

Agema geeft ook aan dat aanlevering niet zomaar kan. "We stellen wel eisen voor aanlevering van archieven. Je kunt zeg maar niet een zak met harde schijven bij ons afleveren." De nieuwe archiefregeling schrijft wel ISO-standaarden voor met betrekking tot de metadata voor de aangeleverde gegevens.

Metadata

In de metadata zijn dan zaken opgeslagen als het bestandsformaat en de gebruikte applicatie, eventueel met versienummer. Normen voor metadata moeten samen met de eis van open bestandsformaten de afhankelijkheid van specifieke, leveranciersgebonden software voorkomen.

"In de nieuwe regeling worden daarom prestatie-eisen gesteld aan het opslagformaat, vooral dat open standaarden worden gebruikt, waarvan precies bekend is hoe ze in elkaar zitten", meldt OCW over de archiefregeling. Het verschilt daarmee nogal van de voorganger uit 2002, de Regeling geordende en toegankelijke staat archiefbescheiden, die wel bestandsformaten noemt. Dat zijn PDF en Tiff, met metadata in XML.

OOXML

In theorie kan nu dus ook een officieel open formaat als OOXML worden gebruikt. Microsoft Nederland vertelt Webwereld dat er op dit moment geen contact is tussen de Office-fabrikant en OCW of het Nationaal Archief. Hans Bos stelt wel: "Als OCW en het Nationaal Archief uitgaan van open standaarden voor document formaten, dan past Open XML daar inderdaad in."

Hij nuanceert: "Internationaal gezien werken de meeste (nationale) archieven met meerdere open standaarden. Zowel voor reviseerbare als niet-reviseerbare documenten, voor tekst als grafisch etc. De meeste archieven verplichten niet tot het omzetten naar één open standaard omdat dit tot verlies van representatie en in sommige gevallen zelfs inhoud kan leiden." De keuze voor een formaat zijn afhankelijk van factoren als het type archief, het doel, de wensen en eisen, legt Bos uit.

"Samengevat gaat het meestal om het archiveren van de documentinhoud maar ook om het behouden van de (oorspronkelijke) representatie van documenten. Dat is complexer dan veel mensen denken, omdat er voor representatie ook afhankelijkheden naar huidige computertechnieken en architecturen kunnen zijn. Hebben we over 100 jaar nog ‘beeldschermen’?"

Update: Verduidelijking toegevoegd voor de ogenschijnlijke tegenstrijdigheid tussen "normen" (voor de bestandsformaten) en "exacte normen" (specifieke bestandsformaten zelf). In 2e en 3e alinea.