De onzekere toekomst van onze data
Gepubliceerd: Dinsdag 21 september 2010
Auteur: Lamont Wood
We produceren inmiddels enorme hoeveelheden digitale data, maar hebben nog geen onfeilbare manier gevonden om al die gegevens te bewaren.
In 1986 ging in Groot-Brittannië het Domesday Project van de BBC van start, ter viering van de 900ste verjaardag van het originele Domesday Book: een onderzoek naar het bodemgebruik in Engeland in opdracht van Willem de Veroveraar in 1086. Voor een recenter onderzoek van het eiland leverden duizenden Britten tekst, afbeeldingen en video's aan die op twee gewone laserdisks werden gepubliceerd.
Slechts 15 jaar later bleek het onmogelijk deze media nog te benaderen zonder een heleboel gespecialiseerde hardware en uitgebreide software-emulaties. Het Centre for Computing History in Haverhill, Engeland, is inmiddels in het bezit van een werkende emulatie en hoopt de inhoud op het Web te kunnen publiceren.
Ondertussen ligt het originele Domesday Book (handgeschreven op schapenvel) keurig in de Britse archieven; na negen eeuwen nog steeds toegankelijk voor eenieder die Latijn kan lezen.
Iedereen die gegevens op 5.25-inch floppy's of tekst in WordStar-formaat heeft opgeslagen, zit met een probleem dat vergelijkbaar is met dat van het Domesday Project van de BBC. We zullen het hoogstwaarschijnlijk zelf nog meemaken dat de digitale data die we nu op grote schaal genereren onbruikbaar worden, tenzij we stappen ondernemen om die gegevens te conserveren.
De situatie is niet geheel te wijten aan de geplande veroudering in de informaticasector. Kort samengevat heeft digitale opslagtechnologie een aantal intrinsieke nadelen die papier onsterfelijk doen lijken.
De sterfelijkheid van data
Een harde schijf die uit een computer wordt gehaald en op een plank in een kantoor wordt bewaard, zal uiteindelijk onbruikbaar worden, gewoon vanwege dagelijkse temperatuurschommelingen, zegt Tom Coughlin, gegevensopslagadviseur in San José. Volgens hem zal de thermische energie die het medium ingaat geleidelijk zorgen voor spontane omkering van de magnetische deeltjes die de informatie opslaan, totdat de oorspronkelijke data verloren is. Dergelijk dataverlies zou de eerste 10 jaar geen probleem mogen vormen, voegt hij toe. Maar daarna is het niet meer de vraag of, maar wanneer de data onbruikbaar wordt.
Magneetbanden kampen met hetzelfde probleem, maar in hun geval duurt het tientallen jaren voordat er op deze manier gegevens verloren gaan. Dat komt doordat magneetbanden een lagere dichtheid hebben dan harde schijven, vertelt Coughlin. Aan de andere kant kom je daar weer een ander probleem tegen: delaminatie. Dit doet zich voor wanneer het magnetische medium los komt te zitten van de band of aangevallen wordt door schimmels. Soms moeten de media door middel van een bakproces opnieuw aan de banden worden vastgehecht zodat ze nog voor een laatste keer gelezen kunnen worden om hun inhoud naar een ander medium over te zetten, aldus Coughlin.
USB-geheugensticks zijn ook aan thermische verwijdering onderhevig en hebben met een extra risico te maken omdat ze over het algemeen de allergoedkoopste controllers bevatten. "Ik zou ze niet voor archiveringsdoeleinden gebruiken," zegt hij. Hoe dan ook vereist het gebruik van USB-sticks dat men over tientallen jaren nog steeds gebruik maakt van USB-poorten. Niemand heeft enig idee hoe laptops eruit zullen zien over 20 jaar, laat staan 50.
Wat DVD's en CD's betreft rapporteert Bill LeFurgy, projectmanager van de Library of Congress, dat zijn organisatie met behulp van ovens versnelde verouderingstests op deze media heeft uitgevoerd en enorme verschillen tussen schijven heeft geconstateerd - zelfs tussen schijven van hetzelfde merk. "Sommige gaan 10 jaar mee en andere veel minder lang," zegt hij. "Na een jaar of vijf zou ik me zorgen beginnen te maken."
Andere opslagprofessionals klagen dat het doorvoervermogen van DVD's te traag is voor archivering. Het doorvoervermogen van een DVD is over het algemeen minder dan een kwart van dat van magneetbanden. Daarnaast is het opslagvermogen van DVD's beperkt tot enkele gigabytes per schijf.
En net als bij andere opslagformaten zit je met de vraag of er over enkele decennia nog CD- of DVD-spelers in gebruik zullen zijn.
