Dat stelt ingenieur Harold van Heerde, die is gepromoveerd op zijn proefschrift 'Privacy: tijdig vervagen van gevoelige gegevens' (pdf). Daarin trekt hij de vergelijking met voetafdrukken op een strand; na verloop van tijd zijn minder details terug te vinden.

Voor gebruikersgegevens betekent dat dat eerst de meest specifieke data wordt gewist. "Eerst je adres, dan alleen je straat, de wijk, de stad en dan het land", legt Van Heerde uit aan Webwereld. Zo'n vervaging van gegevens kan identiteitsfraude tegengaan en reputatieschade beperken.

Minder waard

Hij hoopt dat het belang van de gebruiker de overhand krijgt bij het bewaren van gegevens. "Ik ga er daarbij vanuit dat oude data sowieso minder waard is dan nieuwe data. Bedrijven moeten alleen nog minder bang zijn om oude gegevens te wissen." Veel data wordt bewaard met de gedachte dat het nog bruikbaar kan zijn, en dus wel waarde heeft.

Van Heerde stelt dat bedrijven en organisaties een balans moeten zien te vinden tussen het waardeverlies van te wissen data versus de impact van dataverlies op de gebruiker. "Daar probeer ik met mijn proefschrift een aanzet toe te geven."

Tijd, model en voorkeur

"In principe moet datavervaging gebeuren naar het verloop van tijd. Maar het is natuurlijk ook attribuutafhankelijk, en van het bedrijf en het business model. Én van de gebruiker; wat die hoe snel gewist wil hebben." Idealiter zou een consument dus zelf kunnen aangeven welke data wanneer moet 'vervagen'.

De onderzoeker ziet twee scenario's voor het geleidelijk wissen van gebruikersgegevens. "Als er geen specifiek doel is waar de bewaarde informatie voor dient, of als er geen tijdsspanne voor dat doel is aangegeven."

Zoekmachines waaronder Google liggen daarover in de clinch met de Europese privacywaakhonden over hoe lang ip-adressen en zoekopdrachten worden bewaard. "Google zegt daarmee zijn zoekmachine slimmer te maken, maar dat is een erg onbepaald doel en tijdsspanne." Het tweede scenario is juist als er wel een duidelijk doel, met 'deadline' is. Dan kan daaruit, haast automatisch, het verval van gegevens worden geregeld.

'Mijn zoekgeschiedenis'

Zelf is hij zich bewust van zijn 'digitale schaduw' en daar niet ongerust over. " Daar let ik zelf al op. Wat nu online van mij bekend is, is bekend. Ik maak me meer zorgen over bijvoorbeeld mijn zoekgeschiedenis bij Google. Dat zou ik graag vervaagd zien. Niet dat ik op spannende dingen heb gezocht, maar stel dat er bij Google wordt ingebroken en mijn zoekgeschiedenis komt naar buiten. Dat kan in een verkeerde context heel anders worden gezien."

Een bedrijf als Google anonimiseert gegevens weliswaar in enige mate, maar volgens Van Heerde is dat nooit afdoende. Anonimisering is namelijk omgekeerd evenredig aan de bruikbaarheid van data. "Google geeft dus schijnveiligheid." Hij noemt ook het klassieke voorbeeld van AOL, dat data vrijgaf voor onderzoek zonder de bijbehorende ip-adressen. Individuele gebruikers bleken toch relatief makkelijk te achterhalen.

Dataverlies onvermijdelijk

Het is volgens hem namelijk een foute gedachtengang om te denken dat data veilig is bij welk bedrijf dan ook. Dataverlies zal simpelweg gebeuren, het is nagenoeg onvermijdelijk. Vroeg of laat komen gegevens op straat te liggen, schrijft Van Heerdes in zijn proefschrift. Datavervaging kan dan de impact beperken wanneer - niet als - er iets fout gaat.

Technische beveiliging alleen is niet afdoende; gebruikersinformatie kan ook van binnenuit op straat komen te liggen. "Kijk maar naar T-Mobile, waar medewerkers de klantengegevens hebben verkocht." Medewerkers die vanwege hun werk toegang hadden tot die gegevens. "Daar kan geen beveiliging tegenop. Nu zeg ik niet dat beveiliging per definitie nutteloos is. Dat is het zeker niet."

Vertrouwenskwestie

Van Heerde erkent dat het vertrouwen een heikel punt is. Daar staat of valt het hele idee van vervagende data mee. "Uiteindelijk draait het daar om, ja." Hij noemt Facebook een typisch voorbeeld; een bedrijf met privacyvoorwaarden die later worden bijgesteld. Als een gebruiker het dan niet meer vertrouwt, kan die opstappen maar zijn oude data blijft achter. Met een beleid voor Van Heerdes 'datavervaging' kan de gebruiker geruster zijn dat diens oudere gegevens al wat gewist zijn.

"Ik heb in mijn proefschrift vooral naar de technische kant gekeken, de implementatie. Het is technisch niet eens zo heel moeilijk. Het komt neer op het aanpassen van databases, zodat verwijderen ook echt verwijderen is." Hij erkent dat die aanpassing, door databasemakers en dan ingebruikname door bedrijven en organisaties, wel geld kost. "Belangrijker dan de techniek is de benadering, dan volgt de bewustwording en daarna komt pas de technische aanpak." Dat kan nog wel enige tijd duren. "Het blijft lastig."