In de VS en hier te lande gaat het bij de discussie over 'NSA-praktijken' veelal over metadata. Die term wordt vaak gebruikt om de inbreuk op de privacy te bagatelliseren: het is slechts metadata, niet de inhoud van telefoongesprekken, chats en e-mails. Aan de andere kant wijzen privacygroepen er juist op dat deze data vaak veel privacygevoeliger zijn. Niet voor niets noemt Bits of Freedom het consequent 'gedragsdata'.

NSA'tje spelen voor de wetenschap

Onderzoekers van Stanford namen de proef op de som en zijn NSA'tje gaan spelen. Ze kregen 500 mensen zo ver om de app 'Metaphone' te installeren die een paar maanden lang alle mogelijke metadata verzamelde.

De verwachting was dat deze dataset niet groot genoeg was voor serieuze datamining. "Maar we zaten fout. We merkten dat telefoon-metadata ondubbelzinnig gevoelig zijn, zelfs met een relatief kleine populatie in een korte tijd. We konden medische gesteldheid, vuurwapenbezit en meer achterhalen, puur en alleen op basis van metadata", schrijft student Jonathan Mayer. Door het analyseren van het belgedrag op relaties, contacten en organisaties werden zaken als religie, medicijngebruik, vuurwapens en drugsgebruik als snel duidelijk.

Metadata extreem gevoelig

"Deze dataset had betrekking op honderden gebruikers voor enkele maanden. Telefoondata die de NSA verzamelt beslaan miljoenen (Amerikaanse) burgers over jaren. Mensen kunnen het oneens zijn over het beleid en de juridische waarborgen die nodig zijn voor dergelijke databases. Maar de wetenschap is duidelijk: telefoon-metadata zijn zeer gevoelig."

The Guardian publiceerde vorig jaar vlak na de eerste onthulling van Edward Snowden een handig overzicht van verschillende soorten metadata. Bedenk daarbij: anders dan bij inhoud van communicatie is het vergaren van metadata schaalbaar. Sterker nog, hoe meer (en meer soorten data van meer mensen) hoe beter, want juist in die databerg zie je relaties, patronen en afwijkingen.

Soorten metadata, zie grotere afbeelding. Bron: The Guardian