De NSA wordt overweldigd door de hoeveelheid data die wordt opgevangen en de inlichtingendienst wil selectiever zijn in wat er wordt bewaard. Dat blijkt uit een interne presentatie waarover The Washington Post publiceert. De krant haalde deze gegevens bij klokkenluider Edward Snowden.

Contactenlijsten opgeslurpt

Een presentatie laat zien hoe de datacollectie doorgaans loopt. Daarbij werd als voorbeeld een doelwit genomen die via Yahoo communiceert. In de meeste gevallen gaat NSA op zoek naar meldingen van dat e-mailadres en ontdekt deze dan in de contactenlijsten van anderen. Het komt minder vaak voor dat dan wordt gevonden wat eigenlijk wordt gezocht: de personen met wie het doelwit communiceert, of de contactenlijst van deze persoon zelf.

Juist die dingen zijn belangrijk voor de NSA. Democratisch Senator Dianne Feinstein verdedigde zondag in een opiniestuk in de Wall Street Journal het datasleepnet van de VS en wees op metadata die aanslagen kan voorkomen. Ze schrijft daarbij dat een Al Qaida-verdachte die werd gevolgd door de CIA voor 11 september contact had met een van de 9/11-kapers. Zonder metadata kon die link echter niet worden gelegd, aldus Feinstein.

Beter filteren

Maar de NSA verzuipt inmiddels in de metadata en is begonnen met het filteren van metadata. Zo worden er van de adresboeken die worden opgeslurpt, de contacten gewist waar geen eigenaar is gespecificeerd. De NSA paste in 2011 en 2011 diverse technieken toe om metadata effectiever te filteren en is op die manier volgens de presentatie twintig procent minder gegevens gaan opslaan.

Maar dat is nog niet genoeg. Er is een nieuwe datafilterfilosofie nodig bij de NSA, aldus de dia’s, waarbij analisten kijken naar wat er nodig is in plaats van ‘alles van de menukaart bestellen en eten wat je wilt hebben’.