De analyse van de gigantische database legt talloze significante en onbehaaglijke verbanden bloot tussen bepaalde bevolkingsgroepen en crimineel gedrag. Dit blijkt uit het proefschrift Algorithmic Tools for Data-Oriented Law Enforcement waarop Tim Cocx vorige week is gepromoveerd.

Het onderzoek is het project DALE (Data Assistance for Law Enforcement) en betaald door NWO. Informaticus Cocx liet algoritmes los op een database met alle Nederlanders die sinds 1998 zijn veroordeeld voor een misdrijf, of in de afgelopen zes maanden zijn verdacht van een misdrijf. Dat zijn gegevens van één miljoen landgenoten met hun demografische details en criminele verleden.

Misdaad en persoonskenmerken

"M'n promotor Joost Kok vroeg me dit onderzoek te gaan doen. Onze vakgroep werkte al nauw samen met de politie. De Dienst Nationale Recherche Informatie had behoefte aan verkennend onderzoek naar de mogelijkheden van datamining."

Dus toog Cocx aan de slag aan de Universiteit Leiden, waar ooit professor Wouter Buikhuisen werd weggestuurd na een openbare hetze wegens criminologisch onderzoek naar misdaad en persoonskenmerken. Buikhuisen is juist afgelopen maanden gerehabiliteerd en geeft een gastcollege in 2010.

Cocx vond onder meer de volgende sterke correlaties, sommige voorspelbaar, andere verrassend:

* De vrouwen in de database zijn significant vaker verslaafd aan drugs dan mannen.

* Mensen verdacht van doodslag zijn relatief vaak al veroordeeld wegens racisme.

* Joyriders nemen het ook niet zo nauw met de arbeidswetten en alcohol.

* Diefstal met geweld hangt vaak samen met wapenbezit.

* Afrikaanse afkomst en veroordeeld voor overtredingen inzake 'openbare veiligheid'.

* Criminelen op het platteland begaan ook vaak verkeersmisdrijven.

Politie mag er niks mee

"Ik vond dat opmerkelijk", zegt Cocx. Wat kan de politie ermee? "Ik kan me voorstellen dat in sommige situaties er alarmbelletjes gaan rinkelen bij de politie. Je kunt er ook beleid op gaan baseren. Maar voorlopig wordt er niets mee gedaan omdat het niet toegestaan is. Je mag data wettelijk alleen gebruiken voor het doel waarvoor ze zijn verzameld. Dit heeft geen prioriteit."

Cocx zou er, op grond van zijn resultaten, ook voorzichtig mee omspringen: "In marketing is een succespercentage van 85 procent hoog en met succes toe te passen in campagnes. Maar voor opsporing is een foutenpercentage van 15 procent tegenover mensen die je onterecht verdenkt niet aanvaardbaar."

Minority Report

Privacy is en blijft een zorg. Het staat de toepassing van datamining dan ook in de weg. Cocx zelf heeft er niet zo veel mee: "Persoonlijk kan het me niet zo veel schelen. Maar op mijn vakgebied worden veel zorgen geuit over privacy met verwijzing naar Minority Report-achtige toestanden."

"Ik denk dat je van geval tot geval moet bekijken of nieuwe methoden in de opsporing met behulp van informatica toegepast kunnen worden zonder de privacy te schenden."

Accurate voorspellingen

Over Minority Report gesproken, het geautomatiseerd grasduinen in de databank levert behoorlijk accurate voorspellingen op, blijkt uit het hoofdstuk 'An Early Warning System for the Prediction of Criminal Career'.

"Een cluster van 10.000 criminele carrières uit de database kan als solide basis dienen voor extrapolatie in de tijd", concludeert Cocx. Zo kan een voorspellingsbetrouwbaarheid van maar liefst 88 procent worden bereikt. En dat percentage kan nog hoger, denkt de onderzoeker.