1. Tor-sites bovengronds doorzoeken

De Tor-browser geïnstalleerd maar geen idee waar je Tor-sites kunt vinden en nog niet van The Hidden Wiki gehoord? Geen nood, er is een handige zoekmachine die Tor's zogenoemde onion-sites indexeert en helemaal handig: het is gewoon vanaf het www te bereiken. Onion.city heeft momenteel ongeveer 345.000 pagina's geïndexeerd en biedt zoekopdrachten op het openbare web - compleet met Adwords erboven - dankzij een Tor2web-proxy.

Beheerders van onion-sites die zich willen uitsluiten, moeten net als reguliere sites even robots.txt aanpassen. De beheerders van de zoekmachine zien het als een goede manier om te laten zien dat er ook waardevolle content op ondergrondse sites te vinden is. Let op: zoekopdrachten zijn (nog) niet versleuteld, dus zoekopdrachten naar anarchistische informatie doen je waarschijnlijk nog steeds op de JSCU-radar belanden.

2. Internetapparaten vinden

Shodan, genoemd naar de boosaardige kunstmatige intelligentie uit System Shock, is een gespecialiseerde zoekmachine om naar internetverbonden hardware te zoeken. Je zoekt naar apparaten op poort 80, maar ook bijvoorbeeld SSH en Telnet-poorten zijn te doorzoeken. De machine is gemaakt door beveiligingsspecialist John Matherly. In mei is hij overigens in Amsterdam een keynote-spreker op beveiligingscongres Hack in the Box.

Shodan wordt bijvoorbeeld regelmatig gebruikt door onderzoekers die een kwetsbaarheid ontdekken in een router en willen zien wat de impact daarvan is: een gefilterde zoekopdracht op Shodan geeft een direct beeld van hoeveel van deze machines zijn aangesloten op internet. Hetzelfde geldt voor bijvoorbeeld SCADA-systemen waarmee kritieke infrastructuur wordt beheerd. Deze zouden niet publiekelijk te benaderen moeten zijn, maar Shodan laat zien dat dit nog te vaak wel het geval is.

3. Afbeeldingen herkennen

Waar komt dat ene plaatje nou eigenlijk vandaan? Dat kan inmiddels op mainstreamer Google via diens afbeeldingenzoeker met het uploaden van een afbeeldingen om treffers te zoeken, maar de zoekgigant haalde de mosterd waarschijnlijk bij de site TinEye, die nog steeds bestaat. TinEye is zo'n omgekeerde afbeeldingszoekmachine die een index aanmaakt van afbeeldingen door van de ingevoerde afbeelding een hash te maken, om ze efficiënt aan elkaar te kunnen koppelen.

Je ziet na een zoekopdracht wanneer deze gecrawld is en een vergelijkingsfeature met je ingevoerde afbeelding maakt het mogelijk om zo snel tussen de twee te schakelen om te zien in hoeverre de afbeelding is bewerkt. Zo kan een fotograaf bijvoorbeeld terugvinden welke sites een afbeelding zonder toestemming gebruiken.

4. Platgetreden paden vermijden

Mis je de tijd dat je met Ilse vooral homepages vond met allerlei obscure informatie, waardoor je afgeleid en gevuld met angst en walging nooit vond wat je eigenlijk zocht? MillionShort lost dat voor je op door de eerste miljoen zoekresultaten weg te filteren. Of de eerste 100, zodat je meteen naar de elfde resultatenpagina gaat.

Er worden niet letterlijk een miljoen resultaten verwijderd, het gaat er eerder om enkele honderden of duizenden. Het idee is om juist die obscure sites weer te herontdekken en niet weer op dezelfde grote (media)sites uit te komen. Volgens bedenker Sanjay Arora laat de site je weer een heel ander internet zien dan wat we tegenwoordig gewend zijn door de Google-lens.

MillionShort hanteert in dit filmpje de Microsoft-aanpak en houdt gebruikers MillionShort- en Google-resultaten voor. Raadt eens welke iedereen kiest?

5. Vragen beantwoorden

Weer een trucje dat Google inmiddels toepast (zoals "12 USD = EUR" voor de berekening van 12 dollar naar euro's tegen de huidige wisselkoers) is het antwoord geven op vragen.

Semantische zoekmachines als Google proberen te achterhalen wat een gebruiker eigenlijk wil weten en de context daarvan. Een zoekmachine als Wolfram Alpha bekijkt een vraag en zoekt specifieke antwoorden, in plaats van een lijst van resultaten weer te geven.

Wolfram Alpha interpreteert vragen om bijvoorbeeld specifieke gegevens uit een kluwen van informatie te halen. Als je een Google vraagt wat het NBP van Nederland is, krijg je een aantal pagina's die het aanhalen. Vraag het aan Wolfram Alpha en de zoekmachine gaat kijken in diverse databronnen om het antwoord te geven.