Graph Search moet bezoekers van Facebook de mogelijkheid geven secure zoekopdrachten te doen in de data die door Facebook in de loop der jaren is verzameld. Maar naar nu blijkt gaat het maar met horten en stoten. De bèta die nu door Facebook wordt getest, blijkt te kunnen beschikken over veel te weinig rekenkracht in de datacenters van Facebook. Het omgaan met de enorme hoeveelheid informatie (Big Data) is moeilijker dan verwacht.

De IDG News Service, de nieuwsdienst van onder meer Webwereld, neemt als voorbeeld het vinden van een Japans restaurant in New York. Daar zijn er honderden van en hoe kan je daarvan de kwaliteit nu van te voren inschatten? Een poging daartoe is bijvoorbeeld te zoeken naar likes die door bezoekers vanuit Japan aan een dergelijk restaurant zijn gegeven. De restaurants moeten in ieder geval worden gewaardeerd door de Japanners zelf.

Sociale zoektocht is hels karwei

Maar een dergelijke 'social search' via Graph is een hels karwei, zo blijkt. De zoekmachine gaat eerst door de informatie van 100 miljoen Japanse gebruikers en moet in diezelfde seconde door alle pagina's heen die door die Japanners zijn geliked en daaruit de Japanse restaurants filteren. De zoektocht eindigt in slechts twee gevonden likes van Japanse restaurants terwijl er veel meer, wellicht honderden, moeten zijn, zeggen de technici van Facebook zelf.

De profielensite zal dus zijn gehele aanpak van Graph Search moeten omgooien. Zowel de uitvoering van de zoekopdracht als de hele hardware erachter moet worden verbeterd om zoekresultaten correct, volledig en binnen een aanvaardbare tijd (Facebook vindt een seconde al lang) te kunnen tonen.

Problemen met Big Data aanpakken

Facebook wil nu dit, en andere problemen met Big Data en Graph, op verschillende niveaus aanpakken. Zo kan de zoektechniek worden verbeterd via “query optimization", zodat bepaalde vormden van zoeken sneller en efficiënter kunnen worden uitgevoerd. In het voorbeeld van de Japanse restaurants kan de zoektechniek zo worden ingericht dat er eerst met de restaurants die geliked zijn wordt begonnen in plaats van met Japan te beginnen, en dan de likes te filteren op die van Japanners.

Verder wordt de hardware aangepakt. Zo wordt er flashgeheugen in de servers in de datacenters bijgestoken om de toename van het verkeer vanuit Graph Search aan te kunnen. “We moeten aan het werk in de datacenters, nieuwe hardware kopen met nieuw types servers om de berekeningen die Unicorn nodig heeft te kunnen bieden", zegt Doren Lassen, het technologische hoofd van het team achter Graph Search. Unicorn is de naam van de engine achter de zoekmachine.

De bètaversie van Graph wordt nu nog gebruikt door een beperkt aantal mensen in de Verenigde Staten die het van Facebook mogen uitproberen. Er kan gezocht worden naar mensen, plaatsen, foto's en interesses, maar daar wil facebook nog statusupdates en comments aan toevoegen.