Het direct publiceren van nieuwe content naar Google moet verlopen via PubSubHubBub, een soort push-versie van rss-feeds. Via PubSubHubBub (ook wel PuSH genoemd) kunnen gewone Atom- of rss-feeds direct verschijnen in de reader van de abonnee. De aanbieder van de content stuurt een signaal uit via een gewone feed maar stelt daarbij direct een tussenliggende hub op de hoogte, die kan het bericht dan direct doorsturen naar de abonnees.

PubSubHubBub is een open source codeproject van Google. De zoekmachinegigant gaat de technologie in de nabije toekomst gebruiken om nieuwe content direct in de index van de zoekmachine te laten verschijnen, zegt senior product manager Dylan Casey tegen GigaOM. Op dit moment indexeert Google het web via crawlers, softwarematige zoekrobots die alles naar de index trekken.

Real time indexeren

Via PubSubHubBub kunnen aanbieders hun content actief in de index zetten. In plaats van dat de servers van Google constant kijken of er nieuwe content is, komt de nieuwe content naar Google toe. Dat betekent dat Google gedeelten van het web realtime kan gaan indexeren. Het grootste probleem is hoe deze realtime zoekresultaten moeten worden weergegeven. Normaal wordt dat bepaald aan de hand van autoriteit van de site, die grotendeels afhankelijk is van andere sites die linken naar een bepaalde site.

Bij net gepubliceerde content is het moeilijk te bepalen wat de kwaliteit is, de kans op het indexeren van veel laagwaardige content of spam is groot. Het is dan ook nog onduidelijk wanneer de technologie klaar is voor gebruik.

Wordpress

Eerder deze week maakte Wordpress, een van de grootste bloplatforms ter wereld, bekend PubSubHubBub te gebruiken voor 10,5 miljoen blogs die worden gehost op Wordpress.com. Hierdoor is het mogelijk voor bloggers om hun nieuwe berichten realtime in rss-readers en op andere plekken te laten verschijnen.