Voorlopig beperkt Google Audio Indexing zich tot een aantal video's met toespraken van politici in de huidige Amerikaanse verkiezingscampagne. GAudi indexeert de gesproken taal en geeft die vervolgens als ondertiteling weer.

Deze tekst is uiteraard doorzoekbaar en gekoppeld aan de video. Een gebruiker kan zodoende eenvoudig ín een videotoespraak zoeken naar een bepaald woord, frase of volzin en meteen het zoekresultaat horen en zien.

Spraakdatabank

Spraakherkenningstechnologie als zodanig is verre van nieuw, er wordt al jaren aan geschaafd. Bekend voorbeeld is de dicteersoftware Dragon Naturally Speaking van Nuance. Spraakherkenning zit ook inmiddels ingebakken in Windows Vista en Mac OS X.

Daarnaast heeft Microsoft vorig jaar TellMe overgenomen, een bedrijf gespecialiseerd in spraakherkenning over de telefoon. Google heeft de afgelopen tijd eigenhandig een inhaalslag gemaakt om deze technologie onder de knie te krijgen. Het concern heeft in relatieve stilte een enorme spraakdatabank opgebouwd met een gratis en geautomatiseerde informatienummer 1-800-GOOG-411.

Potentie

Mountain View geeft er ook een eigen draai aan door de techniek nu los te laten op webvideo. Tot nog toe op een beperkt aantal zelf geselecteerde video's, maar duidelijk met de potentie om de snel groeiende videoberg op internet te kunnen indexeren.