Met Impala kunnen bedrijven snel sql-query's uitvoeren op een Hadoop-stack. Cloudera bouwde de zoekmachine met een ontwikkelaar die het bedrijf twee jaar geleden wegkaapte bij Google. Daar werkt hij aan een soortgelijke database-zoekmachine die Google eerder dit jaar presenteerde in de nieuwe relationele database F1.

Hadoop komt naar bedrijven

Er zijn al eerder add-ons verschenen voor dataverwerker Hadoop waardoor er sql-query's kunnen worden toegepast op de database die verspreid is over een hoop verschillende systemen, maar deze zijn behoorlijk traag. Het kost systemen te veel tijd om versplinterde data te analyseren en dat maakt Hadoop-databases voor bedrijven minder interessant.

Impala biedt volgens Cloudera wel deze real-time analyse op ongestructureerde data. Het bedrijf denkt dat de zoekfunctionaliteit interessant is voor bedrijven, omdat de performance van Big Data-analyse sterk toeneemt. “Voor het eerst kunnen organisaties data verwerken op petabyteschaal", staat te lezen in een persbericht van het Cloudera.

Data sneller oppikken

Cloudera zit al diep in het groeiende Hadoop, behalve Facebook en Yahoo maken ook RIM, Expedia en Disney gebruik van de databasestructuur. Cloudera werkt nu ook samen met computerfabrikant Dell, die hoopt het snel verwerken van Big Data van Hadoop naar bedrijven te brengen.

Hadoop haalt stukjes van de databaseopslag op om een analyse uit te voeren. Andere add-ons proberen dit proces te versnellen door de metadata van de opgeslagen data te gebruiken om de juiste stukjes sneller op te pikken. Impala doet hetzelfde met zijn eigen code en is volledig compatibel met de metadata van andere add-ons. De software is open source onder een Apache-licentie.