Twitter draait in de backend nu op MySQL, dat onlangs samen met Sun is overgenomen door Oracle. Maar binnenkort zal de database worden vervangen door Cassandra.

Cassandra is een hybride non-relationele database die is ontwikkeld door Facebook en vervolgens open source is gemaakt. Nu is het een Apache-project. Net als bijvoorbeeld CouchDB, Hadoop, Voldemort en MongoDB is het een ‘NoSQL’ database, die dus geen gebruik maakt van de SQL taal.

In een interview met MyNoSQL legt Ryan King, een software engineer van Twitter, uit dat MySQL in combinatie met memcache steeds duurder wordt om te beheren. Er gaan te veel manuren in zitten om de groeiende hoeveelheid data bij te houden die ze bij Twitter moeten beheren. Daarom waren ze op zoek naar een systeem dat automatisch kan schalen.

Daarvoor hebben ze overwogen om de MySQL setup te veranderen, maar ook hebben ze gekeken naar allerlei andere databases. Uiteindelijk hebben ze gekozen voor Cassandra, dat als enige aan alle voorwaarden voldeed. De voornaamste daarvan waren dat er geen single point of failure is, dat het erg schaalbaar is en dat er een gezonde en productieve open source gemeenschap achter staat, aldus Ryan King.

Op den duur zal Cassandra MySQL helemaal gaan vervangen, maar op dit moment zijn ze bezig met het overzetten van de grootste, en daardoor moeilijkst te beheren database met tweets en retweets.

Bron: Techworld