Analyse van storing in een datacenter
Gepubliceerd: Dinsdag 7 juli 2009
Auteur: Sander van der Meijs
Van fouten kun je leren, en het liefst van die van anderen. In dat kader staat er nu een analyse online van wat er verkeerd ging bij de storing in het datacenter van authorize.net.
Op 2 juni werd er door een brand een grote stroomstoring veroorzaakt, waardoor een groot datacenter werd getroffen. In dat datacentrum werden de servers gehost van authorize.net. Gelukkig beschikte dat bedrijf over een volledige redundant backup faciliteit. Maar toch duurde het 11 uur in plaats van 11 seconden voordat hun site weer omhoog kwam.
Cory von Wallenstein van Dynamic Network Services was betrokken bij het oplossen van deze problemen. Hij heeft een anayse van de storing online gezet, waaruit veel mensen het een en ander kunnen leren.
Zo zal bij een redundant backup faciliteit bijvoorbeeld ook moeten worden gedacht aan een erg lage time to live bij een verandering in DNS. Als de TTL op 24 uur staat, dan wordt de nieuwe locatie niet snel gevonden. Maar dan moet je ISP zo'n lage TTL ook wel tolereren, en dat zal niet altijd het geval zijn. Zelf kun je DNS ook niet draaien, omdat DNS nog moet werken als je datacenter onderuit gaat.
Bron: Techworld
