Tips voor een betere server-uptime
Gepubliceerd: Maandag 29 november 2010
Auteur: John Edwards
Om een server draaiende te houden moet je zorgvuldig plannen, voorzorgsmaatregelen treffen en je gezonde verstand gebruiken. Een hels karwei, maar het loont de moeite.
Iedere beheerder stelt zich ten doel servers levend en wakker te houden, of ze tenminste op orde te hebben wanneer ze in actie moeten komen. Slechts weinig beheerders kunnen eerlijk zeggen dat zij er alles aan doen om de maximale server-uptime uit hun systemen te halen. Volgens deskundigen besteden veel beheerders onnodig veel tijd en budget aan technologieën en werkmethoden die weinig of geen invloed hebben op de uptime.
Het bereiken van een goede server-uptime is zowel een wetenschap als een managementvaardigheid, meent Walter Beddoe van Six Telekurs USA. "Het is een combinatie van veel verschillende zaken, zoals geschikt personeel, foutbestendige hardware, dynamische veiligheidsmethoden en goede onderhoud- en beheersmethoden. Je moet vooral vastbesloten zijn om je best te doen," aldus Beddoe.
Volgens Alan Howard, IT-baas van Princeton Radiology, zouden managers geen geld en tijd moeten verspillen aan activiteiten en tools die niet rechtstreeks bijdragen aan verbetering van de uptime. Zo is server clustering "tamelijk zonde van je tijd", zegt hij. Niet-geautomatiseerde clustering, waarbij de synchronisatie handmatig gebeurt, kan meer problemen opleveren dan dat het wat opbrengt, waarschuwt Howard. "Eén foutje van een primary node kan catastrofale gevolgen hebben."
Zo had Howards bedrijf een Windows Server cluster die bij een failover een toepassing liet vastlopen, omdat de wijziging van het configuratiebestand niet was doorgevoerd voor de stand-by server. "Het kostte veel meer moeite de oorzaak van die crash te herstellen dan de oorzaak van de fout in het knooppunt op te lossen," merkte Howard.
Zijn afdeling voorziet niet langer in geclusterde servers op traditionele wijze. In plaats daarvan heeft hij een cluster van stand-alone servers (verbonden met een dual-controller Compellent Storage Center SAN), "waaraan we indien nodig zonder problemen virtuele machines kunnen toevoegen".
Plannen
De meeste beheerders weten dat zorgvuldig plannen noodzakelijk is als je een betrouwbaar systeem wilt hebben. Van de aanschaf van een server tot het beheer en de vervanging ervan: alles moet worden gepland.
Volgens Raoul Gabiam van de George Washington University is levensduurmanagement een belangrijk onderdeel van de planning voor server-uptime. "Je moet weten wanneer en hoe je hardware vervangt en software upgradet, aangezien dat de prestaties, betrouwbaarheid en uptime beïnvloedt."
Als je bijvoorbeeld software moet upgraden, is het van groot belang dat je van te voren uitzoekt of je huidige hardware de upgrade wel aankan. Het kan nodig zijn de software-upgrade te combineren met een hardeware-upgrade om aan de vereisten te voldoen en verdere uitval te voorkomen, of je kunt eerst het een en dan het ander doen als je niet teveel verandering tegelijk wilt, adviseert Gabiam.
Door standaardisatie en coördinatie verzeker je je van betrouwbare serverprestaties, meent Gabiam. "Voordat iemand iets installeert of wijzigingen doorvoert, moet er een ander beheerproces komen." Dat betekent dat je moet weten "hoe alles staat ingesteld en opgesteld en dat je de veranderingen moet evalueren voordat ze zijn doorgevoerd," legt Gabiam uit. "Op die manier weet je altijd hoe alles samenhangt en hoe het hoort te werken."
Volgens Gabiam maakt verandermanagement het mogelijk te voorspellen hoe servers reageren als ze op een andere manier worden geconfigureerd of als ze in een andere omgeving worden gebruikt.
Paul Franko, CTO van Online Resources, is van mening dat je houding ook belangrijk is. Hij zorgt er bewust voor dat routineuze maar ingrijpende servertaken altijd serieus worden genomen en goed worden aangepakt. "We hebben een systeem opgezet met checks and balances, zodat we zeker weten dat onze beleidsregels worden opgevolgd," zegt Franko. Regelmatig controleren managers het werk van medewerkers en er zijn ook dubbele controles om menselijke fouten te voorkomen. "Vergissen is menselijk en als je niet verschillende controlepunten hebt, dan kan het mislopen," legt hij uit.
De rubriek Tips & Tools biedt praktische informatie die IT-professionals in hun dagelijkse werk kunnen toepassen.
