Als IT-afdeling wil je snel aan verzoeken kunnen voldoen. Extra schijfruimte mag bijvoorbeeld niet pas na weken beschikbaar komen, maar in hooguit een uur of een paar uur. Bovendien is er niet veel tijd om de apparatuur aan te passen en te beheren. Daarom wil je dat beheer zo simpel en geautomatiseerd mogelijk maken. Dat verlaagt de beheerinspanning aanzienlijk. Maar daarvoor is het wel nodig dat je makkelijk en heel precies inzicht hebt in wat er in je datacenter gebeurt en misgaat.

Nimble, vorig jaar overgenomen door Hewlett Packard Enterprise (HPE), is een leverancier die wat dit betreft aan de weg timmert door alles te monitoren wat er te monitoren valt. Zeker bij storage is dit van belang, omdat het traditioneel gezien meteen ook het meest complexe onderdeel is van het datacenter. Aan de hand van dit voorbeeld kunnen we ook zien hoe de toekomst vorm krijgt.

Binnen een uur in de lucht

Frank Pruijs, Sales Manager Nimble Storage bij HPE, geeft zijn kijk op hoe het beheer aan de kant van IT-infrastructuur in het datacenter sterk vereenvoudigd wordt. Allereerst moet de installatie van apparatuur worden versimpeld, vindt hij, want die is vaak nog erg ingewikkeld. "Kies je voor een modern opslagsysteem, dan kost installatie en inrichting ineens nog maar een uur. Letterlijk. Terwijl dat bij traditionele storage systemen wel twee tot drie dagen kan duren."

Maar dat is nog slechts het begin. Het is vooral interessant hoe Nimble voor het beheer alles heeft geautomatiseerd wat er geautomatiseerd kan worden, onder andere door alles near real time te monitoren. Daardoor kunnen problemen al ruim van tevoren worden gesignaleerd en opgelost. Pruijs vertelt hoe dit precies in zijn werk gaat.

Automatische probleemanalyse

"In het storage systeem zitten duizenden hardware- en software-meetpunten, waarmee grote hoeveelheden metadata verzameld worden. Elke vijf minuten ontvangen wij een statusupdate. Dat is de heartbeat van de storage array waarop wij analyses uitvoeren."

Vervolgens wordt automatisch gesignaleerd of bijvoorbeeld de apparatuur te warm wordt, een bepaalde disk volloopt, of er geen stroom meer is. "Dat is nog maar de basis, want wij zien ook of bepaalde instellingen verkeerd staan. Dan maken we voor de klant een case aan. Dit is wat wij zien en zo los je het op. Heb je vragen, bel ons dan even."

Dat potentiële problemen al ver van tevoren gesignaleerd worden, komt de betrouwbaarheid van storage sterk ten goede. Pruijs vertelt dat maar liefst vijfentachtig procent van de cases automatisch verholpen wordt. Slechts in vijftien procent van de gevallen wordt een case door de klant aangemaakt. "Wat daarbij dan zeer gewaardeerd wordt, is dat je een level twee of drie engineer aan de lijn krijgt die meteen voor je gaat troubleshooten. Niet een level één medewerker die een standaard script afloopt."

Onderliggende oorzaak ontdekken

Maar storage staat niet op zichzelf en dus moet het beheer ervan worden geïntegreerd in het beheer van het hele datacenter. Juist als je de storage arrays integreert in bijvoorbeeld vCenter komen de grote voordelen aan het licht. " Bijna alle beheertaken kun je vervolgens regelen vanuit je centrale VMware omgeving. Je komt daardoor bijna nooit meer op de opslagapparatuur zelf," legt Pruijs uit. "Dankzij deze integratie kun je veel breder kijken. Want een vertraging in een applicatie blijkt in de praktijk vaak maar weinig met storage te maken te hebben."

Om vCenter-data mee te sturen met de heartbeat moet je vanzelfsprekend wel een opt-in geven. "Zodra we zien wat er in zowel vCenter als op storage-gebied gebeurt, kunnen we de echte onderliggende oorzaak ontdekken. Het blijkt dan bijvoorbeeld om netwerkvertragingen te gaan."

Inzicht in wat er in de volledige applicatiestack gebeurt is dus essentieel. "Apparatuur moet niet alleen snel zijn. Mocht er een keer een probleem zijn, dan moet je ook snel kunnen achterhalen waar het aan ligt. Voor dit inzicht gebruiken wij onze Info Sight technologie." Nu wordt dat nog alleen voor storage gebruikt, maar uiteindelijk is het de bedoeling deze technologie over het hele datacenter uit te rollen. "Via een SaaS-model en een portal kunnen klanten dan hun eigen omgeving bekijken. We laten alleen zien wat relevant is. De rest wordt door support gebruikt om te troubleshooten."

Self healing datacenter

Stapje voor stapje zijn we zo op weg naar een self healing datacenter, vertelt Pruijs tot besluit. "Nu maken wij nog een case voor de klant aan. Met dit zien wij en zo los je het op. In de toekomst krijg je denk ik een bericht met de vraag of wij het automatisch voor je mogen oplossen." Daar is wel enorm veel telemetrische data nodig.

"De ontwikkelingen zullen waarschijnlijk hetzelfde verlopen als nu bij autonome auto's. In het begin wil je je handen nog dicht bij het stuur houden, mocht het nodig zijn in te grijpen. Pas in een van de vervolgstappen wordt alles automatisch voor je gedaan en worden er snellere en betere beslissingen genomen dan wanneer mensen dat doen. Dat punt ligt nog wel ver in de toekomst."