De storing is vorige week woensdag begonnen en trof naast de gratis maildienst Outlook.com ook andere online-diensten van Microsoft. Naast de opvolger voor het oude Hotmail zijn ook cloudstorage SkyDrive en Windows' cloud-adresboek Peoples geraakt.

Cachingfout leidde tot 'mobiele DDoS'

De oorzaak zat in een cachingdienst van Exchange ActiveSync (EAS), Microsofts gepatenteerde protocol voor synchronisatie van mobiele apparaten met mail, agenda's en contactgegevens opgeslagen op Exchange-servers. Het cloudcomponent voor tijdelijke data-opslag (caching) had last van uitval wat mobiele apparaten een storingsmelding opleverde waarna die devices constant probeerden opnieuw verbinding te maken.

Die herhaalde connectiepogingen hebben een stortvloed aan verkeer opgeleverd die Microsofts clouddiensten niet goed aankonden. Dit meldt het bedrijf in het probleemrapport waarin het ook zijn excuses aanbiedt. De stortvloed kwam neer op een DDoS (distributed denial of service) uitgevoerd door de mobiele apparaten van de eigen gebruikers.

Deels snel opgelost, deels niet

"Om de algehele maildienst te stabiliseren, hebben we tijdelijk toegang tot Exchange ActiveSync geblokkeerd. Dit zorgde ervoor dat we toegang tot Outlook.com via het web konden herstellen, en de sharing-functies van SkyDrive." Terwijl de gedeeltelijke uitval van Outlook.com en de Peoples-app in de loop van woensdag waren opgelost, gold dat niet voor de problemen met SkyDrive en voor mobiel gebruik.

De storing ijlde nog dagenlang na voor die twee laatstgenoemden, meldt Webwerelds Amerikaanse zustersite Computerworld.com. Met zondag nog een kleine 'naschok'. SkyDrive had kuren tot donderdag. Hierdoor konden gebruikers geen bestanden mailen die opgeslagen waren bij die clouddienst van Microsoft. Ook toegestuurde mails met links naar SkyDrive-bestanden (in plaats van attachments) hadden problemen.

Na-ijlen door backlog

Mobiele toegang tot maildienst Outlook.com had nog zeker tot zaterdag last. De storing gold niet over de hele breedte voor alle gebruikers. Microsoft zelf spreekt in de storingsmeldingen van "een klein percentage van mobiele gebruikers". Het is niet bekend hoeveel procent van de vele tientallen miljoenen gebruikers dit is.

De oorzaak voor het na-ijlen was dat er nog een grote, en nog groeiende, backlog aan EAS-verzoeken was, van mobiele apparaten. "Om nog een overstroming aan verkeer te voorkomen, moesten we toegang tot Exchange ActiveSync geleidelijk herstellen." Dat betekende dat sommige klanten langere tijd last hadden van de storing.