Technisch naspeurwerk heeft uitgewezen dat een bug in de software van de ATM-nodes de grootste netwerkstoring ooit in Nederland heeft veroorzaakt. Dat bevestigt KPN desgevraagd aan Webwereld.

Falend register

"De oorzaak zat in een softwarefout", stelt KPN-woordvoerder Bram Oudshoorn onomwonden. "In de switches zit een registerfunctie die capaciteitsaanvragen verwerkt. Dat register wordt ook geacht dubbele en driedubbele aanvragen eruit te wieden, om overbelasting te voorkomen. Maar dat laatste werkte niet, dat deed 'ie niet."

Maandagavond 12 mei trad door dit mankement een overbelasting op in de ATM-backbone van KPN. Als één switch eenmaal overbelast raakt, dan reset die automatisch om zichzelf te 'genezen'. Maar daardoor wordt wel de opgebouwde (over)capaciteit van deze switch afgewenteld op andere nodes, die vervolgens als dominostenen omvielen, zo onderkent KPN.

Het gevolg is bekend: een dagenlange storing bij providers als XS4All, Telfort en Solcon, maar ook van umts-masten en pinbetaalautomaten.

Aanleiding nog onduidelijk

Waarom die overbelasting precies op dat tijdstip plaatsvond, kan Oudshoorn niet verklaren.

De suggestie dat KPN het ATM-netwerk 'te vol laat lopen' omdat het nog druk doende is met de transitie naar een All-IP-netwerk, wil er bij de zegsman niet in.

Dat het te maken zou kunnen hebben met de snelheidsverdubbeling die XS4All momenteel doorvoert bij al haar klanten, kan Oudshoorn niet met zekerheid uitsluiten. Vorige week verklaarde Simon Hania, technisch directeur van XS4All, echter in Radio Online dat deze snelheidsupgrade geen rol kan hebben gespeeld, omdat 'die zorgvuldig gepland is en gefaseerd wordt uitgevoerd'.

Uiteindelijk verhielp een 'gelukkige' firmware-update het probleem met de foutief verwerkte dubbele capaciteitsaanvragen van de switches. Het updaten en nadien herstarten van de nodes duurde nog verscheidene dagen, met steeds opnieuw netwerkstoringen, zij het beperkt en gecontroleerd.

KPN en Alcatel zwijgen

Over de leverancier van de ATM-switches met de onvolkomen software geeft KPN aanzienlijk minder openheid van zaken. Sterker nog, het houdt angstvallig de kaken op elkaar. "Daar doen we helemaal geen mededelingen over. Ik wil hierover dan ook niets ontkennen of bevestigen", aldus Oudshoorn resoluut.

Uit andere bronnen blijkt echter dat het om apparatuur van Alcatel-Lucent gaat. KPN gebruikt netwerkapparatuur van verschillende fabrikanten, waaronder Cisco, maar de ATM-nodes zijn 'voor zover ik weet van Alcatel', zo bevestigt een medewerker van de technische helpdesk van KPN Wholesale desgevraagd.

Eerder vertelde een woordvoerster van KPN zelf ook al dat technici van Alcatel-Lucent samen met het calamiteitenteam van KPN druk bezig waren de megastoring te verhelpen.

Een woordvoerster van Alcatel ontkent niet dat het nauw betrokken was bij het verhelpen van de KPN-storing, maar wil over mogelijke softwarefouten in switchapparatuur niets kwijt. De zegsvrouw geeft aan dat 'is afgesproken met KPN dat alleen zij hierover de woordvoering doen'.

De woordvoerster wil nog zeggen dat het bedrijf uiteraard haar verantwoordelijkheid zou nemen en meteen elders op de wereld haar gebruikte ATM-switches zou updaten en haar klanten informeren, mocht zo'n softwarebug zich voordoen.

Samen verder in All-IP

Dat KPN en Alcatel elkaar zo hoffelijk afdekken heeft een reden: de twee moeten nog langer door één deur. Want alhoewel het ATM-netwerk wordt uitgefaseerd, wordt KPN's voornoemde All-IP-netwerk juist uitgerold. En Alcatel-Lucent is hierbij een van de belangrijkste netwerkintegratoren.