IP-adres WAN-router verantwoordelijk voor storing Microsoft-diensten

Microsoft

De grote panne die de diensten van Microsoft vorige week trof, was het gevolg van een veranderd IP-adres bij een enkele router.

Vorige week waren tal van diensten van Microsoft een tijdlang moeilijk of niet bereikbaar. Toepassingen van Microsoft 365, Azure, GitHub en zelfs LinkedIn waren getroffen. In sommige gevallen konden werknemers een halve dag niet aan hun bestanden. Microsoft laat nu weten hoe de panne kon gebeuren.

WAN-euvel

Volgens de cloudreus lag de oorzaak bij het Wide Area Network (WAN) van Microsoft. Eén WAN-router moest zoals gepland van IP-adres veranderen, maar het commando daartoe noopte het toestel om een kettingreactie te starten waarbij het alle andere routers in de WAN contacteerde. Die begonnen daarom hun adjecency en forwarding tables opnieuw te berekenen. Die lijsten bevatten cruciale informatie over de plaats van een toestel in het netwerk. Tijdens de herberekening konden de routers netwerktrafiek niet correct forwarden en bereikte legitiem verkeer zijn bestemming niet.

Microsoft geeft aan dat het gegeven commando verschillend gedrag uitlokt bij verschillende netwerktoestellen. In dit geval is de instructie onvoldoende gevalideerd voor ze naar de WAN-router in kwestie werd gestuurd. Bij een ander type toestel zou de instructie met andere woorden niet noodzakelijk hetzelfde effect hebben.

Betere controle in de toekomst

De problemen startten om 7u12 UTC. Het duurde tot 12u43 UTC om het WAN opnieuw te herstellen naar de optimale configuratie. In de toekomst gaat Microsoft extra nauwkeurig kijken naar impactvolle commando’s voor die effectief verstuurd worden, in een poging een herhaling van het incident te voorkomen. Hoe de persoon die op de enter-toets heeft geduwd en daarmee het netwerk onderuit heeft gehaald zich nu voelt, lezen we nergens.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.
terug naar home