Hoe Microsoft Azure in Noord-Europa tijdelijk onbereikbaar was door zomers weer

microsoft datacenter

Microsoft Azure kampte begin vorige week met een storing in regio Noord-Europa. Bijna 11 uur lang was een deel van de servers onbereikbaar omwille van een temperatuurprobleem. De oorzaak daarvoor was toen nog niet bekend, maar werd ondertussen door Microsoft uit de doeken gedaan.

“Op 19 juni 2018 ondervonden de Data Center Critical Environments-systemen in één van onze datacenters in Noord-Europa een toename van de temperatuur van de buitenlucht”, klinkt het in een statusrapport. Het datacenter voor regio Noord-Europa staat in Dublin, Ierland waar de temperatuur die dag tot een ongewone 23 °C klom.

Microsoft moest daarom extra inspanningen leveren om de interne temperatuur van het datacenter binnen de operationele specificaties te houden. Daarbij vond een storing plaats in de regelingssystemen in een beperkt gedeelte van het datacenter, wat leidde tot een onverwachte stijging van de luchtvochtigheidsniveaus.

Hardwarefalen

“Deze onverwachte stijging in luchtvochtigheidsniveaus in de operationele gebieden veroorzaakte in deze regio hardwarefalen bij meerdere Top of Rack (TOR)-netwerkapparaten en harde schijven die twee Storage Scale-eenheden ondersteunen”, legt Microsoft verder uit. Dat falen leidde tot latency- en communicatieproblemen tussen de servers, wat op zijn beurt de storing veroorzaakte voor klanten met gegevens op de getroffen hardware.

Hoewel de stijging in luchtvochtigheid snel werd geneutraliseerd, zorgde het hardwarefalen ervoor dat Microsofts datacentertechnici extra werk hadden om de diensten weer volledig te herstellen. Er wordt momenteel onderzocht of aanvullende klimaatregeling nodig is om gelijkaardige incidenten te voorkomen. Dat lijkt geen slecht idee: de temperaturen in Dublin zouden eind deze week stijgen tot een zwoele 26 °C.

Volgens een studie uit 2016 van het Ponemon Institute in opdracht van Vertiv, kan ongeveer 12 procent van de pannes in datacenters aan weersomstandigheden worden toegeschreven. Dat mocht ook Google in 2015 ondervinden toen data verloren raakte in het Belgische datacenter in Ghislain als gevolg van blikseminslag. De overige storingen worden door menselijke of mechanische fouten veroorzaakt.

nieuwsbrief

Abonneer je gratis op ITdaily !
  • This field is for validation purposes and should be left unchanged.
terug naar home