Om de hoge gebruiksdruk tijdens de pandemie te bolwerken, veranderde Microsoft hoe het omgaat met diensten en trafiek in Azure. De geleerde lessen kunnen ook in de toekomst handig blijken.
Bij de start van de pandemie werd Microsoft net als andere cloudproviders getroffen door een sterk groeiende vraag naar de beschikbare diensten. In het geval van Microsoft kwam de vraag naar capaciteit van twee fronten: enerzijds waren er de traditionele Azure Cloud-gebruikers, anderzijds zag Microsoft Teams een enorme groei in capaciteit. Om ervoor te zorgen dat alles zo goed mogelijk beschikbaar bleef, moest Microsoft heel wat procedures en configuraties vervangen.
Zo werd de capaciteit van de onderzeese kabel tussen de VS en Europa verdubbeld en ging Microsoft aankloppen met andere eigenaars van dergelijke infrastructuur voor nog meer bandbreedte. Op twee weken tijd werd de totale capaciteit verdubbeld.
Prioriteiten
Verder keken ingenieurs naar alle diensten die op Azure draaiden en gaven ze prioriteit aan essentiële services zoals Teams, Office, Windows Virtual Desktop, de Azure Active Directory Application Proxy en zelfs de Xbox-diensten. Binnen de week werd de extra capaciteit van Teams verspreid over regionale datacenters wereldwijd in een proces dat traditioneel maanden zou duren. Het team achter Microsofts Azure Wide Area Network voegde 110 terabits aan capaciteit toe in twee maanden. 12 nieuwe edge-sites verbinden voortaan de Azure-infrastructuur met die van lokale internetproviders.
Microsoft zocht verder naar extra efficiëntie, en verbeterde de verwerking van videostreams over een enkel weekend met tien procent. Interne Azure-workloads werden verspreid over andere datacenters om zo piekmomenten te vrijwaren. Gaming-gerelateerde zaken moesten plaats ruimen in sterk bevraagde datacenters in onder andere het VK en Azië.
Optimalisatie
Voor Teams koos Microsoft voor meerdere kleinere compute-clusters. Over het algemeen verhoogde Microsoft zijn flexibiliteit gebruikte cpu’s voor Microservices betreft. Optimalisatie van rekenkracht en geheugen in iedere regio was essentieel.
Een nieuwe routingstrategie moest de belasting van het netwerk dan weer onder controle houden. Door trafiek door verschillende regio’s te routen en Azure Front Door in te zetten, boekte Microsoft significante winsten.
Momenteel is Microsoft volop bezig met de fysieke capaciteit in zijn datacenters uit te breiden. Ingenieurs werken 24 op 24 aan de installatie van nieuwe hardware in de meest bevraagde regio’s, met daarbij inachtneming van de regels rond social distancing.
Containers
Voor de toekomst heeft Microsoft vooral geleerd hoeveel winst er te boeken valt door zaken anders te configureren. Voor Teams kijkt Microsoft concreet naar een uitrol op basis van containers en de Azure Kubernetes Service. De dienst draait momenteel op VM’s, maar dat kan efficiënter.
Over het algemeen is Microsoft Azure, net als andere publieke cloudinfrastructuur van onder andere Google en AWS, best goed overeind gebleven. Aanvankelijk waren er wel enkele problemen zoals met Teams in het begin van de Europese lockdowns, maar die werden gezien de situatie relatief snel verholpen. Snel hardware bijsteken was aanvankelijk immers geen optie, aangezien de eerdere uitbraak van Covid-19 in Azië een voelbare impact had op de logistieke ketting waardoor Microsoft naar eigen zeggen moest wachten op componenten.