Cloudflare slaat mea culpa voor een globale internetstoring op 14 juli. Een DNS-configuratiefout zorgde voor een wereldwijde onderbreking van 62 minuten.
In de avond van 14 juli ging het licht plots uit voor menig website wereldwijd. De oorzaak bleek al snel bij Cloudflare te liggen, één van de grootste aanbieders van internetdiensten. Cloudflare geeft toe in een blogpost boter op het hoofd te hebben en veegt geruchten over een cyberaanval van tafel.
De storing werd veroorzaakt door een interne configuratiefout van een DNS-resolver. Hierdoor lagen alle websites die afhankelijk waren van die DNS-resolver er tijdelijk uit. Aangezien Cloudflare over de hele wereld klanten heeft, hebben storingen bij het bedrijf meteen een grote impact, zelfs al zijn ze maar tijdelijk.
62 minuten
De storing begon rond middernacht in onze tijdszone en eindigde exact 62 minuten later. Als gevolg van de uitval konden gebruikers geen DNS-queries uitvoeren, wat leidde tot onbereikbaarheid van bijna alle internetdiensten voor hen. De storing werd veroorzaakt door een eerdere misconfiguratie van systemen die verantwoordelijk zijn voor het adverteren van Cloudflare’s IP-adressen op het internet.
lees ook
Cloudflare stuit op grootste DDoS-aanval ooit: 7,3 Tbps in 45 seconden
Op 6 juni werd een wijziging aangebracht voor een nieuwe service die nog niet in productie was, maar die per ongeluk de prefixen van de 1.1.1.1-resolver omvatte. Op 14 juli werd een tweede wijziging doorgevoerd voor deze service, wat leidde tot een wereldwijde wijziging van de netwerkinstellingen. Dit resulteerde in het onbedoeld terugtrekken van IP-prefixen uit de Cloudflare-datacenters, waardoor de resolver onbereikbaar werd.
De impact op DNS-verkeer was onmiddellijk zichtbaar voor Cloudflare, waardoor de alarmbellen afgingen. Gelukkig bleef DNS-verkeer via DNS over HTTPS grotendeels onaangetast, omdat gebruikers in dat geval meestal de domeinnaam cloudflare-dns.com gebruiken in plaats van een IP-adres. Dertig minuten na ontdekking van het probleem was 77 procent van het getroffen internetverkeer weer hersteld, na 62 minuten was de fout volledig opgelost.
Mea culpa
Cloudflare slaat mea culpa en zegt verschillende maatregelen te hebben genomen om herhaling te voorkomen. De organisatie is van plan om verouderde systemen af te schaffen en geleidelijke, gecontroleerde implementaties te bevorderen. Dit moet de stabiliteit van de netwerkinfrastructuur verbeteren en toekomstige verstoringen minimaliseren.