Google ontdekt dat sommige processors een beetje onvoorspelbaar en zot zijn

Bits, bytes en duistere magie

Nieuwe processors zijn zo geavanceerd dat bepaalde kernen na verloop van tijd onvoorspelbaar kunnen worden. Dat betekent dat ze subtiele en onverwachte fouten maken, met vervelende gevolgen.

Wie denkt dat een computer een kil en logisch toestel is, dat strikt voorspelbaar functioneert op basis van de nullen en enen die de processor verwerkt, heeft nog niet zo veel tijd doorgebracht achter een pc. De ervaren rot weet dat er een combinatie van geavanceerde elektronica en duistere magie in het spel is, en dat bevestigt nu ook Google.

Onvoorspelbaar en gek

De internetgigant ontdekte na onderzoek in de eigen datacenters wat het mercurial cores noemt. Mercurial gebruikt Google hier onder de astrologische betekenis, waarbij bijgeloof suggereert dat mensen (of processors) geboren onder het teken onvoorspelbaar zijn.

De getroffen kernen zitten in gewone processors, die doorgaans al enkele kilometers op de teller hebben. Ze werken doorgaans goed, maar maken soms op een geheel onvoorspelbare manier willekeurige fouten tijdens berekeningen. Dergelijke rekenfoutjes leiden in het beste geval tot de crash van een programma of VM, maar kunnen in het slechtste geval heel vervelende gevolgen hebben.

Ransomware

Zo werd Google geconfronteerd met een wispelturige rekenkern die een onvoorspelbaar foutje maakte tijdens de encryptie van data. Zo ontpopte de CPU zich tot ransomware-specialist, aangezien de vreemde corruptie tijdens de encryptie ervoor zorgde dat enkel dezelfde specifieke kern de data nog kon recupereren. Datacorruptie is dan ook het gevaarlijkste gevolg van de eigenwijze rekenkernen.

Na uitgebreid onderzoek bleek dat de fout wel degelijk bij de processor lag, en dus niet bij een bug in de software. De fouten in kwestie lijken in zeldzame gevallen te ontstaan door slijtage. De impact van de leeftijd van een processorkern is de laatste jaren gegroeid met dank aan de steeds geavanceerdere technologie onder de motorkap. Google benadrukt dat de fouten losstaan van traditionele problemen bij processors, waarbij bitflips door kosmische straling tot corruptie leiden. Dat fenomeen is gekend en voor kritische workloads bestaan er oplossingen voor, zoals ECC-geheugen.

lees ook

Wat je moet weten over processors en nanometers

Transistors en interconnects op een CPU zijn vandaag zo klein dat ze vervelende kwantum-effecten in toom moeten houden. Omdat ze zo dicht aanleunen bij de grens van wat fysisch mogelijk is, lijkt het erop dat slijtage tot onvoorziene problemen leidt.

Moeilijk te detecteren

Het willekeurige karakter van de fouten is een probleem. Aangezien de kernen hun vreemde eigenschappen pas op latere leeftijd ontwikkelen en er geen lijn zit in fouten, kunnen CPU-bouwers ze niet detecteren wanneer de chips van de band rollen. Google pleit er nu voor om de problemen verder te onderzoeken en mechanismen te ontwikkelen die fouten kunnen voorkomen of toch minstens detecteren.

Google is trouwens niet de enige die met losgeslagen CPU’s werd geconfronteerd. Facebook rapporteerde een gelijkaardig fenomeen, al gingen de onderzoekers van het sociale netwerk niet verder opzoek naar de achterliggende oorzaak.

nieuwsbrief

Abonneer je gratis op ITdaily !
  • This field is for validation purposes and should be left unchanged.
terug naar home