Wat is CXL? Efficiënter geheugen en de toekomst van HCI

De Compute Express Link, CXL in de volksmond, kan de manier waarop servers en datacenters worden samengesteld voorgoed veranderen. De nieuwste processors van AMD en Intel ondersteunen de splinternieuwe standaard al. Wat maakt CXL precies mogelijk?

De nieuwste Epyc-datacenterprocessors van AMD ondersteunen CXL 1.1, net als de Xeon Sapphire Rapids-chips van Intel wanneer de fabrikant die eindelijk uit de stal gestampt krijgt. Tijdens de lancering van de Epyc Genoa kreeg CXL de nodige aandacht. Zowat alle grote spelers hebben hun gewicht achter de splinternieuwe standaard geschaard. CXL, kort voor Compute Express Link, heeft het potentieel om de standaard voor hyperconverged infrastructuur te worden en zo de samenstelling van moderne datacenters voorgoed te veranderen.

Veel enthousiasme voor CXL

CXL is eerst en vooral een open standaard. De technologie werd aanvankelijk vooral door Intel naar voren geschoven maar de standaard wordt sinds 2019 beheerd door het CXL Consortium. Daarin zetelt zowat iedereen die iets met microchips te maken heeft. Denk aan chipdesigners zoals AMD, Ampere, Intel en Arm, geheugenspecialisten zoals Samsung en Micron, serverbouwers waaronder Dell en HPE en cloudreuzen Microsoft, Google en Alibaba. Andere kleppers zoals IBM, Supermicro en Cisco verdienen eveneens vermelding. CXL wordt met andere woorden door de brede industrie gedragen.

AMD lanceert vierde generatie van datacenterchips: Epyc 9004 Genoa

De standaard staat niet helemaal op zichzelf maar is gekoppeld aan PCI Express. CXL Specificatie 1.0 zag in 2019 het levenslicht en is gekoppeld aan PCIe 5.0. CXL 3.0 werd deze zomer onthuld en is vergroeid met PCIe 6.0. Die associatie met PCIe suggereert het doel van de standaard al: CXL moet interconnectiviteit tussen hardwarecomponenten faciliteren op een ongezien verregaande manier.

Gedeeld geheugen

De eerste iteraties van het CXL-protocol richten zich op geheugen. De standaard geeft CPU’s toegang tot gedeeld geheugen, dat bijvoorbeeld ook toegankelijk is voor accelerators. De CXL-standaard garandeert coherentie in het cachegeheugen, zodat er geen problemen ontstaan met instructies in niet gedeeld L1-cache-geheugen.

CXL 1.1, dat vandaag al door Intel en binnenkort door AMD wordt ondersteund, maakt het zo mogelijk om extra geheugen aan een systeem toe te voegen via een PCIe-uitbreidingskaart. Dat PCIe-geheugen moet op het vlak van prestaties en latency natuurlijk een beetje onderdoen aan echt DDR5-geheugen, maar daar tegenover staat dat je servers plots van aanzienlijk meer geheugen kan voorzien op een veel meer flexibele manier.

Flinke besparing

CXL 2.0 biedt nog wat meer mogelijkheden. Die versie van de standaard maakt het mogelijk om een component aan een poule van CPU’s toe te voegen. Geheugen kan zo gedeeld worden door meerdere CPU’s in meerdere systemen. Onderzoek uitgevoerd door Amerikaanse universiteiten en Microsoft suggereert dat ongeveer de helft van alle geprovisioneerde virtuele machines geen gebruik maakt van de helft van het geheugen dat ze toegewezen kregen. Dat geheugen zit nu vast, toegewezen aan een VM die er geen interesse in heeft.

De helft van alle VM’s gebruikt maar de helft van het toegewezen geheugen.

Met CXL is het mogelijk om geheugen in een poule te stoppen en het dynamisch toe te wijzen. Zo komt ongebruikt geheugen vrij voor andere toepassingen. Het onderzoek wijst verder uit dat een poule van geheugen de hoeveelheid benodigd geheugen met tien procent naar omlaag kan halen. Als je dan weet dat DRAM verantwoordelijk is voor tot wel de helft van de totale kostprijs van een server, begint het nut van CXL plots duidelijk te worden.

HCI 2.0

Pas echt interessant wordt het wanneer we naar CXL 3.0 kijken. Op de implementatie van die standaard is het nog enkele jaren wachten, maar de verder doorgedreven specificatie laat de standaard evolueren van een handigheid voor meer geheugenefficiëntie naar de toekomstige norm voor HCI.

De Compute Express Link moet immers evolueren tot een totaalstandaard die CPU’s, geheugen en accelerators zoals GPU’s en FPGA’s met elkaar verbindt in een server of zelfs in een rack. Zo zouden GPU’s met elkaar kunnen praten zonder dat de CPU (of een DPU) daar voor iets tussen zit. Het idee is identiek aan HCI: op rackniveau moet het CXL-protocol bovenop PCIe 6.0 ervoor zorgen dat alle belangrijke componenten van een server binnen een poule beschikbaar zijn en op een snelle en coherente manier met elkaar kunnen praten.

Dat gebeurt op het niveau van het systeem zelf. Om optimaal te profiteren van CXL, is er software nodig. In principe is hier een rol weggelegd voor de hypervisor. Die kan dankzij de CXL-standaard de nodige resources voor een virtuele machine samenstellen uit de beschikbare componenten binnen een rack. Zo wordt al het geheugen optimaal gebruikt door één of meerdere CPU’s, gecombineerd met precies de hoeveelheid accelerators nodig voor de gedraaide workload.

Geduld

Daar zijn we nog niet. Voorlopig is CXL 1.1 de norm. Die standaard zal nog niet voor een aardverschuiving zorgen, maar laat fabrikanten, softwareboeren en cloudproviders al wel toe om de tenen nat te maken. Met CXL 2.0 volgen dan geavanceerdere geheugencentrische applicaties terwijl CXL 3.0 de deur echt wagenwijd opengooit.

De kern van de standaard blijft het gedeelde geheugen. Door dat via een open standaard gedeeld toegankelijk te maken voor CPU’s en accelerators, kunnen componenten samen werken. Dat staat in contrast met de architectuur van vandaag, waarbij CPU’s, GPU’s en FPGA’s typisch beroep doen op hun eigen geheugen en de verwerking van workloads via de CPU wordt aangestuurd.

Types en protocollen

Voor wie wat dieper wil graven, merken we nog op dat de CXL-standaard uit verschillende sub-protocollen, gericht op verschillende zogenaamde types van componenten.

Type 1-toestellen: dat zijn accelerators en Smart NIC’s die doorgaans geen lokaal geheugen ter beschikking hebben, en via CXL plots wel met het DDR-geheugen van de CPU kunnen praten.
Type 2-toestellen: dat zijn GPU’s, FPGA’s en ASIC’s met wel eigen DDR- of HBM-geheugen. Hier helpt CXL opnieuw om het CPU-geheugen lokaal toegankelijk te maken voor de accelerators. Andersom kan de CPU ook aan de slag met het geheugen van de componenten. CXL voorziet cache-coherentie.
Type 3-toestellen: Dit zijn geheugentoestellen die extra capaciteit voorzien los van het geheugen van CPU of accelerators. Denk hierbij aan het eerder vermelde uitbreidbaar geheugen via PCIe, dat de DDR-RAM-poule complementeert.

Compute Express Link zelf ondersteunt de combinatie van de verschillende types van toestellen via drie belangrijke protocollen.

CXL.io is het CXL-equivalent van de PCIe-standaard waarop CXL is gebouwd. CXL.io is de fundering van CXL.
CXL.cache is een gerichte toepassing die accelerators toegang geeft tot het geheugen van de host (CPU), inclusief cache en bijhorende cache coherency.
CXL.memory laat hosts toe om met extra geheugen van type 3-toestellen te praten.

CXL bouwt bovenop PCIe omdat die standaard een goede fundering biedt met een bestaand ecosysteem. PCIe 5 laat toe om alternatieve protocollen op de PCIe-laag te draaien, een beetje naar analogie met hoe de fysieke USB-C-interface ook Thunderbolt of DisplayPort ondersteunt.

CXL is zoals gezegd volop in ontwikkeling. De betrokken partijen hebben er belang bij de standaard tot een succes te laten uitgroeien. Dan kijken we zeker naar hyperscalers, waar besparingen in de grootteorde van tientallen procenten een enorme impact hebben op de efficiëntie van datacenters. Eer CXL doorsijpelt naar de bredere markt, is er software nodig, maar ook die zal ongetwijfeld organisch beschikbaar komen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.