De twee snelste supercomputers ter wereld worden gebouwd met AMD. Er lijkt geen dag voorbij te gaan zonder dat een cloudreus een nieuwe instance aangedreven door AMD Epyc lanceert. Wie waar voor z’n geld wil in een desktop, kijkt al helemaal niet meer naar Intel. Bouwt team rood vandaag betere processors dan team blauw?
AMD, de David tegenover Intels Goliath, werd een decennium geleden genadeloos vertrappeld door oneerlijke marktpraktijken van de gigant. Het bedrijf sukkelde in een underdogpositie waaruit geen ontsnappen mogelijk leek, tot AMD in 2017 een eerste steen richting Intels hoofd katapulteerde met de introductie van de Zen-architectuur en Ryzen. Er zijn films gebaseerd op slechtere scripts.
Kijk je vandaag naar desktops, dan is er geen ontkomen meer aan. Intel heeft geen verhaal tegen de chips van AMD. Het team van CEO Lisa Su biedt consequent meer rekenkernen, gelijkaardige of hogere kloksnelheden en meer cachegeheugen aan significant minder geld.
Epische opkomst
Hetzelfde is waar voor Epyc. Epyc is AMD’s wapen tegen de Xeon-serverchips van Intel. Opnieuw staat een lagere total cost of ownerchip vergeleken met Intel voorop. Bedrijven of cloudproviders betalen minder voor eenzelfde hoeveelheid kernen met een gelijkaardige kloksnelheid, wat in het geval van die laatste de kost van instances verlaagt. Ook OEMS springen gretig op de kar. Wil dat zeggen dat AMD Intel op de knieën heeft, zelfs in serverland waar Santa Clara historisch gezien een bijna-monopolie heeft?
Bedrijven of cloudproviders betalen minder voor eenzelfde hoeveelheid kernen met een gelijkaardige kloksnelheid.
Ja, maar toch ook niet helemaal. “Je kan niet meer rond AMD”, zegt Rick Koopman, Technical Leader High Performance Computing bij Lenovo. Hij bekijkt de chips van AMD vanuit een HPC-standpunt. In de wereld van de supercomputers wordt hardware optimaal benut met een variëteit aan zware en unieke workloads die de voor- en nadelen van een architectuur naar voren laten komen.
Geheugencentrische workloads
“AMD is erg goed bij specifieke types van workloads”, bevestigt hij. “Denk aan simulaties voor vloeistofdynamica, structurele mechanica of andere taken waarbij communicatie met geheugen erg belangrijk is.” Die communicatie is dankzij het infinity fabric van AMD en de grote voorraden cache een grote troef, naast de hoeveelheid rekenkernen. “Bovendien zijn AMD-chips opgebouwd uit chiplets die met elkaar verbonden zijn via interconnects. Een 64 core-chip is eigenlijk een combinatie van vier 16-core-gpu’s en kan je vergelijken met vier processors op een multi socket-server. Dat brengt heel wat voordelen op het vlak van geheugencommunicatie met zich mee.”
Lees ook: GPU’s in het datacenter: achter de schermen van de revolutie
Communicatie tussen gpu-accelerator en cpu is een andere troef van de fabrikant, aangezien geen enkele andere partij beide onderdelen bouwt. In de HPC-wereld zorgde die samenwerking voor twee erg belangrijke contracten: AMD-hardware zal met El Capitan en Frontier ’s werelds eerste exascale-systemen aandrijven.
Meer kernen, meer GHz, maar minder IPC
Toch is daarmee het hele verhaal niet verteld. “AMD-chips leveren heel wat rekenkracht, maar eigenlijk is de architectuur niet zo bijzonder. De prestaties komen van de hoeveelheid rekenkernen die het bedrijf voorziet.” Koopman heeft het over de achilleshiel van de architectuur: de instructies per klokcyclus (IPC). Als consument kijk je vooral naar het aantal rekenkernen en de snelheid van die kernen. Een kern geklokt op 3 GHz kan drie miljard cycli per seconde doorgaan. Traditioneel is een Intel Xeon-kern echter in staat om per cyclus iets meer instructies te verwerken dat een AMD-kern, waardoor twee chips met evenveel kernen en een identieke kloksnelheid in GHz niet in iedere workload identiek zullen presteren.
De cijfers zijn hier in het voordeel van Intel. De eerste generatie AMD Epyc-processors onder codenaam Naples, die vandaag het meest prevalent zijn, hebben een IPC dat drastisch lager ligt dan dat van corresponderende Intel-chips. De tweede generatie Epyc-chips werd midden vorig jaar aangekondigd en wint vandaag aan belang in de markt. Met die Epyc Rome-chips en de Zen 2-architectuur haalde AMD de IPC met 50 procent naar omhoog vergeleken met de vorige generatie, maar Intel evenaren blijft nog steeds een uitdaging. Pas met de nog op til zijnde derde generatie van Zen zou AMD op Intelniveau komen met de instructies per klokcyclus.
Lees ook: Wat je moet weten over processors en nanometers
Dat betekent dat voor rekenwerk waar brute kracht de belangrijkste factor is, Intel-kernen altijd zullen winnen van eenzelfde hoeveelheid bij AMD. Bij meer traditionele workloads, zoals VM’s in een datacenter, maakt dat minder uit. Wie echter een HPC-workload wil draaien die een cpu dagenlang bestookt met instructies, klopt hier volgens Koopman nog steeds beter bij Intel aan. “Wat brute rekenkracht betreft, zijn Intel-chips gewoon een stuk krachtiger”, weet hij. Zo zijn Intel-chips voor heel wat general purpose HPC-toepassingen toch krachtiger dan AMD-processors.
Meten is weten
In de praktijk dicteert de workload welke chip het meest geschikt is en hoewel Koopman enkele belangrijke principes kan schetsen, geeft hij aan dat naast ervaring vooral benchmarken sleutel is om te ontdekken welke chip in een bepaalde HPC-installatie moet. Lenovo heeft in Stuttgart hardware staan van Intel en AMD waarmee het HPC-nodes simuleert en de workloads test waarvoor een klant een HPC-systeem wil. Zo ontdekt het bedrijf aan de hand van concrete cijfers welke chip van welke fabrikant ideaal is in een gegeven scenario.
Koopman: “Je kan wel naar grote lijnen kijken. Zaken zoals de bandbreedte van het geheugen, IPC, het aantal kernen en een hogere frequentie spelen mee. Je kan dan je projecties maken over de gevolgen van de specificaties voor performance en runtime en daarbij krijg je een baseline. Om echt te weten wat het beste werkt, moet je echter telkens benchmarken.”
Lees ook: Hoe wordt een HPC-installatie eigenlijk geboren?
In een praktisch systeem speelt er bovendien meer dan alleen de cpu. Wanneer er accelerators aan te pas komen, test Lenovo chips in combinatie met gpu’s van AMD en Nvidia en die samenwerking kan workload per workload nog verschillen geven. Het komt erop neer dat AMD ondanks de zichtbaar knappe cijfers en sterk geprijsde chips nog niet de koning van x86-land is, en al zeker niet voor HPC-toepassingen.
AMD is ondanks de knappe cijfers en sterk geprijsde chips nog niet de koning van x86-land.
Koopman ziet de processors wel aan belang winnen, maar Intel is allesbehalve uitgespeeld. Het is nu al duidelijk dat team blauw de voordelen van AMD’s chiplet-technologie gezien hebben en daar ook op zullen inzetten. Bovendien zit er een nodeverkleining voor Xeon aan te komen en de sprong naar 10 nm zal de verhouding tussen prestaties en elektriciteitsverbruik een stuk aantrekkelijker maken. Tot slot toonde Intel eerder al dat het niet vies is van een prijsdaling.
Wie wint?
Daarmee komen we terug op de originele vraag: heeft Intel AMD voorbijgestoken? Nemen we alle workloads in beschouwing, van consumer tot HPC, en kijken we ook naar de prijs, dan kunnen we ons ondanks de kanttekeningen niet van de indruk ontdoen dat AMD in het gros van de gevallen de beste keuze is. Dat vertaalt zich niet in brede beschikbaarheid, aangezien de marktdominantie bij Intel momenteel nog te groot is. Koopman toont aan dat klokcyclus per klokcyclus Intel vandaag nog de betere chips bouwt, maar die realiteit is maar belangrijk voor een deel van de workloads. Bovendien belooft AMD met Zen 3 de IPC opnieuw op te krikken.
We kijken in ieder geval uit naar de concurrentie tussen Zen 3 en de eerste 10 nm Xeon-chips. Een periodewinnaar kiezen is niet moeilijk: AMD stond drie jaar geleden virtueel nergens, en vandaag moeten we specifieke workloads analyseren om voordeel voor Intel te vinden. Het is duidelijk wie sinds 2017 de innovatie heeft gedreven en wie dringend moet wakker schieten.