‘De mijne is sneller’: Nvidia en AMD goochelen met benchmarkcijfers voor accelerators

AMD beweert dat zijn Instinct MI300X-accelerator minstens evenwaardig is aan de Nvidia H100 en staaft dat met cijfers. Nvidia van zijn kant vindt die cijfers foutief en claimt veruit de snelste kaart te hebben, zolang je je workloads maar zodanig optimaliseert dat ze enkel op Nvidia-hardware kunnen draaien.

Eerder deze maand kondigde AMD de officiële beschikbaarheid van zijn Instinct MI300-reeks van accelerators aan. De Instinct MI300X is een rechtstreekse concurrent voor de Nvidia H100 en presteert volgens AMD minstens even goed. Bovendien heeft de kaart van AMD zoveel geheugen aan boord dat je er het volledige Llama2-model met z’n 70 miljard parameters in kan proppen, zodat inferentietaken met dergelijke grote LLM’s met één GPU mogelijk zijn. Tijdens de lancering deelde AMD cijfers die aangeven dat de eigen kaart tot wel 1,6 keer beter presteert dan die van Nvidia in bepaalde workloads.

Appels, peren en eieren

Bij Nvidia schoten ze in een kramp. Het bedrijf is het niet gewoon om uitgedaagd te worden aan de bovenkant van het winstgevende AI-segment, en is het niet eens met de analyse van AMD. Op naar eigen tests dus, waaruit moet blijken dat niet de MI300X, maar de H100 de absolute kampioen is.

Eén en ander hangt af van wat je precies wil meten en hoe, maar Nvidia hamert vooral op optimalisatie. Volgens de fabrikant heeft AMD tijdens zijn tests de workloads niet geoptimaliseerd voor de H100. Met optimalisatie schieten de prestaties van de Nvidia H100 de hoogte in. Nvidia zet de cijfers vervolgens tegenover de data van AMD, en kiest er uiteraard voor om geen equivalente optimalisaties op de AMD-kaart uit te voeren.

Intussen liggen er appels, peren en wat eieren in de grote vergelijkingsbak en kan je vergeven worden om de hele saga verticaal te klasseren. Dat lijkt geen slecht idee, al delen we graag toch enkele bedenkingen. Zo kiest Nvidia ervoor om workloads te optimaliseren voor TensorRT-LLM met het FP8-datatype. De H100 is gebouwd om optimaal te presteren onder die omstandigheden.

AMD’s GPU is echter geoptimaliseerd voor vLLM, dat geen FP8 ondersteunt maar enkel FP16. Het is een geldige afweging om voor inferentie de precisie te verlagen van FP16 naar FP8 en dat brengt per definitie een enorme prestatiewinst mee, maar het zegt weinig over de kracht van de ene accelerator tegenover de andere.

Nuance en optimalisatie

Wanneer Nvidia testworkloads volledig optimaliseert voor zijn eigen ecosysteem, is het resultaat natuurlijk beter. Het is dan maar eerlijk dat AMD dezelfde optimalisatie mag voorvoeren via vLLM op zijn kaart. In dat geval blijkt (volgens AMD) opnieuw dat AMD’s kaart beter is.

De hele sage illustreert vooral dat de AMD Instinct MI300X en de Nvidia Hopper H100 best verschillende stukken hardware zijn. Met de lanceringsbenchmarks ben je vermoedelijk niet zo veel. Het lijkt er op dat beide GPU’s krachtpatsers zijn met verschillende sterktes. De juiste keuze zal sterk afhangen van de workloads die voor jouw belangrijk zijn en de manier waarop je die wil draaien. Dat genuanceerde antwoord past natuurlijk niet zo goed in een catchy marketingfolder.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

‘De mijne is sneller’: Nvidia en AMD goochelen met benchmarkcijfers voor accelerators

Appels, peren en eieren

Nuance en optimalisatie

gerelateerd nieuws

nieuwsbrief