Nvidia toont nieuwe GPU’s om inferentie-honger van nieuwe AI-modellen te stillen

Nvidia introduceert nieuwe GPU’s die geoptimaliseerd zijn om eerder ontwikkelde AI-modellen op een efficiënte manier te gebruiken. Dat is met de razendsnelle democratisering van complexe AI-functionaliteit broodnodig volgens het bedrijf.

Training van nieuwe AI-modellen vergt enorm veel GPU’s, en dan moet je de dingen nog in gebruik nemen. Microsoft alleen al ondersteunde OpenAI in het trainingsproces van zijn GPT-model met een AI-supercomputer in de cloud die bestaat uit tienduizenden GPU’s. Om de functionaliteit van GPT-4 nu effectief naar gebruikers te brengen in de vorm van producten, zal Microsoft nogeens honderdduizenden GPU’s uitrollen over al zijn verschillende datacenterregio’s, weet Nvidia. “En dat is maar één klant.”

Een getraind AI-model gebruiken, dat heet inferentie. Inferentie is een stuk minder GPU-intensief dan training, maar gebeurt op veel grotere schaal. Wanneer duizenden mensen tegelijk met ChatGPT praten, dan zijn dat duizenden inferentie-workloads die gelijktijdig moeten draaien. Nu AI-functionaliteit op grote schaal beschikbaar komt, is er volgens Nvidia nood aan hardware om die ambitie te ondersteunen.

Nvidia L4

Op GTC 2023 introduceert CEO Jensen Huang daarom de Nvidia L4 en de Nvidia H100 LVL. De Nvidia L4 is een accelerator speciaal ontwikkeld om efficiënt inferentie uit te voeren op videostreams. De GPU neemt slechts één slot in beslag en is zo best compact. Daardoor past die in iedere server, klinkt het enthousiast.

De GOU zou AI-video zo’n 120 keer vlotter verwerken dan servers met enkel CPU’s. Verder is de chip vier keer sneller dan de vorige generatie van Nvidia-accelerators. Voor generatieve AI-workloads gericht op beeldcreatie is dat 2,7 keer efficiënter. Google zal servers met de kaart in early access aanbieden in zijn cloud en ook klassieke fabrikanten hebben al hardware op de planning staan.

Nvidia H100 NVL

De Nvidia H100 NVL is een Hopper-gebaseerde inferentie-accelerator geoptimaliseerd voor Large Language Model (LLM)-inferentie, zoals praten met ChatGPT. Waar de L4 een relatief bescheiden component is, mogen we de H100 NVL gerust een krachtpatser noemen. Het ding combineert twee GPU-chips met 188 GB HBM3-geheugen, geconnecteerd via NVLink.

De doorvoercapaciteit van dit nieuwe product moet zo’n twaalf keer groter zijn dan bij de Nvidia HGX A100. Vergeleken met de klassieke Nvidia H100 PCIe is de H100 NVL zo’n, 2,5 keer krachtiger. Over beschikbaarheid weten we nog niets.

Nvidia laat in de marge nog weten dat zijn BlueField-3-DPU ook in productie is. Die is niet gericht op AI-workloads an sich, maar accelereert de netwerkcomponent van servers en zorgt zo voor optimalisering.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nvidia toont nieuwe GPU’s om inferentie-honger van nieuwe AI-modellen te stillen

Nvidia L4

Nvidia H100 NVL

gerelateerd nieuws

nieuwsbrief