AWS haalt GH200 Hopper binnen en lanceert ‘AI-microservice’ met Nvidia

AWS en Nvidia breiden hun samenwerking uit ter ere van re:Invent 2023. De nieuwste GPU’s van Nvidia komen als eerste naar de AWS-cloud, samen met onderliggende diensten voor het trainen van LLM’s.

AWS zette zijn vriendschap met Nvidia in de verf tijdens re:Invent 2023 door Jensen Huang uit te nodigen, tegenwoordig een graag geziene gast op technologiebeurzen. De Nvidia-baas kwam hoogstpersoonlijk aankondigen dat AWS de primeur krijgt om zijn nieuwste GPU’s te mogen aanbieden via de cloud. Dat is de Nvidia L40S, maar ook de nieuwe blikvanger uit het GPU-portfolio GH200 Hopper.

Het is leuk om over de nieuwste en meest krachtige GPU’s te beschikken, maar dat is slechts een deel van AI-puzzel. Zonder een stevige infrastructuur kunnen die GPU’s nu eenmaal niet draaien. AWS gaat daarom ‘ultraclusters’ opzetten waar klanten tot duizenden Nvidia-GPU’s tegelijk kunnen schalen. Bedrijven kunnen daarmee hun eigen AI-supercomputers ontwikkelen. Welke proporties dit kan aannemen, tonen AWS en Nvidia zelf in ‘Project Ceiba’, een supercomputer die meer dan 16.000 GH200’s telt, goed voor 65 exaflops aan rekenkracht.

Microservice voor AI

Nu je supercomputer klaar is voor gebruik, is het tijd om je AI-modellen te gaan trainen. Ook hier vinden Nvidia en AWS elkaar. AWS voegt, als eerste der grote cloudproviders, Nvidia’s DGX Cloud-dienst om AI-modellen te trainen toe aan zijn ecosysteem. DGX Cloud biedt voldoende capaciteit om modellen tot een biljoen parameters onder te brengen. Daarbovenop komen nog nieuwe EC2-instances op maat van Nvidia-GPU’s.

ChatGPT-concurrent Amazon Q algemeen beschikbaar

We hebben nu al een supercomputer en de benodigde capaciteit in huis. Het belangrijkste ingrediënt ontbreekt nog: data. AI-modellen hebben data nodig: kwaliteit is daarbij even belangrijk als kwantiteit. Je kan het al raden, ook hier hebben Nvidia en AWS wat op gevonden. Nvidia breidt zijn NeMo-platform uit met NeMo Retriever, een ‘AI-microservice’ binnen de AWS-cloud.

Deze microservice voegt een vleugje retrieval augmented generation (RAG) toe aan je nieuw ontworpen LLM. Dit is een technische term om aan te duiden dat de data die je gebruikt hebt afkomstig is van betrouwbare, externe bronnen. Volgens Huang is de combinatie van generatieve AI met RAG het perfecte recept om ‘killer apps’ te ontwikkelen. NeMo Retriever zal worden aangeboden via de applicatiemarktplaats van AWS.

Meer nieuws van AWS re:Invent 2023

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

AWS haalt GH200 Hopper binnen en lanceert ‘AI-microservice’ met Nvidia

Microservice voor AI

ChatGPT-concurrent Amazon Q algemeen beschikbaar

gerelateerd nieuws

nieuwsbrief