Nvidia NIM vereenvoudigt implementatie AI-modellen in ontwikkelingsomgeving

Nvidia kondigde op de GTDC 2024 Nvidia NIM aan, waarmee ontwikkelaars eenvoudig AI-modellen kunnen implementeren in hun bedrijfsomgeving.

Nvidia lanceerde op GTC 2024 Nvidia NIM, een nieuw softwareplatform waarbij generatieve AI-modellen eenvoudiger in ontwikkelingsomgevingen geïmplementeerd kunnen worden. Het is ontworpen om de kloof te verkleinen tussen enerzijds de complexe wereld van AI-ontwikkelingen, anderzijds de operationele behoeften van bedrijfsomgevingen.

AI-containers

Nvidia omschrijft NIM als “een reeks geoptimaliseerde cloud-native microservices die zijn ontworpen om de time-to-market te verkorten en de implementatie van generatieve AI-modellen overal te vereenvoudigen, op cloud-, datacenter- en GPU-versnelde werkstations.”

NIM omvat het softwarewerk dat Nvidia gedaan heeft rond inferentie en optimalisatie van modellen. Vervolgens wordt die capaciteit toegankelijk gemaakt door een bepaald model te combineren met een geoptimaliseerde inferencing-engine. Die gaat vervolgens alles in een container verpakken waardoor het als microservice toegankelijk wordt.

*NVIDIA NIM is een gecontaineriseerde inferentie-microservice inclusief industriestandaard API’s, domeinspecifieke code, geoptimaliseerde inferentie-engines en enterprise runtime*

Normaal zou het ontwikkelaars weken tot maanden kosten om soortgelijke containers te op te zetten, in het beste geval wanneer er AI-talent in het bedrijf aanwezig is. Met NIM biedt Nvidia kant-en-klare AI-containers waarin de hardware als fundamentele laag gebruikt wordt en de microservices als kernsofwarelaag toegevoegd worden.

Ondersteuning NIM

NIM ondersteunt diverse AI-modellen zoals communitymodellen, Nvidia AI Foundation-modellen en aangepaste modellen geleverd door Nvidia-partners, en dit voor gebruiksscenario’s in meerdere domeinen. Hieronder vallen grote taalmodellen, visuele taalmodellen, maar ook modellen voor spraak, afbeeldingen, video, 3D en veel meer.

Nvidia dropt met Blackwell-GPU 1.200 watt-bom op de AI-wereld

Ontwikkelaars die de nieuwste generatieve AI-modellen willen testen, kunnen dat doen met behulp van door Nvidia beheerde cloud-API’s uit de Nvidia API-catalogus. Een andere optie is om de modellen zelf te hosten door NIM te downloaden en met Kubernetes te implementeren.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nvidia NIM vereenvoudigt implementatie AI-modellen in ontwikkelingsomgeving

AI-containers

Ondersteuning NIM

Nvidia dropt met Blackwell-GPU 1.200 watt-bom op de AI-wereld

gerelateerd nieuws

nieuwsbrief