Nvidia brengt eigen large language models naar enterprises

Nvidia geeft grote bedrijven de tools om aan de slag te gaan met complexe taalmodellen, om zo bijvoorbeeld chatbots te bouwen met geavanceerde functionaliteit binnen nichesectoren.

Op de digitale GTC 2021-conferentie introduceert Nvidia een set aan tools die grote bedrijven moet helpen om aan de slag te gaan met zogenaamde large language models (LLM). LLM’s zijn complexe AI-taalmodellen die computers helpen om op menselijke taal te reageren. Ze geven toepassingen een geavanceerd taalbegrip, niet alleen wat algemene spraak betreft maar ook in nichedomeinen.

Grootste LLM ter wereld

Concreet onthult Nvidia drie zaken, te beginnen met het Nvidia NeMo Megatron-framework om taalmodellen te trainen met biljoenen parameters. Megatron 530B is een LLM getraind binnen het raamwerk en kan getraind worden om met nieuwe domeinen en talen om te gaan. De Nvidia Triton Inference Server omdat tot slot software om met multi-GPU-servers snelle inferentie met de LLM’s te bolwerken. In combinatie met de juiste hardware duurt het zo minder dan een seconde voor een model taal geïnterpreteerd heeft en een antwoord kan bieden.

Het NeMo Megatron-raamwerk bouwt verder op het Megatron-Turing Natural Language Generation-model dat Nvidia begin oktober al introduceerde. Megatron 530B is volgens Nvidia het grootste aanpasbare taalmodel dat vandaag bestaat.

Hardware en inferentie

Het raamwerk en het LLM zijn ontworpen om te draaien op schaalbare infrastructuur met accelerators. Nvidia verwijst weinig verwonderlijk naar zijn DGX SuperPOD-hardware als basis voor de training. Die hardware combineert de strafste chips van Nvidia tot kleine HPC-modules, die organisaties kunnen combineren tot een groot AI-HPC-systeem.

Voor inferentie volstaat het volgens Nvidia om twee Nvidia DGX-systemen te combineren met de pas aangekondigde Triton Inference Serversoftware om de verwerking van data door het LLM tot minder dan een halve minuut te beperken.

Het model wordt momenteel al gebruikt door enkele Nvidia-klanten wereldwijd. Met Nvidia LaunchPad kunnen organisaties gratis expertise opdoen in de uitrol van grote taalmodellen. Verder stelt Nvidia zijn NeMo Megatron early access-programma open. De Triton-server is beschikbaar via de Nvidia NGC-catalogus.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nvidia brengt eigen large language models naar enterprises

Grootste LLM ter wereld

Hardware en inferentie

gerelateerd nieuws

nieuwsbrief