Itdaily - Nvidia lanceert Nemotron 3 Super-model voor AI-agenten

Nvidia lanceert Nemotron 3 Super-model voor AI-agenten

Nvidia lanceert Nemotron 3 Super-model voor AI-agenten
Bron: Nvidia

Nvidia heeft Nemotron 3 Super gelanceerd, een open AI-model met 120 miljard parameters en een contextvenster van één miljoen tokens.

Met Nemotron 3 Super wil Nvidia inspelen op de groeiende vraag naar krachtige AI-modellen die inzetbaar zijn voor geavanceerde agentic systemen. Het model richt zich op multi-agent toepassingen en is ontworpen voor grootschalige automatisering, hogere efficiëntie en nauwkeurigheid in complexe workflows. Dankzij het open karakter kunnen organisaties het model vrij inzetten, aanpassen en optimaliseren voor hun eigen toepassingen.

Innovaties in architectuur en prestaties

Nemotron 3 Super gebruikt een hybride mixture-of-experts (MoE) architectuur waarbij slechts twaalf miljard van de honderdtwintig miljard parameters actief zijn tijdens inferentie. Hierdoor wordt tot vijf keer hogere doorvoer en tot twee keer hogere nauwkeurigheid gehaald ten opzichte van eerdere modellen. Mamba-lagen zorgen voor viervoudige efficiëntie in geheugen en rekenkracht, terwijl transformer-lagen geavanceerd redeneren mogelijk maken.

Daarnaast introduceert Nvidia de Latent MoE-techniek, waarmee vier experts tegelijk worden geactiveerd zonder extra kosten. Dankzij multi-token prediction kan het model meerdere woorden tegelijk voorspellen, wat resulteert in drie keer snellere inferentie. Op het Blackwell-platform draait het model in NVFP4-precisie, wat het geheugenverbruik verlaagt en inferentie tot vier keer versnelt ten opzichte van FP8, zonder verlies van nauwkeurigheid.

Toepassingen en beschikbaarheid

Bedrijven als Perplexity, CodeRabbit en Greptile integreren Nemotron 3 Super in hun AI-agenten voor zaken als zoeken, softwareontwikkeling en wetenschappelijke analyse. Industriële spelers zoals Palantir en Siemens passen het model toe voor automatisering in sectoren als telecom, cybersecurity en chipontwerp.

Het model is per direct beschikbaar voor bedrijven en ontwikkelaars via verschillende cloudplatformen zoals Nvidia’s eigen platform, Perplexity, OpenRouter, Hugging Face. Partners als Dell en HPE bieden het ook aan. Cloudproviders zoals Google Cloud, Oracle Cloud en binnenkort Amazon Web Services en Microsoft Azure ondersteunen het model ook.