Nvidia introduceert prestatieverbeteringen voor DGX Spark in een nieuwe update.
Nvidia heeft tijdens CES 2026 een software-update aangekondigd voor DGX Spark, het compacte AI-workstation dat eind vorig jaar werd getoond onder de codenaam Project Digits. De update levert volgens Nvidia gemiddeld tot 2,5 keer betere prestaties op en breidt het platform uit met toegang tot de volledige AI Enterprise-softwarestack.
Focus op lokale AI-ontwikkeling
De DGX Spark is bedoeld als lokaal ontwikkelplatform voor AI-prototyping, GPU-versnelde softwareontwikkeling en het lokaal trainen en draaien van AI-modellen. Hoewel de rekenkracht vergelijkbaar is met die van een RTX 5070, onderscheidt het systeem zich vooral door zijn 128 GB geïntegreerd geheugen, dat volledig aan de GPU kan worden toegewezen.
Prestatiewinst vooral bij rekenintensieve taken
De prestatieverbeteringen zitten vooral in de rekenintensieve delen van AI-workflows, schrijft The Register. Nvidia zegt dat token-generatie bij LLM’s beperkt blijft door bandbreedte maar dat de update vooral de prefill versnelt. Daardoor is er minder tijd nodig tussen het invoeren van een prompt en het genereren van output.
De updates hebben verbeteringen voor onder andere TensorRT-LLM, PyTorch, Llama.cpp en Nvidia’s eigen inferentie-engine. Dat moet niet alleen LLM-inferentie verbeteren, maar ook workloads zoals fine-tuning en beeld- en videogeneratie.
AI Enterprise beschikbaar als abonnement
Nvidia brengt later deze maand zijn AI Enterprise-suite naar de DGX Spark. Die bevat frameworks, modellen en microservices voor de ontwikkeling en uitrol van AI-toepassingen. Normaal kost het pakket 4.500 dollar per GPU per jaar, maar Nvidia onderzoekt aangepaste prijzen voor Spark-gebruikers. Voor ontwikkelaars blijft de suite gratis, maar om applicaties en services in een productieomgeving te gebruiken is een betaald abonnement nodig.
