Hardwaregigant Nvidia heeft met NVLM 1.0 een nieuw open source AI-model gelanceerd. Het LLM is gebaseerd op een andere versie met 72 miljard parameters.
Het nieuwe multimodale LLM (Large Language Model) van Nvidia zet sterke prestaties neer op vlak van complexe visie-taaltaken. In AI-benchmarks haalt NVLM 1.0 op tekstueel vlak niet de eerste plaats. Afbeeldingen verwerkt het model wel heel goed. Onderzoekers toonden voorbeelden waaruit blijkt dat het model afbeeldingen kan analyseren en complexe wiskundige problemen stap voor stap kan oplossen.
Na multimodale training verbetert de prestatie van tekstuele prompts, terwijl die bij veel andere modellen achteruit gaat.
Nieuw hoofdstuk in AI-ontwikkeling met open model
Volgens Venturebeat willen ze de strijd aangaan met marktleiders met gesloten modellen zoals GPT-4o van OpenAI of Claude 3.5 van Anthropic. Het feit dat Nvidia zijn parameters (model weights) en binnenkort ook de training codes publiek maakt, geeft onderzoekers en ontwikkelaars de volledige toegang tot geavanceerde technologie. Kleinere organisaties of bedrijven kunnen zo efficiënter onderzoek doen naar AI. Het mag alleen niet commercieel gebruikt worden.
Die beslissing van Nvidia om alles open te leggen, zou AI-onderzoek significant kunnen versnellen. Het hoopt hiermee de concurrentie ook richting volledige transparantie te dwingen. Dat zou de innovatie en samenwerking alleen maar ten goede komen.
Anderzijds kan je je ook vragen stellen bij zoveel openheid. Zo’n krachtige en vooral toegankelijke AI kan ook snel in de verkeerde handen vallen, en dat roept ethische kwesties op. De impact van Nvidia’s beslissing zal de komende weken en maanden duidelijk worden.