De opvolger van het R1-model zal nog even op zich moeten laten wachten.
Volgens twee anonieme bronnen van The Information zet een tekort van Nvidia-GPU’s een rem op de productie van het R2-model van DeepSeek.
R2 laat op zich wachten
Enkele maanden geleden verbaasde het Chinese DeepSeek de AI-wereld met zijn R1-model, getraind op vijftigduizend Hopper Nvidia-GPU’s. 10.000 daarvan waren H100 chips, nog eens 10.000 H800 chips en 3.000 H20 chips. Het model presteerde even goed als topmodellen aan een fractie van de kost. Al snel werd duidelijk dat de veiligheid te wensen overliet en het binnenwerk de gemoederen beroerde.
Sinds de exportbeperkingen door de VS naar China is het moeilijk om aan die H20-GPU’s te komen. Degene die al China zijn, worden volop gebruikt door klanten van DeepSeek. Het R1-model zou gebruikt worden door Chinese bedrijven en overheidsinstanties en daarom vermindert de H20-capaciteit bij DeepSeek zelf snel.
Waar blijft de oplossing?
Zonder extra rekenkracht kan het R2-model niet verbeteren en loopt ook R1 tegen problemen aan. Het gebruik groeit sneller dan de beschikbare chipvoorraad, wat voor mindere prestaties kan zorgen. Chinese alternatieven als Huawei blijken niet krachtig genoeg en werken niet met de CUDA-software van Nvidia.
Waar DeepSeek eerst nog furore maakte, lijkt het nu zijn momentum te verliezen in vergelijking met Amerikaanse rivalen als OpenAI en Anthropic.