Vorig jaar gesignaleerde problemen met de Blackwell B200-chips van Nvidia zijn nog niet van de baan. Een bug in het productieproces zou ervoor zorgen dat de AI-accelerators oververhitten.
De high-end Nvidia Blackwell B200-accelerators voor AI-training kampen met problemen. Dat rapporteert The Information en hoewel Nvidia ontkent, is het medium zeker van zijn stuk. De euvels hebben betrekking op dezelfde bug die eerder al voor uitstel zorgde.
Eerdere vertraging
In principe moesten de Nvidia B200-chips al in het laatste kwartaal van 2024 in volume van de band rollen. Een ontwerpfout strooide toen roet in het eten. Die fout werd gemaakt door Nvidia en had te maken met de manier waarom de B200-chips geïntegreerd worden door TSMC. Nvidia claimde eind oktober de fout opgelost te hebben.
Dat zou nu niet helemaal waar blijken. Blackwell-servers vertonen bugs die te maken hebben “met de manier waarop de chips verbinden”. Dat is een vage omschrijving en meer duidelijkheid is er op dit moment niet. Eerdere geruchten suggereerden dat het euvel te doen had met de integratie van de B200-chips via TSMC’s CoWoS-packagingsysteem. Zo’n probleem zou je kunnen omschrijven als verbindingsgerelateerd.
Te warm
Het resultaat ervan is meetbaar: de chips worden te warm. Dat brengt op zijn beurt weer instabiliteit met zich mee. The Information weet dat grote klanten waaronder Microsoft, Amazon, Google en Meta intussen ongeduldig worden. Zij zouden hun Blackwell-bestellingen teruggeschroefd hebben.
Nvidia rekent op miljarden aan inkomsten van de grote bedrijven die zich bezighouden met de training van LLM’s. Als de fabrikant Blackwell niet op de rails krijgt, kan die mislukking een financiële kater veroorzaken. Bovendien opent een misstap van Nvidia de deur voor AMD om met zijn Instinct-accelerators bij te benen. Zo ver zijn we echter nog niet.
Tot slot merken we op dat de Blackwell B200 er een unieke architectuur op nahoudt. De kans is klein dat de problemen van deze chip ook relevant zijn voor de pas aangekondigde RTX 50-reeks.