Nieuwe Nvidia Blackwell-GPU’s kampen met ontwerpfout

De eerder aangekondigde Nvidia Blackwell B200-accelerators lopen enkele maanden vertraging op, omwille van een designfout.

Nvidia zal de lancering van zijn superkrachtige Blackwell GB200-GPU’s noodgedwongen met enkele maanden uitstellen. De Blackwell GB200 volgt de familie van Nvidia Hopper-accelerators op, en moet een thuis vinden in HPC-clusters die nieuwe grote AI-modellen zullen trainen. De GB200 is aangekondigd als veruit de krachtigste chip in zijn soort.

Enkele dagen geleden gingen de eerste samples van Blackwell de deur uit, maar nu komt het lanceringsmomentum abrupt tot stilstand. TSMC, dat de chips bakt voor Nvidia, heeft volgens The Information een designfout ontdekt in de chip.

Fout in de interconnect

The Information weet dat het probleem te maken heeft met de interconnect-processor die twee Blackwell-GPU-chiplets verbindt op een enkele Nvidia GB200. Nieuwe designs moeten nu samen met TSMC uitgetest worden. De fout kwam uitzonderlijk laat aan het licht, waardoor de lancering van de Blackwell B200-GPU’s volgens Nvidia al minstens drie maanden vertraging zal oplopen.

Dat liet het bedrijf weten aan Microsoft, Meta, Google en andere klanten. Die techreuzen kijken reikhalzend uit naar de B200, omdat die chip extra broodnodige pk’s bevat om nieuwe en nog krachtigere generatieve AI-LLM’s te maken. Google alleen al zou een openstaande bestelling hebben van 400.000 getroffen GB200-chips, goed voor een aankoopbedrag van meer dan tien miljard euro.

Eenvoudigere variant

Nvidia zou nu plannen om een eenvoudigere versie van de Blackwell-chip te produceren met daarop slechts een enkele GPU. Zo’n chip zou nog steeds erg krachtig zijn, maar bevat niet de complexiteit van de interconnect. De chip kan in theorie veel sneller van de band rollen.

De fout zal de plannen van grote klanten wat in de war sturen, maar verder vermoedelijk geen al te grote gevolgen hebben. Nvidia is absoluut marktleider in het AI-segment, met een marktaandeel van 90 procent of meer. De Blackwell GB200 kent bovendien geen echte concurrentie. Andere chips van bijvoorbeeld AMD zijn wel competitief met wat vandaag op de markt is, maar kunnen in theorie niet tippen aan de geplande GB2200.

Niet alleen Nvidia

Moderne chips brengen veel complexiteit met zich mee, die ontwerpers best voor de lancering aanpakken. Naast Nvidia kampen ook Intel en AMD met problemen. Zo kampt Intel met degradatie van Raptor Lake (Refresh)-chips omwille van een fout, en stelde AMD de lancering van Ryzen 9000 uit om een vermeend probleem weg te werken.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.