OpenAI zit met GPU-tekort bij lancering GPT-4.5

OpenAI heeft zijn plannen voor GPT-4.5 uit de doeken gedaan, maar kampt met een tekort aan GPU’s.

De lancering van GPT-4.5 zat er al even aan te komen, maar OpenAI’s CEO Sam Altman zegt dat de uitrol in fases zal verlopen, omdat het bedrijf “door zijn GPU’s heen is.” ChatGPT Pro-abonnees krijgen als eerste toegang, gevolgd door Plus-gebruikers volgende week.

Duurste AI-model tot nu toe

GPT-4.5, onder de naam Orion, is OpenAI’s grootste en duurste model tot nu toe. Het vraagt enorme rekenkracht: Altman spreekt op X van “tienduizenden extra GPU’s” die nodig zijn om bredere toegang mogelijk te maken. De kosten zijn niet min: 75 dollar per miljoen input tokens (ongeveer 750.000 woorden) en 150 dollar per miljoen output tokens. De prijzen zijn veel duurder dan GPT-4o, maar liefst 30 keer en 15 keer hoger. GPT-4o kost voor hetzelfde aantal tokens respectievelijk 2,50 dollar en 10 dollar. OpenAI is zelfs niet zeker of GPT-4.5 op lange termijn houdbaar is binnen zijn API-aanbod.

Beter, maar niet revolutionair

GPT-4.5 presteert beter dan GPT-4o op vaardigheden zoals feitelijke vragen (SimpleQA) en creatieve taken, maar blijft achter op benchmarks voor wiskundige en redeneervragen. Modellen als DeepSeek R1 en Claude 3.7 Sonnet scoren hier beter. Toch claimt OpenAI in een whitepaper dat GPT-4.5 “warmer, natuurlijker en beter in intentiebegrip” is dan eerdere modellen.

OpenAI’s grootste uitdaging is dat de voordelen van traditionele AI-training afnemen. De industrie richt zich steeds meer op reasoning-modellen, die problemen stap voor stap oplossen in plaats van enkel te voorspellen.

Itdaily - OpenAI zit met GPU-tekort bij lancering GPT-4.5

Duurste AI-model tot nu toe

Beter, maar niet revolutionair