ChatGPT kost dagelijks 700.000 dollar om te draaien

Elke zoekopdracht kost ongeveer 36 dollarcent. Dagelijks kost ChatGPT OpenAI volgens een analyse 694.444 dollar.

De wereld is in de ban van ChatGPT, maar zo’n AI-model kost geld om te draaien. Allereerst moet je het AI-model trainen met heel wat data via machine learning om tot een Large Language Model (LLM) te komen dat GPT-4 is, het nieuwste model waar ChatGPT op draait. SemiAnalysis deed de rekensom voor GPT-3 en kwam uit op een kost van 841.346 dollar. Het hield hiermee rekening met 175 miljard parameters en 300 miljard tokens, getraind op Nvidia A100 GPU’s.

Belangrijke kanttekening: dit is puur de rekenkost (inference), niet de aankoop van de hardware of de lonen van de datawetenschappers die eraan sleutelen. GPT-4 bevat een nog grotere dataset dan GPT-3, wat de kost omhoog duwt. Het spreekt voor zich dat Sam Altman, CEO van OpenAI een trend ziet waar enorme sets aan data stilaan voorbij zijn. Alles opgeteld kostte de training van GPT-4 ongeveer 100 miljoen dollar volgens hem, inclusief hardwarekost en personeel.

Hij claimt dat het opschalen van de modelgrootte beperkte voordelen omvat. OpenAI moet ook rekening houden met de fysieke limieten van het aantal datacenters dat het bedrijf kan bouwen en hoe snel die er zijn.

OpenAI CEO: ‘Gigantische AI-modellen behoren tot het verleden’

Dagelijks data voeden

Trainen is één, het AI-model dagelijks draaiende houden met de talrijke vragen die worden gesteld kost ook geld. Volgens hetzelfde SemiAnalysis mogen we rekenen dat ChatGPT dagelijks 694.444 dollar kost. Rekening houdend met het aantal zoekopdrachten dat er gemiddeld worden ingevoerd, kost elke zoekopdracht ongeveer 36 dollarcent.

Dat maakt de investering van Microsoft in OpenAI, het bedrijf achter ChatGPT, des te belangrijker. In januari injecteerde het al 10 miljard dollar in het bedrijf, om daarna nog honderden miljoenen te investeren in hardware om het neurale netwerk te trainen en draaiende te houden op zijn Bing-platform en ander toepassingen zoals Microsoft Copilot in Word en PowerPoint of Business Chat in Teams.

Bing wil marktaandeel afsnoepen

Sinds vorige week duiken er ook ChatGPT-antwoorden in zoekresultaten van Bing, wat de kosten verder opdrijft. Ook daar krijgen we een kostenanalyse voorgeschoteld. In het voorbeeld van SemiAnalysis kijken we naar Google dat in 2022 gemiddeld 320.000 zoekopdrachten per seconde verwerkte. Mocht de zoekgigant in elk zoekresultaat zijn ChatGPT-variant Bard inschakelen, dan zou hen dat 36 miljard dollar kosten.

Tel daarbij nog de investering van meer dan 100 miljard dollar om 512.820 Nvidia A100 HGX-servers te kopen met 4.102.568 A100 GPU’s aan boord, en je snapt dat AI niet direct de zoekmachine zal vervangen.

Deze nieuwe Bing forceert Google om buiten te komen en te dansen. Ik wil dat mensen weten dat wij hen hebben laten dansen.
Satya Nadella, Microsoft CEO

Dat Microsoft die investering wel wil doen met zoekresultaten in Bing, is logisch volgens CEO Satya Nadella. “Voor elk punt aan marktaandeel dat onze zoekmachine wint, staat een inkomstenopportuniteit van 2 miljard dollar aan advertenties.” Aangezien Bing een bijzonder klein marktaandeel heeft, 2,88% vergeleken met 93,17% bij Google (via Statcounter), snap je waarom Microsoft nu alle registers opentrekt om kostbaar marktaandeel af te snoepen.

Nadella wil Google maximaal uitdagen deze periode. “Deze nieuwe Bing forceert Google om buiten te komen en te dansen. Ik wil dat mensen weten dat wij hen hebben laten dansen.”

Training GPT-5 (nog) niet begonnen

Eigen AI-chips ontwikkelen

Chips van Nvidia kopen is vandaag een snelle oplossing, maar op termijn wil Microsoft liever eigen AI-chips in Azure-servers stoppen. Het sleutelt daar naar verluidt al aan sinds 2019, lang voor de hype die ChatGPT vandaag is. Onder codenaam ‘Athena’ moet de chip performanter zijn dan die van derde partijen. Bovendien moet Microsoft de microchip niet extern aankopen, wat een positieve impact zal hebben op de eindafrekening.

Microsoft plant niet om het nieuwe Nvidia te worden. De chips van die AI-specialist zullen relevant blijven. Athena is een noodzakelijke extra die toekomstige workloads zal ondersteunen. De eerste Athena-chips worden momenteel al getest door Microsoft zelf, samen met OpenAI. Het is de ambitie om de eerste generatie van Athena in 2024 uit te rollen. Daarna zouden in principe nieuwe generaties volgen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.