Claude 3 verovert de troon van GPT-4

ai

Op het LLM-vergelijkingsplatform Chatbot Arena heeft Claude 3 Opus voor het eerst GPT-4 voorbijgestoken. Is een wissel aan de macht gaande?

“De koning is dood”, klinkt het op X. GPT-4 is niet langer meer de nummer één op het LLM-platform Chatbot Arena en moet zijn plaats afstaan aan Claude 3 Opus. Op dit opensource platform kan je LLM’s één op één naast elkaar leggen om antwoorden die ze geven op eenzelfde vraag geven te vergelijken. Gebruikers stemmen vervolgens op welk model zij het beste vinden: Chatbot Arena kan je zien als een ‘hitlijst’ voor LLM-chatbots.

Magnus Opus

Sinds de introductie van GPT-4 in het voorjaar van 2023, stond het LLM van OpenAI onafgebroken bovenaan de ranglijst. Maar sinds 26 maart pronkt een nieuwe nummer één: Claude 3 Opus, het nieuwe flagship-model van Anthropic. Claude 3 Opus verscheen in maart en bij de lancering zwaaide Anthropic met benchmarks om aan te tonen dat het model superieur was ten aanzien van GPT-4 en Google Gemini. Die woorden lijken niet gelogen te zijn.

Er zijn nog redenen voor Anthropic om de huidige ranglijst af te printen en in de kantoorgebouwen te hangen. Ook het kleinere, snellere model Claude 3 Haiku valt in de smaak en staat op de zesde plaats. Claude Sonnet staat op een gedeelde vierde plaats met Google Gemini Pro.

lees ook

Anthropic brengt AI-model Haiku uit: snel en betaalbaar 

Wissel aan de macht?

Chatbot Arena is een populaire tool voor onderzoekers om de capaciteiten van LLM’s te vergelijken, dus het zegt wel degelijk iets dat Claude 3 hoger wordt ingeschat dan GPT-4. De LLM’s van OpenAI zijn lange tijd de referentie geweest voor generatieve AI, maar Anthropic werpt zich hoe langer hoe meer op tot een te duchten tegenstander.

Die boodschap heeft OpenAI ook begrepen. Het is druk bezig aan een nieuwe versie van GPT. Wanneer die exact op de wereld zal worden losgelaten is nog onduidelijk, maar de geruchten dat dat dit jaar nog zal gebeuren, klinken steeds luider. Of de nieuwe versie GPT-4.5 al dan niet GPT-5 zal heten, is eveneens nog onduidelijk.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.