OpenAI onthult AI-model o1: “denkt voordat het antwoordt”

Het mysterieuze project ‘Strawberry’ van OpenAI onthult zijn geheimen. OpenAI o1 is het nieuwste AI-model dat uitblinkt in redeneertaken.

Er gingen de laatste dagen heel wat geruchten de ronde over het ‘geheime project’ van OpenAI, genaamd Strawberry. Het bedrijf lanceert nu het nieuwe model dat zich hierachter schuilde: OpenAI o1. Dit model zou trager antwoorden dan bijvoorbeeld ChatGPT-4o. Dit omdat het model eerst nadenkt en een heel redeneerproces doorloopt, voordat het een antwoord voorschotelt. Hiermee is het geschikt om complexe wiskundige taken op te lossen. OpenAI o1 verschijn in previewversie voor ChatGPT-Plus-gebruikers.

“Denkt voordat het antwoordt”

Het nieuwe OpenAI o1-model denkt voordat het antwoordt. Dat is hoe OpenAI zijn nieuwkomer introduceert. Het model zal dus veel trager antwoorden in vergelijking met ChatGPT-4o, maar daar heeft OpenAI zijn redenen voor. De chatbot zal namelijk beter controleren of wat hij zegt ook effectief klopt.

OpenAI maakt gebruik van de zogenaamde Chain of Thought dat ingebouwd zit in het model. Het model onderscheidt zich voornamelijk in redeneertaken. Doordat het eerst een lange ‘chain of thought’ neerschrijft, voordat het antwoord komt, kan het model op meerdere antwoorden uitkomen en dus minder fouten maken. Dit zou ook moeten leiden tot minder hallucinaties.

In bovenstaande afbeelding kan je een voorbeeld van het redeneerproces van o1 zien. Wanneer het model een complexe wiskundige vraag wordt voorgelegd, neemt het de tijd om een antwoord te geven. Dit staat bovendien aangegeven: het model nam hiervoor 54 seconde de tijd. Bovendien krijg je in die tijd te zien bij welke stap van het redeneerproces het model zit. Het resultaat is een uitgebreide redenering die aangeeft hoe het model tot het antwoord gekomen is.  

Redeneertalent

Waar OpenAI o1 zich in onderscheidt, zijn de redeneertaken. Dit kan zeker van pas komen om complexere vraagstukken op te lossen. Uit de MATH-benchmark blijkt namelijk dat o1 een score van 94,8 procent behaalt. Dat is een groot verschil met de score van GPT-4o, dat op 60,3 staat. Waar het model dan niet geschikt voor is? Bestanden uploaden of afbeeldingen genereren, daarvoor doet GPT-4o nog goed dienst. De o1-preview is nu beschikbaar, maar enkel voor ChatGPT-Plus-gebruikers.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.