OpenAI lanceert speeltuin voor fine-tuning van modellen

openai

OpenAI optimaliseert het fine-tuning-proces voor ChatGPT. Zo kunnen grote organisaties binnenkort tussenstappen in het proces opslaan, en wordt het mogelijk om verschillende aangepaste LLM’s tegenover elkaar te zetten om na te gaan of de bijkomende training wel verbeteringen oplevert.

OpenAI geeft organisaties meer tools om modellen te optimaliseren en de fine-tunen met eigen data. Dat tunen gebeurt via een API, waar de meeste verbeteringen zich situeren. Een eerste vernieuwing heeft te maken met checkpoints. Fine-tuning gebeurt in verschillende rondes of epochs in vakjargon. Iedere epoch gaat een model aan de slag met dezelfde bijkomende trainingsdata, maar telkens bestaat er een nieuwe kans dat er iets misloopt. De checkpoints zorgen ervoor dat organisaties kunnen teruggrijpen naar een eerdere epoch, en niet helemaal opnieuw moeten beginnen als zoiets gebeurt.

Speeltuin

Ontwikkelaars die aan de slag gaan met de API, krijgen verder toegang tot de Playground. Dat is een interface waar je eenvoudig modellen met elkaar kan vergelijken. Zo kan je dezelfde prompt geven aan GPT 4 of een versie van GPT 3,5 Turbo die je hebt afgesteld met je eigen data, om na te gaan of de fine-tuning de gehoopte resultaten heeft.

OpenAI maakt het voortaan mogelijk om de hyperparameters die het gedrag van een model bepalen, aan te passen via het dashboard. Dat kon voordien enkel via de API of SDK. Zo kunnen gebruikers modellen eenvoudiger naar hun hand zetten. Tot slot zijn er nog enkele andere verbeteringen, zoals nauwkeurigere data voor validering en integratie van toepassingen van derden.

Focus op enterprise

OpenAI wil in 2024 sterk inzetten op enterprises. ChatGPT heeft de AI-hype anderhalf jaar geleden ontketend en generatieve AI in geen tijd tot bij het grote publiek gebracht, maar ChatGPT heeft niet noodzakelijk de naam om de meest geschikte oplossing op enterprise-niveau te zijn. Opties voor meer verfijnde controle, kunnen daarbij helpen.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.