OpenAI stelde naast het nieuwe AI-model ook een desktopversie van ChatGPT voor. Het model, GPT-4o is in staat om gesprekken te voeren. Daarmee zal ChatGPT wellicht een belangrijke concurrent kunnen zijn voor stemassistenten genre Amazon (Alexa), Apple (Siri) en Google.
Het nieuwe programma kan informatie verwerken op basis van gesproken opdrachten, communiceert menselijke stem met de gebruiker en vertaalt tussen verschillende talen, weet persbureau Belga. “Dit is de eerste keer dat we echt een enorme stap vooruit hebben gezet wanneer het gaat om gebruiksgemak”, aldus Mira Murati, hoofd technologie bij OpenAI. Volgens het bedrijf zal het nieuwe GPT-4o model ook beschikbaar zijn voor gratis gebruikers.
Sneller en beter
De topvrouw van OpenAI liet verstaan dat het nieuwe model ‘veel sneller’ is, met meer mogelijkheden op vlak van tekst, video en audio. Het uiteindelijke doel is om gebruikers te laten videochatten met ChatGPT. De ‘o’ in GPT-4o staat voor ‘omni’. Het nieuwe model stelt ChatGPT in staat 50 talen beter en sneller te verwerken. Het zal ook beschikbaar zijn via OpenAI’s API, waardoor ontwikkelaars meteen aan de slag kunnen met het model.
Tijdens de presentatie van GPT-4o demonstreerde OpenAI de audiomogelijkheden van het model. Volgens onderzoeker Mark Chen is het model zelfs in staat emotie waar te nemen en heeft geen moeite met gebruikers die een gesprek onderbreken. Nog volgens het OpenAI-team kan het model ook gezichtsuitdrukkingen analyseren om aansluitend commentaar te geven op de emoties die een persoon mogelijk ervaart.
Testfase
OpenAI gaat de spraakmodus van GPT-4o de komende weken testen. De toepassing zal in een latere fase beschikbaar zijn voor alle gebruikers. Betalende abonnees krijgen sneller toegang tot de tool. Volgens OpenAI zou het model pijlsnel reageren op gesproken prompts. De reactietijd van gemiddeld 320 milliseconden zou vergelijkbaar zijn met de menselijke reactietijd in een gesprek.
GPT-4o zou zelfs een concurrent kunnen worden voor GitHub Copilot (Microsoft). Het model kan wiskundige vergelijkingen oplossen en helpen bij het schrijven van code. De timing van de presentatie is interessant, want vandaag houdt Google zijn jaarlijkse ontwikkelaarsconferentie Google I/O. Daarop worden aankondigingen verwacht over nieuwe functies met artificiële intelligentie. Een paar maanden geleden liet Google al zien hoe zijn AI-software Gemini gesproken en visuele informatie kan verwerken.