Google geeft Gemini 1.5 Pro oren

google gemini

Gemini 1.5 Pro kan geluid interpreteren. Google rolt de capaciteiten enkel uit naar gebruikers met toegang tot Vertex AI en de AI Studio.

Google zet een handige stap in de evolutie van zijn AI-model Gemini. Gemini 1.5 Pro kan voortaan audio interpreteren. Het model heeft dus geen nood meer aan een geschreven transcriptie van een gesprek om ermee aan de slag te gaan: je kan het geluidsfragment rechtstreeks uploaden. Ook met geluid van video’s weet Gemini 1.5 Pro raad.

Troef

De mogelijkheid om rechtstreeks naar audio te luisteren, is een belangrijke toevoeging aan de capaciteiten van het AI-model van Google. Het bedrijf heeft een valse start genomen aan het begin van de AI-hype, met een eerder pijnlijke lancering van de voorloper van Gemini: Bard. Intussen lijkt Google goed op weg om de kwaliteit van de LLM’s van grote concurrent OpenAI te evenaren. De integratie van audio is in ieder geval een handige troef.

Gebruikers kunnen binnenkort met de nieuwe mogelijkheden aan de slag, maar alleen binnen Vertex AI en de AI Studio. Het krachtige Gemini 1.5 Pro-model is immers niet zo vrij beschkikbaar als de Gemini-chatbot of andere LLM’s. Het lijkt wel onvermijdelijk dat ook het brede publiek in de toekomst toegang zal krijgen tot gelijkaardige functionaliteit.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.