Google brengt verbeteringen aan Gemini 1.5 Pro en introduceert de nieuwe Gemini 1.5 Flash.
Op het Google I/O 2024-event vormde AI de rode draad in een reeks nieuwe updates en ontwikkelingen. Zo lanceert het bedrijf een nieuw – AI-model Gemini 1.5 Flash – en brengt het kwaliteitsverbeteringen aan zijn recentste Gemini 1.5 Pro-model zoals vertalen, coderen, redeneren en meer. Gebruikers met Gemini Advanced zullen bovendien kunnen genieten van een contextvenster van 2 miljoen tokens. De nieuwe updates zijn vandaag beschikbaar in het model.
Verbeteringen Gemini 1.5 Pro
In februari werd Gemini 1.5 Pro gelanceerd, de nieuwste in de Gemini-reeks dat tot miljoenen tokens accuraat kan verwerken. Slechts drie maanden later, op het Google I/O-event van 14 mei, brengt Google nieuwe kwaliteitsverbeteringen aan het model zoals vertalen, coderen, redeneren en meer. Zo deelde het bedrijf mee dat de nieuwste versie verbeteringen heeft bereikt op diverse benchmarks waaronder MMMU, MathVista, ChartQA, DocVQA, InfographicVQA en meer.
Daarnaast zal Gemini 1.5 Pro beschikbaar gesteld worden voor consumenten in Gemini Advanced. Dit laat gebruikers toe om AI-hulp te krijgen bij grote hoeveelheden werk zoals lange pdf’s. De updates stellen het model op Android beter in staat om AI toe te passen op wat er op je scherm verschijnt. Gemini 1.5 Pro wordt geleverd met een contextvenster van 1 miljoen tokens en stelt gebruikers in staat om tekst, afbeeldingen, audio en video als invoer te gebruiken.
Voor toegang tot 1.5 Pro met een contextvenster van 2 miljoen tokens, dienen gebruikers zich op de wachtlijst te zetten in Google AI Studio of in Vertex AI voor Google Cloud-klanten.
Updates AI-modellen
Naast de Gemini-modellen zal Gemma ook upgrades krijgen met de lancering van Gemma 2 in juni. Die volgende generatie is geoptimaliseerd voor TPU’s en GPU’s, en wordt gelanceerd met 27B-parameters. De Gemma-familie krijgt er naast Gemma 2B en Gemma 7B nog een zuster bij, namelijk PaliGemma. Dit is het eerste vision-language-model van Google.
Verder geniet ook Gemini Nano, het model dat op smartphones draait, van uitbreidingen en zal het naast tekst ook afbeeldingen aannemen. Applicaties die Gemini Nano met multimodaliteit gebruiken vanaf Pixel, zullen in staat zijn om beeld, geluid en gesproken taal te begrijpen.
Gemini 1.5 Flash
Een Google I/O-event met AI als rode draad, kan onmogelijk zonder de aankondiging van een nieuw AI-model. Hoewel Google nog maar recent zijn nieuwste Gemini 1.5 Pro-model lanceerde, staat het volgende model al klaar: Gemini 1.5 Flash. Dit kleinere Gemini-model is geoptimaliseerd voor hoogfrequente taken waarbij snelheid en reactietijd van het model een belangrijke rol speelt.
Het vormt bovendien het snelste Gemini-model dat in de API wordt aangeboden en biedt een kostenefficiënter alternatief dan Gemini 1.5 Pro. Gemini 1.5 Flash is vandaag beschikbaar in preview in Google’s AI-studio en Vertex AI.
Integratie Android en Workspace
Gemini zal bovendien Google Assistant vervangen en wordt omgedoopt tot de standaard AI-assistent op Android-telefoons, door lang op de aan/uit-knop te duwen. Gemini kan binnen verschillende services en apps gebruikt worden, en multimodale ondersteuning bieden op verzoek.
Verder krijgt ook Google Workspace AI-upgrades en zal het Gemini-zijpaneel van Gmail, Documenten, Drive, Presentaties en Spreadsheets vervangen worden door Gemini 1.5 Pro. Dit biedt heel wat verbeteringen voor gebruikers omdat dit model een langer contextvenster en geavanceerde redeneringen biedt.
Een volledig overzicht van alle nieuwe aankondigingen op het Google I/O 2024 event kan je hier vinden.