Google lanceert Gemini 3.1 Flash-Lite, sneller en goedkoper AI-model

Google lanceert Gemini 3.1 Flash-Lite, sneller en goedkoper AI-model
Bron: Google

3.1 Flash is volgens Google ontworpen met snelheid als focus.

Google heeft Gemini 3.1 Flash-Lite aangekondigd, een nieuwe multimodale AI-modelvariant die focust op snelheid en lage kosten voor grootschalige toepassingen.

Goedkoper dan andere Gemini-modellen

Volgens een blogpost van Google is Gemini 3.1 Flash-Lite aanzienlijk goedkoper dan andere modellen in de Gemini-reeks. Het model kost 0,25 dollar per miljoen inputtokens en 1,50 dollar per miljoen outputtokens. Ter vergelijking: Gemini 3.1 Pro, Googles krachtigste model, start bij 2 dollar per miljoen inputtokens en 18 dollar per miljoen outputtokens.

Het model is ook sneller. In interne tests genereerde Flash-Lite antwoorden 45 procent sneller dan Gemini 2.5 Flash, terwijl de tijd tot de eerste outputtoken 2,5 keer korter zou zijn.

Gericht op grootschalige taken

Gemini 3.1 Flash-Lite kan multimodale prompts verwerken tot 1 miljoen tokens en antwoorden genereren tot 64.000 tokens tekst. Het model kan ook code genereren, bijvoorbeeld om dashboards of andere visuele toepassingen te bouwen.

Google verwacht dat ontwikkelaars het model vooral gebruiken voor taken met hoge volumes maar beperkte redeneervereisten. Voorbeelden zijn het vertalen van productcatalogi of het automatisch modereren van content op e-commerceplatformen.

Benchmarkresultaten

In elf benchmarktests behaalde Flash-Lite de hoogste score in zes tests, waarbij het onder meer GPT-5 mini en Claude 4.5 Haiku versloeg.

Het model haalde een goede score op GPAQ Diamond, een benchmark met vragen op doctoraatsniveau. Op de zware HLA-benchmark scoorde het 16 procent, tegenover 44,4 procent voor Gemini 3.1 Pro.

Gemini 3.1 Flash-Lite is voorlopig beschikbaar in preview via Vertex AI en via Google AI Studio.