Demovideo Google Gemini in scène gezet

google gemini

Eén van de demovideo’s die Google deelde om de mogelijkheden van zijn nieuwste Gemini-model te tonen, blijkt niet helemaal authentiek te zijn.

Google kondigde woensdagavond Gemini aan, het meest krachtige taalmodel dat tot heden uit de laboratoria van DeepMind is komen rollen. Met Gemini wil Google zich eindelijk opnieuw naast OpenAI hijsen in de AI-race. Bij de aankondiging publiceerde Google ook enkele video’s om de multimodale capaciteiten van Gemini te demonstreren.

Een video trok in het bijzonder de aandacht. We zien een werknemer van Google een reeks spelletjes spelen met Gemini. De AI wisselt moeiteloos tussen tekst, spraak, beeld en audio, en het voelt als een natuurlijke interactie tussen mens en artificiële intelligentie. Al blijkt die video niet helemaal authentiek te zijn, merkte Bloomberg op.

Creatief montagewerk

In de beschrijving van de video geeft Google eigenlijk zelf al aan dat er wat creatief montagewerk aan te pas is gekomen. “Voor deze demo is de latentie gereduceerd en zijn de Gemini-uitgangen ingekort”, staat er te lezen. In andere woorden: Google laat het lijken alsof Gemini veel sneller en bondiger antwoordt dan dat werkelijk het geval is.

Maar ook met de aard van de conversatie zelf is geknutseld. Google geeft aan Bloomberg toe dat de demo niet in real-time gefilmd is, maar gemaakt is door stilstaande frames aan elkaar te plakken en vervolgens tekstprompts waarop Gemini antwoordde toe te voegen. “Dat is heel wat anders dan wat Google leek te suggereren: dat een persoon een vloeiend spraakgesprek zou kunnen voeren met Gemini terwijl het in realtime meekeek en reageerde op de wereld om zich heen,” schrijft journaliste Parmy Olson in het opiniestuk.

Live is zelden live

Google bijt via sociale media van zich af. DeepMind-onderzoekers Orial Vinyals schrijft op X dat alle prompts en antwoorden van Gemini honderd procent echt zijn en dat de video gemaakt werd om ontwikkelaars te inspireren. Dat een demovideo geënsceneerd is, is ook helemaal niet zo uitzonderlijk. Demonstraties tijdens persconferenties of conferentiekeynotes zijn zelden tot nooit ‘live’, bedrijven willen niets aan het toeval overlaten.

Daar heeft Google zelf ook ervaring mee. De lancering van Bard liep in februari helemaal in het honderd. Google wil diezelfde fout duidelijk geen twee keer maken. Het verhoogt nu wel de druk op Gemini om de mooie beloftes waar te maken.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.