Google toont zijn nieuwste AI-model Genie 3. Het model kan in interactieve werelden ontwerpen terwijl je ze ontdekt.
Google heeft een demo vrijgegeven van Genie 3, het nieuwste AI-model dat voortgekomen is uit het DeepMind-lab. Het model is een combinatie van de vorige Genie-generatie en de AI-videogenerator Veo. Genie 3 is echter niet beperkt tot korte videoclips en kan virtuele werelden ontwerpen en in real-time aanpassen.
De demovideo die Google DeepMind toont, lijkt zonder context op een reclamefilmpje voor een VR-game. Genie 3 ontwerpt op basis van een tekstprompt virtuele werelden die je interactief kan ontdekken. Die live-simulaties kunnen gaan van skiën in de bergen, terug in de tijd gaan naar een historische periode tot alledaagse situaties zoals je huis verven.
“Het gaat veel verder dan de beperkte modellen die voorheen bestonden. Genie 3 is niet begrensd tot een bepaalde omgeving. Het kan zowel fotorealistische als imaginaire werelden genereren, en alles daartussenin”, zegt Deepmind-onderzoeker Shlomi Fruchter aan TechCrunch.
Interactieve wereld
De virtuele werelden bewegen immers met je mee. Met iedere stap die je zet, breidt het model op het moment zelf de wereld uit. Met tekstprompts kan je doorgeven wat je wil toevoegen aan de wereld of naar welke omgeving je wil reizen. Genie 3 onthoudt iedere verandering en actie die je neemt, zodat deze ook zichtbaar blijven als je terugkeert. Het model is zo ontwikkeld dat het eerste moet ‘terugkijken’ op vorige stappen voordat het de volgende stap kan genereren.
Genie 3 genereert beeld aan een resolutie van 720p en 24 fps. Simulaties zijn nog begrensd op enkele minuten, maar dat is nog steeds een stap vooruit in vergelijking met huidige beeldgeneratiemodellen.
Move 37
Volgens Google zijn de mogelijke gebruikstoepassingen van Genie 3 legio. Denk aan gamen in virtual reality zonder een gespecialiseerde bril te moeten dragen, maar het gaat veel verder. Google is ervan overtuigd dat de simulaties ook van dienst zullen zijn voor wetenschappelijk onderzoek, onderwijs en het ontwikkelen van digitale tweelingen voor landbouw en productie.
AI-agenten zijn hip en dus benadrukt Google dat bedrijven hun agenten via Genie 3 kunnen klaarstomen voor de echte wereld. Bij DeepMind spreekt men zelfs al van het ‘Move 37’-moment voor AI-agenten, verwijzend naar toen een AI-model van Google de wereldkampioen versloeg in een spelletje Go.
lees ook
Sam Altman: “AI-agenten worden beter dan je meest ervaren werknemers”
Voorlopig houdt Google Genie 3 wel nog achter gesloten deuren voor het grote publiek. Een preview is beschikbaar voor onderzoeksdoeleinden. Het is nog niet duidelijk of en wanneer Genie 3 breder beschikbaar komt.