Google Deepmind kondigt een nieuwe versie van de AI-videogenerator Veo aan. Veo 2 krikt de videokwaliteit op en heeft een beter begrip van fysica en cinematografie.
De eerste versie van Veo, een AI-model dat op basis van tekstprompts korte videoclips kan genereren, is nog maar pas gelanceerd of Google Deepmind kondigt al de opvolger aan. Veo 2 wordt in een beperkte testversie beschikbaar gesteld via het videoplatform VideoFX. Het nieuwe model kan veel realistischere video’s maken.
Het nieuwe model heeft een beter begrip van de wetten van de fysica, leggen de onderzoekers van Google Deepmind uit in een blog. Hierdoor kan het bewegingen en expressies beter vastleggen. Ook de beeldkwaliteit en lengte van video’s wordt opgekrikt. Veo 2 kan beelden aan 4K-kwaliteit maken en is niet meer beperkt tot clips van maximaal één minuut. De testversie houdt het nog bij een bescheiden 720p-resolutie, merkt TechCrunch op.
Cinematografische kennis
Veo 2 heeft ook een cursus cinematografie gekregen om de ‘unieke taal van cinema te beheersen’, schrijft Google in een blog. Je kan het model vragen om een stijl te hanteren, een specifiek type lens te gebruiken of filmische effecten toe te passen. Zo zou het model bijvoorbeeld moeten begrijpen dat wanneer je vraagt een 18 mm lens te gebruiken, het een groothoekopname moet maken.
In de blog laat Google enkele zorgvuldige uitgekozen voorbeelden zien om de mogelijkheden met Veo 2 te demonstreren. Tegelijkertijd is het ook eerlijk over beperkingen. Hoewel de kans op hallucinaties, zoals het toevoegen van een extra vinger, aanzienlijk zou moeten gedaald zijn, valt het niet uit te sluiten dat Veo 2 onnatuurlijke zaken toevoegt.
Concurreren met Sora
Met Veo 2 wil Google OpenAI opnieuw de loef afsteken. Google was OpenAI te snel af doen het Veo begin december officieel lanceerde. Een reactie bleef niet lang uit en slechts enkele dagen later legde OpenAI zijn videogenerator Sora onder de kerstboom (maar niet in Europa). Nu probeert Google de spotlights weer naar zich toe te trekken met Veo 2.
lees ook
Video-AI Sora van OpenAI te populair bij lancering
AI-video lijkt zo stilaan voor een doorbraak te staan. Dat is niet helemaal zonder risico, want hoe beter het beeldmateriaal van Veo en Sora wordt, hoe moeilijker het wordt om video’s van mensen te onderscheiden van AI-gegeneerde video’s. Google probeert dit op te lossen door een onzichtbaar watermerk toe te voegen aan video’s gemaakt door Sora.
Waar Google dan weer vaag over blijft, is hoe het Veo getraind heeft. De kans is zeer aannemelijk dat dit met de enorme database van YouTube gebeurd is, die eigendom is van Google. Het Deepmind-lab en moederbedrijf Google beroepen zich op het principe van ‘eerlijk gebruik’ voor het trainen van modellen met openbare gegevens.
Google is niet alleen actief in video, maar ook in AI-generatie van stilstaand beeld. Het lanceerde eerder deze maand Imagen 3 en onthult nu zelfs een gloednieuwe beeldgenerator Whisk.