Niet alles wat met AI te maken heeft, leeft bij Google onder de Gemini-vlak. Op I/O toont het bedrijf verschillende tot de verbeelding sprekende capaciteiten in verband met video- en beeldgeneratie, samen met verbeteringen aan een tool die AI van de werkelijkheid moet onderscheiden.
Op Google I/O toont Google verschillende nieuwe ontwikkelingen in de zoektocht naar steeds meer AI-capaciteiten. Die ontwikkelingen staan (voorlopig) los van Gemini en tonen aan waar generatieve AI naartoe evolueert.
AI-cameraman
Zo toont Google Veo. Veo is de opvolger van Lumiere en kan net als zijn voorgangers bewegende beelden genereren. Veo is in staat clipjes in 1080p aan te maken, die langer dan één minuut duren. Dat doet het model op basis van tekstprompts. Veo is nog niet beschikbaar voor het grote publiek, al kan je in sommige landen wel inschrijven op een wachtlijst via VideoFX.
Veo is het rechtstreekse antwoord van Google op Sora van OpenAI. Dat model verblufte in februari de wereld met goede en uitgebreide videoclips op basis van prompts, waarbij het AI-model zich erg bewust leek van de personages, het decor en hun verhouding tot elkaar gedurende de hele video.
Betere beelden
Moeten de beelden niet bewegen? Dan is er Imagen 3. Imagen is de nieuwste generatie van de genAI-beeldengenerator van Google en zou beelden in hogere kwaliteit met meer details opleveren. Daarbij hoort eveneens een breder begrip van de prompts van gebruikers. Geduld is ook hier een schone deugd, want net als Veo is Imagen 3 niet publiek beschikbaar, maar kan je wel intekenen op een wachtlijst. Google deelt voorbeelden van de nieuwe foto- en videocapaciteiten op zijn blog.
Schrik dat je binnenkort het verschil niet meer zal zien tussen een echte foto of video, en een beeld of clip gegenereerd door AI? Die angst is terecht en dat beseft ook Google. SynthID zorgt ervoor dat gegenereerde beelden watermerken bevatten waardoor ze eenvoudig detecteerbaar zijn als gegenereerd. Alle video’s van Veo zullen zo’n watermerk bevatten.