DeepMind AI ontwikkelt natuurgetrouwe videoclips door YouTube te kijken

DeepMind heeft een manier gevonden om een AI videoclips te laten maken van ‘opmerkelijke natuurgetrouwheid’. De zogeheten Dual Video Discriminator GAN (DVD-GAN) genereert coherente video’s van 256 op 256 pixels, tot 48 frames lang.

Computationeel efficiënte componenten, technieken en een nieuwe op maat gemaakte dataset hebben uiteindelijk geleid tot de ontwikkeling van DVD-GAN. Onderzoekers van DeepMind, het Britse zusterbedrijf van Google dat gespecialiseerd is in AI, hebben hun bevindingen rondom het generen van AI-clips gepubliceerd in een nieuwe paper.

Videosynthese en -voorspelling

“Het genereren van natuurlijke video vormt een voor de hand liggende verdere uitdaging voor generatieve modellering, maar dan een die wordt geplaagd door toegenomen gegevenscomplexiteit en computervereisten”, schrijven de auteurs. “Om deze reden draaide veel eerder werk met betrekking tot het genereren van video rond relatief eenvoudige gegevenssets of taken waarbij sterke tijdelijke conditioneringsinformatie beschikbaar is”

“Wij richten ons op de taken van videosynthese en videovoorspelling. We streven ernaar de sterke resultaten van generatieve beeldmodellen uit te breiden naar het videodomein”, leggen de onderzoekers uit.

Kinetics-600

Het onderzoeksteam bouwde hun systeem rond een geavanceerde AI-architectuur en introduceerde videospecifieke tweaks. Deze maakten het mogelijk om te trainen op Kinetics-600, een dataset van natuurlijke video’s die is samengesteld uit 500.000 hoge-resolutie YouTube-clips van telkens 10 seconden, oorspronkelijk samengesteld voor menselijke actieherkenning.

De onderzoekers gebruikten opgeschaalde GAN-netwerken (Generative Adversarial Networks). Dat zijn tweedelige AI-systemen waarbij twee neurale netwerken tegen elkaar worden uitgespeeld. Het ene netwerk (de generator) genereert nieuwe data op basis van een bestaande dataset, terwijl het tweede netwerk (de discriminator) de authenticiteit van die data evalueert.

Het ging hier om zogeheten BigGAN’s, die zich onderscheiden door hun batchgrootte en miljoenen parameters.

Dubbele discriminatoren

DVD-GAN bevat dubbele discriminatoren. Om te beginnen een ‘ruimtelijke discriminator’, die kritiek levert op de inhoud en structuur van een enkel frame door willekeurig frames met volledige resolutie te samplen en individueel te verwerken. Daarnaast is er ook sprake van een ’temporele discriminator’, die een leersignaal geeft om beweging te genereren. Een transformator, wat als afzonderlijke module gezien moet worden, laat vervolgens toe dat geleerde informatie zich over het gehele AI-model verspreidt.

Nadat de DVD-GAN tussen de 12 en 96 uur was getraind op Googles AI-versnellende Tensor Processing Units van de derde generatie, slaagde het erin video’s te maken met objectsamenstelling, beweging en gecompliceerde texturen. De zijkant van een ijsbaan is daar een voorbeeld van.

Voordeel

“We willen het voordeel benadrukken van het trainen van generatieve modellen op grote en complexe videogegevenssets, zoals Kinetics-600. We denken dat de sterke baselines die we hebben vastgesteld op deze dataset met DVD-GAN, door de generatieve modelleringsgemeenschap als een referentiepunt zullen worden gebruikt”, aldus de onderzoekers.

Volgens het team is er nog veel werk aan de winkel alvorens realistische video’s consistent kunnen worden gegenereerd in een ongedwongen omgeving. Toch zien ze DVD-GAN als een stap in de goede richting.

Gerelateerd: Hoe DeepMind een technologische wapenrace in de gezondheidszorg veroorzaakte

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

DeepMind AI ontwikkelt natuurgetrouwe videoclips door YouTube te kijken

Videosynthese en -voorspelling

Kinetics-600

Dubbele discriminatoren

Voordeel

gerelateerd nieuws

nieuwsbrief