Microsoft’s VALL-E heeft slechts drie seconden nodig om je stem na te bootsen

Microsoft demonstreert VALL-E, een technologie die stemmen realistisch kan nabootsen op basis van korte opnames. Het AI-model is zelfs getraind om emoties te reproduceren.

Het zijn interessante tijden voor wie de laatste ontwikkelingen in artificiële intelligentie volgt. Nadat OpenAI indrukt maakte met Dall-E en ChatGPT, is het nu aan Microsoft om uit te pakken met een knap staaltje AI. Via GitHub geeft Microsoft een demonstratie van VALL-E, een AI-systeem dat stemmen kan nabootsen.

VALL-E is een neuraal taalmodel dat bedoeld is voor tekst-naar-spraaksynthese. In een onderzoekpaper staat te lezen dat het model getraind werd met voor meer dan zestigduizend uur aan spraakopnames in de Engelse taal. Daardoor is het model nu al in staat om op basis van een opname van slechts drie seconden iemands stem vrij realistisch te imiteren.

Het model van Microsoft is zeker niet de eerste van zijn soort, maar eerdere AI-spraakmodellen klonken tot nu toe altijd nog zeer robotachtig. De output die VALL-E levert, klinkt veel natuurlijker en komt ook beter overeen met de spreker. We raden je aan om enkele opnames te beluisteren en zelf te oordelen.

vall-e schema — Een schematisch overzicht van VALL-E. *Bron: Microsoft*

Emoties en akoestiek

VALL-E is bovendien ook getraind om emoties en de omgevingsakoestiek mee op te nemen. Als het model een opname van een telefoongesprek voorgeschoteld krijgt, dan zal het de stem ook reproduceren alsof die door een telefoon komt.

Met emoties natuurlijk te laten weerklinken, heeft het model nog veel moeite. In de demo zitten enkele fragmenten waar VALL-E woede, moeheid, vreugde en walging probeert na te bootsen. Je hoort onmiddellijk dat deze emoties zeer gemaakt klinken en het resultaat is beter als de stem neutraal is.

Doembeelden

De schoonheidsfoutjes ten spijt, is de vooruitgang van VALL-E indrukwekkend te noemen. De geproduceerde stemmen klinken over het algemeen zeer realistisch. Zo realistisch dat doemdenkers nu al van zich laten horen. Zo wordt er gevreesd dat technologieën zoals VALL-E kunnen worden ingezet in de verspreiding van misinformatie, omdat je zo nog makkelijker mensen woorden kan laten uitspreken die ze nooit gezegd hebben.

ChatGPT helpt hackers met ontwikkelen van malware

De onderzoekers zijn zich bewust van ethische complicaties en roepen op tot protocollen die ervoor moeten zorgen dat de spreker altijd zijn of haar toestemming kan geven voor het gebruik en bewerken van opnames. Voorlopig lijkt het er ook nog niet naar dat VALL-E beschikbaar komt voor het grote publiek. Microsoft onderzoekt wel al volop hoe het met ChatGPT AI-technologie kan integreren in Office en Bing.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Microsoft’s VALL-E heeft slechts drie seconden nodig om je stem na te bootsen

Emoties en akoestiek

Doembeelden

ChatGPT helpt hackers met ontwikkelen van malware

gerelateerd nieuws

nieuwsbrief