Nvidia versnelt ontwikkeling conversationele spraakbots met nieuwe opensource tools

Nu we de technologie voor spraakbesturing redelijk onder de knie hebben, is conversationele AI de volgende stap. Nvidia heeft drie nieuwe technologieën opensource beschikbaar gemaakt om die ontwikkeling te versnellen.

In plaats van één commando aan één actie te koppelen, is het doel van conversationele AI om het gesprek met een spraakassistent interactiever en natuurlijker te maken. De spraakasssistent moet daarvoor een begrip krijgen van context.

De eerste resultaten daarvan zie je bijvoorbeeld al bij de Google Assistant. Die kan na een correct antwoord op de vraag “Wie was de hoofdrolspeler in Indiana Jones?” (Harrison Ford) vervolgens ook de vraag “Wat is zijn leeftijd?” (77 jaar) correct beantwoorden. De Assistent onthoudt bij vraag twee dat wordt terugverwezen naar de eerste vraag. Dat is een evidentie voor mensen, maar een stuk lastiger voor een computer.

Hoewel de bouwstenen van conversationele AI gelijk zijn aan die voor klassieke spraakherkenning, liggen de eisen voor training, inferentie en modelgroottes hoger, waardoor meer rekenkracht nodig is. Om de ontwikkeling te versnellen, heeft Nvidia drie nieuwe technologieën ontwikkeld en opensource beschikbaar gemaakt via GitHub, zo meldt ExtremeTech.

Snellere training

Het trainen van conversationele AI gebeurt via bestaande taalmodellen, zoals BERT van Google. Zo’n referentiemodel moet evenwel nog voor elke specifieke taak opnieuw worden getraind. Dat trainingsproces kan zelfs op high-end GPU-clusters dagen duren.

Nvidia heeft die klus nu in minder dan een uur geklaard met behulp van een DGX SuperPOD. Die is opgebouwd uit maar liefst 1.472 Tesla V100-gpu’s (SXM3-32GB), 92 DGX-2H-servers en 10 Mellanox Infiniband-switches per node. De huurprijs om daar gebruik van te maken zal niet mals zijn, maar het kan de time-to-market aanzienlijk verkorten.

Snellere inferentie

Ook het inferentieproces, waarbij op basis van het model en de data-input nieuwe informatie wordt gegenereerd, kan dankzij ontwikkelingen van Nvidia worden versneld. De benchmark die de industrie hanteert voor natuurlijke conversaties ligt op 10 milliseconden. Het begrijpen van de vraag en aanbieden van een antwoord is maar een deel van dat proces en moet dus nog sneller gaan.

Door BERT te optimaliseren met TensorRT 5.1, is Nvidia erin geslaagd om het inferentieproces terug te brengen tot 2,2 milliseconden met een Nvidia T4. Dat is een gpu die binnen het bereik ligt van elk ietwat serieus project.

Grotere modellen

Tot slot heeft Nvidia een manier bedacht om meerdere gpu’s tegelijk in parallel te laten meewerken aan het trainen van een model. De omvang en complexiteit van een model worden beperkt door de hoeveelheid beschikbare RAM, omdat alle parameters van het model tegelijk in het geheugen verwerkt moeten worden.

Dat betekent dat de grootte van een model wordt beperkt door het beschikbare RAM-geheugen. Een cpu kan in vergelijking met een gpu over veel meer RAM beschikken, maar dat gaat ten koste van de snelheid van de training. Door meerdere gpu’s te laten samenwerken, is meer geheugen beschikbaar voor training van complexere modellen.

Gerelateerd: Met de neus tegen de muur: het einde van de grote sprongen in computerkracht

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nvidia versnelt ontwikkeling conversationele spraakbots met nieuwe opensource tools

Snellere training

Snellere inferentie

Grotere modellen

gerelateerd nieuws

nieuwsbrief