Google ontwikkelt AI-taalmodel dat meer dan 1.000 talen zal ondersteunen

Nvidia wil eveneens meer talen vertegenwoordigd zien

Google kondigt een groots AI-project aan. De ambitie is er om een taalmodel te creëren dat de duizend meest gesproken talen ondersteunt.

Het AI-taalmodel van Google kan momenteel al vierhonderd talen spreken. Volgens het bedrijf gaat het om ‘de grootste die tot nu toe al in een spraakmodel werd gezien.’ Op termijn is er de ambitie om het aantal talen op te voeren, totdat duizend talen ondersteund worden.

Talen vertegenwoordigen

Zoubin Ghahramani, vp-onderzoek bij Google AI, vertelt in een interview met nieuwsmedium The Verge dat het project ervoor moet worgen dat talen die online minder voorkomen beter gerepresenteerd raken.

“Met één enkel model te hebben dat is blootgesteld aan en getraind is in veel verschillende talen, krijgen we veel betere prestaties op onze talen met weinig middelen. De manier waarop we tot 1.000 talen komen, is niet door 1.000 verschillende modellen te bouwen. Talen zijn als organismen, ze zijn van elkaar geëvolueerd en hebben bepaalde overeenkomsten.”

De juiste informatie verkrijgen om het taalmodel te trainen op deze minder vertegenwoordigde talen, is minder voor de hand liggend. Het bedrijf is van plan om te betalen voor onder andere geschreven teksten en audiofragmenten uit de benodigde talen.

Google ontwikkelt taalmodel dat robots in staat stelt ons beter te begrijpen

Populair domein

De zoekgigant is zeker niet de enige die onderzoek doet naar AI-taalmodellen. Het bedrijf toont wel aan het publiek dat het al wat begrepen heeft van het domein, met de AI Test Kitchen-app.

Nvidia verscherpt nu ook zijn strategie in het domein, dat kondigt het bedrijf aan op zijn eigen Speech AI-conferentie. Net als in de ambities van de zoekgigant, komt de focus te liggen op talen die nog onvoldoende vertegenwoordiging kennen. Het bedrijf ziet in dat spraakassistenten momenteel nog geen één procent van de wereldtalen spreken en dat moet anders.

Nvidia brengt eigen large language models naar enterprises

In samenwerking met Mozilla Common Voice ontwikkelde Nvidia een AI-ecosysteem. De focus ligt op het ontwikkelen van crowdsourced meertalige spraaksystemen en vooraf getrainde opensource-modellen. Momenteel worden honderd talen door het platform ondersteunt. Iedereen kan via dit platform bijdragen aan het project door een fragment in te spreken of ingesproken fragmenten te valideren.

terug naar home

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.