Meta lanceert nieuw groot AI-model in zoektocht naar universele vertaler

Meta wil een AI-model bouwen dat werkt zoals een universele vertaler in Star Trek. Een nieuw model, dat vrij beschikbaar is voor onderzoekers, heeft alvast veelbelovende capaciteiten.

Meta lanceert een nieuw AI-model dat meerdere talen spreekt en begrijpt: SeamlessM4T. M4T staat voor Massively Multilingual and Multimodal Machine Translation. Het model is in staat om tekst naar spraak, spraak naar tekst, tekst naar tekst en spraak naar spraak te vertalen.

Als de uitvoer tekst moet zijn, dan begrijpt het model al bijna honderd talen. Is het de bedoeling om tekst of spraak meteen om te zetten naar gesproken uitvoer, dan begrijpt SeamlessM4T diezelfde honderd talen als invoer maar kan het antwoorden in ‘slechts’ één van 35 talen.

Alles naar alles

Het is de ambitie van Meta om een model te ontwikkelen waarbij gesproken taal meteen wordt omgezet naar een andere taal, zodat mensen die elkaars taal niet machtig zijn, welk met elkaar kunnen praten. Denk bij het opzet aan de universal translator van Star Trek. Meta zelf verkiest de vergelijking met de Babel Fish uit The Hitchhiker’s Guide to the Galaxy.

De aanpak van Meta is innovatief omdat het bedrijf sleutelt aan een model dat de vertaling in één keer kan doen, en dat voor zowel tekst als spraak als in- en uitvoer in verschillende talen. Het model begrijpt automatisch welke taal er gesproken wordt, en weet zelfs raad met sprekers die van taal wisselen. In theorie kan het dus zelfs in Brussel werken.

Gevoeligheden

Voor de training van het model houdt Meta rekening met eventuele gevoeligheden. Zo let het bedrijf erop dat vertaling niet per ongeluk grof of beledigend worden, en er geen foutieve gender-informatie in woorden sluipt (wanneer een woord bijvoorbeeld vrouwelijk is in de brontaal, maar daar geen equivalent voor bestaat in de doeltaal).

SeamlessM4T is beschikbaar onder een Creative Commons-licentie zodat andere onderzoekers er ook mee aan de slag kunnen.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.