Franse AI-start-up mikt op goedkope, open spraakintelligentie voor bedrijven.
Mistral stelt Voxtral voor, zijn eerste open audiomodel dat volgens het bedrijf “echte spraakintelligentie” bruikbaar maakt voor productie. Daarmee gaat de Franse start-up de strijd aan met gesloten systemen van grote spelers zoals OpenAI.
Open, betaalbaar en meertalig
Voxtral kan tot 30 minuten audio transcriberen en tot 40 minuten begrijpen dankzij de integratie van Mistral Small 3.1, een compact taalmodel. Gebruikers kunnen vragen stellen over de inhoud, samenvattingen genereren of real-time acties uitvoeren op basis van spraakcommando’s. Het model werkt in meerdere talen, waaronder Nederlands, Engels, Frans, Spaans, Duits en Hindi.

Voxtral komt in twee varianten: Voxtral Small (24 miljard parameters) voor productieschalen, en Voxtral Mini (3 miljard parameters) voor lokale toepassingen. Een aparte transcribeer API is gericht op snelheid en lage kosten, en zou beter presteren dan Whisper voor minder dan de helft van de prijs.
Alternatief voor dure systemen
Volgens Mistral is Voxtral goedkoper dan vergelijkbare oplossingen. Bedrijven kunnen de API gratis testen via Hugging Face of Le Chat. De integratie in applicaties start vanaf 0.001 dollar per minuut.
Voxtral volgt op de recente introductie van Magistral, het redeneermodel van Mistral.