Amazon Nova Sonic combineert begrips- en generatiemogelijkheden in één model, waardoor het model in staat zou zijn om menselijke gesprekken te voeren.
Amazon onthult Nova Sonic, een stemmodel dat “mensachtige spraakgesprekken” in AI-toepassingen mogelijk maakt. “Het model houdt rekening met de nuance en complexiteit van menselijke gesprekken”, aldus Amazon in een persbericht. Nova Sonic is het resultaat van zowel begrips- en generatiemogelijkheden, en kan de stemrespons aanpassen op basis van de context. Nova Sonic is beschikbaar via een nieuwe API in Amazon Bedrock.
Mensachtige spraakgesprekken
Waar traditioneel meerdere modellen ingezet worden, verenigt Amazon de begrips- en generatiemogelijkheden in één model. Hierdoor zou het model in staat zijn om de gegenereerde stemrespons aan te passen aan de akoestische context (bv. toon) en de gesproken input. Dit moet een meer natuurlijke dialoog tot stand brengen. Verder zou Nova Sonic de nuances van menselijke gesprekken, alsook de pauzes en aarzelingen in de spreker zijn of haar stem, begrijpen.
lees ook
ChatGPT’s Advanced Voice Mode onderbreekt je minder tijdens gesprek
Het stemmodel kan bijdragen aan de automatisering van klantenservicegesprekken en AI-agenten in een breed scala van sectoren, waaronder reizen, onderwijs, gezondheidszorg, entertainment en meer. Amazon toont in een bericht diverse voorbeelden van scenario’s, waar je het stemmodel aan het werk hoort.
Engelse accenten
Het model is beschikbaar in verschillende Engelse accenten, waaronder Amerikaans en Brits. Volgens Amazon volgt de ondersteuning voor extra talen binnenkort. Het spraakmodel is beschikbaar via een nieuwe API in Amazon Bedrock. Om het model te gebruiken, dien je eerst modeltoegang in- en uit te schakelen in de Amazon Bedrock-console. Nadien kan je navigeren naar Modeltoegang en zoeken naar Amazon Nova Sonic onder de Amazon-modellen.