Zeg het met een beeld: Microsoft werkt aan audio-naar-beeld-generator

microsoft mwc

Uit patentdocumenten blijkt dat Microsoft aan een nieuwe AI-functie werkt die beelden maakt op basis van live audio tijdens vergaderingen, om communicatie visueel te maken.

Een beeld zegt meer dan duizend woorden: Microsoft lijkt dit gezegde wel heel letterlijk op te vatten. Microsoft heeft een patent ingediend voor een nieuwe AI-technologie die live audio kan omzetten naar beelden. De technologie zou onder meer kunnen dienen om Teams-vergaderingen van beeld te voorzien.

Het technische patentdocument legt uit hoe het systeem te werk gaat. De AI luistert mee tijdens vergaderingen en zet de audio voor zichzelf om naar tekst. Op basis van die tekstsamenvattingen genereert het model vervolgens beelden die bij het gesprek horen. Dit gebeurt allemaal in real-time, zodat het beeld de inhoud van de vergadering zo nauw mogelijk opvolgt.

Zien, horen en spreken

Een patent indienen betekent niet automatisch dat Microsoft van plan is de technologie voor het grote publiek te lanceren. Maar de softwarereus ziet er wel degelijk een nuttige toevoeging voor videogesprekken in.

“Wanneer afbeeldingen worden gebruikt als aanvulling op verbale communicatie, kunnen ze helpen concepten verduidelijken en begrijpelijker maken, wat vooral gunstig kan zijn voor mensen die beter leren met visuele hulpmiddelen”, legt Microsoft zijn gedachtegang achter de technologie uit.

Nieuwe updates hebben Microsoft Copilot al ogen en het vermogen om te spreken gegeven. Microsoft zoekt naar manieren om de AI-assistent voor iedereen relevant te maken. Dat lukt met wisselend succes: het aantal gebruikers van Copilot neemt maand op maand toe, maar niet iedereen is al overtuigd van het nut ervan voor zijn of haar werk, inclusief Salesforce CEO Marc Benioff.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.