Salesforce lanceert CoAct-1-techniek voor geautomatiseerde AI-agenten 

Salesforce lanceert CoAct-1-techniek voor geautomatiseerde AI-agenten 

Onderzoekers van Salesforce ontwikkelden een nieuwe techniek die AI-agenten automatiseert.

Salesforce heeft de CoAct-1-techniek ontwikkeld en beschreven in een paper. De techniek laat AI-agenten code uitvoeren terwijl ze doorheen interfaces navigeren. Dat wil zeggen dat ze de cursor kunnen verplaatsen en ermee kunnen klikken. Zo zouden AI-agenten sneller werken en minder fouten maken.

Drie agenten combineren

CoAct-1 bestaat uit drie onderdelen: een Orchestrator agent die het werk verdeelt in de back-end, een graphical user interface (GUI)-operator agent die front-end op schermen navigeert, en een Programmer agent die code schrijft in Python of Bash. Het systeem beslist zelf of een taak beter via klikken of coderen verloopt. CoAct-1 lost taken op in gemiddeld tien stappen, een mooie verbetering vergeleken met de vijftien stappen van agenten die geen gebruik maken van de techniek.

werkwijze coact-1

Bron: CoAct-1 Paper

Op de OS-World benchmark met 369 realistische computertaken behaalde CoAct-1 een succespercentage van ruim 60 procent, een nieuw record. Vooral complexe taken, zoals het filteren van bestanden of het comprimeren van mappen, werden efficiënter en minder foutgevoelig.

Uitdagingen blijven groot

Hoewel de techniek goed scoort in benchmarks, zijn zakelijke omgevingen vaak rommeliger of werken ze met onduidelijk interfaces van legacy software. Voorlopig is er nog menselijk toezicht nodig om het werk van AI-agenten in de juiste banen te leiden.

Daarom stelt Salesforce een doel op: “Een systeem waar de agent kan observeren hoe de mens werkt, verder wordt getraind in een sandbox-omgeving en na livegang continue begeleiding en bescherming krijgt.” Voorlopig is dat toekomstbeeld nog fantasie, en zal het waarschijnlijk jaren duren om dat werkelijkheid te laten worden.