Chinese onderzoekers van Microsoft hebben een nieuwe techniek ontwikkeld om het vermogen van grote taalmodellen te verbeteren op vlak van wiskundige problemen. De techniek om uit fouten te leren zou vergelijkbaar zijn met hoe mensen leren. Het model heet niet toevallig Learning from Mistakes (LeMa).
De onderzoekers van Microsoft Research in Peking en de universiteit van Xi’an Jiaotong onthulden hun, naar eigen zeggen baanbrekende, strategie op de website van Cornell University. Volgens hun paper is het taalmodel getraind om zijn eigen fouten te corrigeren, wat leidt tot verbeterde redeneervaardigheden. Opvallend, vorige week voerde ook Google enkele vernieuwingen door om leerlingen te helpen bij moeilijkere, wiskundige problemen.
Menselijke leerprocessen
De onderzoekers lieten zich inspireren door menselijke leerprocessen, waarbij studenten leren uit fouten om de uiteindelijke prestaties te verbeteren. “Een student die een wiskundig probleem niet kon oplossen, zal leren uit de fouten die hij of zij maakte. Zo leert de student de fout corrigeren”, aldus de auteurs van de paper. Hetzelfde principe pasten ze toe op taalmodellen (LLM’s) waabij ze ‘foutencorrectiegegevensparen’ gebruikten, die door GPT-4 waren gegenereerd om ze te verfijnen.
Concreet lieten de onderzoekers modellen ‘gebrekkige’ redeneerpaden maken voor wiskundige woordproblemen. GPT-4 identificeerde die fouten, gaf er uitleg bij en corrigeerde de redenering. Die aangepaste gegevens gebruikten de onderzoekers aansluitend om de originele modellen verder te trainen. “LeMa verbetert consequent de prestaties en is een belangrijke stap in de richting van AI-systemen die kunnen leren en verbeteren van hun fouten”, aldus het onderzoeksteam.
Open source-benadering
De brede AI-gemeenschap kan het werk van de onderzoekers onder de loep nemen én er zelf mee aan de slag gaan. Alle gegevens, inclusief code en modellen, zijn beschikbaar via GitHub. Deze zet moet verdere vooruitgang op het vlak van machine learning mogelijk maken. De ontwikkeling van een model dat redeneert zoals mensen, kan een revolutie teweeg brengen in sectoren zoals gezondheidszorg, financiën maar ook autonome voertuigen waar foutencorrectie en continu leren uiteraard van cruciaal belang zijn.
lees ook
Nederland bouwt eigen open taalmodel GPT-NL
Volgens Venture Beat ligt er opwindend potentieel in het verschiet op vlak van kunstmatige intelligentie. Naarmate machines bedrevener worden in het leren van hun fouten, komen we dichter bij een toekomst waarin AI de menselijke capaciteiten kan overtreffen bij complexe situaties, klinkt het. Of we daar allemaal zo blij mee moeten zijn, laten wij op de redactie in het midden.