Hugging Face en ServiceNow lanceren opensource-project BigCode

bigcode-large-language-models-hero

Het nieuwe project moet de ontwikkeling van AI-systemen voor code democratiseren en open trekken.

Startup Hugging Face en ServiceNow Research hebben BigCode gelanceerd. Met het project willen ze de ontwikkeling van AI-systemen voor code naar het grote publiek brengen. Het uiteindelijke doel is om een dataset te ontwikkelen die groot genoeg is om een code-generating systeem te trainen. Met BigCode komen Hugging Face en ServiceNow in het vaarwater van systemen als AlphaCode, CodeWhisperer en Codex.

Open trekken van het onderzoek

Slechts enkele code-generating systemen zijn gratis en via opensource toegankelijk voor iedereen. Met BigCode willen Hugging Face en ServiceNow daar verandering in brengen. Door iedereen toegang te geven tot de ontwikkeling van code, willen ze uiteindelijk een model met 15 miljard parameters ontwikkelen. Een parameter is in Machine Learning een onderdeel dat een AI-systeem heeft aangeleerd.

Hoe meer parameters, hoe meer gesofistikeerd het systeem is en hoe beter code kan worden gegenereerd. Ter vergelijking; Codex heeft 12 miljard parameters en AlphaCode liefst 41,4 miljard. BigCode zal dus worden opengesteld, net zoals Hugging Face heeft gedaan met haar tekst-systeem BigScience. BigCode zal open staan voor iedereen met een professionele AI-achtergrond die tijd kan uittrekken voor het project. Kandidaten moeten eerst een toegangsformulier invullen en krijgen nadien bevestiging van hun deelname.

Vertrouwd met AI

“In het algemeen verwachten we dat kandidaten verbonden zijn aan een onderzoeksinstantie (school of industrie) en dat ze werken aan de technische, ethische en legale aspecten van taalmodellen voor code-applicaties”, zegt ServiceNow in een blog. “Eens het systeem is getraind, dan zullen we de mogelijkheden ervan bestuderen. We streven er naar om die evaluatie gemakkelijker en breder te maken zodat we meer kunnen leren over de mogelijkheden.”

lees ook

Google ontwikkelt taalmodel dat robots in staat stelt ons beter te begrijpen

Met de ruime en open samenwerking wil BigCode een probleem aanpakken dat is gegroeid rond het gebruik van AI-aangestuurde code generatie, meer bepaald rond het fair gebruik ervan. Zo verweet de non-profitorganisatie Software Freedom Conservancy zowel GitHub als OpenAI van het gebruik van opensource voor commerciële doelen. Bij BigCode klinkt het dat ze werk zullen maken van verantwoorde AI-praktijken voor het trainen en delen van code-generating systemen, rekening houdend met de feedback van stakeholders.

Hugging Face en ServiceNow hebben niet aangegeven wanneer ze denken dat het project zal zijn afgerond. Ze verwachten wel dat het project verschillende vormen van code-generatie zal opleveren in de komende maanden. Inclusief systemen die code automatisch vervolledigen en synthetiseren op basis van code-fragmenten en Natural Language beschrijvingen. Bovendien moet het mogelijk zijn om te werken over een breed spectrum van domeinen, taken en programmeertalen.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.