Hugging Face en ServiceNow lanceren gratis AI-codeertool als alternatief voor GitHub CoPilot

PHP code

De AI-startup Hugging Face heeft samen met ServiceNow een gratis AI-codeersysteem uitgebracht onder de naam StarCoder.

Met StarCoder lanceren Hugging Face en partner ServiceNow een gratis alternatief voor codeersystemen met kunstmatige intelligentie, zoals Copilot van Microsoft’s GitHub.

Risico’s en mogelijkheden van AI in codering

Systemen zoals CodeWhisperer van Amazon of Codex van OpenAI (waarop Copilot draait) lichten al een tipje op van de sluier die de mogelijkheden bedekt van AI in codering en computerprogrammeren. Voorlopig zijn er nog heel wat problemen waarmee men rekening moet houden, zowel ethisch, legaal en puur technisch.

Volgens een studie van de universiteit van Cambridge spenderen ontwikkelaars ongeveer de helft van hun tijd aan bugs oplossen in plaats van effectief programmeren. Dat feit kost de software-industrie jaarlijks ruim driehonderd miljard dollar kost. Die problemen oplossen betekent dus een enorme vooruitgang: met een fatsoenlijke implementatie van kunstmatige intelligentie in codering kunnen ontwikkelaars zich focussen op de meer creatieve kant van hun job. Voorlopig zijn er echter nog niet veel systemen publiek beschikbaar.

Daar komt er nu dus wel eentje bij met StarCoder. Daar kan iedereen rechtenvrij gebruik van maken, zelfs bedrijven. Het systeem werd getraind in meer dan 80 programmeertalen en met de verzameling tekst van GitHub, waaronder documentatie en virtuele programmeer-notebooks. Het systeem is eveneens complementair met Visual Studio Code van Microsoft. En net als het gekende ChatGPT kan je StarCoder instructies geven als ‘creëer een gebruikersinterface voor een app’ of vragen stellen over code.

Volgens Hugging Face is StarCoder even goed of misschien zelfs beter als OpenAI. Het bedrijf rekent op de creativiteit en kunde van de opensource-gemeenschap en neemt daarvoor Stable Diffusion als voorbeeld. Enkele weken na de lancering van die AI-beeldgenerator waren er al tientallen variaties en toepassingen in omloop.

Big picture

StarCoder is onderdeel van het project BigCode. Daarmee willen Hugging Face en ServiceNow op een verantwoorde manier baanbrekende AI-systemen ontwikkelen die zelf code kunnen schrijven.

Intussen werken ruim zeshonderd mensen op het project, opgedeeld in verschillende werkgroepen. Zo is er een groep die modellen voor code ontwikkelt, eentje voor evaluatie of een groep die zich focust op de ethische kant van dit onderwerp. Die laatste is niet onbelangrijk: onder de naam Legal, Ethics and Governance bekijkt deze groep alles rond licenties van gebruikte data, de oorsprong van originele code en de risico’s op kwaadwillige code. De groep voert ook redactiewerk uit op potentieel herkenbare persoonlijke informatie.

De bedoeling van BigCode is om een aantal problemen aan te pakken rond de implementatie van kunstmatige intelligentie bij codering. Licenties en auteursrecht zijn bijvoorbeeld een belangrijk punt. Zowel OpenAI als GitHub hebben bij monde van non-profit Software Freedom Conservancy al kritiek gekregen door publiek beschikbare code te gebruiken om commerciële systemen te trainen. Beide bedrijven weerleggen echter dat ze iets doen dat niet mag, toch zeker in de VS.

StarCoder werd getraind via The Stack; dat is een datacollectie met meer dan 19 miljoen licentievrije en samengestelde teksten en wel zes terabyte aan code in ruim 350 programmeertalen. Doordat The Stack licentievrij is kan code die ervan werd gebruikt niet alleen gekopieerd, maar ook aangepast en herverdeeld worden. BigCode helpt ontwikkelaars zelfs om hun werk te verwijderen uit The Stack.

Het project gaat nog een stap verder en werkt actief aan het verwijderen van potentieel herkenbare persoonlijke informatie uit The Stack. Denk aan namen, IP-adressen, gebruikersnamen of zelfs wachtwoorden. Daarbovenop zet BigCode het detectiesysteem voor kwaadwillige code van Hugging Face in om gevaarlijke bestanden uit The Stack te halen.

Belangrijkste problemen aangepakt

Privacy blijft voorlopig nog een stevig aandachtspunt bij het inzetten van generatieve AI. Zulke systemen trainen immers via immense hoeveelheden data die quasi ongefilterd van het internet worden gehaald. Sommige experten waarschuwen zelfs dat AI-codering een gevaar kan vormen voor bedrijven, door gevoelige informatie of teksten waarop auteursrechten rusten te gebruiken zonder dat die firma’s zich daarvan bewust zijn.

Omdat sommige systemen de licenties van gebruikte code verwijderen, is het vaak moeilijk om aan te geven welke code vrij te gebruiken is en op welke codes er beperkingen gelden. Als antwoord op zulke kritiek installeerde GitHub een virtuele schakelaar die het mogelijk maakt voor gebruikers om code waarop potentieel auteursrecht geldt, te vermijden. Ook Amazon installeerde intussen iets gelijkaardigs in zijn CodeWhisperer.

kanttekeningen

Met die bedenkingen in het achterhoofd is het de vraag wat ServiceNow nu juist uit StarCoder haalt; uiteindelijk is het zelf ook een commercieel bedrijf (vooral gericht op automatiseringssoftware). Het antwoord daarop is volgens ServiceNow ‘een sterk model met verantwoorde AI, dat commerciële mogelijkheden toelaat’. De verwachting is dan ook dat ServiceNow StarCoder in de nabije toekomst gaat integreren in zijn commerciële producten.

Het is niet bekend hoeveel het bedrijf exact in BigCode investeerde, maar ServiceNow verklaarde al dat het over een substantieel bedrag gaat. Het bedrijf benadrukte ook nog de vele voordelen die deelname aan het project sowieso oplevert.

StarCoder wordt dan wel geadverteerd als open-source, maar dat klopt niet helemaal. Het systeem wordt uitgebracht onder een licentieregeling die OpenRAIL-M werd gedoopt. Dat houdt in dat er wel degelijk zaken zijn waarmee gebruikers rekening moeten houden. Zo mag StarCoder niet gebruikt worden om kwaadwillige code te schrijven. Specialisten hebben immers al aangetoond hoe AI kan worden ingezet om malware onzichtbaar voor detectie te maken.

StarCoder is vanaf deze week beschikbaar op GitHub; initieel met minder features dan Copilot, maar ServiceNow rekent op de community om verbeteringen aan te brengen en zelfs eigen modellen te voorzien. BigCode blijft intussen verder zoeken naar nieuwe modellen, gelijk met het verbeteren van de huidige systemen. Dat is nodig, want Hugging Face en ServiceNow verklaarden bij de lancering van StarCoder dat er nog wel gevaar kan bestaan voor kwaadwillige code, samen met mogelijke problemen op gebied van privacy en misleidende inhoud.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.