Sinds juni is de AI-programmeertool Copilot beschikbaar voor iedereen. Omdat de Opensource gegevens doorstuurt naar moederbedrijf Microsoft, zorgt dit voor problemen bij sommige ontwikkelaars. Enter FauxPilot, een platform dat onafhankelijk draait en geen (of veel minder) gegevens doorspeelt.
Copilot draait op een Open AI-codex, gebaseerd op GPT-3 en getraind op miljarden aan publieke code in de GitHub-huishouding. Alleen, Microsoft en GitHub specifiëren niet welke repositories (een locatie of combinatie van gedistribueerde locaties die gegevens bevatten) de codex informeren. Dat kan voor grote ontwikkelaars veiligheidsproblemen met zich meebrengen.
Alternatief zonder gegevensverzending
In een blogpost eerder dit jaar schreef Bradley Kuhn (Software Freedom Conservancy) dat “de copyleft van Copilot een uitdaging is voor de gebruikers. Door de toenemende populariteit en verbetering van de tool zal de aansprakelijkheid van de gebruiker ook vergroten. Op dit moment hebben die gebruikers enkel een onderbouwde gok als steun om te weten of een output van Copilot door iemand anders auteursrechtelijk is beschermd.”
FauxPilot, ontwikkeld door Brendan Dolan-Gavitt (NYU Tandon) gebruikt geen codex maar vertrouwt op CodeGen van Salesforce. Al zal gebruikers van FOSS (Free and Open Source Software) misschien ook niet bevallen. Want net als Copilot is CodeGen getraind op publieke open source, zonder rekening te houden met verschillende licenties.
Het voordeel van FauxPilot is dat het AI-ondersteunde software on-premises kan draaien. “Er zijn gebruikers die problemen hebben met veiligheid en die gegevens niet kunnen, willen of mogen verzenden via Copilot. Voor hen is het belangrijk om de tool enkel lokaal te draaien”, zegt Dolan-Gavitt.
Onderzoeksplatform
Volgens Dolan-Gavitt is FauxPilot een onderzoeksplatform om code te trainen die meer beveiligde output genereren. “Van zodra we daar in slagen, kunnen we die code testen en dat misschien wel samen met gebruikers van Copilot. Het is een grote uitdaging om een dataset creëren zonder veiligheidsproblemen want dergelijke modellen zijn enorm data-afhankelijk”, zegt Dolan-Gavitt.
De onderzoeker zegt bovendien dat wie FauxPilot gebruikt met de officiële Visual Studio Code Copilot extensie, toch nog gegevens zal doorzenden naar GitHub en Microsoft. Zij het geen code completion requests. “Zodra we onze eigen VSCode extensie hebben zal dat probleem zijn opgelost.
Kortom, FauxPilot stuurt geen gegevens naar Microsoft en GitHub. Wie een totaal Microsoft-vrije werkervaring wil met VSCode, moet de extensie van FauxPilot gebruiken zodra die klaar is.