Zin om een eigen ChatGPT te bouwen? Ga aan de slag met StableLM

chatbot AI

Via StableLM kan je aan de slag met twee uitgebreide modellen via GitHub, zolang je akkoord gaat met de randvoorwaarden.

Wie zin heeft om met een Large Language Model (LLM) aan de slag te gaan zoals ChatGPT, kan nu voortaan op GitHub gratis twee modellen raadplegen. Stability AI heeft twee modellen van zijn StableLM beschikbaar gesteld. Het kleinste model bevat 3 miljard parameters, de grotere variant 7 miljard. Op termijn wil Stability AI ook modellen met 15 miljard en 65 miljard parameters online zetten voor ontwikkelaars om mee aan de slag te gaan.

De fabrikant positioneert zich als het opensource-alternatief voor OpenAI met ChatGPT. Die laatste heeft wel ‘open’ in zijn naam, maar is dat tegenwoordig allesbehalve. Stability AI gelooft dat LLM’s de ruggengraat zullen vormen van onze digitale economie. “Iedereen zou daarin een stem moeten hebben”, zegt het in een blogpost waar het model publiek wordt gemaakt.

StableLM claimt dat het dezelfde prestaties haalt als GPT-3, ook al werd die laatste met 175 miljard parameters getraind. Een kleinere dataset maakt een LLM efficiënter, waardoor je die eenvoudiger lokaal kan draaien op bijvoorbeeld smartphones en tablets.

Ontwikkelaars die met StableLM aan de slag willen, kijken best even naar de regels rond eventuele projecten. Het bedrijf stelt de LLM beschikbaar onder een Creative Commons BY-SA-4.0-licentie. Kort samengevat moet je in projecten de originele maker vermelden en dezelfde licentie verlenen.

‘Beter dan GPT-3’

Stability AI haalde trainingsdata uit een nieuwe experimentele dataset gebaseerd op opensourcebron The Pile, maar dan drie keer groter. Ars Technica ging met StableLM aan de slag en merkte dat het model met 7 miljard parameters flexibeler en degelijker reageert dan GPT-3. De publicatie gebruikte een model gebouwd voor dialogen gebaseerd op de Alpaca-methode.

StableLM is nieuw, maar Stability AI is dat niet. Het bedrijf leverde fondsen om een opensource-lancering van Stable Diffusion mogelijk te maken. Deze open tool kan beelden genereren, vergelijkbaar met Dall-E van OpenAI, maar bood ontwikkelaars de mogelijkheid om alles verder te verfijnen. Wat volgde is een razendsnelle ontwikkeling van AI-beelden. Stability AI kwam daarmee in een slecht daglicht, omdat het zijn model zou hebben getraind op onrechtmatig verkregen beelden, waaronder die van Getty Images.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.