‘Jaren oud, eenvoudig te trainen, veel kleiner maar even slim’: Databricks toont toegankelijke ChatGPT-concurrent

Databricks bouwde een AI-systeem met capaciteiten die aan ChatGPT doen denken, maar gebruikte voor de training een twee jaar oud opensource-model en een enkele computer in de plaats van een volledig datacenter.

OpenAI gebruikte miljarden van Microsoft, een supercomputer in de cloud met tienduizenden GPU’s en een complex neuraal netwerk met 175 miljard parameters om ChatGPT te ontwikkelen. ‘Overkill’, vinden ze bij Databricks. Dat bedrijf bouwde met Dolly een AI-systeem dat gelijkaardig gedrag vertoond als ChatGPT, maar deed dat aan de hand van een gewone computer en een twee jaar oud opensource-model met amper 6 miljard parameters.

Dolly kan net als ChatGPT antwoorden genereren op basis van je vragen, en dus tips geven rond een bepaald onderwerp, een promotionele tweet genereren of een liefdesbrief schrijven. Databricks denkt dat Dolly een doorbraak is die generatieve AI-modellen sneller naar een groter publiek kan brengen.

Veel minder moeite, gelijkaardige resultaten

De basis van Dolly is een twee jaar oud opensource-LLM-model gebouwd door EleutherAI. Dat heeft Databricks een klein beetje aangepast om het de mogelijkheid te geven om instructies te volgen en dus de link te leggen tussen input ‘Schijf X of Y’ en output gebaseerd op die vraag. Gewapend met dat raamwerk trainde Databricks het model op een kleine maar heel kwalitatieve gecureerde dataset. Dat deed het bedrijf in drie uur tijd op een enkele machine.

De resultaten hebben Databricks zelf verrast. Het model was erg snel in staat om zich met ChatGPT te meten. Het begrijpt vragen en instructies en genereert nuttige en zinnige tekst op basis van die vragen. Het succes suggereert volgens Databricks dat de doorbraken van OpenAI en consorten niet alleen te wijten zijn aan de toegenomen complexiteit van de gebruikte modellen, maar ook aan de kwaliteit van de datasets.

Dat Dolly met beperkte training en met een opensource-model als basis zo goed werkt, is veelbelovend voor de bredere adoptie van AI denkt Databricks. Het opent immers de deur voor bedrijven om modellen op eigen data te trainen zonder gegevens toe te vertrouwen aan een cloudprovider, of een klein fortuin te spenderen aan AI-hardware in de cloud. Databricks deelt een Github-project waar je zelf met Dolly aan de slag kan gaan.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

‘Jaren oud, eenvoudig te trainen, veel kleiner maar even slim’: Databricks toont toegankelijke ChatGPT-concurrent

Veel minder moeite, gelijkaardige resultaten

gerelateerd nieuws

nieuwsbrief