Databricks lanceert opensource LLM DBRX

Databricks mengt zich als nieuwe speler in het ruime aanbod aan LLM’s met DBRX. Het model wordt opensource aangeboden en is volgens het bedrijf het meest geavanceerde in die categorie.

Databricks mengt zich volop in de AI-debatten en lanceert vandaag zijn LLM DBRX. Het bedrijf investeerde tien miljoen euro in de opvoeding van het model, de nodige financiële middelen daarvoor werden vorig jaar bij elkaar gespaard. DBRX is opgebouwd uit 132 miljard parameters en werkt volledig tekstgebaseerd: het model kan dus enkel tekst verwerken en produceren.

In de competitieve AI-markt is het gedurfd om jezelf nog als de beste uit te roepen, maar Databricks heeft een categorie gevonden waarin het uitblinkt. Volgens het bedrijf is DBRX het meest geavanceerde opensource LLM van het moment. Het deelt benchmarks waarin het model zich in taalvaardigheid, programmeren en wiskunde de betere toont van Meta’s LLama2 (dat inmiddels al een opvolger LLama 3 kreeg), Elon Musk’s Grok-1 en de modellen van het Franse Mistral, dat tevens vriend aan huis is bij Databricks.

databricks dbrx benchmarks — Bron: Databricks

Mix van experten

Databricks DBRX werd ontwikkeld volgens een mixture of experts-architecture. Dat houdt in dat het model is onderverdeeld in meerdere submodellen die elks in een specifiek domein getraind zijn. Als je DBRX een wiskundig probleem voorlegt, dan wordt het model dat goed is in wiskunde opgeroepen en vragen over softwarecode worden doorgespeeld naar het model dat daarop getraind is. Dit maakt DBRX in principe lichter om te draaien.

‘Licht’ is een overschatting, want om DBRX te draaien heb je nog altijd minstens vier Nvidia H100-GPU’s nodig en die heeft de doorsnee organisatie niet in een schuif liggen. Databricks zal het model ook via zijn eigen Mosaics AI-platform aanbieden. Voor Databricks-klanten zal dit wellicht de meest toegankelijke weg zijn om DBRX eens uit te proberen.

Open vs gesloten

Databricks durft de benchmarks van DBRX niet naast GPT-4 of Google Gemini te leggen, maar meent wel dankzij het open karakter van het model te kunnen wedijveren met de twee giganten. Het model wordt opensource aangeboden via GitHub en Hugging Face voor onderzoek en commerciële doeleinden.

KubeCon wijst met de vinger naar gesloten AI-modellen: “Concentratie van technologie heeft slechte neveneffecten”

“De meest waardevolle gegevens bevinden zich binnen organisaties. Dit is een sector waar hoge opleidingseisen de toegangsdrempel te hoog liggen voor kleine ondernemingen. Op dit moment zijn alleen de goed gekapitaliseerde bedrijven klaar om mee te spelen. Wij proberen AI voor iedereen mogelijk te maken met opensource modellen”, zegt CEO Ali Ghodsi aan SiliconAngle.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Databricks lanceert opensource LLM DBRX

Mix van experten

Open vs gesloten

KubeCon wijst met de vinger naar gesloten AI-modellen: “Concentratie van technologie heeft slechte neveneffecten”

gerelateerd nieuws

nieuwsbrief