Lumi-supercomputer bouwt mee aan enorme LLM’s die Europese talen spreken

De rekenkracht van de supercomputer Lumi, waar ook ons land in investeerde, wordt door academici gebruikt om zelf snel nieuwe maar ook open LLM’s te bouwen gericht op onderzoek.

Microsoft moest een supercomputer in de cloud bouwen om de GPT-3- en GPT-4-modellen te bouwen die ChatGPT aandrijven. De large language models (LLM’s) zijn echter niet open en transparant, en blijven eigendom van OpenAI. Onderzoekers van de universiteit van Turku in Finland willen daarom eigen LLM’s ontwikkelen voor gebruik in de academische wereld, die bovendien niet gebaseerd zijn op het Engels.

Lumi

Ook daar is een supercomputer voor nodig. Gelukkig staat er een echte vlakbij: Lumi. Lumi staat in Finland en heeft een rekenkracht van 309 petaflops. Het systeem, gebouwd door een consortium waar ook ons land deel van uitmaakt, is op dit moment het op twee na krachtigste ter wereld. De onderzoekers gebruiken die rekenkracht om zelf complexe modellen te trainen binnen een werkbare tijdspanne.

LUMI-supercomputer met deels Belgisch DNA is klaar voor gebruik

Met 192 nodes duurt het twee weken om een model met 176 miljard parameters te trainen. Ter vergelijking: GPT-4 zou een amalgaam van vier modellen zijn met iedere 220 miljard parameters.

Samen met AMD

De onderzoekers werken voor de nieuwe LLM’s samen met Hugging Face, dat zich intussen heeft opgeworpen als een soort GitHub voor AI-modellen. De inzet van Lumi is opvallend aangezien de meeste AI-modellen getraind worden met de hulp van Nvidia-hardware.

Vooral de krachtige Nvidia Hopper H100 is een populaire accelerator om training te ondersteunen. Lumi is echter helemaal gebaseerd op AMD-componenten, met een combinatie van Epyc-processors en Instinct MI250X-GPU’s. AMD werkte samen met de onderzoekers om de software te integreren met het complexe hardwareplatform.

Afstuderen in een EU-taal

De samenwerking is belangrijk omdat ze toont hoe de EU ook zonder Microsoft of AWS de nodige infrastructuur heeft om competitief te zijn in de ontwikkeling van AI. Bij de universiteit van Turku lag de prioriteit op de ontwikkeling van een Fins LLM, maar het is de ambitie om zogenaamde funderingsmodellen te bouwen voor alle officiële Europese talen.

Zo’n funderingsmodel is een vooraf getraind model waarmee je aan de slag kan voor concrete toepassingen. Nvidia-CEO Jensen Huang vergeleek het met een pas afgestudeerde werkkracht, die veel kennis heeft maar natuurlijk nog wel een beetje opleiding binnen z’n specifieke eerste job nodig heeft. De universiteit werkt dus aan een soort Europese AI-school waar modellen afstuderen getraind in Europese talen. Het is de ambitie om ’s werelds grootste open model met uitgebreide ondersteuning voor Europese talen te bouwen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Lumi-supercomputer bouwt mee aan enorme LLM’s die Europese talen spreken

Lumi

LUMI-supercomputer met deels Belgisch DNA is klaar voor gebruik

Samen met AMD

Afstuderen in een EU-taal

gerelateerd nieuws

nieuwsbrief