Meta’s Llama 3 deinst minder terug voor ‘controversiële’ vragen

De nieuwe versie van het Llama-LLM van Meta zal mogelijk volgende maand al verschijnen. De grootste aanpassing zit in hoe het model omgaat met vragen die het als ‘controversieel’ beschouwt.

Mark Zuckerberg kondigde in januari aan dat zijn bedrijf Meta begonnen was met de training van Llama 3, de derde generatie van het LLM. Meta zou op een evenement in Londen hebben bevestigd dat het model volgende maand wordt gelanceerd, nadat The Information eerder op een lancering in de zomer mikte. Meta stopt zijn taalmodel onder andere in de eigen sociale mediaplatformen om generatieve AI-functies aan te drijven.

Controversiële vragen

De grootste aanpassing aan Llama 3 zal, opnieuw volgens The Information, worden aangebracht aan de behandeling van ‘controversiële’ prompts. Om te voorkomen dat het AI-model dingen zegt die Meta reputatieschade kunnen bezorgen, heeft het bedrijf vangrails ingebouwd in het model. Onderzoekers van het bedrijf zouden die veiligheidsmechanismen zelf overdreven vinden, omdat Llama ook weigert te antwoorden op vragen die helemaal niet zo controversieel zijn.

Zo zal Llama je niet vertellen hoe je een oorlog wint om maar een voorbeeld te geven, maar ook tips geven voor een grap uit te halen met een vriend, vindt het model te ver gaan. Een illustrerend voorbeeld dat The Information geeft is dat de huidige versie van Llama bijvoorbeeld ook niet antwoordt op de prompt kill an engine. Het model lijkt niet te begrijpen dat je in deze context vraagt hoe een motor uit te zetten en niet om letterlijk iets te doden, en dus neemt Llama het zekere voor het onzekere.

Llama 3 zou wel in staat moeten zijn om de context bij dergelijke ‘controversiële’ vragen te begrijpen. Dat betekent nog altijd niet dat je het model alles kan laten zeggen natuurlijk. Meta zou de antwoorden die het model ook genuanceerder willen maken en zal daarvoor iemand intern aanstellen om de training van Llama 3 te overzien.

AI uit de bocht

De voorzichtige houding van Meta ten aanzien van zijn LLama-LLM valt wel te begrijpen. LLM’s zijn al vaker uit de bocht gegaan. Denk aan de begindagen van Microsoft’s Copilot, toen het nog Bing Chat heette en bij momenten zeer vreemde antwoorden gaf, van ruzies met gebruikers over de feitelijke juistheid van antwoorden tot liefdesverklaringen.

Het meest actuele voorbeeld van ontsporende AI komt uit het kamp van Google. De techgigant besliste om Gemini tijdelijk geen beelden meer van mensen te laten genereren. Het model was getraind om diversiteit te weerspiegelen in AI-gegeneerde beelden, maar dat leidde in de praktijk vooral tot historische onnauwkeurigheden.

Google excuseert zich voor onnauwkeurige beeldgeneratie Gemini

Dit artikel verscheen origineel op 29 februari. De tekst kreeg een update met de recentste informatie over de lancering.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Meta’s Llama 3 deinst minder terug voor ‘controversiële’ vragen

Controversiële vragen

AI uit de bocht

Google excuseert zich voor onnauwkeurige beeldgeneratie Gemini

gerelateerd nieuws

nieuwsbrief