Anthropic bereikt doorbraak in werking neurale netwerken

Het Amerikaanse AI-bedrijf Anthropic heeft aangekondigd dat het vorderingen heeft gemaakt in het begrijpen van artificiële neurale netwerken.

De AI-startup Anthropic heeft een doorbraak bereikt in zijn begrip over de werking van artificiële neurale netwerken. Dat kondigde het bedrijf aan met een uitgebreide blog.

De uitdaging

Zoals de meeste AI-modellen zijn neurale netwerken getraind met data. Omdat ze echter niet werden geprogrammeerd om bepaalde regels te volgen, kunnen zulke modellen zich op heel wat manieren gedragen. Anthropic begrijpt de berekeningen achter de training van de netwerken, maar niet hoe die de gedragingen beïnvloeden. Dit limiteert diagnoses, herstellingen en veiligheid.

SAS Viya breidt uit met doe-het-zelfwerkbank voor AI-applicaties

Experimenten kunnen wel de activatie van elke neuron in een artificieel netwerk vastleggen. Zo kunnen onderzoekers die stimuleren of net stilleggen en het netwerk testen. Helaas hebben neuronen geen consistente invloed op het gedrag van netwerken. De activatie van een neuron kan per context iets heel anders betekenen.

Experiment

Anthropic bouwde machines om units (‘features’) te vinden die gelinkt zijn aan patronen van neuronactiveringen. Hiermee kunnen onderzoekers neurale netwerken opbreken in meer begrijpbare stukken. Ze bouwen er bovendien mee verder op eerder verkregen informatie.

Een laag met 512 neuronen is zo opgebroken in vierduizend units met verschillende betekenissen. Die zijn meestal onzichtbaar bij de individuele activering van neuronen. Dat gebeurde in een transformer language model.

De units bleken veel meer te interpreteren dan aparte neuronen.

Een LLM genereerde vervolgens omschrijvingen van de units. Die is vergeleken met de mogelijkheid van een ander model om met die omschrijving de activatie van een unit te voorspellen. Daarin deden aparte neuronen het opnieuw veel minder. Een unit artificieel activeren veranderde een model op voorspelbare wijze.

Een set van lerende units bleek veelal universeel tussen verschillende modellen, dus de onderzoekers durven ze nu te generaliseren.

De resultaten zijn nog meer goed nieuws voor Anthropic, na de verwachte miljardeninvestering van Google. Dat is dan nog nadat Amazon al een keer hetzelfde deed.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Anthropic bereikt doorbraak in werking neurale netwerken

De uitdaging

SAS Viya breidt uit met doe-het-zelfwerkbank voor AI-applicaties

Experiment

gerelateerd nieuws

nieuwsbrief