Nvidia schopt chatbots een geweten met NeMo Guardrails

Nvidia lanceert Nemo Guardrails: een opensource toolkit die ervoor zorgt dat chatbots niet van het padje gaan, toegeven wanneer ze iets niet weten en zwijgen wanneer ze iets niet mogen zeggen.

Nvidia stelt NeMo Guardrails voor. Dat is een toolkit waarmee het relatief eenvoudig is om gedragsregels voor chatbots te programmeren. Nvidia maakt NeMo Guardrails meteen opensource en stelt de code via GitHub ter beschikking. Het is de bedoeling dat ontwikkelaars overal ter lande er op verder bouwen, zodat chatbots zo snel mogelijk zo veilig en zo betrouwbaar mogelijk worden.

“Doorgaans praat je als gebruiker niet rechtstreeks met een Large Language Model, maar met een toolkit die daar tussen zit”, licht Jonathan Cohen toe. Hij is Vice President voor Applied Research bij NVIDIA en stelde NeMo Guardrails aan ons voor in anticipatie voor de lancering. “LangChain is zo’n populaire toolkit. NeMo Guardrails zit tussen de gebruiker en het LLM of zo’n toolkit.”

3 domeinen

Daar moet NeMo Guardrails chatbots houvast bieden in drie domeinen:

Onderwerp-gerelateerd: NeMo kan beperken over welke onderwerpen een ChatBot kan praten. Zo kan een bedrijf een LLM bijvoorbeeld verbieden om dieper in te gaan op producten van de concurrentie.
Veiligheid: NeMo Guardrails voorkomt hallucinaties, waarbij een chabot een antwoord verzint zonder feitelijke fundering. De toolkit moet ook gevaarlijke antwoorden of misinformatie tegengaan.
Beveiliging: De opensource toolkit zorgt ervoor dat een LLM niet zomaar aan een externe toepassing kan gekoppeld worden.

Colang

NeMo Guardrails is eenvoudig te programmeren via een taal die Nvidia ontwikkelde: Colang. Die lijkt erg op Engels en dient om NeMo te vertellen wat een chatbot wel en niet mag. Nvidia geeft het voorbeeld van een HR-chatbot binnen het eigen bedrijf. Die mag enkel op HR-vragen antwoorden. Om te voorkomen dat de chatbot informatie over financiële resultaten van Nvidia geeft, die misschien zelfs foutief zijn, volstaat het om enkele voorbeeldvragen rond dat onderwerp te geven en die te koppelen aan een voorbeeld van een weigering.

Stel je dan een vraag over de kwartaalresultaten, dan zegt de chatbot dankzij NeMo iets als “Sorry, ik ben een HR-bot, op die vraag kan ik niet antwoorden.” Hetzelfde geldt voor alle types van ongeoorloofde of malafide vragen. Via Colang moet je niet alle mogelijke ongeoorloofde prompts ingeven; een tweetal voorbeelden volstaat.

Een LLM voor je LLM

NeMo is dus best intelligent. Dat komt omdat de toolkit zelf werkt via een LLM dat voor de job getraind is. “Voorlopig is één van de beste manieren om een LLM te controleren om een ander LLM te gebruiken om antwoorden te verifiëren”, verduidelijkt Cohen. Als een chatbot een antwoord heeft op een vraag, kan NeMo aan zijn fact check-LLM vragen of dat antwoord klopt op basis van de beschikbare bedrijfsinformatie.” Volgens Cohen werkt dat systeem best goed.

Als gebruiker praat je met NeMo, en niet rechtstreeks met het LLM. NeMo verifieert dan antwoorden, maar zorgt er ook voor dat malafide vragen nooit tot bij het LLM geraken. In het voorbeeld van de HR-chatbot kan je bijvoorbeeld als werknemer vragen of Nvidia werknemers die willen adopteren kan bijstaan. Die legitieme vraag gaat naar het LLM, waarna een feitelijk antwoord volgt. Vraag je hoeveel mensen die bij Nvidia werken, al geadopteerd hebben, dan blokkeert NeMo de vraag. Je krijgt te horen dat de chatbot het antwoord op die vraag niet kan delen. In feite is het NeMo die de weigering communiceert, en niet de achterliggende chatbot zelf.

Niet onbaatzuchtig, wel heel relevant

Cohen denkt dat NeMo Guardrails een goed systeem is om chatbots allerhande veilig te houden. “We maken de toolkit opensource, omdat betere chatbots volgens ons een goede zaak zijn voor iedereen”, zegt hij. Toch zien we ook een beetje eigenbelang. Cohen: “De NeMo Engine is bescheiden en gebruikt weinig rekenkracht, maar wanneer NeMo Guardrails zelf iets aan een LLM moet vragen, gaat daar wel een kost mee gepaard.” Met andere woorden: NeMo zelf vertrouwt op inferentie via LLM’s. En wie zou de marktleider zijn in hardware voor dergelijke workloads?

Nvidia toont nieuwe GPU’s om inferentie-honger van nieuwe AI-modellen te stillen

NeMo Guardrails lijkt wel een best complete oplossing die de grootste problemen van chatbots vandaag oplost. Door antwoorden van LLM’s na te kijken, hallucinaties te voorkomen en gesprekken af te bakenen tot onderwerpen waarvoor het achterliggende LLM de juiste informatie ter beschikking heeft, wordt de technologie plots een stuk betrouwbaarder. Via Colang kost het bovendien niet zoveel moeite voor programmeurs om de juiste handvaten voor een chatbot te implementeren.

NeMo Guardrails is per direct beschikbaar via GitHub. Nvidia voorziet meteen verschillende templates van handvaten waar ontwikkelaars mee aan de slag kunnen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.