Onderzoekers stellen zich serieuze vragen bij de beveiliging van het DeepSeek-model. Het model blijkt eenvoudig om de tuin te leiden zijn, waardoor het niet zo onschuldig is.
DeepSeek maakte eind januari een opvallende intrede. Het model werd met aanzienlijk minder middelen ontwikkeld dan ChatGPT, Gemini en consoorten, maar doet op vele tests niet onder. De beveiliging van DeepSeek is veel minder indrukwekkend. Het bedrijf AppSoc nam DeepSeek onder de loep, en gaf een slecht rapport.
lees ook
Binnenwerk DeepSeek-AI beroert gemoederen: hoe werkt het, en wat is gestolen?
De onderzoekers onderwierpen DeepSeek aan zes proeven. Een eerste proef is de jailbreak-test, waarbij er met prompts gespeeld wordt om de beveiligingsmechanismen te omzeilen. Dit bleek bij DeepSeek niet zo moeilijk te zijn: het model scoorde een mislukkingsratio van 91 procent. Op gevoeligheid voor promptinjectie-aanvallen deed het met 86 procent niet veel beter.
Slecht rapport
Ook op andere tests haalde DeepSeek een ruime onvoldoende. Zo bleek het zeer eenvoudig te zijn om met DeepSeek malware te ontwikkelen en is het model gevoelig voor hallucinaties. Het volledige rapport van AppSoc ziet er als volgt uit, waarbij het percentage de mislukkingsratio voorstelt:
- Jailbreaking: 91%
- Prompinjectie: 86%
- Genereren van malware: 93%
- Supply chainrisico’s: 72%
- Gebruik van schadelijke taal: 68%
- Hallucinaties: 81%
Alles opgeteld geeft AppSoc DeepSeek een risicoscore van 8,3 op een schaal van tien, waarbij tien het maximale risico voorstelt. Het gebruik van het model is dus niet zonder risico: AppSoc noemt het zelfs een ‘doos van Pandora’. Naast gebrekkige beveiliging worden ook compliancevragen gesteld.
Dit is niet het enige slechte rapport voor DeepSeek. Palo Alto Networks paste drie jailbreakingtechnieken toe om het model te misleiden. DeepSeek hapte toe en de onderzoekers slaagden erin instructies los te peuteren om molotovcocktails te maken of code voor malware te schrijven. Als kers op de taart, lieten de ingenieurs achter DeepSeek een database met gesprekken van gebruikers wagenwijd openstaan.
Risico’s
AppSoc raadt bedrijven ten strengste af om DeepSeek te gebruiken voor bedrijfstoepassingen en het gevoelige bedrijfsdata te delen. Dat houdt Microsoft en andere grote techbedrijven niet tegen het model mee op te nemen. Om snel mee te zijn met AI, kijken bedrijven naar de prestaties en kostenefficiëntie van modellen en wordt beveiliging te licht genomen, met alle risico’s van dien, waarschuwt AppSoc.
De negatieve evaluaties van DeepSeek blijven niet onopgemerkt. De Italiaanse privacyautoriteit besliste al snel om DeepSeek te verbieden om grondig te onderzoeken hoe gebruiksgegevens verwerkt worden. In de privacyverklaring wordt zwart op wit gesteld dat de servers in China staan. Meerdere landen volgen dat voorbeeld, waaronder de Belgische Gegevensbeschermingsautoriteit.