Een cleanroom is een zuivere ruimte waar werk gebeurt zonder contaminatie van buitenaf. Verplaats je dat principe naar de digitale wereld, dan krijg je een data cleanroom. Wat is zo’n data cleanroom precies, en waarom is het belangrijk om sommige data erin te verwerken?
Wil je gevoelige data zoals persoonsgegevens verwerken, correleren met andere data of misschien zelfs linken aan datasets van derde partijen? Dan heb je een oplossing nodig die garandeert dat niemand de gevoelige data niet op een oneigenlijke manier gebruikt. Persoonsgegevens mogen bijvoorbeeld niet lekken naar externe partijen, informatie waarmee je iemand kan identificeren mag je niet zomaar linken aan een externe dataset en bepaalde gegevens mogen de grenzen van de EU zelfs niet uit. Wil je in die context toch waarde halen uit gegevens, dan heb je een data cleanroom nodig.
Een data cleanroom is geen ruimte of zelfs geen server, maar een framework. De verwijzing naar een fysieke cleanroom bestaat niet alleen omdat het goed klinkt in de marketingpamfletten, maar ook omdat de echte cleanroom en de data cleanroom er gelijkaardige principes op nahouden. In beide gevallen staat de cleanroom garant voor een beveiligde en erg gecontroleerde omgeving waarin secure activiteiten plaatsvinden.
Vooral voor persoonsgegevens
Een data cleanroom kom je doorgaans tegen in de context van Personally Identifiable Information (PII), of gewoon persoonsgegevens in het Nederlands. Zeker binnen Europa moet je met dank aan de GDPR-wetgeving omzichtig omspringen met dergelijke gegevens. Je mag ze bijvoorbeeld niet zomaar verzamelen in een database die je dan integraal doorverkoopt aan de hoogstbiedende adverteerder.
Adverteerders mogen natuurlijk wel gepersonaliseerde reclame aanbieden. Dat impliceert dat ze op een bepaalde manier toegang moeten hebben tot data die op z’n minst gebaseerd is op een database met persoonsgegevens. Een data cleanroom biedt hier een oplossing.
Een data cleanroom is een veilige digitale omgeving die persoonsgegevens anonimiseert en aggregeert volgens privacy- en compliance-regels.
Een data cleanroom is een veilige digitale omgeving die persoonsgegevens anonimiseert en aggregeert volgens privacy- en compliance-regels. De anonieme data zijn vervolgens in de cleanroom onder strenge voorwaarden beschikbaar voor externe partijen, die dankzij het cleanroom-principe op geen enkel moment toegang krijgen tot de gevoelige brongegevens.
Boer zkt vrouw
In een cleanroom kan een bedrijf met toegang tot spannende persoonsgegevens die bijvoorbeeld gebruiken om op een geanonimiseerde manier conclusies te trekken over voorkeuren gerelateerd aan bepaalde doelgroepen. Een provider van digitale televisie weet hoe fanatiek jij naar Boer zkt vrouw kijkt, maar mag dat niet verklappen aan een agrarische getinte matchmaking-website die gerichte reclame wil sturen.
De provider kan de data wel anonimiseren en gebruiken om conclusies te trekken op basis van bijkomende gegevens. Misschien kijkt vijftig procent van de mannen tussen de 31 en de 38 jaar oud wel geregeld naar Boer zkt vrouw en misschien is het programma buitensporig populair in de Kempen en de Haspengouwse fruitstreek. Een digitaal advertentieplatform kan aan de hand van die data wel vaststellen wanneer het statistisch interessant is om iemand reclame tonen voor de agrarische datingsite (wanneer alles er op wijst dat een 35-jarige man uit Geel aan het surfen is) en wanneer niet.
Relevante, maar geen gevoelige gegevens
De eigenaar van de persoonsgegevens versleutelt en anonimiseert die op weg naar de cleanroom. Daar worden de data verwerkt en geordend in belangrijke categorieën. Externe partijen krijgen toegang tot de cleanroom waar ze hun data kunnen toetsen aan de inzichten gebaseerd op de anonieme persoonsgegevens. Op geen enkel moment verlaten de feitelijke persoonsgegevens de servers van de originele verzamelaar, of kan de externe partij die inkijken.
lees ook
7 tips om je data veilig naar een cloudomgeving over te zetten
In de cleanroom zitten voldoende relevante gegevens om analyses op uit te voeren. Trends komen aan het licht en (toekomstige) gebruikers kunnen aan de hand van bepaalde kenmerken gekoppeld worden aan categorieën van gebruikers (kapitaalkrachtige autofanaat, jonge wellness-liefhebber, dorstige bier-connaisseur…). Externe partijen kunnen hun gegevens koppelen aan relevante inzichten van andere partijen, zonder dat iemand zijn vergaarde persoonsgegevens te grabbel gooit of op een andere manier z’n voeten veegt aan de GDPR.
Cookies en de data cloud
Cookies worden stilaan richting de uitgang worden geduwd en compliance-wetgeving voor PII is van kracht. Tege de achtergrond bieden data cleanrooms de oplossing om samenwerkingen tussen adverteerders enerzijds, en content- of dienstenproviders anderzijds nog steeds mogelijk te maken.
Data cleanrooms zijn essentieel voor een moderne data-strategie, waarbij iedereen zijn eigendom over vergaarde gegevens behoudt, maar toch inzichten kan delen of verkopen aan derden.
Eén van de partijen die sterk inzet op de meerwaarde van een data cleanroom, is weinig verrassend Snowflake. Dat bedrijf wil immers een soort data cloud uitbouwen waarin bedrijven allerhande hun data combineren met die van andere partijen (al dan niet tegen betaling) om zo tot nieuwe inzichten te komen. Dataprivacy speelt daarbij een essentiële rol.
Telecom
Op het Mobile World Congress praten we daar kort over met Alison Tierney, GVP EMEA bij Snowflake, in de marge van de lancering van de Telecom Data Cloud. Met dat aanbod wil Snowflake telecomspelers in de data cloud betrekken. Zij hebben heel waardevolle informatie voor derden.
Ze weten bijvoorbeeld waar jij was, wanneer en voor hoe lang, aan de hand van je smartphone en wanneer die met bepaalde masten verbindt. Winkeliers in een stad willen (en mogen) niet noodzakelijk weten wanneer jij in de buurt bent, maar trends over drukte en de aanwezigheid van bepaalde doelgroepen zijn natuurlijk wel erg interessant.
“Data cleanrooms bieden al die populatiegegevens, zonder specifieke data”, legt Tierney nog eens uit. “Anonieme data worden in een cleanroom gecorreleerd, zodat bedrijven tot inzichten kunnen komen op basis van datasets die ze niet bezitten en nooit zullen inkijken. Dat resoneert, zeker ook in Europa.”
Cleanrooms voor iedereen
Een data cleanroom is zo veel meer dan een oplossing voor het post-cookie- en GDPR-tijdperk. Een goede implementatie geeft de mogelijkheid aan veel meer bedrijven uit veel meer industrieën om data beschikbaar te stellen. Via cleanrooms kunnen anonieme en beschermde gegevens zo toch bijdragen aan nieuwe inzichten.
lees ook
Wat is Zero-Copy, en wat kan je leren van de Canadese standaard voor data-integratie?
De focus van cleanrooms ligt op inzichten uit persoonsgegevens, maar mogelijke toepassingen gaan veel verder. Alle bedrijven met datasets die ze niet graag willen delen, kunnen via een cleanroom toch gegevens en kennis delen en beschikbaar stellen voor correlatie met andere datasets. Het is belangrijk om te benadrukken dat alles gebeurt zonder dat de gevoelige data gekopieerd worden of ergens op een externe server buiten de controle van de eigenaar terecht komen. In dat opzicht past een data cleanroom ook mooi binnen de filosofie van Zero-Copy Integration.
Wat hebben we geleerd vandaag?
We vatten tot slot nog even de essentie samen: een data cleanroom is een raamwerk waarin je inzichten uit gevoelige data gedeeld kan delen met derden, zonder dat de oorspronkelijke data beschikbaar komen. De data cleanroom is in eerste instantie relevant voor bedrijven die inzichten uit persoonsgegevens willen delen met externe partijen, maar het concept is relevant voor iedereen die de controle over gevoelige data wil behouden maar toch inzichten wil kunnen delen.