Data-as-a-Service van Bright Data: helderheid troef of privacyschending baas?

Bright Data is een Data-as-a-Service-aanbieder met hoofdkantoren in Israël, de VS en het VK. Wij zaten met het bedrijf samen tijdens de TNW-conferentie om te achterhalen of de dataverzameling even helder en zuiver is als de naam van het bedrijf.

Data-as-a-Service is een overkoepelende term waarmee softwaretools voor dataverzameling en -ordening worden aangeduid. In deze tak van sport werkt Bright Data. Welke data verzamelen zij en waarom zou een bedrijf gebruikmaken van datacollectietools?

Zuivere dataverzameling?

Dataverzameling heeft een negatieve bijklank gekregen door het Cambridge Analytica-schandaal. Het schandaal zit zeker in de geheugens van de meesten vastgeroest, al geven we toch even een opfrissing.

In 2018 kwam aan het licht dat Cambridge Analytica tussen 2007 en 2014 gegevens van miljoenen Facebook-gebruikers buitmaakte. Het verzamelde in de eerste plaats gegevens van 270.000 gebruikers die een quiz op het platform invulden, maar kon via de toenmalige regels van Facebook ook de data van vrienden van deze gebruikers verzamelen. In totaal kwamen de gegevens van 87 miljoen gebruikers zonder hun medeweten in handen van het databedrijf.

Op basis van de data toonde Cambridge Analytica zeer gerichte verkiezingscampagnes aan Facebook-gebruikers. Dat gebeurde onder andere tijdens de eerste verkiezingscampagne van Donald Trump.

Vertrouw magnaten zoals Meta, toen nog Facebook, persoonlijke gegevens toe en het platform en zijn partners zullen gretig profiteren van dat vertrouwen.

Het privacyschandaal benadrukt dat online een bepaalde vorm van voorzichtigheid is aangewezen. Vertrouw magnaten zoals Meta, toen nog Facebook, persoonlijke gegevens toe en het platform en zijn partners zullen gretig profiteren van dat vertrouwen.

Openbare informatie

Bright Data doet evengoed aan dataverzameling. Maar met de grote nuance dat het hier om informatie gaat die publiekelijk toegankelijk is. Een manier van werken die niet indruist tegen de geldende privacyregels. 

Door de jaren heen hebben Europese instanties ook meer handvaten gekregen om privacyschandalen zoals Cambridge Analytica zwaarder aan te pakken. De Algemene Verordening Gegevensbescherming (GDPR) trad op 25 mei 2018 in werking om dataverzameling van privégegevens bij Europese burgers aan banden te leggen. Feiten die daarvoor plaatsvonden, zoals het Cambridge Analytica-schandaal, worden bestraft met minder gepeperde boetes van de Data Protection Act. Deze wet dateert nog uit een ander internettijdperk van 1998.

Bright Data Collector verzamelt publiek toegankelijke data online. Het gaat met andere woorden om gegevens die zichtbaar zijn als de gebruiker niet is ingelogd.

Keren Pakes, VP Brand Marketing en Communicatie

De verzameling van openbare informatie druist niet in tegen de principes van de GDPR. Bright Data ontwierp voor dit doel de dataverzamelingstool ‘Bright Data Collector’ dat het losliet op het publiek in 2020. “Onze tool verzamelt publiek toegankelijke data online. Het gaat met andere woorden om gegevens die zichtbaar zijn als de gebruiker niet is ingelogd”, verduidelijkt Keren Pakes, VP Brand Marketing en Communicatie.

Datasets op maat

Zo werkt het bedrijf met enkele online verkoopplatformen samen. Daar gaat de datacollectie meestal slechts over het verzamelen van prijzen van concurrerende platformen. Stel dat Amazon de dienst gebruikt, dan kan het bedrijf onder andere aftoetsten of zijn prijzen wel competitief zijn. Blijkt bijvoorbeeld een koptelefoon vele malen goedkoper op Bol.com, dan kan Amazon op basis van deze informatie een prijswijziging doorvoeren. Een beetje zoals de Belgische Colruyt zijn prijzen vergelijkt met alle nabijgelegen supermarktketens.

Datacollectietools kunnen dienstdoen voor bedrijven uit verschillende sectoren. De financiële sector, retail, reisorganisaties en cyberbeveiligingsbedrijven zijn slechts enkele voorbeelden uit de brede waaier. Het type informatie dat de dienst verzamelt, verschilt per sector en zelfs per bedrijf. Ieder bedrijf bepaalt immers zelf welke gegevens het graag in zijn dashboard ziet terugkomen. Enige voorwaarden is dat het gaat om publiekelijk toegankelijke informatie.  

Werk uit handen geven

Voor dataverzameling zijn bedrijven niet per definitie aangewezen op externe partijen. Het is perfect mogelijk om de volledige datacollectie en -analyse binnenshuis te regelen met een team data-engineers. Wat geeft een externe tool dan als voordeel?

Om te beginnen vormt het al een uitdaging op zich om een team van dataspecialisten samen te stellen. Personeelstekorten vormen vandaag de dag een probleem waar heel wat industrieën mee te kampen hebben. Steeds meer databedrijven roepen daarom dat er een nood is aan het democratiseren van data

lees ook

Een dataplatform verkopen als avocadotoast: de grote ambities van Dataiku

Bedrijfsspecifieke noden zullen na de democratisering nog steeds in de werkbak van datawetenschappers vallen. Bright Data beweert met een betere oplossing te komen. “Het is mogelijk om datawetenschappers in enkele maanden tijd miljoenen lijnen aan code te laten schrijven, waarna zij deze opgebouwde complex infrastructuur integreren.”

Al is dan de volledige puzzel nog niet gelegd: “Daarna moeten zij uitdagingen bij de verzameling het hoofd bieden”, zoals de correcte en volledige naleving van de GDPR. “Om uiteindelijk de data nog in een niet te complexe opmaak te gieten.” Deze handelingen neemt een datatool om automatisch data te genereren allemaal uit handen.

Data voor vzw’s

Pakes is in haar rol als algemeen-manager van The Bright Initiative zelf betrokken bij het onderdeel dat zich richt op vzw’s en openbare instellingen Zij kunnen de datasets gratis benutten met ‘The Bright Initiative’. Een stap weg van het bedrijfsleven dus, maar het initiatief laat wel zien wat dataverzameling allemaal mogelijk maakt.

Een voorbeeld is de Israëlische organisatie ELEM. “De organisatie struist foto’s van kinderen op Instagram af op zoek naar tekenen van misbruik. Maar liefst één op de acht jongeren zou daar in de thuissituatie mee geconfronteerd worden. Als ze duidelijke aanwijzingen vinden, zoeken ze deze jongeren op om hun uit de onveilige situatie te halen.”

Een duidelijke datastrategie is enorm belangrijk voor bedrijven die willen blijven gelden in het digitale tijdperk. Om personeelstekorten op te vangen en tijd uit te sparen, kan het kiezen van een partner de juiste keuze vormen. Data-as-a-service-dienst Bright Data werpt zich op als één van de mogelijkheden en verzamelt data zonder privacyschending, want ook openbare informatie vormt een schat van informatie.  

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.
terug naar home