Het maximale potentieel uit je data halen met een gedecentraliseerde data mesh

Het is moeilijk om de Belgische economie voor te stellen zonder big data. Veel bedrijven zien al in dat op data gebaseerde inzichten veel waard kunnen zijn voor het succes van de organisatie. Dit blijkt uit het feit dat in 2018 al één op de vijf Belgische ondernemingen big data analyseerde, voor verschillende doeleinden. Tegelijk realiseren Belgische ondernemingen zich dat ze nog verwijderd zijn van het optimaal gebruik maken van data. Daar zijn verschillende redenen voor: sommigen beschikken niet over de juiste tools, anderen missen de tijd die nodig is om daadwerkelijk gebruik te maken van de voortdurend groeiende dataverzamelingen.

Om echt het maximale potentieel uit data te halen, zouden bedrijven moeten kiezen voor een data mesh aanpak.

Waarom een gedecentraliseerde aanpak niet per se hoeft te leiden tot datasilo‘s

Veel internationaal opererende bedrijven hebben een complexe organisatiestructuur. Hoe groter ze zijn, hoe meer afdelingen ze hebben en met hoe meer leveranciers en partners ze samenwerken. Om de vorming van datasilo’s te voorkomen en de informatiestroom te stroomlijnen, proberen zij de input van alle databronnen te bundelen in één centrale oplossing.

Deze strategie heeft echter vaak nadelen: er is vaak maar één datateam in een centraal georganiseerde IT-infrastructuur. Dit team komt vervolgens klem te zitten tussen de vele informatiebronnen aan de ene kant en het steeds verder toenemende aantal gebruikers aan de andere kant. Het team heeft als taak alle datastromen in een centrale repository te integreren. Maar omdat het team vaak niet voldoende op de hoogte is van de precieze inhoud van de data en wie de data in welke context voor analyses gebruikt, lijdt zowel de wendbaarheid als uiteindelijk ook de kwaliteit van de geïntegreerde data hieronder.

Een data mesh is anders. In tegenstelling tot een traditionele, gecentraliseerde infrastructuur vormt het een gedecentraliseerde aanpak voor schaalbaar beheer en beschikbaarheid van analytische data. Het resultaat is dat er niet langer één datateam is dat alle databronnen tegelijk onder zijn hoede moet nemen. In plaats daarvan worden er cross-functionele teams ingezet, die elk alleen verantwoordelijk zijn voor hun specifieke bedrijfsdomein. Afhankelijk van hoe een bedrijf is georganiseerd, kan er één datateam per afdeling zijn, maar het kan bijvoorbeeld efficiënt zijn om verwante gebieden zoals marketing en PR in één domein samen te voegen.

Daarbij is het belangrijk dat elk team over de nodige deskundigheid op zijn specifieke gebied beschikt en bijvoorbeeld weet welke data bijzonder belangrijk zijn op de communicatieafdeling, welke analyses hier regelmatig worden uitgevoerd en wanneer eventueel externe informatie moet worden ingekocht om betere resultaten te behalen. Met deze technische know-how kunnen de afzonderlijke datateams er van tevoren voor zorgen dat de typische knelpunten worden vermeden en dat de gebruikte informatie altijd in de beste kwaliteit beschikbaar is.

Verder zouden bedrijven er goed aan doen om data meer te gaan behandelen zoals ze ook een fysiek product zouden behandelen. Dat betekent dat er ook voor data moet worden gedacht aan een eigen logistiek, governance, opslag en verantwoordelijkheid. Veel wat je nu ziet gebeuren in hoe er wordt omgegaan met data kan (vrijwel) 1-op-1 worden overgenomen van hoe er wordt omgegaan met fysieke producten.

Hoe pas je een data mesh toe in je organisatie?

Allereerst moet je als organisatie duidelijk op een rijtje hebben wat je wil bereiken met je data. Pas als je die vraag duidelijk kunt beantwoorden kun je onderbouwde keuzes maken over welke data je wil centraliseren en welke data je juist wil decentraliseren. Om dit te realiseren doe je er goed aan om zo vroeg mogelijk KPI’s mee te geven aan de verschillende domeinen.

Als je er als bedrijf voor kiest om een data mesh te implementeren in de organisatie dan kun je dat het beste met één stap tegelijk te doen. Kies een afgebakend domein en een specifiek data product waar je een duidelijk doel mee voor ogen hebt en stel daarvoor je eerste cross-functionele team op met een eigen verantwoordelijke. Het is niet de bedoeling dat je daarna stil blijft staan.

Daarnaast is er zowel een technologische, als een culturele verandering vereist om het volledige potentieel uit je data te halen. Sterker nog, de grootste uitdagingen bij het implementeren zitten vaak niet aan de technische kant, maar aan de organisatorische kant. Domeinen worden soms te klein of juist te groot ingedeeld en er ontstaan vaak onduidelijkheden over wie de verantwoordelijkheid neemt over welk domein. Het is dus belangrijk dat je hier als organisatie duidelijke verdelingen en afspraken over maakt. Anders bestaat het risico dat de decentraal georganiseerde infrastructuur juist nieuwe datasilo’s creëert, in plaats van deze te verwijderen. Dat wil je natuurlijk vermijden.

Interoperabiliteit is de sleutel

Vooral voor bedrijven met een complexe organisatiestructuur kan een data mesh de betere keuze zijn, aangezien niet alleen de wendbaarheid maar ook de kwaliteit van de geïntegreerde gegevens lager zou zijn onder een centrale IT-infrastructuur.

Zodra duidelijke afspraken zijn gemaakt over welke datateams verantwoordelijk zijn voor welke domeinen, is het essentieel om de interoperabiliteit tussen de afzonderlijke bedrijfsdomeinen te waarborgen. Dit kan worden gerealiseerd door het maken van overkoepelende standards en het bijhouden van een centraal datateam dat de verschillende teams kan ondersteunen. Dit team is ook belangrijk bij het beantwoorden van datavraagstukken die niet per se gebonden zijn aan één domein.


Dit is een ingezonden bijdrage van Ludmilla von Thun, Sales Engineer bij Snowflake.

nieuwsbrief

Abonneer je gratis op ITdaily !
  • This field is for validation purposes and should be left unchanged.
terug naar home