Zonder data geen AI: hoe bouw je een solide data-architectuur?

hou bouw je data-architectuur

Wie meer met AI en data wil doen, moet eerst beginnen bij de basis. In een data-architectuur leg je de fundering om je data ten volle te benutten.

Er gaat tegenwoordig geen dag voorbij zonder dat we het over artificiële intelligentie hebben. Nieuwe technologieën worden aan de lopende band aangekondigd en experten uit de sector geraken maar niet uitgepraat over de transformatie die (generatieve) AI teweeg zal brengen bij bedrijven. Mogelijk doet al dat moois ook jouw bedrijf popelen om meer met AI te doen.

Christophe Robyns, Managing Partner van het Brusselse Agilytic, roept op om niet blind mee op de hype te springen. “Bedrijven hebben vandaag hoge, soms onrealistische verwachtingen van AI. Dus gaan ze AI ook gebruiken voor projecten waarbij dat eigenlijk niet hoeft en eenvoudigere alternatieven evenveel meerwaarde zouden bieden. Veel projecten hebben daardoor niet de verhoopte impact.”

lees ook

AI heiligmakend? Klassieke analytics is al goed genoeg

Consultancybureau McKinsey hamert er al jarenlang op dat het ontbreken van een datastrategie en ondersteunende architectuur de grootste struikelblokken zijn voor het halen van digitale transformatiedoelstellingen. Net zoals een huis niet blijft staan zonder stevige fundering, kan ook data niet renderen zonder een goede basis. Met hulp van Robyns bespreken we waar je op moet letten bij het bouwen van data-architectuur.

Blauwdruk van data

Data-architectuur kan je zien als de blauwdruk van je bedrijfsgegevens. Iedere beweging die data maken binnen je organisatie breng je in kaart, van het verzamelen van de ruwe gegevens tot het gebruik ervan in concrete praktijksituaties. Robyns wijst naar artificiële intelligentie om het belang van architectuur aan te tonen:

“Voor experimenten met prototypes is het mogelijk om geen architectuur te hebben, maar wanneer je AI dieper wil integreren in je organisatie, dan wordt dat wel onmisbaar. Modellen zijn heel gevoelig voor deviaties in de data. Het is dus nodig om de kwaliteit van de data voortdurend te monitoren. AI ontwikkelen is op zich niet zo moeilijk, het in leven houden wel”, aldus Robyns.

Een goede data-architectuur groeit mee met je organisatie, benadrukt Robyns. “De noden van je organisatie zullen met de tijd veranderen. Veelzijdigheid en schaalbaarheid zijn cruciale voorwaarden voor een moderne architectuur, zodat je data meegroeien met je bedrijf.

AI ontwikkelen is op zich niet zo moeilijk, het in leven houden wel.

Chris Robyns, Agilytic

Vier dimensies

Voor Robyns zijn er vier dimensies die je voor aanvang van ieder data- of AI-project grondig moet onderzoeken. De antwoorden op die dimensies zullen de architectuur vormgeven. “Alles begint bij het zakelijke doel: wat wil je bereiken met je data? Dit klinkt als een logische beginvraag, maar wordt toch vaker dan je denkt over het hoofd gezien”, zegt Robyns. “Men heeft vaak op voorhand al iets in gedachten, waardoor niet wordt nagedacht over alternatieven.”

Hierna pas komt het technologische plaatje. “Nu moet je je afvragen welke tools je gaat gebruiken en vooral wat je al in huis hebt. Het heeft geen zin om iets te vervangen wat nog goed werkt”, gaat Robyns verder.

Hij deinst er niet voor terug om enkele technologieclichés te doorprikken. “Er bestaan veel verschillende soorten dataplatformen, het ene al wat complexer dan de andere. Een eenvoudig platform is vaak al een heel goede oplossing, als de zakelijke strategie de datastrategie ondersteunt. Bedrijven hebben ook de neiging om te denken dat ze voor alles real-time data nodig hebben, maar dat hoeft niet noodzakelijk.”

Je moet ook voorbij het technologische kijken. Data governance is evenzeer een belangrijk onderdeel van data-architectuur. Als bedrijf dat actief is in de Europese Unie, ben je gebonden aan strikte regels over waar en hoe je gegevens van klanten mag opslaan en hoe lang die nog kunnen worden bijgehouden na verwerking. Of zoals Robyns het verwoordt: “Het is niet omdat je de infrastructuur hebt, dat je die zomaar kan laten draaien. Je moet alle datastromen zorgvuldig documenteren.”

lees ook

Waarom de EU en de VS data anders behandelen

Tenslotte is er nog het organisatorische aspect. Dit zal je niet in elke handleiding terugvinden, maar volgens Robyns is het nodig hier voldoende aandacht aan te besteden. “Een dataproject is geen alledaags IT-project. Dit brengt vaak verschillende disciplines samen. De impact op je teams mag je niet onderschatten. Het volstaat niet om expert in data te zijn, je moet ook expert in transformatie zijn om conflicten tussen teams te verkleinen.”

Om alles nog eens samen te vatten, zijn dit de vier dimenises om data-architectuur rond te bouwen:

  1. Business: wat wil je doen met data? Welke businessproblemen wil je oplossen?
  2. Technologie: welke tools wil je gebruiken om dat doel te bereiken en wat heb je al in huis?
  3. Governance: wat mag je doen met de data waarover je beschikt? Hoe moet je die data bewaren en verwerken?
  4. Organisatie: hoe ga je je teams organiseren voor het project?

Vijf lagen

Omdat data-architectuur in functie staat van specifieke gebruikstoepassingen, is er niet één juiste manier om het uit te bouwen. Ieder project zal een unieke architectuur vereisen. Toch zijn er enkele componenten te onderscheiden die bijna altijd weer terugkeren. Robyns somt er enkele voor ons op:

  • Datapijplijnen: het proces van gegevensverwerking. Datapijplijnen halen gegevens op uit de bron en brengen ze tot bij de bestemming. Die gaan over verschillende soorten gegevens (gestructureerd en ongestructureerd) en naar verschillende opslagbronnen (cloud, on-premise, …)
  • Storage: de plaats waar je data bewaart die in ‘rust’ zijn.
  • Orkestratie: de coördinatie en het beheer van gegevensworkflows en -processen.
  • Toegang & beveiliging: het doel van data-architectuur is om silo’s te breken. Een moderne data-architectuur zorgt ervoor dat iedereen een adequate toegang heeft tot de gegevens.
  • Connectiviteit: platformen moeten kunnen interageren met de omgeving, om bestaande gegevens op te halen of verrijkte gegevens te pushen.

Onzichtbare kracht

Experten zeggen wel eens dat de architectuur belangrijker is dan de data zelf. Data-architectuur is de onzichtbare, stille kracht van je organisatie. Net daarom heeft het Robyns moeite gekost bedrijven hiervan te overtuigen, al ziet hij dat de boodschap wel begint door de dringen. “Als je de directe meerwaarde niet meteen ziet, kan het wat langer duren om iets te omarmen. Wij proberen bij het opzetten van een dataplatform ook zoveel mogelijk concrete use cases op te zetten, om de toegevoegde waarde voor de business aan te tonen.”  

Zonder data geen AI, maar zonder architectuur ook geen bruikbare, betrouwbare gegevens. Dat is de les die we onthouden van ons gesprek met Chris Robyns. Of hoe het gezegde ‘Bezint eer ge begint’ ook bij de nieuwste technologieën altijd weer relevant blijft.

“Een dataproject is geen alledaags IT-project. De impact op je teams mag je niet onderschatten.”

Chris Robyns, Agilytic

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.