Het Amerikaanse bedrijf Datacore is gespecialiseerd in de opslag van data. Maar als het van zijn CEO afhangt, is er veel meer mogelijk dan alleen dat. De stap naar AI is in het huidige klimaat dan snel gezet.
Toen Dave Zabrowski in 2018 bij Datacore begon als CEO, was dat met een duidelijke ambitie. Hij wou een platform bouwen dat de opslagindustrie fundamenteel zou veranderen. We hadden een gesprek met de man achter dat plan, om te polsen of die ambitie is waargemaakt en zo ja, hoe dat in zijn werk is gegaan. In één adem keken we samen ook naar de toekomst van Datacore en de grote rol die AI daarin speelt.
Regionale liefde
Het gesprek begint meteen met een onverwachte positieve noot: Zabrowski blaast meteen de loftrompet wanneer hij hoort dat we van België zijn. Hij was hier eerder dit jaar en vertelt dat Datacore een goede klantenbasis heeft in ons land. Hij voegt daar meteen aan toe dat hij België, samen met Nederland, als een belangrijke groeimarkt beschouwt en een goede regio om te investeren.
Onze babbel met Zabrowski gaat echter niet over de vele voordelen van de Benelux. We willen het met hem hebben over de weg die Datacore heeft afgelegd sinds hij er begon als CEO in 2018 en over de toekomstige route.
Datacore 1
Vijf jaar geleden was Datacore vooral een platformbedrijf (organisatie die alle oplossingen in één bepaalde categorie samen aanbiedt) voor dataopslag. “Dat gebeurde historisch gezien vooral in silo’s.” zegt Zabrowski. Een aantal van die platformbedrijven hebben een bepaalde niche, zoals de opslag van back-ups of van bestanden en innoveerden niet langsheen het spectrum. Een schril contrast met de toenmalige plannen en visie van Zabrowski en zijn nieuwe team: Datacore 1.
Met dat project werden de eerste stappen gezet om van Datacore meer te maken dan zomaar een bedrijf voor de opslag van data. “Ons plan in 2019 was om een breed aanbod te creëren om de markt van alle oplossingen te voorzien.” verduidelijkt Zabrowski. “Dat hebben we die eerste jaren (nadat hij CEO werd) gedaan.”
Een deel gebeurde organisch, door investeringen in R&D en een ander onderdeel was de overname van enkele andere bedrijven. “Die overnames waren gericht op een sterke groei van de markt,” zegt Zabrowski.
Dubbele strategie
De focus van die aankopen lag vooral op twee strategische punten, waarvan het eerste ongestructureerde data was. “Historisch gezien draait opslag vooral net rond gestructureerde data,” weet Zabrowski.“Daar was de markt rond opgebouwd. Maar de meeste groei in de huidige markt, die vind je in ongestructureerde data.” Hij geeft een hersenscan als praktisch voorbeeld. De foto’s die daaruit voortkomen, bevatten ongestructureerde data. Het zal niet de laatste keer zijn dat de medische wereld een vermelding krijgt.
Met die strategie als basis nam Datacore dan Caringo over aan het begin van 2021. Dat bedrijf had met Caringo S3 de beste oplossing voor hybride objectopslag in de gehele sector, volgens Zabrowski. “Dat is iets waarin we zwaar hebben geïnvesteerd.” gaat hij verder. “We hadden al onze eigen traditionele blokopslag en daar kwam dan één van de beste oplossingen uit de hele industrie bij met S3.”
Het tweede focuspunt in de strategie voor Datacore 1 was de Kubernetes container-business, nog een markt die volgens Zabrowski de afgelopen jaren sterk is gegroeid. “Kubernetes heeft zich intussen eigenlijk opgewerkt als de facto standaard voor het ontwikkelen van nieuwe applicaties.” vindt Zabrowski. “Het hele systeem is erg mobiel en kan makkelijk tussen locaties bewegen, zoals in de cloud, on prem of aan de edge.”
Kubernetes heeft zich intussen eigenlijk opgewerkt als de facto standaard voor het ontwikkelen van nieuwe applicaties.
Dave Zabrowski
Net als bij het eerste punt was de groei ook een deel organisch en via een overname. Eind 2021 werd Mayadata namelijk toegevoegd aan de portfolio, samen met zijn systeem OpenEBS. “Een opensource product dat de standaard is geworden binnen de Kubernetes-gemeenschap.” zegt Zabrowski.
Datacore had toen al wel een intern project rond Kubernetes lopen. “We creëerden een architectuur en een bètaproduct,” vertelt Zabrowski. “Dat team combineerden we dan met dat van Mayadata, voor de markt van dedicated containeropslag. Een beetje van beiden, organisch en niet organisch.”
Containers en chill
“De reden achter de snelle groei van opslag is vanuit een technisch standpunt best een uitdaging.” vindt Zabrowski. “Een groot voordeel van containers is de vluchtigheid ervan: het is er wanneer je het wil en daarna gaat het weer weg.” Hij gebruikt streamingsdiensten als voorbeeld. “Wanneer je een aflevering van een serie kijkt, creëert dat een container speciaal voor jou. Die gaat vervolgens weer weg wanneer je stopt met kijken. Later zal het systeem vragen of je verder wil kijken en dat komt door persistent storage. Het systeem slaat eigenlijk een status op. Dat is eigenlijk de grote uitdaging in de containermarkt.”
Een groot voordeel van containers is de vluchtigheid ervan.
Dave Zabrowski
Vanuit het opslagperspectief gelooft Zabrowski dat Datacore hiervoor de beste oplossing heeft. Hij noemt het een complexe architecturale uitdaging: de data taggen, weten dat die bestaat en van wie die is.
Daar is AI
Met de integratie van Caringo en Mayadata en de investeringen in eigen onderzoek was Datacore 1 een feit. De visie om een platformbedrijf te worden met de breedst mogelijke waaier aan oplossingen in de sector en dan vooral daar waar de markt het hardste groeit.
Vervolgens keken Zabrowski en de zijnen naar wat datacreatie nu eigenlijk juist veroorzaakte en dat bleek voor een groot deel artificiële intelligentie te zijn. “AI creëert massieve hoeveelheden aan data en veel van die data wordt verwerkt aan de edge.” verklaart Zabrowski. “Historisch bevonden data en compute zich altijd in een hub-spoke-model. Compute in het centrum en wanneer er data was aangemaakt, werd die terug naar de compute gebracht. Data groeit echter exponentieel tegenover compute en dat begint op de duur veel geld te kosten.”
AI creëert massieve hoeveelheden aan data en veel van die data wordt verwerkt aan de edge.
Dave Zabrowski
Veel data, heel veel data
Dat AI aan een steile opmars is, dat weten we intussen wel, maar lang niet iedereen staat stil bij de enorme hoeveelheden data die de technologie genereert. Zabrowski staaft dat met een mooi en recent voorbeeld uit de popcultuur, de serie Ted Lasso. “Een klant van ons doet de hele productie van die serie en in het eerste seizoen genereerde één aflevering 10 TB aan data, wat al een enorm cijfer is.” vertelt hij.
Bovenop die data kwam dan nog eens heel wat AI kijken. Dat kon zijn voor productplacement (het systeem herkent het product of logo en berekent hoeveel elke plaatsing kost), maar ook via 3D-modellen van acteurs om scenes veel sneller in te blikken. “Genereerde een aflevering in het eerste seizoen nog 10 TB aan data, is dat voor eentje van dezelfde lengte nu één PB (petabyte, gelijk aan duizend TB) aan data. Dat is maal honderd op ongeveer drie jaar.” rekent Zabrowski voor ons uit. “Dit is maar één voorbeeld van de explosieve groei die data aan de edge kent.”
Datacore houdt zich ook bezig met gezondheidszorg. Een sector waar AI stevig huishoudt, volgens Zabrowski. “Ik heb medische beeldvorming al een keer vermeld,” zegt hij, “we weten dat dat veel data genereert. Bijvoorbeeld, wanneer je een MRI laat nemen weet je al dat dat proces zelf heel wat gegevens voortbrengt. Maar wat de hoeveelheid aan data echt drijft, is jouw beeld door middel van AI vergelijken met duizenden anderen. Er wordt dan gekeken naar parameters zoals diagnoses, behandelingen of resultaten.” Die enorme hoeveelheden aan data zijn volgens Zabrowski een probleem binnen de gezondheidszorg.
EaaS in the game
Het is op die AI-laag dat Datacore wil innoveren. Het bedrijf gaat van de opslag van de infrastructuur naar AI, met hun eigen oplossing aan de edge: Edge as a Service. Dat is een product dat voortkomt uit Perifery, een nieuwe divisie die in april werd opgericht. Perifery focust zich volledig op de edge-markt.
Met Datacore 1 als basis creëert het bedrijf een efficiënte infrastructuur voor in de AI-laag, via AIOps (Artificial Intelligence for IT Operations). “Op die innovatie zijn we nu echt gefocust,” vertelt Zabrowski, “we noemen dit product AI+.”
“Gartner schat dat de helft van alle data die bedrijven genereren, aan de edge gaat zijn”, gaat Zabrowski verder. “Het model tussen compute en opslag wordt gebroken. In plaats van de opslag naar de compute te brengen, doen wij het omgekeerde. Wij brengen compute eigenlijk naar de edge.”
Wij brengen compute eigenlijk naar de edge.
Dave Zabrowski
“Ons EaaS-model brengt verwerking naar de edge, waarbij metadata wordt onttrokken en ondergebracht in AI+ om vervolgens naar de cloud of on prem te verhuizen voor verdere processen”, verklaart Zabrowski. Hiermee lost Datacore volgens hem het probleem van datazwaartekracht (aantrekking tussen applicaties en data) op voor zijn klanten.
Trendsetter
De timing voor Perifery tegenover de astronomische groei van AI-modellen zoals ChatGPT was niet toevallig. “We waren hier de laatste paar jaar al mee bezig,” verduidelijkt Zabrowski. “Ons team voorzag de enorme hoeveelheid aan data die deze modellen zouden gaan genereren. Ik kon natuurlijk niet voorspellen dat het zo snel zou gaan, maar we waren hier al mee bezig nog voor iemand iets van ChatGPT had gehoord.”
“Wij kijken naar twee zaken: waar wordt de data geproduceerd en door wie of wat. Dat is respectievelijk aan de edge en door AI”, vat Zabrowski het nog een keer samen. “Daarop zijn we al twee jaar gefocust.”
Het opslagverhaal gaat vlot mee met wat Nvidia nu bijvoorbeeld ook beleeft qua compute. Zabrowski is daar duidelijk in: “Zij zijn de verwerkingsunit en hoe meer capaciteit zij verwerken, hoe meer data. Voor ons is dat een ideale kans, omdat we onze oplossing als uniek zien tegenover anderen in de sector, dankzij onze verschillende assets.” Hij ziet ook een mooie cyclus ontstaan: “Hoe meer Nvidia produceert, hoe meer data en hoe efficiënter dat gebeurt, hoe goedkoper het wordt. Daaruit ontstaan meer applicaties, die op hun beurt ook weer voor meer data zorgen.”
Over wat nu het belangrijkste is, de snelle chip of opslag, daar wil Zabrowski zich niet echt over uitspreken. Dat opslag belangrijk is, staat uiteraard buiten kijf: “Ze zijn beiden belangrijk. Holistisch gezien, als je kijkt naar databeveiliging, brengt dat opslag wel naar een ander niveau. In de “levenscyclus” van data is opslag wel een belangrijk onderdeel van het AI-verhaal.”
Geld en groei
Momenteel steunt Datacore op vier grote pilaren:
- SANsymphony hyper converged infrastructure voor IT-infrastructuur
- Swarm voor objectopslag
- Bolt voor Kubernetes
- Perifery voor de edge
Daarvan brengt SAN nog steeds het meeste op voor het bedrijf, maar dat is dan ook zijn klassieker. De basis van dat product bestaat namelijk al meer dan een decennium. Zabrowski nuanceert echter wel een beetje: “SAN groeit nog steeds, vorig kwartaal zelfs meer dan ooit. De andere drie vormen echter het snelst groeiende deel van ons bedrijf. Swarm gaat dit jaar bijvoorbeeld verdubbelen. Ze zijn dan wel kleiner qua opbrengsten, hun groei is veel sneller dan SAN.”
Hoewel hij nog niet aan boord was toen SAN uitkwam, beseft Zabrowski er wel het belang van: “Onze kanalen zijn erop gebouwd en die zijn erg loyaal. Bij nieuwe producten worden we met open armen verwelkomd.”
Levens redden met AI
Dat AI een belangrijk onderdeel vormt in de verdere toekomst van Datacore, dat is nu wel duidelijk. Zabrowski ziet dat nog op heel wat vlakken evolueren: “AI is één van de meest disruptieve technologieën die ik ooit heb meegemaakt, maar dat creëert ook nieuwe mogelijkheden.”
Hij haalt het voorbeeld aan van sentimentanalyse via gezichtsherkenning: “Privacyregels laten niet toe dat bedrijven je foto nemen en die delen, maar ze mogen wel je sentiment analyseren: ben je blij, gefrustreerd, kwaad,… Dat kan heel wat sectoren dramatisch veranderen, zoals casino’s, bioscopen of shoppingcenters. Maar ook security in een luchthaven kan daarmee werken. Er komen heel wat veranderingen, in heel wat sectoren en daar gaan wij met EaaS deel van uitmaken.”
AI is één van de meest disruptieve technologieën die ik ooit heb meegemaakt, maar dat creëert ook nieuwe mogelijkheden.
Dave Zabrowski
Zabrowski denkt verder dan die puur commerciële toepassingen. Hij is bijvoorbeeld een fan van de verschillende levenswetenschappen. “Er is nu veel te doen rond de overgang van 2D- naar 3D-beeldvorming bij het in kaart brengen van genomen. Dat is weer iets dat enorm veel data gaat genereren, vooral bij pathologie of tests.”
Wat voor hem ook belangrijk is, is hoe veel sneller alles kan gaan. “Je kan een erg zieke patiënt hebben of iemand die zelfs in levensgevaar is, waarover je dringend bepaalde analyses nodig hebt. Wij willen de tijd daarvoor dramatisch inkorten: van letterlijk dagen, naar slechts enkele minuten. Dat wordt allemaal mogelijk dankzij EaaS.”