­­­Applicaties, ijsbergen en een beetje crack: hoe Snowflake het datalandschap door elkaar wil schudden

Zeg niet data warehouse...

snowflake

Tijdens Summit 2022 stuurt Snowflake naar eigen zeggen zijn belangrijkste aankondigingen in jaren de wereld in. Onder de woestijnzon in Las Vegas schetst het bedrijf waar het meerwaarde biedt en waar het naartoe wil. Is het tijd om de datacloud te omarmen?

Vorig jaar kregen we naar onze oren van Alison Tierney, Senior Vice President EMEA van Snowflake, omdat we gewaagd hadden het bedrijf als een specialist in data warehousing te omschrijven. Dat hebben de mensen van Snowflake niet graag, konden we op Summit 2022 opnieuw vaststellen. Chris Degnan, Chief Revenu Officer, trok tijdens zijn keynote van leer tegen cloudproviders die Snowflake in het data warehouse-segment willen positioneren. “Dat doen ze omdat ze geen antwoord hebben op ons werkelijke aanbod”, aldus Degnan. “Wij zijn de datacloud.”

Wie deelt, wordt slimmer

Daarmee is de toon gezet. In Las Vegas doet Snowflake er alles aan om duidelijk te maken dat het een eenzame speler in het zelf uitgevonden segment van de datacloud is. Natuurlijk biedt Snowflake wel data lake- en data warehouse-functionaliteit, maar daar begint het verhaal pas. De missie van Snowflake is om organisaties de mogelijkheid te geven om niet alleen inzichten maar ook centen uit hun data te halen.

Dat kan door binnen Snowflake op een veilige manier data te delen met andere organisaties, of net datasets van derden te integreren met de eigen gegevens. Historische temperatuurdata zijn daarbij een mooi voorbeeld, aangezien dergelijke data van een externe partij een nieuw beeld kunnen schetsen in combinatie met eigen verkoopdata van korte broeken en paraplu’s.

Turbogroei

De conferentie in Las Vegas is volgens de Snowflake-ingewijden de belangrijkste in een half decennium. De aankondigingen hier tonen de koers die het bedrijf de komende jaren wil varen en dat lokt meer gasten en partners dan ooit tevoren. Snowflake zelf groeide tijdens corona als een kool en tekende 1,2 miljard omzet neer het afgelopen fiscale jaar, goed voor een jaargroei van honderd procent. Het resultaat is een ietwat chaotische conferentie, waar verdient zelfvertrouwen kleine groeipijnen niet kan maskeren.

lees ook

Hoe Snowflake je data veilig toegankelijk wil maken

Op het podium heeft CEO Frank Slootman daar niet veel last van. Hij schetst hoe zijn bedrijf zichzelf vandaag ziet. “Snowflake is niet gewoon een database met infrastructuur. Ons doel is veel groter dan databases in de cloud draaien. We willen een hele stack bieden met een marktplaats, monetizering, applicatieontwikkeling, workload-executie en meer.”

Als de data niet naar de app komt…

Applicatieontwikkeling en de marktplaats: dat is de spil waarrond Summit 2022 draait. “In 2014 ontstond Snowflake en de ambitie om het analytics-landschap te verstoren”, schetst Christian Kleinerman, Senior Vice President Product. “In 2018 wilden we samenwerking door heruitvinden .” Toen evolueerde Snowflake naar wat het vandaag de datacloud noemt: een platform dat het mogelijk maakt om data veilig te delen en te verkopen.

“Nu gaan we app-ontwikkeling verstoren”, zegt Kleinerman. Daartoe brengt Snowflake applicaties naar de data. Het opzet is eenvoudig: Snowflake-klanten hebben hun data in de cloud en gebruiken het Snowflake-platform om die te beheren en te ontsluiten, vrij van silo’s. Snowflake zelf draait op AWS, Google en Azure, en biedt een abstractielaag waardoor het voor de klant weinig uitmaakt waar de onderliggende infrastructuur zit. Het Snowflake-platform heeft wel toegang tot een vrijwel onuitputtelijke bron van cloud-rekenkracht.

…komt de app naar de data

Op Summit 2022 introduceert Kleinerman de Native Apps. Dat zijn applicaties die Snowflake-data gebruiken en als serverless-toepassing draaien binnen het platform zelf. Klanten hoeven dus geen data te dupliceren of te verplaatsen: de applicaties zelf komen naar de data.

‘Applicatie’ mag je daarbij ruim zien. Binnen de Snowpark-ontwikkelomgeving van Snowflake kunnen ontwikkelaars voortaan zelfs met Python aan de slag om toepassingen te ontwikkelen. Snowflake zorgt er automatisch voor dat de belangrijkste Python-bibliotheken uit het Anaconda Default-kanaal geïnstalleerd zijn op het platform.

lees ook

Snowflake integreert Python in Snowpark

Bijkomend integreert Snowflake Streamlit, dat het in maart kocht. Streamlit zorgt ervoor dat machine learning-toepassingen handig gevisualiseerd worden via een front-end die ontwikkelaars met enkele low-code commando’s kunnen samenstellen.

Van data naar inzichten

Het resultaat van dat alles zien we tijdens een demo: met relatief weinig code kan een fictieve organisatie, Sportco, via Python in Snowpark een machine learning-model trainen op zijn data. Dat model kan Sportco vervolgens integreren in een applicatie voor inferentie. Het concrete voorbeeld heeft betrekking op de relatie tussen het advertentiebudget gespendeerd over verschillende kanalen en de opbrengst. Uit historische data concludeert het model wat de impact van bijvoorbeeld hogere uitgaven aan video-advertenties zal zijn op de verkoop in de winkel.

Via Streamlit krijgt die app vervolgens een front-end met een handig grafiekje en sliders waarmee zakelijke gebruikers kunnen ingeven hoeveel ze in een bepaald advertentiekanaal willen uitgeven. De app delen kan via een link.

“Al heeft de gebruiker wel toegang nodig tot Snowflake”, zegt Benoit Dageville, medeoprichter en president of product bij Snowflake. Logisch: de applicatie geeft inzichten op basis van data, en die data zijn enkel toegankelijk voor gebruikers met de juiste rechten. Data-governance is één van de stokpaardjes van Snowflake en dat gaat niet overboord met de native apps.

Snowflake hoopt onder andere met de Python-integratie ontwikkelaars te overtuigen om hun applicaties bij de data te schrijven, maar beseft dat daar een cultuurverandering mee gemoeid is. Technisch ziet het er heel knap uit, maar mensen en bedrijven moeten nog op de kar springen.

Van inzichten naar een nieuw verdienmodel

Snowflake biedt in ieder geval een incentive: centjes. Via de voormalige Data Marketplace, voortaan gewoon Snowflake Marketplace, kan je gebouwde applicaties immers aanbieden aan andere (externe) Snowflake-gebruikers. De Marketplace is een appstore waar je geld kan vragen voor je app via een maandelijks bedrag en eventueel bijkomend per query.

De native applicaties zijn zo een verlengde van de datacloud. Via de marktplaats konden organisaties immers al datasets aanbieden. Met applicaties kunnen bedrijven echter inzichten verkopen, zonder hun data bloot te stellen.

In het voorbeeld kan Sportco zijn applicatie met getraind model in de store aanbieden. Een andere onderneming kan die applicatie dan via de store kopen en installeren. Dat gebeurt automatisch, in de Snowflake-omgeving van de koper. Die kan de broncode niet zien en de data waarop de app gebaseerd is al evenmin.

De klant kan zijn eigen data wel aan de Sportco-app koppelen om zo via het inferentiemodel gebouwd door Sportco tot eigen inzichten te komen. Omgekeerd ziet Sportco als aanbieder van de app niet welke data de koper invoert, aangezien de applicatie serverless in de omgeving van de klant draait. In de praktijk kan de koper zo inzichten van Sportco toepassen op zijn eigen data, terwijl ieders gegevens privé blijven.

Vele verbindingen maken één cloud

De native applicaties vertegenwoordigen de grootste verschuiving in de manier waarop organisaties Snowflake kunnen gebruiken. Ze komen boven op de eerder geïntroduceerde data cleanrooms, waar verschillende bedrijven op een veilige manier kunnen samenwerken op basis van elkaars veilig beheerde data.

Frank Slootman, CEO van Snowflake, ziet hoe zijn platform snel groeit tot een echte cloud met dank aan alsmaar meer dataverbindingen tussen verschillende organisaties.

Het resultaat is een alsmaar groeiende datacloud. “We hebben vandaag al 1.550 stable edges zegt Frank Slootman, CEO van Snowflake. Stable edges is Snowflake-taal voor structurele en duurzame dataconnecties tussen verschillende bedrijven. “20 procent van de klanten heeft minstens één stable edge en klanten die één miljoen dollar of meer spenderen bij ons bezitten er vrijwel allemaal.” De focus van Snowflake ligt op de meerwaarde die dergelijke verbindingen creëren. Vandaar dus datacloud, en niet gewoon data lake of data warehouse.

Transacties en Apache Iceberg

Al vergeet Snowflake in Las Vegas de basis niet. Data delen met derden kan pas wanneer die toegankelijk is in het Snowflake-platform. Daartoe zien we een heleboel aankondigingen. Zo krijgt Snowflake zelf optimalisaties zodat de ingestie van gegevens sneller gaat en minder kost.

Verder is Snowflake trots op de introductie van Unistore, waarmee bedrijven plots transactionele workloads kunnen integreren in Snowflake. Transactiedata verschilt van klassieke analytische data omdat die sneller evolueert en wordt daarom in andere formaten bewaard. Met hybrid tables en een nieuwe storage engine slaat Snowflake nu de brug tussen analytische gegevens en de transactiedata.

Christian Kleinerman, Senior Vice President Product, ziet de compatibiliteit met Apache Iceberg als een grote sprong voorwaarts voor het Snowflake-platform.

Bijkomend pakt Kleinerman op het podium uit met de integratie van Apache Iceberg. “Iceberg is een open standaard die tables definieert aan de hand van een open formaat”, legt Kleinerman uit. Het formaat is geschikt voor enorme tables geschreven in Parquet. Snowflake gaat Apache Iceberg ondersteunen als alternatief voor zijn eigen table-formaat maar biedt er dezelfde functionaliteit op.

Verbindt eens een eigen server

Dat opent de deur naar nieuwe mogelijkheden. Dankzij de ondersteuning van het open table-formaat kan Snowflake plots praten met datasets die niet van het begin af aan in Snowflake werden geïntegreerd. Concreet wordt het mogelijk om on-premises gegevens met Snowflake te gebruiken.

“On-premises is een nieuwe databron voor Snowflake”, legt Tierney uit. “Er zijn nu eenmaal sommige datasets die organisaties nooit in de cloud zullen zetten, zoals bijvoorbeeld gegevens van defensie. Door Snowflake uit te breiden naar die on-premises datasets kunnen organisaties de gegevens wel gebruiken in het platform.” Zo sloopt Snowflake alsnog een belangrijke muur, of toch een beetje. On-premises data draait op de hardware van de klant en niet in de cloud, met alle prestatie-gerelateerde gevolgen van dien. “Een query op die data kost tijd. Er is meer latency. Dat is de verantwoordelijkheid van de klant.”

Het Snowflake-platform beheert dus meer data in meer formaten ,van meer bronnen en doet dat efficiënter dan voorheen. Silo’s tussen gegevens zijn verleden tijd en zelfs tussen organisaties verschijnen er deuren in de hoge muren. Ieder bedrijf bepaalt wie welke gegevens kan zien, en neemt die governance mee wanneer het datasets deelt met externe partijen. Met de native applicaties wordt het zelfs mogelijk om enkel inzichten en functionaliteit op basis van data te delen, zonder dat iemand buiten de organisatie de brondata ooit te zien krijgt.

Onafhankelijk

Ja, Snowflake is een data warehouse. Al  is dat niet de reden dat het Ceasars Forum-conventiecenter uit z’n voegen barst, en een bedrijf als Novartis zijn gevoelige data aan het platform toevertrouwt. Loïc Giraud, Global Head Digital Delivery bij de Zwitserse farmagigant legt het mooi uit: “Ontwikkelaars van medicijnen en de bredere medische sector moeten meer samenwerken. Samenwerking zorgt voor eenvoud, waardoor medicijnen sneller op de markt komen. Wanneer wij een dergelijke onafhankelijke samenwerking probeerden op te zetten, lukte dat niet. Concurrenten trekken onze onafhankelijkheid in twijfel. Een echt onafhankelijke technologiespeler maakt daar het verschil.”

Novartis gebruikt Snowflake nu om bij proeven van nieuwe medicijnen eigen data te combineren met gegevens van deelnemende ziekenhuizen, wat zonder het platform niet mogelijk was. Giraud: “Bij dergelijke proeven zijn heel wat interne departementen en externe partijen betrokken. De tests worden ontworpen, we moeten patiënten zoeken, de geschikte landen en hospitalen voor het onderzoek selecteren, de test monitoren… Met Snowflake brengen we alle data samen en kunnen we die correleren met externe data, wat heel het proces versnelt.”

Novartis vertrouwt Snowflake volledig met zijn data en ziet het datacloud-model als de toekomst. “We waren al geëvolueerd naar een cloud first-strategie”, zegt Giraud, “maar nu hebben we beslist om al onze IT-toepassingen naar de cloud te migreren tegen 2026. We gaan voor cloud only.” Snowflake krijgt de nodige lof, en hoopt daar in Las Vegas verder op te kapitaliseren.

Hip, hipper, cybersecurity

Als Snowflake alle data samenbrengt en helemaal veilig is, waarom zou je het platform dan niet gebruiken als basis voor de IT-beveiliging? Met die ingesteldheid horen we in de wandelgangen enthousiast geroezemoes over de nieuwe ‘Snowflake workload for cybersecurity’.

lees ook

Beveiliging in 2022: wat komt er op je af, en hoe bescherm je jezelf?

Het bedrijf merkt bij monde van Omer Singer op dat beveiligingsteams met dezelfde problemen worden geconfronteerd als andere departementen binnen een organisatie: data zit in silo’s, te veel werk gebeurt manueel en het is moeilijk om geïnformeerde beslissingen te nemen. Klopt, dat probleem is eigen aan alle takken van alle organisaties die middenin een digitale transformatie zitten en waarde uit hun gegevens willen halen. Het hele opzet van Snowflake is om daar een antwoord op te bieden, dus waarom niet voor cybersecuritydata?

Gevaarlijk vaarwater

Singer geeft enkele voorbeelden. Organisaties kunnen security- en logdata bijvoorbeeld combineren met HR-data, aangezien alle gegevens in Snowflake zitten. Handig, dat betwisten we niet. Het zou ongetwijfeld een goed idee zijn moesten beveiligingsspelers massaal hun diensten via Snowflake gaan aanbieden en we begrijpen dat Singer ons graag de capaciteiten van Snowflake door een cybersecuritybril toont.

Beveiliging is weliswaar een hot topic maar hier schiet Snowflake volgens ons zijn doel een beetje voorbij. In de praktijk doen securityspelers vandaag hun eigen ding. Consolidatie van beveiligingsoplossingen bij een enkele speler lost de problemen van datacorrelatie, automatisering en zichtbaarheid voor een groot stuk op, zonder dat Snowflake daarbij een rol speelt. We betwijfelen dat de Fortinets, Sophossen en Check Points van deze wereld staan te springen om hun kar aan Snowflake te hangen. Misschien is het daar nog wel te vroeg voor.

Moet het zwaartepunt van je beveiliging bovendien bij een data warehouse (sorry, datacloud)-provider liggen? Het is mogelijk voor wie wil. Partner Securonix is in Las Vegas erg enthousiast. Uiteindelijk gaat het om een ecosysteem-kwestie. ‘Workload for Cybersecurity’ is een lege doos die Snowflake graag gevuld ziet door security-partners.

Eén keer proberen, voor altijd verslingerd

Snowflake lijkt in ieder geval op goede weg, ondanks het stuiterende aandeel. Bij investeerders heerst de vrees dat Snowflake misschien een ietwat duur product is, maar dat spreken de Snowflake-bobo’s niet verwonderlijk tegen. Ze hebben een punt: omdat de opslag van data volledig losgekoppeld staat van de workloads die je erop loslaat, blijft je opslagkost gelijk, wat je ook doet. “Voor data betaal je 23 dollar per terabyte per maand bij Snowflake”, zegt Singer.

Kapase neemt eveneens uitgebreid de tijd om te schetsen hoe groot de markt wel niet is, zowel voor Snowflake zelf als voor partners. Het bedrijf mikt op tien miljard dollar aan omzet tegen 2029. Het vertrouwen in het product is groot en met reden. Wie zijn data ontsluit en effectief waarde haalt uit de datacloud door te verbinden met externe partijen, zal niet snel terug willen naar een wereld met minder zichtbaarheid. “In feite verkopen we crack”, vertrouwt Dageville enkele analisten toe. “Maar op een goede manier.”

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.