Vandaag werken wetenschappers massaal in aparte silo’s en is interoperabiliteit over de landsgrenzen zelden een gegeven. De European Open Science Cloud (EOSC) wil daar verandering in brengen met een ambitieus project dat in de steigers staat.
Elk Europees land heeft vandaag zijn eigen IT-infrastructuur die beschikbaar is voor wetenschappers, allemaal in aparte silo’s die handenvol geld kosten. Vanuit de Europese Commissie kwam de vraag op een bepaald moment om al die inspanningen van de deelstaten in synergie te brengen. In 2016 volgde een principeakkoord en werd de EOSC in het leven geroepen.
De essentie zit in de data: de onderste laag waarop alles wordt gebaseerd. Die moet machine readable worden zodat je niet altijd een wetenschapper nodig hebt om tot inzichten te komen. Het ambitieuze project zit nog maar in de beginfase.
Belnet voor België
In België is Belnet verkozen als gemandateerde organisatie door de EOSC. De rol is zowel coördinerend als operationeel, met Chris De Loof aan het roer als adviseur sinds eind vorig jaar. Hij legt uit dat Belnet vandaag al een technische provider is voor wetenschappelijke instituten zoals bijvoorbeeld universiteiten. Daaronder valt vandaag connectiviteit, security en opslag. De toplaag met de wetenschappelijke data is nieuw voor Belnet.
Via de EOSC moeten de data beschikbaar worden gesteld voor andere toepassingen, ongeacht in welke silo ze zitten.
“Alle knowhow rond research data zit bij universiteiten en onderzoekscentra. We zoeken op dit ogenblik uit hoe dat allemaal in elkaar zit. Via de EOSC moeten de data beschikbaar worden gesteld voor andere toepassingen, ongeacht in welke silo ze zitten.”
Volgens De Loof is er een digitale transformatie nodig binnen de onderzoekswereld. Vandaag werken we nog teveel met eigen wetenschappers, nationale infrastructuur en bijhorende silo’s. Elk land heeft zijn eigen aanpak, waardoor interoperabiliteit eerder beperkt is. Ieder eigen datacenter kost geld. Daarom rijst sinds enige tijd de vraag bij de deelstaten om Europees geld beter te spenderen en waar nodig synergiën te vinden.
Wisselwerking tussen Europese landen
Allereerst moeten alle datacenters met elkaar worden verbonden. “Mensen en machines moeten data kunnen terugvinden en leveren aan onderzoekers die ze nodig hebben. Het plan ligt al enige tijd op tafel en op 17 december vorig jaar werd de startknop ingedrukt.”
Hij benadrukt dat het hele project een gezamenlijke inspanning is waarbij de Europese Commissie vrij veel geld ter beschikking stelt. “Technisch zitten er al heel wat componenten op hun plaats”, benadrukt De Loof. “We moeten echter over de landsgrenzen kijken. Een wetenschapper moet infrastructuur uit bijvoorbeeld Duitsland of Italië kunnen gebruiken.”. Zo’n gezamenlijk netwerk kan op termijn potentieel wrijving geven.
Stel dat Belgische wetenschappers repositories uit Nederland wil gebruiken, moet dat dan worden gefactureerd? Moet ze in ruil iets worden teruggegeven met andere middelen richting Nederland? Het biedt ruimte voor nieuwe businessmodellen. De Loof verwacht niet dat er veel wrijving zal zijn omdat EU-budgetten vaak kunnen dien als glijmiddel om alles vlot te laten samenwerken. EOSC zit nog in een vroeg stadium, maar de denkoefening is nodig om een gelijk speelveld te voorzien voor elke deelstaat.
Oud en nieuw
Data publiek en machine readable maken is één, maar het start vaak bij de wetenschapper om de metadata aan te vullen. Daarop moet worden gehamerd, want zonder die metadata kunnen organisaties nooit de juiste info vinden. Nieuwe data van de afgelopen vijf jaar bevatten vaak al heel wat metadata, maar het grootste probleem schuilt in historische data. Volgens De Loof schat de EOSC dat 30 procent interoperabiliteit van alle wetenschapsdata binnen een deadline van 20 jaar een succes zou zijn.
Data publiek en machine readable maken is één, maar het start vaak bij de wetenschapper om de metadata aan te vullen.
“Al die datasets van vroeger die overal verspreid liggen op harde schijven, floppy’s of op papier vragen ontzettend veel tijd en mankracht om ze allemaal te digitaliseren. Een deel van het budget gaat naar deze operatie om te voorkomen dat belangrijke wetenschappelijke bevindingen verloren gaan. Denk ook aan geschiedenisdata die bijvoorbeeld 100 jaar oud is. Alle data die je niet permanent op lange termijn kan bewaren, ben je kwijt.”
Om data onder meer machine readable te maken, heeft minister van Innovatie Hilde Crevits (CD&V)voor het Flanders Research Data Network vijf miljoen euro uitgetrokken om alles vorm te geven.
Fair data en open data
Door data over heel Europa beschikbaar te stellen, opent dat heel wat deuren voor andere onderzoekcentra maar ook bedrijven en andere instanties. Niet alle data is open, soms rusten er op bepaalde gegevens auteursrechten. Vergelijk het met opensource-software waar vaak kleine letters gelden die bepalen wat je wel en niet met de software mag doen.
Wanneer burgers, bedrijven of kmo’s die data gebruiken om apps te bouwen, moet er toestemming zijn. Dat is het verschil tussen FAIR data en open data. “Er kan met licenties worden gewerkt, maar soms is dat niet genoeg. Onderzoeksdata kan persoonsgegevens bevatten, wat eerst moet worden geanonimiseerd. De burger moet erbij betrokken worden”, zegt De Loof.
Wanneer burgers, bedrijven of kmo’s die data gebruiken om apps te bouwen, moet er toestemming zijn.
Het hele EOSC-project zou best zijn wagonnetje hangen aan het Gaia-X-project, een Europees cloud-alternatief voor Amerikaanse hyperscalers als AWS, Azure en Google Cloud Platform. In juni vorig jaar werd het startschot gegeven met als doel de soevereiniteit, beschikbaarheid, interoperabiliteit en portabiliteit van data te garanderen, alsook transparantie en eerlijke deelname te waarborgen.
Geen echte deadline
EOSC zit vandaag nog maar in de beginfase. Volgens De Loof is er voorlopig geen deadline, maar is ASAP de juiste teneur. “Wetenschappers hebben steeds meer nood aan betrouwbare digitale data om verder onderzoek te verrichten.”
De keuze voor Belnet in België is een logische. Als nationaal onderwijs- en onderzoeksnetwerk is Belnet één van de weinige onderzoeks-infrastructuren in ons land met een nationale reikwijdte. Via zijn mandaat zal Belnet een rechtstreekse invloed uitoefenen op de strategische richting van de EOSC en de belangen behartigen van alle spelers in het Belgische onderzoekslandschap. Hiervoor zal Belnet nauw samenwerken met onder meer de diverse overheden met wetenschappelijke bevoegdheden.