Bestrijding corona begint met het verantwoord delen van data
Het verzamelen en verspreiden van patiëntgegevens kan een belangrijke bijdrage leveren aan het indammen van het coronavirus. Maar willen we succesvol zijn, dan moeten die data beter. Leidse data stewards sluiten zich daarom aan bij het Virus Outbreak Data Network (VODAN).
Wat zijn de belangrijkste symptomen van het coronavirus? Voor welke groepen vormt het virus het grootste gevaar? En hoe lang ligt een patiënt gemiddeld op de intensive care? De antwoorden op deze vragen sijpelden de afgelopen dagen en weken binnen vanuit ziekenhuizen van over de hele wereld. En het zijn natuurlijk vragen van levensbelang, want ze bepalen onder meer wie er in quarantaine moet en of de ziekenhuizen voldoende bedden hebben.
Het net opgerichte Virus Outbreak Data Network (VODAN) wil de dataverzameling en -verspreiding rond het coronavirus en andere epidemieën nu professionaliseren, waardoor dit soort belangrijke vragen sneller en beter kunnen worden beantwoord. VODAN is een samenwerkingsverband dat voorkomt uit GO FAIR, een Leids initiatief om data in brede zin beter toegankelijk te maken voor wetenschappelijk onderzoek. Vanuit de Universiteit Leiden zijn onder meer het LUMC en het Centre for Digital Scholarship van de Universitaire Bibliotheken Leiden (UBL) aangesloten bij dit internationale initiatief.
‘Over de hele wereld verzamelen ziekenhuizen momenteel patiëntgegevens over het coronavirus, bijvoorbeeld over de symptomen, de behandeling en het ziekteverloop,’ zegt Kristina Hettne, die werkzaam is bij het Centre for Digital Scholarship. ‘Met VODAN willen we ervoor zorgen dat die data onderling uitgewisseld kunnen worden, zodat anderen ervan kunnen leren. Het is van groot belang dat ze snel en efficiënt kunnen worden gedeeld.’
Het basisprincipe is daarbij dat de data FAIR zijn: findable (vindbaar), accessible (toegankelijk), interoperable (onderling vergelijkbaar) en reusable (herbruikbaar). Op die manier kunnen data over de hele wereld gebruikt en vergeleken worden door onderzoekers en artsen, en zijn ze zelfs geschikt voor gebruik in kunstmatig intelligente software of machine learning. Op dit moment voldoen nog lang niet alle data aan deze FAIR-principes, bleek bijvoorbeeld uit de ebola-epidemie (zie kader).
Ebola: hoe het niet moet
Hoe hard het VODAN-initiatief nodig is, blijkt wel uit de ebola-uitbraken die de afgelopen jaren Afrika teisterden. Data over die uitbraken zijn moeilijk te vinden en te openen, en al helemaal niet onderling vergelijkbaar of herbruikbaar. In het geval van ebola is het bovendien ironisch dat de data het minst toegankelijk zijn voor gebruikers in landen die het meest getroffen werden door de epidemie.
‘Daarnaast is het van groot belang dat alle data opgeslagen blijven in hun land van oorsprong,’ zegt LUMC-hoogleraar Barend Mons, die de leiding heeft over VODAN. ‘In deze crisistijd is de roep erg groot om alle ziekenhuisdata centraal op te slaan. Maar dat is onrealistisch. Vanwege geopolitieke redenen zal China haar gegevens waarschijnlijk niet zomaar willen overdragen aan de VS, en vice versa. Bovendien mag dat in veel gevallen ook niet van de privacywetgeving.’
VODAN moet daarvoor een alternatief bieden. Dat alternatief bestaat uit ‘datastations’ in alle deelnemende landen, van waaruit de gegevens veilig gedeeld kunnen worden. Met algoritmes kun je vervolgens een ‘treintje’ laten rijden dat bij al die stations de juiste gegevens gaat ophalen. Op die manier houden de deelnemende landen de volledige controle over hun data, maar is er toch gegevensuitwisseling mogelijk.
‘Als alle partijen meedoen, kunnen we bijvoorbeeld onderzoeken waarom mannen zo veel zieker worden dan vrouwen,’ geeft Mons als voorbeeld. ‘Komt dat door hun testosteronniveau? En zo ja, hoe vergaat het mannen die toevallig om medische redenen testosterononderdrukkers slikten voordat ze ziek werden? Je hoeft maar een algoritme aan te maken of je kunt deze data opvragen bij de deelnemende landen.’
De komende weken en maanden worden cruciaal voor het FAIR-principe. De grote dataorganisaties en talloze individuele wetenschappers hebben zich in solidariteit achter VODAN geschaard, maar het is nog afwachten of het genoeg is. Wordt dit de definitieve doorbraak van FAIR? Of vallen we juist in crisistijd op oude reflexen? ‘Eén ding is zeker,’ zegt Mons. ‘Het algoritme zal het worst wezen dat de data niet op één plek zijn opgeslagen.'
Tekst: Merijn van Nuland
Mail de redactie