Leiden: Silicon Valley van FAIR data
Als onderzoekers hun data FAIR maken, kunnen computers grote hoeveelheden data koppelen en patronen herkennen waardoor onderzoekers veel sneller tot nieuwe inzichten kunnen komen. In Leiden, de bakermat van FAIR data, legt professor Barend Mons uit wat die term inhoudt.
Stel dat een computerprogramma via internet toegang zou hebben tot alle resultaten van al het medische onderzoek ter wereld. Het programma zou dan verbanden kunnen leggen die geen arts ter wereld ooit heeft gelegd, simpelweg omdat het meer data betreft dan een mens kan overzien. Dat zou kunnen leiden tot nieuwe inzichten, betere diagnoses en nieuwe geneesmiddelen. Technisch gezien is dit al mogelijk, niet alleen voor de medische wetenschap, maar voor alle disciplines.
Voordat al die data zich hiervoor lenen, moeten ze wel eerst FAIR worden. FAIR staat voor Findable, Accessible, Interoperable en Reusable. Pas als wetenschappelijke resultaten niet alleen vindbaar en toegankelijk zijn voor een computer, maar ook nog verwerkbaar en herbruikbaar, komt het beschreven toekomstbeeld dichterbij.
Toegankelijkheid en privacy
‘Nu al moeten wetenschappelijke publicaties van Nederlands onderzoek gefinancierd door publieke middelen voldoen aan de Open Access-eisen’, zegt Barend Mons, hoogleraar Biosemantiek aan het LUMC. ‘Dat iedereen het artikel mag lezen, betekent echter niet dat de achterliggende onderzoeksdata vindbaar en toegankelijk zijn voor een computer.’ Daarvoor zijn meta-datastructuren nodig: datastations die het computerprogramma vertellen welke soort data waar te vinden is, bijvoorbeeld de medische gegevens over rokers.
De balans tussen informatiekoppeling en privacy mag uiteraard niet verstoord raken. ‘De meta-datastations geven daarom ook duidelijkheid over de mate van toegankelijkheid: zijn de rokersdata beschikbaar voor iedereen, of moet je contact opnemen met een onderzoeksleider?’
Tenslotte moet het computerprogramma de data kunnen verwerken en hergebruiken. Een computer kan niet goed overweg met dubbelzinnigheden, zoals bijvoorbeeld de afkorting PSA die behalve Prostate Specific Antigen, nog meer dan 100 andere betekenissen heeft. Elk mogelijk begrip ter wereld zou daarom een unieke getalcode moeten krijgen, die centraal bekend is.
Delen van data belonen
‘Dat klinkt allemaal ingewikkelder dan het is’, zegt Mons. ‘Het probleem is voor tachtig procent cultureel. Er zijn nog niet genoeg prikkels om wetenschappelijke data te delen. Onderzoekers worden beloond voor de publicatie van hun artikel en hun citation/journal impact factor.’ Dat wetenschappelijke artikel komt wat Mons betreft op de tweede plaats te staan. ‘Er moet een impact factor komen op de data output van onderzoek: als je data worden gecombineerd met een andere dataset, wordt de onderzoeker beloond.’
Mons is voorzitter van een Europese adviescommissie op dit gebied. Volgens hem gaat het niet lang duren, voordat het geschetste toekomstbeeld stapsgewijs realiteit wordt. ‘Vanaf 2017 krijgen onderzoekers alleen nog geld van het subsidieprogramma Horizon 2020, als ze hun data FAIR maken. Zodra andere financiers volgen, moeten de wetenschappers wel. Maar idealiter zien zij zelf heel snel de enorme voordelen van FAIR data en goed datastewardship.’
Leiden Silicon Valley van FAIR data
Het FAIR maken van onderzoeksdata staat wereldwijd op academische agenda’s. Het begrip is echter afkomstig uit Leiden, vertelt Mons niet zonder trots. 'Ongeveer tweeënhalf jaar geleden werden de principes van FAIR data voor het eerst geformuleerd tijdens een workshop in het Lorentz Center. Inmiddels komen experts op het gebied van linked data uit de hele de wereld hier naartoe om FAIR data te implementeren. Als de overheid genoeg investeert, kan Nederland een heel belangrijke FAIR data speler worden en Leiden een soort Silicon Valley van FAIR data.’
Hoogleraar Barend Mons - Social machines & FAIR data
Vanwege de gekozen cookie-instellingen kunnen we deze video hier niet tonen.
Bekijk de video op de oorspronkelijke website ofZie ook:
Publicatie 'The FAIR Guiding Principles for scientific data management and stewardship'
Dutch Techcentre for Life Sciences (DTLS)
Video Vision on Open Science