'Biologen moeten ook een beetje data-analist zijn’
Het is tegenwoordig essentieel dat een bioloog om kan gaan met big data. Daarom moeten data-analysevaardigheden vanaf het begin van de studie, of liever zelfs vanaf de middelbare school, worden aangeleerd. Dat stelt Vera van Noort, de nieuwe hoogleraar Computationele Biologie. Oratie op 22 januari.
Biologen zijn al eeuwenlang gefascineerd door alles wat leeft. Het onderzoek naar de structuur van levende organismen is daarbij altijd van groot belang geweest. ‘In de botanie van de 17e eeuw ging dat vooral om het vastleggen van de veelheid aan biologische structuren, om planten vervolgens te kunnen indelen in groepen en soorten,’ illustreert hoogleraar Vera van Noort. ‘In de 20e en de 21e eeuw gaat biologie meer over het begrijpen van mechanismen en functie.’ Nog altijd worden biologische structuren in kaart gebracht, zoals driedimensionale structuren van eiwitten in cellen. ‘Maar dit is vooral om de werking van deze eiwitten te ontdekken en het systeem waarin zij functioneren.’
Biologisch systeem bestuderen
Grote hoeveelheden data zijn hiervoor heel geschikt. Om een biologisch systeem te bestuderen, meten we de aanwezigheid van bepaalde chemische stoffen, bijvoorbeeld de aanwezigheid van eiwitten in een cel. ‘We meten echter niet meer de aan- of afwezigheid van één eiwit in de cel, maar van duizenden eiwitten tegelijkertijd, en ook de concentratie van ieder van die eiwitten. Dit noemen we proteomics, en het levert enorm veel data op.’ Hetzelfde zien we bij de genomics, waarbij grote hoeveelheden DNA-volgorden worden geproduceerd. En ook de microscopie is niet achtergebleven, met enorme hoeveelheden beelden van hoge resolutie. ‘De biologie is dus ook een wetenschap van big data geworden.’
Data-analyse
De biologen van tegenwoordig moeten met al deze hoeveelheden data om kunnen gaan: structureren, behendig zijn met databases, de juiste statistische modelleertechnieken er op los laten en de juiste conclusies trekken, ook al de data incompleet is of ruis bevat. ‘Je moet begrijpen waar correlaties vandaan komen en of er eventueel problemen zijn met de onderliggende data die tot verkeerde conclusies zouden kunnen leiden. Kortom: een bioloog moet de vaardigheden hebben van een data-analist,’ stelt Van Noort.
Vaardigheden aanleren
Die vaardigheden leer je niet met één vak biostatistiek tijdens de studie Biologie, aldus Van Noort. Ze vergelijkt het met piano spelen. Een jaar pianoles in je jeugd is niet voldoende om de rest van je leven mooi piano te kunnen spelen. Je moet blijven oefenen, ook als je geen componist of sterpianist wilt worden. ‘Op dezelfde manier ben ik ervan overtuigd dat we data-analysevaardigheden moeten aanleren vanaf het begin van de studie – liever nog vanaf het lager of middelbaar onderwijs – en blijven onderhouden, ook als we geen wiskundige of statisticus worden. ‘Hoe vroeger we beginnen, hoe beter we een vaardigheid onder de knie krijgen. Hoe meer we er mee oefenen, hoe natuurlijker het gaat.’
Specialist in biologie
Maar kan elke data-analist dan biologisch onderzoek gaan doen, en worden biologen overbodig? Nee, verzekert Van Noort. ‘Zonder kennis van de biologische systemen kun je geen biologische vragen bedenken. Zomaar willekeurig data bij elkaar zetten en er een model op loslaten is niet zinvol. We moeten als bioloog specialist zijn in biologische kennis, en daarbij een aantal vaardigheden beheersen uit andere disciplines.’