Van mobiliteit tot matchfixing: de wereld van datawetenschap
De wereld van datawetenschap kent vele kanten, bleek tijdens de eindseminar van de Bachelor Honours Class ‘Data Science’ op 31 mei. Onder leiding van docent Iris Yocarini bevroegen de studenten elkaar over hun onderzoeksrapporten en presentaties.
In de Bachelor Honours Class Data Science leren de studenten alles over datawetenschappelijk onderzoek. Een belangrijk onderdeel van dit vak is het dataonderzoek dat de honoursstudenten in groepjes doen en vervolgens presenteren. De presentaties zijn door alle studenten vooraf bekeken, waarna het in de laatste seminar tijd was om elkaar scherp te bevragen op de onderzoeken die andere groepen verricht hadden.
Risico op een hartaanval
De onderwerpen van de onderzoeken liepen erg uiteen. Zo onderzocht groep 8 welke variabelen het beste patiënten met risico op een hartaanval kunnen selecteren. Het bleek te gaan om de maximale hartslag, een bepaalde soort borstpijn en het medische begrip ‘ST-depression’, een afwijking in de elektrische activiteit van de hartspier. Een medestudent vraagt of hun bevindingen ook overeenkomen met de medische praktijk. Mark antwoordt bevestigend: ‘Veel mensen krijgen problemen tijdens het sporten door een zuurstoftekort, wat te maken heeft met die ‘ST-depression’’.
Nauwkeurigheid van mobiliteit
De leden van groep 1 onderzochten iets heel anders: zij keken naar mobiliteitsveranderingen in Italië tijdens de eerste corona-uitbraak, waarvoor ze data van Apple Maps hadden gebruikt. Winter, die met zijn groep dezelfde trends onderzocht maar dan in Nederland, vraagt zich af waarom er gedurende de week en het jaar maar weinig schommelingen zijn in de verkeersdrukte.
Uit hun eigen onderzoek, met behulp van data van Google, bleek namelijk dat de veranderingen in weekenden en tijdens vakanties minder groot waren, omdat de mobiliteit in die periodes altijd al lager ligt. ‘Apple Maps is wat minder nauwkeurig’, weet docent Yocarini te vertellen. ‘Wanneer iemand opzoekt hoe hij ergens kan komen, ziet Apple dit al voor mobiliteit aan, ook al wordt er verder geen actie ondernomen.’
Sumowedstrijden voorspellen
Groep 9 deed aan de hand van sportdata onderzoek naar de mate waarin professionele sumoworstelwedstrijden in Japan te voorspellen zijn. Hoewel speeldatum en tegenstander de beste voorspellende variabelen waren, bleken winst en verlies toch een stuk lastiger te voorspellen dan gedacht. ‘Er wordt ontkend dat matchfixing bestaat binnen het sumoworstelen, maar misschien is dat een verklaring waarom het voorspellen van wedstrijden toch lastig blijkt te zijn’, suggereert Olivier.
Leerzame discussies
Yocarini kijkt positief terug op de seminars die zij heeft mogen geven: ‘Ook tijdens gastcolleges was er nog veel ruimte voor interactie en vragen van studenten. Dat vond ik erg belangrijk, want juist bij een Honours Class – waarin de groep studenten erg divers is – zijn de discussies die we met elkaar hebben over datawetenschap extra leerzaam en motiverend.’
Tekst: Abel van de Sluis