Data Science Onderzoeksprogramma
Promovendi aan het woord
Het Data Science Onderzoeksprogramma (DSO) combineert Leidse promotieonderzoeken uit allerlei disciplines met data science. Het programma loopt nu ruim twee jaar, en levert verrassende eerste resultaten op. Hieronder vertellen een aantal promovendi over hun ervaringen en hun onderzoek.
6.000 belastingverdragen doorzoeken op 27 miljoen patronen
Met een algoritme doorzoekt promovenda Manon Wintgens duizenden internationale belastingverdragen. Ze hoopt zo een systeem te ontwaren in het duizelingwekkende samenspel van landen, bedrijven en documenten. Het is een uniek onderzoek. ‘Een kersvers resultaat van mijn onderzoek is bijvoorbeeld dat voormalige koloniën dikwijls een belastingverdrag dat door de voormalige kolonisator wordt gesloten, overnemen. Waarom ze dat doen, dat weten we nog niet. Maar de patroonherkenning zelf is al een belangrijke stap. Je kunt op deze manier gedrag van spelers – landen, verdragen, bedrijven – herkennen, misschien ook gaan voorspellen.'
Het patiëntenforum als kennisgoudmijn
Patiënten met een bepaalde aandoening bezitten samen veel kennis over de kwaal. Bijvoorbeeld welke onbekende bijwerkingen bepaalde medicijnen hebben, of welke voeding kan helpen. Die kennis kan in de eerste plaats goede aanknopingspunten bieden voor nieuw onderzoek naar (behandeling van) de ziekte, ten tweede kunnen patiënten elkaar met deze kennis ondersteunen. Neurowetenschapper Anne Dirkson werkt aan software die dit soort kennis kan verzamelen. 'Om een beeld te geven van de omvang van het werk: een van de onderzochte fora bestaat uit 36277 berichten, 1.255.741 woorden. Uiteindelijk willen we met al die gegevens een kennisbank maken, en die vergelijken met de bestaande kennis. Wat weten we al, en wat is nieuw?'
Een brug slaan tussen sociale wetenschap en datawetenschap
Hoe kun je een zo prettig en gezond mogelijke leefomgeving creëren voor dementie-patiënten? Daniela Gawehns gebruikt data mining-technieken om verschillende soorten databronnen te doorzoeken en een antwoord te vinden op deze vraag. En passant slaat haar onderzoek een brug tussen twee wetenschappelijke disciplines die elkaar soms nog met een scheef oog aankijken. 'Het complexe van dit project zit hem in het combineren van data die eigenlijk niet op elkaar ‘passen’. De waarnemingen van sociale wetenschappers aan de ene kant, de ‘harde data’ van de gegevens aan de andere. Zeker binnen de context van een zorginstelling is zoiets nog niet eerder gedaan.’
Een digitaal oog voor de archeoloog
Prachtig, al die beelden die archeologen tegenwoordig binnenkrijgen dankzij satellieten, hoogtemetingen en andere vormen van remote sensing. Op de scans kunnen ze onontdekte archeologische objecten vinden. Maar inmiddels is er zó veel materiaal beschikbaar, dat het onmogelijk allemaal handmatig kan worden bekeken. In zijn promotieonderzoek werkt Wouter Verschoof-van der Vaart daarom aan de ontwikkeling van een universeel systeem van kunstmatige intelligentie dat op digitale beelden archeologische objecten kan vinden en classificeren. 'De resultaten zijn zeer bemoedigend. De eerste versie van het systeem detecteerde 80% van ons bekende grafheuvels op de Veluwe, de tweede al bijna 90%. De komende twee jaar ga ik het systeem verfijnen, en zorgen dat het ook te gebruiken is door iemand die geen computerwetenschapper is.'
Gebarentalen vergelijken
Er zijn 130 bekende gebarentalen en -dialecten in de wereld. Het kan erg lastig zijn voor taalkundigen om deze gebarentalen te vertalen: elke taal of dialect heeft verschillen in de vorm, positie en beweging van de hand. Computerwetenschapper Manolis Fragkiadakis werkt voor zijn promotieonderzoek aan een computerprogramma dat video’s van verschillende gebarentalen kan vergelijken. Hiermee kunnen verschillen tussen gebarentalen worden ontdekt, en dat kan vertaalfouten voorkomen. Uiteindelijk moet het programma alle gebarentalen van de wereld kunnen vergelijken.