Slim speuren in bergen gegevens
We produceren meer data dan ooit tevoren, en ook onderzoekers verzamelen meer en meer gegevens. Daar zitten een schat aan inzichten en nieuwe mogelijkheden in verborgen. Maar hoe haal je die eruit? In Leiden komen statistiek en informatica samen in innovatief, multidisciplinair onderzoek. Lees erover in het wetenschapsdossier Data Science.
Schatgraven in data
Met onze OV-chipkaart, smartphones en ons gebruik van de zoekmachine Google produceren we continu data. Ook onderzoeksinstellingen produceren meer data dan ooit te voren en de hoeveelheid data op de wereld groeit exponentieel. In al die gegenereerde big data zitten schatten aan informatie verstopt die data scientists naar boven kunnen halen. Met nieuw verkregen inzichten en mogelijkheden kan bijvoorbeeld de ziekte van Alzheimer vroeger gediagnosticeerd worden of inzicht verkregen worden in het ontstaan van het universum. Data science opent deuren tot ongekende mogelijkheden.
Intelligente computers
Data scientists ontwerpen algoritmen waarmee computers patronen kunnen herkennen in grote hoeveelheden data. Ze zorgen er ook voor dat de computers zichzelf slimmer maken waardoor de computers nog meer patronen kunnen vinden en ook taken kunnen uitvoeren met de gevonden inzichten. Met dit soort software kan een computer bijvoorbeeld data van eerdere rechtszaken analyseren en aan de hand daarvan zelf vonnissen leren schrijven. Hoogleraar Juridische Informatica Jaap van den Herik denkt dat over 15 jaar computers al eenvoudige vonnissen zullen afhandelen in de rechtbank, zonder dat daar een rechter aan te pas komt.
Zonder statistiek geen data science
Om software te kunnen ontwikkelen die patronen kan herkennen is een solide basis van wiskunde en statistiek nodig, want alleen met statistiek kun je aantonen dat een gevonden patroon geen toeval is, maar een echt patroon. Al decennia voordat data science een hot topic werd, deden Leidse wetenschappers veel onderzoek naar methodes om patronen en signalen tussen de ruis te vinden in grote datasets. Leiden staat dan ook bekend om de wiskundige, fundamentele aanpak van data science door statistiek met informatica te combineren.
De standaard zetten
De data scientists in Leiden onderzoeken ook de randvoorwaarden van het kunnen bedrijven van data science. Het is bijvoorbeeld organisatorisch een uitdaging om wetenschappers hun datasets beschikbaar te laten stellen. Leiden is de bakermat van de ‘FAIR data principles’. Pas wanneer wetenschappers hun data compatibel maken ontstaat de mogelijkheid om elkaars data te koppelen, waarna slimme computers patronen kunnen gaan ontdekken. Ethisch gezien zijn er ook hordes om te nemen. Hoe ga je verantwoordelijk om met al die data en de daaruit voortschrijdende inzichten?
Lees meer over Data Science in het nieuwe wetenschapsdossier.
Vanuit verschillende disciplines werken onderzoekers van de Universiteit Leiden samen aan een veilige, gezonde, duurzame, welvarende en rechtvaardige wereld. U leest hierover in onze wetenschapsdossiers.