Onderzoeksproject
Linking University, City and Diversity
In dit interdisciplinaire project worden data science technieken toegepast om de interactie tussen de Universiteit en stad Leiden (Town&Gown) kwalitatief en kwantitatief zichtbaar te maken vanaf 1575. Een van de mogelijke invalshoeken voor vervolgonderzoek is diversiteit, met name vanuit de internationale relaties die er zijn opgebouwd door de eeuwen heen en de impact van de komst van studenten en hoogleraren van buiten Nederland op de stad.
- Looptijd
- 2021
- Contact
- Ariadne Schmidt
- Financiering
- Leiden University
- Partners
Historisch Erfgoed Leiden, Historisch Leiden in Kaart, Universiteit Utrecht
Ontsluiting gedigitaliseerde bronnen maakt nieuw historisch onderzoek mogelijk
Door de samenwerking met data scientists en erfgoedinstellingen wordt het mogelijk om verschillende soorten bronnen, zoals het register van hoogleraren, studenten inschrijvingen in het Album Studiosorum, volkstellingen en kaartmateriaal (kadastrale gegevens) te koppelen op personen en percelen, waardoor de gegevens in samenhang kunnen worden bevraagd en doorzocht.
Uitdagingen vanuit data science perspectief
Het geschikt maken van gedigitaliseerde historische bronnen is een gebied waar machine learning technieken al enkele tientallen jaren worden toegepast maar waar nog veel uitdagingen liggen. In deze context zijn de volgende vragen van belang:
- Van ruwe data (images historische kranten) naar gestructureerde data in datamodel: artikel segmentatie, herkennen entiteiten in OCR tekst
- Netwerkanalyse op gestructureerde data (subgroepen, interactie, zwaartepunten)
- Diachronische veranderingen taalgebruik, perceptie (sentiment), en presentatie (tekst mining)
- Visualisatie tbv ontsluiting / analyse
In het pilot project richten we ons in eerste instantie op vragen 3 en 4.
Plan
In het project richten we ons op het creƫren van een basis infrastructuur die het mogelijk maakt om nieuw historisch onderzoek te kunnen doen. Die infrastructuur zal het mogelijk maken middels een interactieve tijdlijn en een kaart de gestructureerde gegevens over personen, percelen en gebeurtenissen te doorzoeken, te presenteren en analyses te ondersteunen.
Op 3 februari werd het projectplan gepresenteerd aan scheidend rector/voorzitter Carel Stolker (die het project steunt met een startsubsidie) en de nieuwe collegevoorzitter Annetje Ottow (zie ook: https://www.universiteitleiden.nl/nieuws/2021/02/diversere-beelden-van-de-academische-geschiedenis )
Met de startsubsidie gaan we werken aan een visualisatie in tijd en ruimte van beschikbare datasets over studenten en hoogleraren, en een tekst mining analyse doen van historische kranten uit de KB. Het is de bedoeling om de projectresultaten te presenteren tijdens Leiden City of Science 2022.
Visualisaties
Het project wordt gerealiseerd door Bachelor en Master projecten van studenten van het LIACS in nauwe samenwerking met het instituut voor Geschiedenis. In 2022 waren dat Rick Schreuder, Liam van Dreumel en Michael de Koning. Door een project team bestaande uit Richard van Dijk, Ben van Yperen en Michael de Koning wordt deze basis geconsolideerd in een website met visualisaties van hoogleraren en studenten ingeschreven aan de Universiteit Leiden. De visualisaties zijn binnenkort beschikbaar.