PhD defence
Digging in Documents - Using Text Mining to Access the Hidden Knowledge in Dutch Archaeological Excavation Reports
- A. Brandsen
- Date
- Tuesday 15 February 2022
- Time
- Location
-
Academy Building
Rapenburg 73
2311 GJ Leiden
Supervisor(s)
- Dr. K. Lambers
- Prof.dr. J.C.A. Kolen
- Dr. S. Verberne
Archeologen produceren grote hoeveelheden teksten, te veel om effectief te kunnen lezen of handmatig te doorzoeken voor onderzoek. Om dit probleem op te lossen hebben we een zoeksysteem ontwikkeld (AGNES), dat zoeken in de volledige tekst van de docmenten combineert met zoeken op entiteiten en zoeken op een kaart.
We hebben eerst een handmatig gelabelde dataset gemaakt om een Named Entity Recognition model te trainen, dat gebruikt wordt om entiteiten uit tekst te extraheren. We hebben ook een studie gedaan naar de gebruikerseisen en een evaluatie van de usability van het systeem, om er zeker van te zijn dat het geschikt is voor archeologisch onderzoek.
In een case studie over Vroeg-Middeleeuwse crematies, laten we zien dat het gebruik van AGNES leidt tot een toename van kennis in vergelijking met de kennis van experts, verzameld met behulp van eerder beschikbare zoekmachines. Dit toont aan dat dit soort intelligente zoeksystemen kunnen helpen bij literatuuronderzoek, meer relevante gegevens kunnen vinden, en uiteindelijk kunnen leiden tot een beter beeld van het verleden.
PhD dissertations
Approximately one week after the defence, PhD dissertations by Leiden PhD students are available digitally through the Leiden Repository, that offers free access to these PhD dissertations. Please note that in some cases a dissertation may be under embargo temporarily and access to its full-text version will only be granted later.
Press enquiries (journalists only)
+31 (0)71 527 1521
nieuws@leidenuniv.nl
General information
Beadle's Office
pedel@bb.leidenuniv.nl
+31 71 527 7211