Gebruiker proof of concept toegang Digitaal Magazijn KB
Voor deze use case zoeken wij een gebruiker die voor onderzoeksdoeleinden interesse heeft in de auteursrechtelijk beschermde collectie van de KB en ons kan helpen met het opstellen door wensen, noden en ervaringen te delen.
Onder de wat saaie naam "Use Case #3" vindt in work package 6 "Tekst" van CLARIAH PLUS een uitdagend infrastructureel experiment plaats met onder andere de CLARIAH PLUS-partners Koninklijke Bibliotheek en Huygens Instituut. Voor deze use case zoeken wij een gebruiker die voor onderzoeksdoeleinden interesse heeft in de auteursrechtelijk beschermde collectie van de KB en ons kan helpen met het opstellen door wensen, noden en ervaringen te delen.
Wat houdt de use case in?
"Use Case #3" zal experimenteren met de methode waarbij het onderzoeksalgoritme naar de data wordt gebracht. Het Use Case team bestaat uit verschillende deelnemers, waaronder twee gebruikers die elk hun eigen onderzoek willen doen met een subset van de KB-collecties. Eén onderzoek zal zich buigen over de analyse van literaire bronnen en heeft dus een letterkundige invalshoek. Om ook een meer historische invalshoek te hebben en zo ook meer te weten te komen over mogelijk eisen en wensen van historici zijn wij zijn op zoek naar een onderzoeker die het leuk zou vinden om dit experiment samen met ons aan te gaan.
Wie zoeken we?
Wij zoeken een historicus (niveau vanaf Phd-student) die geïnteresseerd is in de mogelijkheden van computationeel onderzoek; die een onderzoeksvraag heeft waarvoor een hoeveelheid tekstmateriaal doorzocht zou moeten worden waarvoor een menselijke onderzoeker niet aan één carrière genoeg zou hebben. Idealiter heeft de onderzoeker al vaker met scripts en algoritmes gewerkt, maar een must is dit niet. Interesse om zich te verdiepen in zulke technologie is natuurlijk wel een must. In eerste instantie zullen we in de Use Case werken met de volledige DBNL collectie (dus ook het auteursrechtelijk beschermd materiaal) en born-digital literatuur uit het Digitaal Magazijn van de KB.
Welk probleem lost de Use Case op?
Onderzoek in de geesteswetenschappen is vaker dan voorheen onderzoek met behulp van veel meer bronnen dan een menselijke onderzoeker in een leven zou kunnen analyseren. Dit soort computationeel (of ook wel "distant reading") gebaseerd onderzoek analyseert grote corpora met behulp van computationele algoritmen en statistische methoden. Vanwege het auteursrecht, om veiligheidsredenen, of bijvoorbeeld omdat de data simpelweg te groot zijn, is het soms niet mogelijk om de data op de computer van de onderzoeker te gebruiken. In dat geval zou het een oplossing zijn om niet de data naar de onderzoeker te brengen, maar het onderzoeksalgoritme naar de data. Deze manier van werken willen we verder uitwerken in de Use Case.
Wat kunnen wij bieden?
Naast dat wij ondersteuning bieden op technisch vlak, het research design en de samenwerking tussen de verschillende partners, kunnen we het onderzoek ook voor ongeveer één maand (full time equivalent) financieren. De doorlooptijd van het experiment is uiteraard langer, dus de onderzoeker moet denken aan een beperkte tijdsbesteding over langere tijd (tot einde 2022). Daarnaast is dit uitdrukkelijk infrastructureel experimenteel werk. Dit betekent dat de onderzoeker ook bereid moet zijn om mogelijk met minder resultaat genoegen te nemen door technische beperkingen.
Ben jij diegene die we zoeken?
Stuur dan vóór 6 november een mail naar lotte.wilms@kb.nl met een korte omschrijving (250 tot maximaal 500 woorden) van het onderzoek dat je zou willen doen. Je hoort dan snel meer!