Marco Spruit wil taalmodel ontwikkelen om zorg te verbeteren
Door beschikbare data slim te gebruiken kan de gezondheid van én de zorg voor mensen substantieel verbeterd worden. Marco Spruit wil de komende jaren taal- en machine learning gebruiken om de grootste zorgvraagstukken in de regio Den Haag te duiden en op te lossen. Hij is 1 december 2020 aangesteld als hoogleraar Geavanceerde Datawetenschappen in Population Health in het Leiden Institute of Advanced Computer Science (LIACS) en het Leids Universitair Medisch Centrum (LUMC).
Translational Data Science centrum
Vanuit de LUMC-Campus Den Haag gaat Spruit aan de slag met verschillende projecten. Zijn grootste doelstelling is het opzetten van een Translational Data Science centrum. ‘Ik wil een gezaghebbend taalmodel voor de Nederlandse gezondheidszorg construeren', vertelt hij. 'Het analyseren van Nederlandstalige taal voor het gericht verbeteren van de gezondheidszorg staat eigenlijk nog in de kinderschoenen. Dat terwijl de manier waarop iemand praat, heel veel zegt over de mentale gesteldheid van die persoon.’
Natural Language Processing
Al sinds de jaren '80 trachten AI onderzoekers het menselijk taalvermogen te begrijpen door de neurale en logische benaderingen van Natural Language Processing met elkaar te verbinden. De afgelopen jaren heeft het gebruik van vooraf getrainde contextuele, diep-neurale taalmodellen zoals BERT/ClinicalBERT een grote vlucht genomen. Deze grootschalige maar algemene taalmodellen kunnen vervolgens met Transfer Learning technieken beter worden afgesteld op domein-specifieke taalproblemen.
De tekstanalysemethoden kunnen daarnaast uitgebreid worden met andere bronnen die gestructureerde gegevens bevatten. Met behulp van Multimodal Machine Learning kan er bijvoorbeeld betere risicoprofilering en welzijnsdetectie worden berekend door ongestructureerde spraak- en tekstgegevens te combineren met gestructureerde EHR-gegevens en sensordata van wearables.
Psychologische problemen achterhalen
Door een goed taalmodel te ontwikkelen, verwacht Spruit onder andere veel voor kwetsbare ouderen te kunnen betekenen. Een taalmodel kan bijvoorbeeld helpen om psychosociale klachten bij deze groep te detecteren. ‘Stel je voor: we lanceren een applicatie waarmee ouderen in gesprek kunnen gaan. Aan de hand van die gesprekken kunnen we achterhalen als er iets mis is. Mensen met psychologische problemen zoals borderline en ouderen met dementie praten bijvoorbeeld vaak in de derde persoon over zichzelf. Door dit in het model te verwerken, weten we wanneer er bij iemand een interventie nodig is.’
Zorgplatform
Ook artsen en andere zorgmedewerkers kunnen data science gebruiken om het werk in de dagelijkse praktijk te vergemakkelijken. Machine learning biedt hiervoor veel mogelijkheden. Dit stuurt zelflerende systemen aan, die ingevoerde modellen kunnen verbeteren naarmate meer data wordt toegevoegd. Machine learning staat volgens Spruit aan de basis van het ontwerpen en implementeren van een open, online, selfservice, patiëntgevoelig platform voor de zorg. 'Met behulp van een slimme medicatie review kunnen artsen bijvoorbeeld beter controleren welke medicatie wel en welke niet goed aanslaat bij patiënten. Als je daar goed zicht op hebt, dan kun je onjuiste medicatie verminderen en waar nodig andere medicatie starten', legt Spruit uit.
Onder de noemer Translational Data Science onderzoekt hij daarom hoe Nederlandse zorgprocessen op betrouwbare wijze beter kunnen worden met behulp van data sciencetechnologieën. Volgens hem draait het er vooral om dat je weet wat je doet, en resultaten betekenisvol kunt duiden en reproduceren. 'Data is op veel verschillende manieren te interpreteren. Daarom is het zo belangrijk dat er lerende modellen worden opgezet, waarmee we de data goed kunnen interpreteren en de juiste acties kunnen ondernemen.'