Krachtiger datacenter zorgt voor stroomversnelling in onderzoek
De evolutie van taal, doeltreffender medicijnen of de duiding van archeologische vondsten. Steeds meer onderzoekers werken met supercomputers die snel grote hoeveelheden data kunnen verwerken. Mede daarom wordt het universitaire datacenter sterk uitgebreid en vernieuwd. 'Dankzij datamining krijgen we een beter beeld van het verleden.'
Door de bliksemsnelle opmars van kunstmatige intelligentie in de wetenschap zijn er meer en krachtiger installaties nodig die complexe berekeningen kunnen uitvoeren en ruimhartig grote hoeveelheden data opslaan. Daarom gaf het college van bestuur onlangs groen licht voor de uitbreiding en vernieuwing van het universitaire datacenter. Vernieuwing is nodig omdat het huidige datacenter na meer dan vijftien jaar aan vervanging toe is en het datacenter in het LMUY-gebouw in 2024 gesloopt wordt. Als alles meezit is de uitbreiding en verbouwing begin 2022 gereed en dat is goed nieuws voor alle faculteiten.
Wat houdt de vernieuwing in?
Het ISSC is verantwoordelijk voor het beheer van het datacenter. ISSC-directeur Joop van der Born legt uit wat er gaat veranderen. De huidige twee datacenters bestaan uit 130 ‘rekken’: diepe kasten met onder andere serverinstallaties en ruimte voor dataopslag. Dat worden na de verbouwing 180 ultramoderne rekken met veel extra vermogen om aan de toenemende vraag naar rekenkracht en opslag te kunnen voldoen. Daarnaast wordt er een extra installatiepaviljoen gebouwd voor de energievoorziening en de koeling van het datacenter. Een ander pluspunt is dat het vernieuwde datacenter ‘muisstil’ wordt. Nu zorgen zoemende installaties buiten de rekken voor verkoeling van de warme servers, maar straks krijgen de rekken ieder een eigen koelingssysteem en dat scheelt een hoop herrie. Het datacenter wordt zo duurzaam mogelijk ingericht, onder andere door het hergebruik van restwarmte waarmee het hele gebouw verwarmd kan worden.
Slimme computersystemen
Holger Hoos, hoogleraar Machine learning, is zo’n wetenschapper voor wie een groter en sterker datacenter cruciaal is. Hij perfectioneert de algoritmen van computersystemen waardoor systemen zelf met de beste oplossing komen voor een probleem. Op die manier kan software zichzelf verbeteren en dat helpt enorm bij de ontwikkeling van efficiënte medicijnen, complexe klimaatmodellen of de techniek van zelfrijdende auto’s. Hoos werkt dus samen met heel uiteenlopende onderzoekers. Zo probeert hij met Leidse astronomen dynamische processen in het universum na te bootsen.
Wereldwijde concurrentieslag
De hoogleraar Machine learning benadrukt dan ook dat een krachtig datacenter niet alleen voor zijn eigen vakgebied noodzakelijk is. ‘Het is belangrijk voor de hele Leidse universiteit. Want het vergroot ons vermogen om wereldwijd te concurreren in al die onderzoeken waar een snelle verwerking van data en informatie essentieel is. Dat gold al voor medicijnontwikkeling, computerwetenschap, astronomie, scheikunde en natuurkunde, maar in toenemende mate ook voor sociale wetenschappen, geesteswetenschappen, archeologie en ga zo maar door. Rekenkracht wordt goedkoper en we zien dat universiteiten overal ter wereld grotere datacenters inrichten. Dat moeten we dus ook in Leiden doen.’
Experimenten in clean room conditions
Een deel van Hoos’ experimenten wordt gedaan met de reguliere machines van het universitaire datacenter. ‘Voor andere experimenten hebben we heel specialistische machines nodig in clean room conditions. Omdat mijn groep vlakbij het datacenter is gevestigd, konden we daar machines plaatsen die we exclusief voor ons werk gebruiken. Weer andere experimenten vereisen een datacentrum op nationale of commerciële schaal, zoals Google of Amazon.’
Licht op ontwikkeling taal
Ook geesteswetenschappers benutten dus in toenemende mate de digitale spierballen van het datacenter. De Leidse taalwetenschapper Jelena Prokic gebruikt grote datasets om te onderzoeken hoe talen veranderen. Deze inzichten zijn belangrijk voor de ontwikkeling van taaltheorie en voor het begrijpen van kennisverwerving en dat zegt weer meer over de ontwikkeling van samenlevingen.
Rekenen met ALICE
In 2019 breidde de universiteit de infrastructuur voor reken- en data-intensief onderzoek al uit met het nieuwe rekenkluster ALICE (Academic Leiden Interdisciplinairy Computing Environment). Prokic gaat ALICE in verschillende projecten gebruiken, waaronder in het multidisciplinaire project MacBERTh. Een team wetenschappers onderzoekt hoe de betekenis en het gebruik van Engelse en Nederlandse woorden en zinnen in de loop van de tijd veranderden. Met diepe neurale netwerken - algoritmen die zijn geïnspireerd op de gelaagde structuur en de functie van de hersenen - worden duizenden oude teksten doorgespit. Prokic: ‘In het afgelopen decennium hebben deze neurale netwerken voor spectaculaire ontwikkelingen gezorgd op het gebied van kunstmatige intelligentie, nu kunnen we die toepassen in de geesteswetenschappen.’
Online ploegen
Archeoloog Alex Brandsen maakt ook heel dankbaar gebruik van ALICE, de diva van het datacenter. Tot voor kort konden archeologen met online zoekmachines alleen snel informatie opsporen in veldwerkrapporten via titels en de samenvatting. Hierdoor bleef veel interessante informatie buiten beeld. Met datamining-methoden doorploegt Brandsen vliegensvlug en gedetailleerd online veldwerkrapporten. ‘Ik gebruik ALICE voor het trainen van complexe taalmodellen die erg goed zijn in het automatisch vinden en herkennen van archeologische concepten zoals bepaalde perioden of vondsten.’ Zo'n model wordt getraind door miljoenen zinnen te 'bekijken'. Brandsen: ‘Dit duurt op een normale pc heel erg lang, tot wel een maand. Op ALICE kan ik zo'n model in ongeveer twee tot drie dagen trainen.’
Beter beeld van verleden
Vervolgens stopt hij de gevonden archeologische concepten in een intelligente zoekmachine waardoor hij accurater de juiste informatie vindt en dat zorgt dikwijls voor nieuwe inzichten. Een voorbeeld zijn ‘begravingen’ in de vroege middeleeuwen in Nederland. ‘De consensus is dat de vroege Nederlanders voornamelijk in de grond werden begraven. Maar we zien met ons systeem dat er ook veel crematies voorkwamen. Het moet nog verder onderzocht worden, maar dit soort nieuwe informatie kan ons een beter en vollediger beeld van het verleden geven.’
Tekst: Linda van Putten