Leidse bachelorstudenten analyseren EK-data
Net als sportjournalisten weten nu ook studenten Informatica van de Universiteit Leiden er alles van: in de zomervakantie is het hard werken. Het halve land ligt op het strand, maar voor jou is het juist de drukste tijd van het jaar. Leidse bachelorstudenten verzamelden de data van het EK voetbal voor vrouwen. Nu de sportzomer voorbij is, hebben zij hun informatie binnen en begint de analyse van de gegevens. De grote vraag: wat maakte de OranjeLeeuwinnen kampioen?
Voetbalshirt
Bachelorstudenten Patrick Bergman, Lucie Kuiper, Jody Liu en Lars Suanet vertellen in blauwe voetbalshirts over hun zomerbaantje. Nou ja, baantje. Vrijwilligerswerk. Studieproject. Noem het hoe je wilt, maar ze doen het voor hun lol. Ze zien de mogelijkheden van data analyseren voor topsport. Werk maken van je studie Informatica. Aan de slag met échte data. Behalve dat T-shirt was het enige dat ze kregen voor al die weken data verzamelen en analyseren: een ticket voor de openingswedstrijd van het EK.
Twee soorten data
Tijdens het EK kreeg het studententeam daags na een wedstrijd allerlei gegevens door. Patrick Bergman: ‘Er zijn twee soorten informatie. In de eerste plaats de positionele data: welke speler stond waar op welk moment. Dat werd automatisch vastgelegd met camera’s, 10 keer per seconde. Daarnaast kregen we van een gespecialiseerde bedrijf de eventdata binnen. Wat voor soort acties gebeurde er op het veld. Er zijn zo’n 100 soorten events. Event 1 is bijvoorbeeld een pass.’
Software
Het team bestaat eigenlijk uit vijf studenten. Erik Weenk kon er deze ochtend niet bij zijn. ‘Met zijn vijven hebben we een stuk software geschreven om nu, na het EK, de data te analyseren’, vertelt Patrick. ‘Iedereen heeft zijn eigen onderwerp. Zo krijgen we nu inzicht in alle wedstrijden van het Nederlands elftal.’ Jody Liu: ‘Ik kijk bijvoorbeeld naar de duur en aantallen keren balbezit in een wedstrijd.’
Ingewikkelder dan alleen nummertjes tellen
En Lars Suanet analyseert met de zelfgemaakte software de duels binnen iedere wedstrijd van Oranje. ‘Het gaat dan om duels tussen individuen. Hoe vaak won een bepaalde persoon zo’n duel? Verder kijk ik naar inworpen. Gooiden spelers de bal naar voren of juist naar achteren? En waren ze dan meer of juist minder succesvol? Tijdens het EK was het werk vooral al die gegevens te transformeren naar begrijpelijke informatie. Het is ingewikkelder dan alleen nummertjes tellen. Je moet ook kiezen hoe je de informatie wilt weergeven. Daarvoor kun je 101 verschillende grafieken kiezen.’
Leren programmeren
De enige die echt van voetbal houdt, is Lucie Kuiper. De enige niet-Informaticastudent ook, maar wel voetbalster. ‘Ik ben derdejaars scheikunde en zit op voetbal. Ik heb al wel een minor data science gedaan. Momenteel leer ik programmeren omdat ik hierna waarschijnlijk een master bij Informatica ga volgen. Lars ken ik van het honours programma van de universiteit. Hij vertelde me over dit project.’
Golden Standard
Als Lucie begint te praten over de inzichten die ze met data science hoopt te krijgen in de uitmuntende resultaten van de OranjeLeeuwinnen op het EK, zie je haar genieten. ‘Het zou toch mooi zijn om te weten of je beter een korte corner kan nemen of een lange.’ En over haar rol in het project: ‘Mijn taak binnen ons team is om te zoeken naar de Golden Standard. We gaan nu proberen via de onafhankelijke data vast te stellen wat Nederland de kampioen maakte.’ Lars vult aan: ‘Maar natuurlijk is creatief spel het belangrijkste. Dat kun je niet formaliseren.’
Samenwerking
IT-dienstverlener Qualogy, gespecialiseerd in data-gedreven technologieën en partner van Universiteit Leiden, ondersteunde de studenten bij de softwareontwikkeling. Het bedrijf heeft een analyse-applicatie ontwikkeld die trainers en technische staf inzichten biedt in de prestaties van individuele spelers en het team als geheel, op basis van positionele data en eventdata. Het onderzoeksteam krijgt daarnaast hulp op internationaal niveau: universiteiten in Porto, Leuven en het Duitse Lüneburg denken mee over de analyse van de voetbalgegevens.