Beleid maken met big data
Overheden hebben steeds grotere hoeveelheden data tot hun beschikking. Hoe kan big data worden gebruikt bij het ontwikkelen van beleid? En zijn overheden klaar om met al die data om te gaan? Dat is wat Sarah Giest, universitair docent bij het Instituut voor Openbaar Bestuur, graag wil weten.
Is het een recente ontwikkeling dat overheden big data gebruiken bij beleidsvorming?
'Niet echt. Overheden hebben altijd grote hoeveelheden data gebruikt: persoonlijke gegevens, belastinggegevens, administratieve gegevens. Het belangrijkste verschil is dat er nu nieuwe soorten data beschikbaar zijn, en nieuwe technieken om deze te analyseren.'
Kunt u een paar voorbeelden geven van die nieuwe soorten data?
‘Denk bijvoorbeeld aan mobiele-telefoongegevens, zoals gps-locaties van burgers, en reizigersinformatie. Dat is meer dynamische, realtime data, die een stad bijvoorbeeld kan gebruiken om te kijken hoe burgers zich verplaatsen in de stad. Wat ik graag wil weten, is of het overheden helpt om grotere hoeveelheden data te hebben. En hoe ze die data gebruiken ten behoeve van de burger.’
Wat kunnen overheden doen met al die gegevens?
‘Ze zouden bijvoorbeeld een app kunnen maken met informatie over het weer, verkeer en openbaar vervoer. Door al die informatie in één app op te nemen, zou het voor burgers eenvoudiger worden om beslissingen te nemen als ze onderweg zijn. En overheden kunnen big data natuurlijk ook op beleidsniveau gebruiken, bijvoorbeeld om beslissingen te nemen over CO2-emissie, gezondheid of openbare diensten. Maar eigenlijk zijn succesvolle voorbeelden nog steeds zeldzaam. Er moet veel met de gegevens gebeuren voordat ze daadwerkelijk bruikbaar kunnen zijn voor beleidsmakers.’
U werkt samen met computerwetenschappers en de Gemeente Den Haag in het onderzoeksproject READ-URBAN. Helpt dat project de lokale overheid om meer gebruik te maken van data?
‘Ja, in dat project kijken we naar een specifieke groep mensen, de ‘werkende armen’: mensen die wel een baan hebben, maar onder de armoedegrens leven. De Gemeente Den Haag wil nieuwe beleidsinitiatieven ontwikkelen voor deze specifieke groep burgers. Daarom helpen we de Gemeente erachter te komen waar deze mensen zijn, wat ze doen en welke diensten ze nodig hebben om verder te kunnen komen. We helpen door data uit verschillende bronnen samen te brengen: Google Maps, sociale media, CBS, enzovoorts. Op deze manier kunnen we meer te weten komen over de sociale netwerken van deze mensen, bijvoorbeeld, en over het soort woonwijken waarin ze leven.’
Wat is de grootste uitdaging van dat project?
‘Het moeilijkste deel is het koppelen van alle data. Het verzamelen van veel gegevens over iemand is eigenlijk een heel lastig proces. In dit geval hebben we toestemming nodig om de officiële data te krijgen, moeten we begrijpen hoe deze is gestructureerd, en moeten we de data vervolgens combineren, rekening houdend met de complexiteit ervan in termen van tijd, ruimte en type. We hebben zelfs een theoretisch natuurkundige ingehuurd om inzicht te krijgen in sommige van de ruimtelijke processen in die data.’
Denkt u dat overheden er zelf klaar voor zijn om met zulke complexe datasets om te gaan?
‘Veel overheden hebben moeite om mensen te vinden dit soort gegevens kunnen analyseren. Een oplossing daarvoor is om sommige van die analyses uit te besteden aan bedrijven. Maar dan krijg je het probleem dat overheden de ruwe data niet te zien krijgen; ze krijgen gewoon een samenvattend rapport. Data is niet neutraal - er worden keuzes gemaakt over welke gegevens moeten worden uitgesloten en over welk algoritme moet worden gebruikt. Dus ik denk dat het uitbesteden daarvan gevaarlijk is, maar het opbouwen van die vaardigheden binnen overheden zal tijd kosten.’
Zijn er grote verschillen tussen landen in de manier waarop overheden gebruik maken van data?
‘Ja, maar het is lastig om landen te vergelijken. Estland en Singapore worden vaak genoemd als voorbeelden van landen die op dit gebied wat verder zijn. Maar ik vind dat gevaarlijke voorbeelden: Estland was een communistisch land en Singapore is een eenpartijstaat, waar het makkelijker is om dingen te beslissen. In Nederland is het anders: er is een vaste institutionele structuur die al jaren bestaat, en die bepaalt hoe data mag worden verzameld, gedeeld en gekoppeld.’
Hebben deze verschillen tussen landen ook te maken met culturele verschillen?
‘Ja absoluut. In Zweden zijn bijvoorbeeld veel gegevens openbaar, en dat vindt niemand daar raar. Iedereen kan er je schoolgegevens en cijferlijsten online opzoeken. In Duitsland, waar ik vandaan kom, is het heel anders. Toen Google Maps straten begon te fotograferen, protesteerden mensen om hun huizen van Google Streetview af te krijgen. Hoe mensen denken over privacy en het delen van data kan dus enorm verschillen tussen landen.’
Hoe zit het met privacykwesties in Nederland: kijkt big brother mee over onze schouder?
‘Ik denk dat het een misvatting is dat de overheid de hele tijd naar individuen kijkt. Ja, er wordt veel data verzameld, maar dat gebeurt meestal op een zeer gebundeld niveau. Dus een stad zal weten hoeveel mensen op een bepaald moment in de stad zijn, bijvoorbeeld, maar ze volgen mij niet persoonlijk, als ik naar mijn werk ga of als ik de stad verlaat. Gegevens op individueel niveau worden pas van belang als overheden een specifiek persoon willen volgen, bijvoorbeeld een verdachte. Maar om echt naar individuen te kijken moet een overheid aan allerlei regels voldoen.’
Big data lijkt tegenwoordig overal te zijn. Denkt u dat het een voorbijgaande trend kan zijn?
‘Nee, ik denk dat we echt op een punt zijn waar we big data serieus moeten nemen, vooral als we het hebben over gebruik door overheden. Dus ik denk dat het afdoen als een trend, zoals veel mensen doen, gevaarlijk is. Want als we dat doen, zullen we nalaten goed onderzoek te doen naar de effecten en het gebruik van big data. Het maakt niet echt uit hoe we het noemen - 'big data' of gewoon 'data' – maar het blijft bestaan.’
Sarah Giest promoveerde in Political Science aan de Simon Fraser University, Vancouver (Canada) en heeft daarnaast twee Masters behaald: een in Political Science aan de Universiteit van Bonn (Duitsland) en de andere in Society, Science and Technology Studies aan de universiteiten van Aalborg ( Denemarken) en Lund (Zweden). Giest is sinds september 2014 universitair docent aan het Instituut Bestuurskunde van de Universiteit Leiden. Ze maakt deel uit van de Governance and Data Science Group van de Faculteit Governance and Global Affairs, waar onderzoekers big data en beleid bestuderen vanuit verschillende invalshoeken.
In deze serie interviews komen onderzoekers van het Leiden Centre of Data Science (LCDS) aan het woord. LCDS is een netwerk van onderzoekers uit verschillende wetenschappelijke disciplines, die gebruik maken van innovatieve methodes voor het omgaan met grote hoeveelheden data. Het doel van samenwerking tussen deze onderzoekers is het vinden van slimme oplossingen voor wetenschappelijke en maatschappelijke kwesties.