Een juridische schatkist aan data
Data science biedt ongekende mogelijkheden voor juridisch onderzoek, zeggen Simone van der Hof en Bart Custers van eLaw. Maar we moeten ook de ongewenste bijwerkingen van big data - zoals etnisch profileren - in de gaten houden.
Traditioneel werken juristen vooral met data op papier, maar toch is ook in deze tak van de wetenschap het gebruik van big data-methodes in opkomst. Binnen de Rechtenfaculteit lopen Simone van der Hof (Hoogleraar Recht en de Informatiemaatschappij) en Bart Custers (hoofd onderzoek bij eLaw) op dat gebied voorop.
Simone van der Hof
Wat is het doel van het Research Lab op 23 september?
Simone van der Hof: ‘In ons vakgebied biedt data science veel mogelijkheden: we hebben een juridische schatkist aan data die we met behulp van deze nieuwe methoden kunnen ontsluiten. Maar het gebruik van die methoden staat nog in de kinderschoenen. Ons doel is om aan onze vakgenoten te laten zien wat we er allemaal mee kunnen, en van hen te horen welke vragen en ideeën ze daarover hebben.’
Wat is er in dit vakgebied allemaal mogelijk met data science?
Bart Custers: ‘Juristen werken traditioneel met heel veel data, ook al zien ze het misschien niet zo. Er zijn bibliotheken vol wetboeken, rapporten en jurisprudentie. Met behulp van bijvoorbeeld text mining kunnen we al die data veel beter toegankelijk maken: in plaats van alles zelf te lezen, kunnen we de computer er patronen in laten ontdekken. Het is nu bijvoorbeeld mogelijk een database niet alleen te doorzoeken op zoekwoord, maar ook op context. Zo kan een computer leren herkennen of een gerechtelijke uitspraak positief of negatief voor iemand is uitgevallen.’
Bart Custers
En hoe kunnen we zoiets toepassen, in de praktijk?
BC: ‘We kunnen bijvoorbeeld veel beter gaan voorspellen wat de uitkomst zal zijn van een rechtszaak. Want een computer kan razendsnel de resultaten van tienduizenden vergelijkbare zaken doornemen en analyseren. Je kunt je voorstellen dat het dan mogelijk wordt een kanseninschatting te maken, voordat je een dure advocaat inhuurt. Dat de computer je bijvoorbeeld in no time kan vertellen: begin er maar niet aan, want de kans dat je deze zaak gaat winnen is klein.’
SvdH: ‘En daarnaast kan het gebruik van nieuwe onderzoeksmethoden uit de hoek van data science heel veel opleveren voor de wetenschap zelf. Bijvoorbeeld op het gebied van rechtsvergelijking: nu doen we dat allemaal met de hand, met het hoofd, maar wie weet wat we ontdekken als we een algoritme op die data loslaten. Misschien zien we dan wel heel onverwachte patronen verschijnen.’
Dat klinkt allemaal geweldig. Maar tegen welke beperkingen lopen juridisch onderzoekers nog aan?
SvdH: ‘Wat nog wel lastig is, is dat juristen nu nog een heel andere taal spreken dan informatici. Terwijl het juist belangrijk is om in dit soort onderzoek samen te werken. Met ons Research Lab proberen we daar ook een brug in te slaan.’
BC: ‘Een ander punt is dat de data waar juristen mee werken voornamelijk uit tekst bestaat. En tekst is voor een computer nu eenmaal veel lastiger te analyseren dan cijfertjes en Excel-bestanden, waar in veel andere wetenschapsgebieden mee wordt gewerkt. Maar gelukkig gaan de ontwikkelingen op het gebied van big data analytics snel.’
En als juristen houden jullie je ook bezig met de ethische component van big data, stel ik me zo voor?
SvdH: ‘Precies. We kijken aan de ene kant wat voor juristen de mogelijkheden zijn van deze nieuwe onderzoeksmethoden, en aan de andere kant kijken we vanuit juridisch perspectief naar hoe je big data op een goede manier kunt gebruiken, zonder onwenselijke neveneffecten.’
Aan wat voor onwenselijke effecten moeten we dan denken?
BC: ‘Soms komen er uit de data bijvoorbeeld patronen naar voren die je eigenlijk niet op die manier geformuleerd wilt zien. Zoals verbanden tussen etniciteit en criminaliteit: soms is er wel een statistische correlatie, maar dat wil nog niet zeggen dat er een causaal verband is. Wat doe je met dat soort data? Daar moeten we heel voorzichtig mee zijn. De laatste tijd was bijvoorbeeld etnisch profileren veel in het nieuws: is het wenselijk dat de politie mensen eerder staande houdt als ze statistisch behoren tot een bepaalde risicogroep?’
Je zou kunnen zeggen: door met behulp van big data risicoprofielen op te stellen, kan de politie veel gerichter te werk gaan.
BC: Ja, maar ook met zoiets moeten we erg oppassen. Stel dat de politie veel meer surveilleert in bepaalde wijken dan in andere gebieden. Dan is het te verwachten dat ze meer criminaliteit aantreft in die wijken waar ze het vaakst komt, terwijl er in die andere wijken misschien ook wel van alles gaande is. Die tunnelvisie geeft dan een steeds meer vertekend beeld in de data. Het gevaar is dus dat je op een gekleurde manier gaat kijken, en dat je door je manier van data verzamelen steeds bevestigd wordt in je vooroordeel.’
En intussen heeft de burger geen idee van hoe die profielen worden opgesteld en wat voor data er over hem wordt verzameld...
BC: ‘Dat gebrek aan transparantie is ook een probleem, inderdaad. Je kunt als burger in een bepaalde risicogroep terechtkomen zonder dat je het weet. Maar intussen kan het een grote impact hebben op je leven: misschien betaal je wel een hogere verzekeringspremie dan je buurman, of kun je er zelfs geen hypotheek door krijgen.’
SvdH: ‘Als burger zit je in honderden verschillende databases. Wat gebeurt er met al die data? Dat is echt een black box. Bij eLaw houden we ons ook met dat soort vraagstukken bezig: wat voor impact hebben deze nieuwe manieren van omgaan met data op de maatschappij? En wat voor waarborgen zijn ervoor nodig om daarbij de rechten en de privacy van het individu te beschermen?’
Waar moeten we dan bijvoorbeeld aan denken?
SvdH: ‘We moeten in ieder geval zien te voorkomen dat de menselijke maat wegvalt bij het nemen van beslissingen op basis van data. Of het nou bij de overheid is of bij een verzekeringsmaatschappij, het is belangrijk dat er altijd een menselijke schakel in het proces zit. Dat er een medewerker is die ook naar het grotere geheel kijkt en die nadenkt over wat voor effecten bepaalde beslissingen kunnen hebben. En dat er in het systeem ook ruimte is ingebouwd voor de mens om kritisch te blijven nadenken, in plaats van de computer te laten beslissen.’
In dit soort kwesties lijkt voor juridisch onderzoekers een belangrijke rol te zijn weggelegd.
SvdH: ‘Ja. Recht wordt vaak als obstakel gezien: daar heb je die juristen weer. Maar als je naar het grotere plaatje kijkt, zie je hoe belangrijk het is om na te denken over welke spelregels we in moeten bouwen om onze vrije en open samenleving te beschermen. Big data brengt fantastische mogelijkheden en toepassingen met zich mee, maar de wereld moet straks geen plek worden waarin we ons niet meer thuis voelen.’
Simone van der Hof is Hoogleraar Recht en de Informatiemaatschappij en afdelingshoofd bij eLaw, het centrum voor recht en digitale technologie aan de Faculteit der Rechtsgeleerdheid. Ze leidde o.a. het NWO-project 'Empowering and protecting children and adolescents against cyberbullying'. Daarnaast is Van der Hof programmadirecteur van de Advanced Master Law and Digital Technologies.
Bart Custers is universitair hoofddocent en hoofd onderzoek bij eLaw. Hij is projectleider van twee EU-projecten: EuDeCO, over hergebruik van data in de context van big data, en e-SIDES, over ethische en juridische implicaties van big data. Hij publiceerde onder meer het boek 'Discrimination and Privacy in the Information Society' over de effecten van data mining en profiling in de context van big data.
(JvdB)