Onverwachte data zijn goed voor je business
In iedere organisatie spelen data een belangrijke rol. Steeds meer gegevens zijn bekend over producten, over productieprocessen en over klanten. Op het jaarlijkse LIACS Business event van woensdag 18 januari stond centraal hoe je in Big Data onregelmatigheden kunt vinden. En hoe je zo fouten - óf juist kansen - op het spoor komt. Ruim 80 bezoekers hoorden hoe anomalie-detectie in data science van belang kan zijn voor de maatschappij. Een verslag van het tweede Business Event van het informatica-instituut van de Universiteit Leiden.
Oorzaak van een anomalie
Thomas Bäck is hoogleraar aan het Leiden Institute of Advanced Computer Science (LIACS) en initiator van de bijeenkomst. ‘Veel bedrijven en overheidsorganisaties verzamelen veel data. Wij ervaren dat juist de onverwachte gegevens die verborgen zitten in de datastroom, vaak van belang zijn voor een organisatie. Je zoekt eigenlijk de hobbels waarvan je de oorzaak niet precies weet. Die hobbels kunnen invloed hebben op je productieprocessen, positief of negatief. Dus je moet zien te achterhalen wat de oorzaak is van die anomalie.’
Fraude en verdachte transacties vinden
Wojtek Kowalczyk, data scientist bij LIACS en directeur van het Fraud Detection Expertise Center, laat zijn toehoorders eerst schatten hoeveel geld internationaal alleen al gedurende deze bijeenkomst verloren gaat aan fraude. Met verbazing: ‘Jullie maken een goede inschatting met tussen 1 en 50 miljoen. Ik krijg ook wel eens “Enkele tienduizenden euro’s” als antwoord.’ Vervolgens legt hij uit hoe hij middelen ontwikkelt waarmee fraude zo vroeg mogelijk vast te stellen is. De Leidse data scientist Cor Veenman is in deeltijd verbonden aan het Nederlands Forensisch Instituut. ‘Wij werken samen met de politie om onwaarschijnlijkheden in patronen te herkennen. Op die manier proberen we bijvoorbeeld te verdachte transacties te vinden.’
Staalrollen
Ook onderzoekspartners uit het bedrijfsleven geven presentaties. BMW en Tata Steel gebruiken de algoritmen van de Universiteit Leiden om anomalieën in opgerolde staalplaten op te sporen. ‘Nu analyseren we factoren als de dikte van de plaat, de hoeveelheid olie op de plaat en de temperatuur nog handmatig’, zegt de Duitse medewerker van BMW Sebastian Kreissl. ‘Die hebben namelijk invloed op de kwaliteit van ons product. Via data mining kunnen we fouten automatisch opsporen en dan direct terugkoppelen naar onze experts.’
Anomalieën in de gezondheidszorg identificeren
LIACS doet ook onderzoek samen met Zorginstituut Nederland, een overheidsorganisatie die adviseert over de kosten van de zorg. Bert van Nistelrooij is er data scientist. Hij legt uit dat anomalieën ook voorkomen in de zorg, maar dat ze niet altijd wijzen op gezondheidsproblemen.
Geen vrachtwagens meer langs de weg
Mark van den Akker, CEO van Supergraph, een bedrijf dat voorspellende modellen maakt voor opdrachtgevers, vindt het vooral van belang dat de theoretische bevindingen worden omgezet in beslissingen. ‘Wij werken bijvoorbeeld samen met een transportbedrijf dat chips in autobanden van hun vrachtwagens plaatst. Daarmee kun je de slijtsnelheid van die banden monitoren en voorspellen wanneer een band stuk zal gaan. Dus nu kunnen ze die band vervangen voordat de vrachtwagen langs de weg komt te staan.’
Elke business is data business
Na afloop van de bijeenkomst bieden een plenaire discussie en een borrel ruimte voor meer gedachtewisseling met het breed aanwezige publiek. Initiator Thomas Bäck vat zijn oordeel over de middag samen met de uitspraak: ‘Elke business is data business. Omdat anomalieën in data steeds belangrijker worden, is anomaliedetectie nu een sleutelonderwerp voor de industrie en de publieke sector. Bij ons business event is dat volgens mij eens te meer duidelijk geworden.’