Opslag big data kan verkeerd uitpakken
dossier Big data

Opslag big data kan verkeerd uitpakken

door Jitske Leemrijse en Sophia van Petegem in rubriek flexibel vervoer
Reacties uitgeschakeld voor Opslag big data kan verkeerd uitpakken

Zelfrijdend ov verzamelt volop data voor nuttige toepassingen. Maar diezelfde data kunnen leiden tot verlies van privacy, ongelijke behandeling en andere negatieve effecten, waarschuwen Jitske Leemrijse en Sophia van Petegem.

Zelfrijdend openbaar vervoer is de toekomst, maar roept ook allerlei vragen op. Een grote angst is dat dit verlies van banen met zich meebrengt, maar er zijn meer problemen. Zo slaat zelfrijdend vervoer door het gebruik van sensoren en camera’s veel meer informatie op dan het reguliere vervoer. Deze opslag is nuttig voor tal van toepassingen, maar brengt ook risico’s met zich mee. Gelderland kent de WEpod – een zelfrijdend busje dat ritten maakt tussen station Ede-Wageningen en de campus van de Universiteit Wageningen. Vanuit de Radboud Honours Academy hebben wij in opdracht van de provincie Gelderland onderzocht welke gegevens de WEpod opslaat, wat de toepassingen en risico’s daarvan zijn en hoe hiermee om te gaan.

Negen camera’s
Om de WEpod goed te laten functioneren zijn maar liefst negen camera’s, negen radars en zes laserscanners gemonteerd op het voertuig. Door het combineren van alle informatie van deze sensoren worden de verkeersdeelnemers en de omgeving goed in kaart gebracht en kan de WEpod op een veilige manier de weg op. De verzamelde data zijn in de testfase toegankelijk voor iedereen die hierin is geïnteresseerd.

Als toevoeging aan de WEpod komt er een app die de reiziger kan installeren en waarmee de WEpod als taxi wordt gebruikt. Deze app geeft aan waar de WEpod zich bevindt, wanneer het voertuig aankomt, en ze functioneert als sleutel om de WEpod te openen. Om deze applicatie te kunnen gebruiken, moet je in ieder geval je e-mailadres invoeren ter identificatie. De app zou echter nog meer informatie van je smartphone kunnen opvragen. Dit zal voornamelijk gaan om de locatie, maar technisch gezien kan er veel meer (persoonlijke) informatie worden verzameld.

Nuttige toepassingen
De gegevens die zelfrijdende voertuigen verzamelen kunnen op verschillende manieren worden ingezet. Een van de belangrijkste toepassingen is het bevorderen van de verkeersveiligheid. Veranderingen in de verkeerssituatie worden door het voertuig direct gesignaleerd, gelokaliseerd, gelabeld en verwerkt – volledig automatisch. De beslissingen van de WEpod zijn gebaseerd op algoritmes en daarom voorspelbaarder en veiliger dan het gedrag van menselijke bestuurders. Bovendien geven de voertuigen waarschuwingen over technische mankementen. Verder kan de infrastructuur worden verbeterd doordat drukke routes en knelpunten automatisch in kaart worden gebracht.

Een minder voor de hand liggende toepassing is misdaadbestrijding. Aan de hand van camerabeelden van zelfrijdende voertuigen en in- en uitcheckgegevens kan de politie alibi’s en vluchtroutes checken. Iedereen op straat is te volgen en door gedragsgegevens uit verschillende bronnen met elkaar te combineren, kan de overheid profielen van burgers opstellen. Met behulp van statische gegevens zijn burgers in te delen in risicogroepen en zo kan de overheid hun (illegale) gedrag voorspellen en mogelijk beïnvloeden.

Commercieel gebruik
Er zijn ook veel mogelijkheden voor de commerciële sector. In- en uitcheckgegevens, locatiedata en camerabeelden kunnen worden ingezet om gedrag van consumenten te analyseren. Aan de hand van deze informatie leiden bedrijven af aan welke producten behoefte is. Ook stellen ze consumentenprofielen op. Die zijn vergelijkbaar met de burgerprofielen van de overheid. Zo wordt het mogelijk om advertenties te personaliseren.

Verder kunnen advertentiebedrijven die toegang hebben tot jouw locatiegegevens, advertenties van een winkel laten zien wanneer je in de buurt bent van die winkel. Dit laatste staat ook wel bekend als geotargetmarketing. Aan de hand van locatiedata kan ook de vraag naar producten beter worden voorspeld, waarop de productie en voorraad wordt afgestemd. Dit verbetert het logistieke proces van bedrijven, reduceert de kosten en is gunstig voor de duurzaamheid.

Fabrikanten van voertuigen analyseren in de toekomst wellicht de technische gegevens van het voertuig om fouten op te sporen en het product te verbeteren. De auto stuurt een signaal door naar de fabrikant als de auto gerepareerd moet worden. Dit zorgt voor meer veiligheid en efficiënte reparaties.

Privacy
De mogelijkheden zijn eindeloos, maar er is ook een keerzijde van de medaille: het verlies van privacy. En met name van autonomie. Dit begrip houdt in dat elk mens zonder bemoeienis van buitenaf zelfstandig keuzes kan maken. Het is in de digitale tijd voor overheden en bedrijven heel makkelijk om zich te bemoeien met onze keuzes. Want zij bezitten veel gegevens over burgers.

Mensen slaan doorgaans het lezen van de kleine lettertjes van de gebruikersvoorwaarden over en geven zo applicatieontwikkelaars onbewust toegang tot veel persoonlijke data. Als mensen de voorwaarden wél lezen en tot de conclusie komen dat ze geen persoonlijke data willen delen, betekent het vaak dat een dienst of product niet beschikbaar is. Voor zelfrijdend vervoer is dit een uitdaging: is een privacyvriendelijk alternatief mogelijk, of moeten mensen ‘noodgedwongen’ instemmen met het delen van persoonlijke gegevens?

Onjuiste informatie
Ongelijke behandeling is, naast autonomieverlies, een ander nadelig gevolg van massale dataopslag. Op basis van gegevens worden we ingedeeld in profielen. Hierdoor kan iemand een hogere ziektekostenpremie moeten betalen dan zijn buurman. In het ov wordt het denkbaar dat je een hogere prijs betaalt voor een treinkaartje dan je reisgenoot omdat je bijvoorbeeld zelden met het ov reist.

De basis van een profiel kan gebaseerd zijn op onjuiste informatie. Persoonlijke gegevens uit verschillende databases komen terecht in één grote datapool. Autonome software voert hiervoor technische bewerkingen uit en reduceert de gegevens tot kale getallen die slechts in enkele categorieën passen. De data zijn dan lastig te interpreteren door mensen, en dat maakt het moeilijk om de betrouwbaarheid van de gegevens te controleren. Als hierdoor een fout ontstaat in één enkele database, kan de fout zich tijdens het combineren van data razendsnel verspreiden en zelfs verergeren. Elke Nederlandse burger heeft recht op inzage en correctie van zijn persoonlijke gegevens, maar doordat alle gegevens met elkaar verstrikt raken, is dat lastig. Het kan bijvoorbeeld voorkomen dat een trouwe reiziger wil inchecken met zijn app, maar wordt geweigerd vanwege vermeende wanbetaling. Zonder menselijk loket, en met het zogenaamd waterdichte technische systeem dat in verbinding staat met de app, is het lastig je onschuld te bewijzen.

Risico’s nemen toe
Ten slotte is de toekomst ongewis. Welke gegevens zal een vervoerapp of zelfrijdend voertuig in het vervolg nog meer verzamelen? En wat zijn de gevolgen? Denk bijvoorbeeld aan de innovatieve administratie van de Amsterdamse gemeente tijdens de Tweede Wereldoorlog. Deze papieren bleken documenten des doods voor Joden toen de Duitsers ze in handen kregen. Op het moment dat bepaalde gegevens in verkeerde handen vallen kan het gruwelijk mis gaan. Zo kunnen vervoerbedrijven onbeperkt veel data verzamelen, die nu nog irrelevant lijken voor gebruik en waarvan het teveel moeite zou zijn om ze te verwijderen. Maar data-analysetechnieken en -toepassingen blijven zich ontwikkelen en maatschappelijke ontwikkelingen zijn niet te voorspellen. De risico´s worden eerder groter dan kleiner.

Ongebreideld datagebruik leidt dus tot autonomieverlies, ongelijke behandeling en fouten in het systeem. Dat moet worden voorkomen.

Privacy als bescherming
Gelukkig kunnen we onszelf beschermen tegen deze risico’s als we privacy hoger in het vaandel dragen. Als allerlei instanties niet zomaar toegang hebben tot onze persoonlijke gegevens blijven onze autonomie, gelijke behandeling en juistheid van data gewaarborgd. We kunnen privacy beschermen door gegevens in hun oorspronkelijke context te laten.

Als iemand vroeger naar de dokter ging, konden alleen de arts en zijn medewerkers het papieren dossier inzien. Dit kun je de ‘medische context’ noemen. Tegenwoordig worden medische gegevens vaak digitaal verwerkt, maar het principe van de privacy van die gegevens, die context, is niet veranderd. Alleen de mensen die het doel van de medische context voor ogen hebben – het bevorderen van iemands gezondheid – mogen toegang hebben tot het medische dossier. Zorgverzekeraars horen hier bijvoorbeeld niet bij.

Dit concept is ook toe te passen op de ‘context van vervoer’. Het doel van deze context is het realiseren van veilig, comfortabel en efficiënt vervoer, een taak waar veel medewerkers in het ov zich voor inzetten. Datastromen moeten in dienst van deze waarden worden ingezet.

Anonieme gegevens
Zelfrijdend ov kent nieuwe datastromen en nieuwe betrokkenen, en daarom moet er worden nagedacht bij wie al deze nieuwe data terecht mogen komen. Nieuwe betrokkenen zijn bijvoorbeeld technici en softwareontwikkelaars. Zij hebben toegang nodig tot alle gegevens om hun werk goed te kunnen doen, maar moeten hier wel gewetensvol mee omgaan. Passagiers moeten altijd toegang kunnen krijgen tot hun eigen persoonlijke gegevens. Transportbedrijven en Rijkswaterstaat kunnen ook met anonieme locatie- en transportgegevens uit de voeten, dat is winst voor onze privacy.

© Radboud Honours Academy

Externe partijen als de politieorganisatie of wetenschappers mogen slechts bij wijze van uitzondering toegang krijgen tot bepaalde zaken wanneer ze evident het maatschappelijk belang dienen. Commerciële partijen die niets toevoegen aan veilig, comfortabel en efficiënt vervoer horen niet thuis in de context van vervoer. Als ze wel een zinvolle bijdrage kunnen leveren, moet worden nagedacht of zij toch toegang krijgen tot sommige data.

Om criminelen buiten de context te houden, is het belangrijk dat alle digitale informatiestromen goed worden beveiligd. Kortom, de opslag van data kent veel mogelijkheden maar we moeten oog houden voor de risico’s.

Jitske Leemrijse en Sophia van Petegem studeren respectievelijk bedrijfskunde en geneeskunde aan de Radboud Universiteit. Zij vormen met acht andere studenten een denktank van de Radboud Honours Academy, onderdeel van de Radboud Universiteit in Nijmegen.

Reageren op dit artikel is niet mogelijk.

Lees ook