Dat er data van je wordt verzameld, weten we zo langzamerhand wel. Aanstaande vrijdag gaat dan ook de Algemene Verordening Gegevensbescherming (AVG) in, een wet die er onder andere voor moet zorgen dat de privacyrechten worden uitgebreid, en organisaties meer verantwoording moeten afleggen over alle gegevens die ze van je verzamelen.
Maar eigenlijk wil ik het juist hebben over het tegenovergestelde: de data die níet van je verzameld wordt. Er valt namelijk een hoop af te leiden uit de gegevens die juist worden overgeslagen, zegt de Amerikaanse kunstenaar Mimi Onuoha. Zij doet onderzoek naar de sociale gevolgen van datacollectie en computergestuurde categorisering, en bij wijze van kunstproject richtte ze een fysieke bibliotheek op waarin ze bijhoudt om welke gegevens dit gaat; van de verschillende etniciteiten van acteurs op Broadway tot het aantal geweldsincidenten onder gevangenisbewakers.
Videos by VICE
Onuoha was een van de sprekers tijdens de laatste editie van Coded Matter(s) – een reeks evenementen die FIBER organiseert in samenwerking met Vlaams Cultuurhuis de Brakke Grond in Amsterdam, over de invloed van digitale technologie op kunst en de maatschappij. Ik sprak haar over wat het eigenlijk betekent dat er bepaalde datasets ontbreken, en welke dat zoal zijn.
De gegevens die Onuoha daadwerkelijk ‘verzamelt’ in de lades van de bibliotheek, The Library of Missing Datasets, bestaan uit lege mapjes waarop de naam van de verzameling staat. “Het kunstproject is vooral een manier om iets abstracts als data concreet te maken. En om mensen na te laten denken over welke data er in hun eigen leven zou kunnen ontbreken, en waar dat door komt.”
Er zijn meerdere redenen denkbaar. Soms is het simpelweg onmogelijk om te verzamelen, zoals de internationale stroom van contant geld in dollars. “Of denk aan cijfers over seksueel overschrijdend gedrag. Slachtoffers komen daar niet zo makkelijk voor uit, wat het lastig maakt om er data over te verzamelen.”
Maar het kan ook ingewikkelder liggen en te maken hebben met bepaalde machtsverhoudingen. Als voorbeeld geeft Onuoha de schietincidenten in de Verenigde Staten tussen politieagenten en Afro-Amerikanen. Hoeveel incidenten dat precies waren was destijds nog niet bekend, en dat zette Onuoha aan het denken. “We verzamelen zoveel data over criminaliteit. Waarom over dit specifieke punt dan niet? Aan de mogelijkheden ligt het in ieder geval niet.”
Dat is dan ook precies het probleem: hoewel ze er wel achter zouden kunnen komen, is het niet in het belang van de politie om te weten bij hoeveel geweldsincidenten ze betrokken zijn geweest, laat staan om te weten welke etniciteiten daarbij betrokken zijn. Andersom is het wel degelijk in het belang van Afro-Amerikanen om te weten of ze bovengemiddeld vaak het slachtoffer zijn van politiegeweld, alleen beschikken ze niet over de middelen om die gegevens te verzamelen.
Onuoha heeft meer voorbeelden. In de gevangenis op Rikers Island in New York, wordt bijvoorbeeld wel bijgehouden welke geweldsincidenten er plaatsvinden tussen gevangenen onderling, of van gevangenen richting bewakers, maar andersom niet. “En dat maakt voor die beveiligers niet uit, maar voor de gevangenen natuurlijk wel.”
Daarnaast was er een groep Aziatisch-Amerikaanse Broadway-acteurs die nauwelijks rollen kregen, en het gevoel hadden dat ze ondergerepresenteerd waren. Bewijzen konden ze dat niet, want er waren geen gegevens over beschikbaar. Nadat ze die, samen met Onuoha, zelf hadden verzameld, zagen ze hun gelijk bevestigd: de statistieken lieten zien dat niet-witte acteurs veruit in de minderheid waren, en de Aziatische acteurs die wél waren terug te zien, vooral betrokken waren bij één voorstelling. Het werkveld was dus flink gesegregeerd.
Dankzij deze data hadden de acteurs een poot om op te staan, en kregen ze meer rollen. Het is een voorbeeld van wat Onuoha sousveillance noemt; ‘surveillance,’ maar dan van onder in plaats van boven.
Hoewel de acteurs erbij gebaat waren om hun data aangevuld te krijgen, is haar project geen pleidooi om ontbrekende datasets aan te vullen, zegt ze. “Ik wil mensen laten nadenken over wat het betekent dat bepaalde data niet verzameld worden.” Wat wél nog aangevuld kan worden is haar bibliotheek. Er zijn nog talloze ontbrekende gegevens denkbaar, en ze krijgt elke week wel een nieuwe suggestie. “De makkelijkste manier om aan ontbrekende datasets te komen, is door met mensen te praten. Uiteindelijk weten mensen veel beter welke informatie ontbreekt dan machines.”