Tech

Dit nieuwe machine learning programma kan een pistool razendsnel herkennen

Een pistool is eigenlijk een soort ballistische verlenging van de hand. Het is een klein, en subtiel instrument dat kan zorgen voor grote vernietiging. Het grote voordeel voor criminelen is dat je het heel nonchalant beet kan houden, zonder dat iemand het doorheeft. Totdat je de trekker overhaalt natuurlijk. En dan schiet een semiautomatisch pistool ook nog eens zo snel als je de trekker over kan halen. Met andere woorden: als je eenmaal door hebt dat iemand met een pistool rondloopt, is het al te laat.

Een team computerwetenschappers aan de Universiteit van Granada in Spanje heeft hier een oplossing voor bedacht. Ze wilden de dreiging van pistolen neutraliseren door vroegtijdige opsporing. Als we een pistool kunnen registreren, voordat deze is afgegaan, herwinnen we wat controle. En daarom hebben ze een machine learning programma ontwikkeld dat betrouwbaar pistolen kan detecteren op basis van visuele herkenning en classificatie. Het systeem is zelfs in staat om pistolen in slechts een kwartseconde te identificeren in video’s met een lage kwaliteit op YouTube.

Videos by VICE

“De cijfers van pistool-gerelateerde criminaliteit is op veel plekken in de wereld zorgwekkend, vooral in landen waar wapenbezit legaal is of een tijdje legaal is geweest,” schrijven Siham Tabik en zijn collega’s in een paper dat pas online kwam op de arXiv preprint server. “Een manier om dit soort geweld te stoppen is preventie door vroegtijdige opsporing zodat bewakers of politieagenten kunnen ingrijpen. Vooral één innovatieve oplossing voor dit probleem is het voorzien van surveillance of controlecamera’s met een accuraat systeem voor automatische pistooldetectie.”

Gezien het succes van machine learning gezichtsherkenning, zou dit een makkelijk oplosbaar probleem moeten zijn. Het algoritme moet gewoon kijken naar een heleboel afbeeldingen van pistolen in verschillende situaties en uiteindelijk zal het de visuele kenmerken van een handwapen herkennen als pistool, of in ieder geval genoeg kenmerken om het ding te identificeren.

Zo makkelijk zou het inderdaad zijn geweest als we net zoveel foto’s van pistolen hadden als van gezichten, wat helaas niet het geval is. Het gebruiken van convolutionele neurale netwerken (CNNs) voor gezichtsherkenning is alleen mogelijk omdat we miljoenen foto’s hebben van gezichten. Tabik had slechts 3000 afbeeldingen van pistolen, wat eigenlijk te weinig is voor het herkennen van kenmerken met machine learning.

De onderzoekers hebben de afgelopen jaren gewerkt aan een soort mengelmoes van soortgelijke objecten. Dit is een methode om het visueel herkennen mogelijk te maken, ondanks dat de data schaars is. In het algemeen wordt dit transfer learning genoemd. Het basisidee is dat we de kennis over een object kunnen toepassen op een ander, gerelateerd object. We hebben bijvoorbeeld misschien maar weinig afbeeldingen van vrachtwagens, maar als we genoeg foto’s van auto’s hebben dan komen we er ook wel.

Stel dat we al een goed model hebben voor het herkennen van auto’s. Dan is het mogelijk om het autoherkenningsmodel te “finetunen” en daarbij gebruik te maken van nieuwe beelden van vrachtwagens. Het model voor auto’s heeft al een heleboel informatie over vrachtwagens omdat die ergens toch wel een beetje lijken op auto’s. Dus door het proces te finetunen, kunnen we het bestaande automodel omscholen tot een vrachtwagenmodel. Dit gebeurd door het verschil tussen een auto en een vrachtwagen te leren herkennen. De abstracte representatie – de generieke kenmerken die worden gebruikt om iets te herkennen – wordt uitgebreid en aangepast.

De Tabik’s gefinetunede versie van het model heet VGG-16 en is gebaseerd op een dataset van 1.28 miljoen afbeeldingen dat luistert naar de naam ImageNet. Het programma biedt hulp bij het herkennen van allerlei soorten objecten. Als je een afbeelding invoert, is het model in staat om deze te classificeren in een van de ruim 1000 verschillende categorieën: blikopener, gier, koraalrif, toiletpapier, en ga zo maar door. Door het VGG-16 model te finetunen met 3000 foto’s van pistolen, werd het mogelijk om essentiële nieuwe categorieën van objecten toe te voegen.

“Het model dat het best werkt heeft veel potentie, zelfs in YouTube video’s met een lage kwaliteit. De resultaten die het model boekt als automatisch alarmsysteem zijn erg goed,” schrijft Tabik. “Bij 27 van de 30 gevallen werd het alarm, na vijf opeenvolgende herkenningspunten, terecht geactiveerd in minder dan 0,2 seconden.”

De technologie die komt kijken bij het detecteren van pistolen gaat van ultra high-tech tot ongelooflijk opzichtig. Aan de ene kant is de politie in New York een systeem aan het testen dat handwapens traceert op basis van de radiatieve signatuur van het menselijk lichaam, terwijl het bedrijf Shooter Detection Systems aan de andere kant bezig is met een systeem dat de rook van pistolen automatisch detecteert, oftewel: “een rookalarm voor pistoolschoten.” Dit systeem is sinds 2014 al in een aantal scholen geïnstalleerd. Het systeem van Tabik zit ergens tussen deze twee tegenpolen in.

Het trainen van een machine learning model is vooral een rekenkundige aangelegenheid. Het duurt lang – dagen, weken. Maar als het model – wat eigenlijk vooral een groot nummerraster is – eenmaal werkt, kun je heel snel objecten herkennen. Bij al de verschillende combinaties die er zijn voor het detecteren van objecten, hebben onderzoekers de fout-positieve factoren uitgesloten. Desondanks blijven er nog steeds een aantal fout-negatieven over, wat de betrouwbaarheid van het systeem reduceert tot tussen de 90 en 95 procent.

Deze relatief nieuwe mogelijkheid van het ontwikkelen van een nieuw object herkenningsmechanisme met een kleine dataset, biedt in ieder geval genoeg potentie om nog veel vaker gebruik van te maken.