Meestal worden de meest simpele taken als eerste uitbesteed aan machines. Die zijn het makkelijkst terug te brengen tot meetbare parameters om een algoritme mee te trainen. Een voordeel daarvan is dat kunstenaars en andere creatievelingen opgelucht adem konden halen. Het meetbaar maken van creativiteit en esthetiek is nou eenmaal een stuk lastiger is dan het programmeren van verkeersregels voor de zelfrijdende auto’s van Uber.

Toch zijn AI-onderzoekers hard bezig met het kraken van kunstmatige creativiteit. Machines leren langzaam maar zeker al poëzie, romans en zelfs filmscripts schrijven. Maar volgens een nieuw paper van Google-onderzoekers Hui Fang en Meng Zhang zouden professionele fotografen wel eens het volgende slachtoffer kunnen zijn van de creatieve AI-revolutie.

Videos by VICE

Het paper werd eerder deze maand gepubliceerd op arXiv, en beschrijft een kunstmatig neuraal netwerk genaamd Creatism, een “systeem voor artistieke contentcreatie.” Het idee was om de esthetiek van foto’s in meetbare parameters om te zetten die je aan een machine kunt leren met professionele artistieke voorbeelden. Het resultaat is, zoals Fang en Zhang in hun paper schrijven, een algoritme dat “de workflow van een landschapsfotograaf nadoet, van het kadreren van de beste compositie tot het nabewerken van de foto.”

Om dat te doen, gebruikten Fang en Zhang formules om verschillende esthetische aspecten van fotografie, zoals beeldverzadiging, compositie en de hoeveelheid details, in cijfers uit te drukken.

Vervolgens gebruikten ze 15.000 thumbnails van landschapsfoto’s die het goed deden op 500px.com om hun neurale netwerk te leren hoe het moest croppen en belichtingseffecten toe moest voegen om de beste foto te krijgen. Het neurale netwerk sneed de foto’s bij en voorzag ze van nieuwe belichting, waardoor er verschillende versies van de inputfoto ontstonden. De onderzoekers keken daar samen met vier professionele fotografen naar om de beste versie te selecteren.

Het bewerkingsproces van het neurale netwerk, van een panorama tot een bijgesneden foto tot een foto waarvan de verzadiging en belichting is aangepast. Afbeelding: Google/arXiv

Nadat het neurale net de parameters voor goed bijsnijden en goede belichting had geleerd, mocht het ‘eigen’ foto’s gaan nemen. De onderzoekers ‘voerden’ het daarom panorama’s uit Google Street View van mooie plekken als de Grand Canyon en Yellowstone. Het neurale net moest daar dan een unieke foto van maken met wat het had geleerd over bijsnijden en belichting.

De laatste stap in het proces was het doorstaan van een fotografische turingtest om te kijken of mensen konden zien dat een foto door een machine gemaakt was.

Fang en Zhang vroegen daarom zes professionele fotografen, allemaal met minstens een bachelor in fotografie en twee jaar professionele ervaring, om los van elkaar de foto’s te bekijken. Ze moesten elke foto beoordelen op een schaal van 1 tot 4, waarbij 1 een beginnersfoto was zonder veel artistieke vaardigheid, en 4 een professionele foto. Geen van de fotografen wist dat een deel van de foto’s door een machine was gemaakt.

Verbazingwekkend genoeg werd 41 procent van de 173 foto’s beoordeeld als semi-professioneel of hoger (een gemiddelde score van 3 of hoger). Maar liefst dertien procent van de foto’s scoorde 3,5 of hoger. Ter vergelijking: 45 procent van de foto’s gemaakt door een professional scoorde 3,5 of hoger.

Dus hoewel Creatism van Google niet bepaald de nieuwe Anton Corbijn is, is het algoritme toch beter dan jouw beste Instagramfoto’s. Veel van de foto’s die het algoritme gemaakt heeft zijn door de onderzoekers online geplaatst op Github. Hieronder zie je er een paar.

Afbeelding: Google/arXiv

Afbeelding: Google/arXiv

Afbeelding: Google/arXiv