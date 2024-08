In de hoogtijdagen van QWOP zijn er vele toetsenborden gesneuveld toen ze uit pure frustratie kapot werden geslagen tegen bureau’s, muren en andere harde oppervlakken. Het flashspelletje draaide maar om één ding: een gesimuleerde hardloper 100 meter laten afleggen op een atletiekbaan. Het is tevens een van de weinige spelletjes waarbij de gemiddelde gebruiker een score van -1 meter haalde. Veel verder ben ik zelf in ieder geval niet gekomen. Hier is trouwens een guy die wél goed is:

DeepMind, de AI van Google, heeft nu iets voor elkaar gekregen waar zelfs mijn persoonlijk record in QWOP compleet bij verbleekt. Het heeft zichzelf leren lopen.

De mensen van Google gaven de AI in een simulatie verschillende figuurtjes met virtuele sensoren, uiteenlopend van een mensachtig poppetje tot een bal met vier pootjes. De sensoren gaven de AI informatie over de omgeving in de simulatie, bijvoorbeeld of er ergens een muurtje of afgrond zat.

Vervolgens gaven ze Deep Mind de opdracht om het figuurtje van punt A naar punt B te laten bewegen. Meer opdrachten gaven ze niet, ook niet om uit te leggen hoe het moest. En het is gelukt.

De AI had van tevoren dus geen enkel besef van wat lopen was. Toch is het ‘m gelukt om de poppetjes met succes de digitale hindernisbaan af te laten leggen. Dat het er debiel uitziet is bijzaak. Als het toch een keer mislukte, nam de AI die informatie mee om het de volgende keer beter te doen. Maar hoe tof het ook is, het is niet zo bijzonder als het volgens sommige bronnen lijkt.

De AI kreeg een situatie voorgeschoteld met een aantal vaste parameters. Hij moest figuurtjes die alleen op bepaalde manieren konden bewegen van de ene kant van het parcours naar de andere kant krijgen. Iedere keer als het faalde, moest met de informatie daarover een betere manier bedenken om het voor elkaar te krijgen. Meer niet. Daar komt nog bij dat het hier om een gesimuleerde omgeving gaat. Een flinke, platte lap code.

Dat we nu met zijn allen denken dat de AI kan lopen, komt doordat wij mensen onze eigen manier van voortbewegen erin herkennen. We zien poppetjes bewegen op een manier die het midden houdt tussen een normale wandelgang en een scène uit die “late for meeting”-video op YouTube.

De computer ‘ziet’ ondertussen (als een AI zou kunnen zien) een gigantische berg code waar het wel raad mee weet. De AI is immers gebouwd om grote hopen code door te werken. En dat is precies wat hij hier doet: z’n werk.

Dat het de AI van DeepMind gelukt is om door middel van machine learning de andere kant van het hindernisparcours te bereiken, is mooi. Dat betekent dat het doet wat het moet doen. Maar de poppetjes die het over het parcours moesten bewegen, waren zo ontworpen dat ze eigenlijk alleen maar door te lopen de andere kant konden bereiken. Op andere manieren konden die figuurtjes zich niet voortbewegen.

En als je zo’n AI dan maar lang genoeg laat proberen het op andere manieren te doen, komt het vanzelf tot de conclusie dat lopend de beste manier is.

Mooi? Ja. Indrukwekkend? Best wel. Wereldschokkend? Nee.

En nu ga ik verdomme mijn high score van QWOP verbeteren.