Jason Les is een geroutineerd professionele pokerspeler. Toch vertelt hij niet veel te kunnen doen om zich voor te bereiden op zijn volgende wedstrijd.

Normaal zou Les onderzoek doen door video’s te kijken van zijn aankomende tegenstander. Zo leert hij de speelstijl kennen en analyseert hij de handen die zijn opponent heeft gehad. “Op die manier begrijp je de strategie van je volgende tegenstander en kan je nadenken over een contra-strategie,” vertelde Les aan Motherboard.

Maar de volgende wedstrijd van Les, een heads-up no-limit Texas Hold ‘em wedstrijd met drie andere professionele pokerspelers, die 20 dagen gaat duren, is geen typische wedstrijd. Samen met pokersterren Dong Kim, Jimmy Chou en Daniel McAuley, neemt Les het op tegen een kunstmatig intelligent programma dat werd ontwikkeld door onderzoekers aan de Carnegie Mellon Universiteit (CMU). De grote prijs voor het verslaan van AI? Een deel van de $200.000 en de voldoening van het verslaan van een machine – voor de tweede keer.

De wedstrijd tussen organische hersenen en kunstmatige intelligentie, die gisteren begon in het Rivers Casino in Pittsburgh, is eigenlijk een herkansing van het originele AI experiment van CMU uit 2015. Het ultieme doel, volgens de computerwetenschappers van CMU die aan het programma werken, is hetzelfde als tijdens de eerste wedstrijd: het instellen van een nieuwe norm voor AI.

In 2015 speelde de vorige versie van het AI programma, met de naam Claudico, 80.000 handen tegen vier professionals, waaronder Les en Kim. Toen verzamelde de AI minder chips dan drie van hen. De resultaten van de wedstrijd waren niet beslissend genoeg om te bepalen of AI beter was dan een menselijke pokerprofessional.

Maar onder het mom van ‘een nieuw jaar, nieuwe ik’ is de AI nu terug met een andere naam en verbeterde capaciteiten, klaar om 120.000 handen te spelen in het River Casino. Libratus, zoals de nieuwe versie heet, heeft veel meer computerkracht dan Claudico. “We zijn de computer heel erg aan het pushen,” vertelde Tuomas Sandholm, hoogleraar computerwetenschap, aan CMU. Hij legde hierbij uit dat het team 15 miljoen uur aan gegevensverwerking nodig had om Libratus te maken, in vergelijking met 3 miljoen voor Claudico.

Voor Les is de herkansing een ontmoedigend vooruitzicht. “Er is niets dat je kan observeren of bestuderen om je voor te bereiden op deze nieuwe AI. Het is een onbekende deelnemer die nog nooit heeft meegedaan. Dus het is erg spannend om te zien hoe dit nieuwe systeem gaat spelen,” zei hij.

Toch zegt Les wel wat geleerd te hebben van de wedstrijd uit 2015, en die kennis zal hij nu gaan gebruiken. Een van de belangrijkste strategieën waar Les gebruik van moet maken is niet reageren op het instinct om te anticiperen op hoe zijn tegenstander (AI, in dit geval) zijn strategie zal zien. Hij moet zich alleen maar richten op het maximaal benutten van kansen. “Het klinkt makkelijk, maar dat instinct is gebaseerd op jarenlange ervaring en de laatste keer liet ik het niet zo makkelijk varen als zou moeten,” vertelde Les. Libratus zal de wedstrijd spelen met de Nash-evenwicht strategie – oftewel het idee dat een verandering in de tactiek niet zal helpen, aangezien beide spelers zich bewust moeten zijn van de strategie van een deelnemer.

“Als je tegen een AI speelt die de Nash-evenwicht strategie gebruikt, is het jouw doel om een zwak punt te vinden en die zoveel mogelijk uit te buiten,” vertelde Les. “Ik denk dat ik me deze week veel meer richt op het maximaal uitbuiten van de zwakke punten van een tegenstander, die we (hopelijk) kunnen vinden.”

Poker is niet het enige spel dat AI onderzoekers onder de knie proberen te krijgen. Twee decennia na de overwinning van Deep Blue op schaakkampioen Garry Kasparov, versloeg Google’s AlphaGo AI de 18-voudig wereldkampioen Go Lee Sedol vorig jaar in Zuid-Korea. Deze maand werd AlphaGo stiekem gelanceerd met de naam Master, op de online Go servers van Tygem en FoxGo, waar het zorgde voor oproer toen het 50 potjes op een rij won. Het AlphaGo team stopte vervolgens met het trainen tegen echte spelers, en zei dat de Go gemeenschap veel kan leren van de succesvolle strategieën van AlphaGo.

Er is zelfs sprake van een competitieve strijd tussen AI in de pokerwereld. Rivaliserende academici aan de Universiteit van Alberta publiceerden deze week een paper over hun programma met de naam DeepStack. De onderzoekers beweren dat het programma professionele pokerspelers kan verslaan. “In een onderzoek met tientallen deelnemers en 44.000 pokerhanden, werd DeepStack het eerste computerprogramma dat professionele pokerspelers versloeg in heads-up no-limit Texas Hold ‘em, aldus het paper. Motherboard zocht contact met een van de auteurs, Michael Bowling, om te vragen naar het programma, maar kreeg te horen dat hij er niets over kan zeggen totdat de peer-review van het paper, gepubliceerd op de Arxiv pre-print server, achter de rug is. Toch bleek uit een eerder paper dat Bowling en zijn team menselijke pokeraars succesvol versloegen met limit Hold’ em poker, een variant van de no-limit versie.

“”Het is onmogelijk om als mens de strategie van AI aan de pokertafel over te nemen”

Maar tegen welke AI Les ook speelt, hij ziet de wedstrijd niet als een uitdaging tegen de mensen, maar juist als een kans om te werken met een leermiddel dat menselijke spelers nog beter kan maken.

“Het is onmogelijk om als mens de strategie van AI aan de pokertafel over te nemen, maar ik denk dat het de ogen van mensen zal openen naar een heleboel dingen die ze zelf kunnen uitproberen als ze spelen,” zei Les. “Dat is niet per se goed nieuws voor mij als professional, maar het zal interessant en misschien zelfs vermakelijk zijn om te zien hoe mensen proberen om AI’s strategie over te nemen.”