FYI.

This story is over 5 years old.

Tech

Laat game theory je uitleggen waarom er straks een oorlog in Oekraïne is

Het blijkt dat we liever fout en consistent zijn dan slim en wispelturig.
Laat game theory je uitleggen waarom er straks een oorlog in Oekraïne is

De Oekraïense crisis is inmiddels verouderd nieuws, wat begon met acties op grote schaal - het verschijnen van Russische troepen in Oekraïne, de annexatie van de Krim - is nu een dagelijkse gang van zaken geworden. De escalatie naar een echte oorlog vindt stap voor stap plaats terwijl Oekraïense manschappen met pro-Russische separatisten sparren. Helikopters worden uit de lucht geschoten, er vinden vuurgevechten plaats om checkpoints en bruggen in te nemen, mensen worden gekidnapt en een Russisch/Oekraïens staakt het vuren wordt niet nageleefd.

Advertentie

Alles bij elkaar is het een vervelende situatie en wordt het moeilijk voor één van de betrokken partijen om uiteindelijk als winnaar uit de bus te komen. Ongeacht de uiteindelijke uitkomst blijven er vragen rondzingen: wat is wijsheid voor de verschillende spelers in de huidige crisis? Wat vermindert geweld, economische schade en regionale instabiliteit? Dit zijn overwegingen die een vorm van rationaliteit in Oekraïne zouden aangeven, maar hier zijn de betrokken partijen niet echt in geïnteresseerd. In plaats daarvan richten ze zich op nationalisme, etnische segregatie en retoriek.De berichtgeving omtrent het conflict is heel routine-matig geworden, het is meer een vooruitgezette route dan dat er daadwerkelijk actuele krantenkoppen zijn. Maar game theory (en psychologie in het algemeen) vertelt ons dat we op het kritieke moment voor een rationale uitkomst belandt zijn, als we het al niet gepasseerd zijn.

Escalatie in het algemeen bevindt zich in de sfeer van cognitieve vooroordelen. Het is, in andere woorden, een manier van denken die dwars op onze rationaliteit staat. De beoordeling raakt gefixeerd op resultaten behaald in het verleden, in plaats van dat het gericht is op uitkomsten in de toekomst. Ik heb dit al gedaan, daarom moet ik dit weer doen, in plaats van: Als ik dit doe, zal de uitkomst slecht zijn. Het houdt verband met het ego, een overheersende kracht die dicteert dat je niet als een mislukkeling gezien wilt worden. Als je een x aantal euro’s zou hebben om te gokken op een bepaalde uitkomst en je had de keuze tussen twee verschillende opties, één betere en één slechtere, is het waarschijnlijker dat je geld gokt op de slechte uitkomst wanneer je dat al eerder hebt gedaan. Het is dus op een bepaalde manier veiliger om dezelfde fout te blijven maken, dan je nek uit te steken en het risico te lopen dat je inconsistent gevonden wordt. Dit fenomeen wordt het “sunk-cost effect” genoemd en het vormt de essentie van escalatie, of het nu gebeurt tijdens de vooravond van een oorlog of tijdens een avondje casino.

Advertentie

Een boeiend voorbeeld van het effect is te zien in de NBA. Een onderzoek, van de Cornell University uit 1995, keek naar de relatieve kosten van verschillende basketbalspelers en hoeveel tijd ze spendeerden in het veld tegenover de tijd die ze doorbrachten op de bank. Rationele besluitneming zou er voor zorgen dat de meest productieve (beste) spelers het meeste tijd zouden doorbrengen op het veld. Maar het Cornell team kwam erachter dat de speeltijd van de spelers disproportioneel werd beïnvloed door de selectie die vooraf had plaats gevonden. Dus, als een speler als eerste werd gekozen in de eerste wissel, maar het slecht deed tijdens het spelen, is het waarschijnlijk dat hij meer speeltijd krijgt dan een speler die later is gekozen maar wel beter speelt.

Dit wordt ook wel escalatie van gelofte genoemd, voor het eerst beschreven in een paper uit 1976 van Barry Staw. Staw vat het algemene effect van de studie als volgt samen: “individuen investeerden een substantieel grote hoeveelheid van hulpmiddelen wanneer ze persoonlijk verantwoordelijk waren voor negatieve gevolgen.” Het is een krachtig idee: wanneer je iets doms doet is het maken van dezelfde fout in de toekomst een manier om de eerste fout te rationaliseren.

Advertentie

Dat is een raar idee en het verdient nog een voorbeeld. Stel ik heb een auto gekocht en het blijkt een barrel te zijn. Ik heb er geen monteur naar laten kijken voordat ik het kocht en nagelaten om ook maar even het oliepeil te bekijken. Ik schopte wat tegen de banden en gooide een paar duizend euro over de balie voor de sleutels. De auto takelt direct af en kost iedere keer weer meer geld. Voordat ik het weet heb ik er meer geld in gestopt dan de auto eigenlijk waard was. Iedere keer als de auto stuk gaat, doet zich de optie voor om het wrak te verkopen, maar ik laat de auto toch iedere keer weer repareren. Iedere beslissing die ik maak wordt voortgestuwd door het feit dat ik een kat in de zak kocht en niet door de toekomstige kosten van de reparaties. Iedere beslissing die ik maak om de auto te repareren rationaliseert de eerste slechte keuze om deze specifieke auto te kopen: het herhalen van een slechte keuze zorgt dat het minder voelt als een slechte keuze.

Je ziet iets soortgelijks in gokken, maar met een extra element. Het heet de “gambler’s fallacy”: het foute geloof dat kansen cumulatief zijn of dat er een natuurlijke balans in de wereld is dat in jouw voordeel zal werken wanneer je genoeg verliest. Tenminste, als je aan het verliezen bent (zoals vijf keer achter elkaar op rood verliezen bij roulette). Je zou dit kunnen misinterpreteren en denken dat er een groeiende kans is dat het wiel de volgende keer op rood valt, ondanks dat iedere draai van het wiel los staat van de vorige keren. Je ziet hier een beetje van terug in bijna alle escalaties: de gedachte dat wanneer de situatie slecht genoeg is het waarschijnlijk wel beter zal worden. Jammer genoeg is karma bullshit.

Advertentie

De paper van Staw quote een ijzige conversatie tussen Under Secretary of State George Ball, “Vietnam’s advocaat van de duivel,” en President Lyndon Johnson dat plaats vond in 1965. Wanneer grote aantallen van Amerikaanse troepen ingezet worden voor directe gevechten zullen er veel gewonden vallen in een oorlog waar de troepen slecht op voorbereid zijn en zich in een niet-meewerkende, als niet vijandige, omgeving bevinden. Wanneer we veel gewonden hebben, zullen we een bijna onomkeerbaar proces begonnen zijn. Onze betrokkenheid zal zo groot zijn dat we niet - zonder nationale vernedering - kunnen stoppen zonder onze volledige doelstellingen te behalen. Van de twee mogelijkheden, denk ik dat vernedering waarschijnlijker is dan het behalen van onze doelen - zelfs als we zulke verschrikkelijke kosten hebben geleverd. Dus, de dood van iedere troep in Vietnam zou een argument vormen voor het sturen van een andere troep soldaten. Het rationele alternatief, de-escalatie, zou betekenen dat de eerste slechte keuze erkent zou moeten worden. Het sturen van meer troepen zou de keuze valideren. Dat is escalatie.

Dit is te reduceren tot een zeer simpel en illustratief spel wat ook wel de dollarveiling wordt genoemd. Een aantal spelers bieden op een dollar, een gewoon dollarbiljet, waarbij ze iedere keer met vijf cent mogen verhogen. Uiteindelijk zal iedereen misschien wel meer ingezet hebben dan één dollar, maar er is maar één iemand die de dollar mag houden. De rest is het geld wat hij of zij heeft ingezet kwijt. Degene die op de tweede plek komt is dus uiteindelijk de grootste verliezer. In het begin heeft het dus nog zin om op de dollar te gokken, je biedt bijvoorbeeld vijf cent voor de dollar en als niemand anders biedt, maak je vijfennegentig cent winst. Maar iemand anders kan de eerste speler overbieden en vijftien cent bieden, waarbij potentieel vijfentachtig cent winst gemaakt kan worden. Op den duur heeft iedereen meer dan de waarde van de dollar geboden en is het geen kwestie meer van winst maken, maar van verliezen beperken. Dat is ook escalatie.

Het Oekraïense conflict kost beide zijden iets, en beide partijen hebben een geschiedenis van het verliezen van weddenschappen. Is het hopeloos? Nee. Al deze game theorieën hebben enig goeds gedaan en bieden een aantal uitwegen. Één oplosing is om de makers van de beslissingen te scheiden van diegenen die de beslissingen evalueren. Putin kan besluiten om troepen te sturen naar het oosten van Oekraïne, maar hij moet zijn volgende beslissing maken aan de hand van iemands evaluatie van zijn eerste besluit.

Dit idee werd gedemonstreerd in een onderzoek naar het verstrekken van leningen gedaan door een selectie van Californische banken. Wanneer een bankmanager een slechte lening gaf aan een klant en de klant wanbetaalde, was het waarschijnlijk dat ze een tweede lening gaven aan de klant om de redenen die ik hierboven heb genoemd. Wanneer de omzet van een bankmanager tot een bepaald punt omhoog ging, ging het aantal slechte leningen omlaag. Dit kwam omdat het waarschijnlijker was dat een tweede bankmanager in dat geval de beslissing nam over de vervolg-lening. Deze manager was niet beïnvloed door de eerste, slechte beslissing.

Wat waarschijnlijk meer toepasbaar is op de huidige situatie is het idee van omkeerbaarheid. De verscheidene partijen in het conflict moeten wegen aangeboden krijgen die ze in staat stelt om hun vorige beslissingen valide te laten blijven, maar zonder ze opnieuw uit te voeren. De groeiende sancties en militaire druk op Rusland en pro-Russische separatisten versterken slechts de foutheid van de Russische beslissingen die tot nu toe zijn gemaakt, wat de escalatie versterkt. De pro-separatistische kant zit gevangen in escalatie en de NATO (en anderen) zijn ook gedwongen verder te escaleren. Dat is hoe deze dingen gaan, en op een bepaald punt zal één kant meer dan een dollar hebben gegokt. Dat is wanneer het echt fout gaat.