Advertentie
Tech by VICE

Ik heb big data gebruikt om op de voetbalwedstrijden van dit weekend te gokken

De oplossing voor emotionele gokkers komt uit Polen.

door Jordi Willemse
23 september 2016, 11:02am

Hoewel ik best wel veel over voetbal weet, durf ik geen geld in te zetten op de wedstrijden. Ik weet gewoon dat het geen winst voor me op zal leveren. Om echt geld te verdienen met gokken hebben mensen namelijk een groot nadeel: emotie. Zo verwacht ik dat mijn club Feyenoord altijd wint, wat me nogal eens op een teleurstelling komt te staan. En zo zijn er meer mensen die bijna wekelijks geld verliezen.

Maar voor al deze mensen, en mijzelf, lijkt een oplossing te zijn gevonden. Het Poolse bedrijf Betegy berekent namelijk, aan de hand van heel veel data, waar jij het beste op in kan zetten. Dit beperkt zich niet alleen tot de toto: je kan ook zien wat de uitslag wordt, of beide teams scoren en hoeveel doelpunten er zullen vallen. Met andere woorden: big data kan de oplossing zijn voor alle emotionele gokkers.

Om beter te begrijpen waar de voorspellingen op gebaseerd worden, sprak ik met Vitaliy Yatsunyk en Alex Kornilov van Betegy. "Onze voorspellingen komen tot stand door een combinatie van allerlei statistieken," vertelt hij. "Zo worden de algemene resultaten van een voetbalclub meegenomen, maar wordt ook gekeken naar de teamprestaties en spelers."

Het voorspellen van voetbal is al bijzonder op zichzelf. "Veel onderzoekers benadrukken dat voetbal de moeilijkste sport is om te voorspellen," vertelt Kornilov, "Zo zijn er bijvoorbeeld, anders dan bij veel andere sporten, drie mogelijke uitkomsten van een wedstrijd. Verder worden er relatief weinig punten gescoord waardoor een overwicht dus niet goed te zien is. Al met al is een voorspelling met een betrouwbaarheid van tegen de 100% absoluut niet haalbaar bij voetbal."

Dit klinkt misschien logisch, maar achter zulke voorspellingen zit veel werk. "Bij de vorm van het team kijken we bijvoorbeeld naar het balbezit, aantal schoten, passprecisie en doelpunten," aldus Yatsunyk. De vorm wordt volledig gebaseerd op de prestaties van de laatste vijf wedstrijden van een club. "Daarom is het bijvoorbeeld nog lastig om de eerste vijf wedstrijden van het seizoen in te schatten: de resultaten van het vorige seizoen zijn dan niet relevant meer," zegt Kornilov.

Door de grote database die het bedrijf door de jaren heen heeft opgebouwd, is het ook mogelijk om te kijken of er een verband is tussen de prestaties van een team en het weer. Zo kan het bijvoorbeeld zijn dat een team als FC Twente vaker wint als het regent.

"Bij regen hameren trainers er vaak op om meer van afstand te schieten, omdat de bal nog weleens door de handen van een keeper kan glippen. Als er dan een team is met goede afstandschutters, is de kans groter dat zij scoren," aldus Kornilov. De precieze invloed hiervan is alleen moeilijk in te schatten. Daarom wordt hierbij gekeken naar alle eerdere wedstrijden van een club in vergelijkbaar weer, om te kijken hoe groot de invloed van het weer is.

Ondanks dat prestaties van individuele spelers worden meegenomen, tellen deze niet altijd heel zwaar mee. "Voetbalteams zijn vaak groot genoeg om een geblesseerde speler op te vangen. Zo heeft het uitvallen van Cristiano Ronaldo bij Real Madrid niet een hele grote invloed, omdat er goede vervangers zijn. Maar als Ronaldo bij het Portugese elftal afhaakt, zijn de gevolgen wel heel groot," vertelt Kornilov.

Voor de voorspellingen worden alle wedstrijden meegenomen, waardoor het kan dat de voorspellingen in de loop van de week (als er bijvoorbeeld Europees voetbal is) veranderen. Zo kan een hele goede wedstrijd in Europees verband ervoor zorgen dat de winkansen van dat team ook in het weekend toenemen, of juist andersom.

1474631758039933

De voorspellingen van Betegy voor Feyenoord

De data wordt zelfs op een nog grotere schaal ingezet door Betegy: "We proberen patronen te ontdekken in het verloop van de competitie," zegt Yatsunyk. Toch verschilt het per competitie of dit mogelijk is. Zo zijn de Eredivisie en de Bundesliga vrij constant, maar is de Serie A moeilijk te voorspellen. "Dat komt omdat veel Italiaanse clubs erg wisselend presteren. Ze kunnen de ene week heel goed spelen en een week later kansloos verliezen," aldus Yatsunyk.

Op dit moment maakt Betegy gebruik van een algoritme om al deze data te combineren. "We werken continu aan het algoritme om deze te verbeteren en de betrouwbaarheid te vergroten" aldus Yatsunyk. "Voetbalclubs maken nu nog helemaal geen gebruik van statistieken omdat ze niet weten hoe," zegt Kornilov. "Dat is hartstikke zonde, want ze kunnen er ontzettend veel profijt van hebben. Zo kunnen ze bijvoorbeeld op basis van statistieken zien wie het beste van afstand schiet of wanneer het beste moment is om een speler te wisselen." Het gebruik van big data kan dus niet alleen voordelig uitpakken voor gokkers, ook voor de voetbalclubs zelf.

Gezien de hoge betrouwbaarheid van de voorspellingen (tussen de 60-70%, en soms zelfs richting de 90%) zou je verwachten dat leden volledig vertrouwen op de data van Betegy. Niets is minder waar. "We zien dat onze leden vooral gebruikmaken van de data als een soort second opinion. Ze geven vaak alsnog de voorkeur aan hun eigen gevoel," aldus Kornilov. En daarom maken bookmakers nog steeds winst: met het berekenen van de winstuitkering letten ze niet op welk team de meeste kans maakt, maar op welk team het meeste geld wordt ingezet. "Zo speelde Galatasaray een paar jaar geleden tegen Manchester United. Hoewel Galatasaray meer kans had om te winnen, werd veel meer geld op Manchester United ingezet, waardoor die een lager uitkeringspercentage kreeg," vertelde Kornilov.

Toch ga ik me wel volledig baseren op het advies dat Betegy geeft. Dit zou namelijk, kijkend naar de cijfers van het bedrijf, de juiste manier moeten zijn om met meer zekerheid geld te verdienen. Omdat het geluk niet altijd aan mijn kant staat, is dat best een geruststellende gedachte.

Om een goede keuze te kunnen maken, heeft Betegy een zogenaamde Accuracy Tracker, waarbij je verschillende criteria kan kiezen om te zien hoe betrouwbaar de data op dat gebied is. Zoals bijvoorbeeld de betrouwbaarheid van de voorspelde thuisoverwinningen de afgelopen twee jaar in de eredivisie.

Na wat puzzelwerk kwam ik bij de volgende criteria uit: thuisoverwinning, uitoverwinning, beide teams scoren en beide teams scoren niet. Deze criteria leverden de volgende tabel op:

1474631639257426

Zoals je ziet is de ROI (return on investment) bij alle drie de manieren van inzetten positief. Dat betekent dat je er statistisch gezien altijd winst op gaat maken. Toch ga ik natuurlijk voor zoveel mogelijk winst en zet ik alleen in op de wedstrijden waar de betrouwbaarheid hoog genoeg is.

Uiteindelijk heb ik besloten om komend weekend op de vogende wedstrijden in te zetten:

Thuisoverwinning:
Ajax - PEC Zwolle
AZ Alkmaar - Go Ahead Eagles
Feyenoord - Roda JC

Uitoverwinning:
Excelsior - PSV

Beide teams scoren:
NEC - Willem II

Niet allebei de teams scoren:
Feyenoord - Roda JC

En de Toto-formulieren om het te bewijzen:

1474631614675438

Onze voorspellingen voor dit weekend, voel je vrij om ze te kopiëren

Maandag zullen we met je delen of dit ons geld heeft opgeleverd.

Volg ons en wij maken je rijker, zo niet financieel dan wel geestelijk:

Tagged:
tech
Motherboard
Big data
motherboard show
gokken
wedden
Betegy