begrip van en grip op data en toeval in (top)sport!


krijg grip op het rendement van je investering door beter te begrijpen hoe data en toeval het verschil maken op het veld

voorkom overhaaste beslissingen na een slechte reeks door inzicht te krijgen in de statistiek achter sportresultaten

breng rust, richting en realisme aan in je organisatie door inzicht te verwerven in de ware betekenis van prestaties

leer wanneer je moet ingrijpen en wanneer je moet volhouden, met heldere inzichten in de rol van data en toeval in prestaties

krijg meer controle en ontwikkel meer zelfvertrouwen door te begrijpen op welke factoren je geen invloed hebt

bekijk je favoriete voetbalclub met een nieuwe blik en ontdek dat achter elke uitslag een wereld van data schuilgaat

koppel je merk aan slimme analyses en vooruitgang door zichtbaar te zijn in een wereld die steeds meer data driven wordt

verrijk je analyses en verhalen met nuance door meer kennis en begrip van de onzichtbare cijfers op het scorebord

til je analyses over het verloop van een wedstrijd of competitie naar een hoger niveau met statistische kennis over toeval


aanleiding en achtergrond

In de sport - en zeker in de voetballerij - is toeval nog altijd een onderschatte factor van betekenis. Een afgeslagen bal, een moment van geluk of pech: het verschil tussen triomfantelijk scoren en hopeloos missen en tussen winnen en verliezen is vaak kleiner dan menigeen denkt. En toch worden er elke dag weer grote beslissingen genomen op basis van uitslagen of prestaties die statistisch gezien maar weinig om het lijf hebben. Dat is een vorm van kapitaalvernietiging die eenvoudigweg niet nodig is.


missie, visie en doelgroep

Als onafhankelijk (sport- en in het bijzonder voetbal)data scientist zie ik het als mijn missie om aan investeerders, aandeelhouders, sponsors, bestuurders, trainers, spelers, fans, journalisten en analisten meer begrip en inzicht te verschaffen in de ware betekenis van data, alsmede de rol en impact van toeval daarin en hoe daarmee om te gaan. Niet om de emoties uit het spel te halen, want die maken het juist zo ongelooflijk mooi en uniek, maar om betere en meer doordachte keuzes te maken, met meer rust, minder paniekzaaierij en een gezondere meer duurzame sport- en organisatiecultuur.


aanpak en werkwijze

Met verhelderende en inzichtelijke analyses, demonstraties, voorbeelden en anekdotes help ik clubs en organisaties om prestaties op zowel collectief als individueel niveau in hun juiste context te plaatsen en niet langer te worden meegesleept of zelfs geleefd door schommelingen die simpelweg bij (top)sport horen. Dat kan zijn in de vorm van een langdurige strategische samenwerking, een tijdelijke consultancy- of adviesopdracht, een bijdrage aan een netwerk- of sponsorbijeenkomst, een kennissessie tijdens een beurs of evenement, een gastcollege aan een onderwijsinstelling, een een- of meerdaagse (in-company) training/cursus of een interactieve lezing of workshop. Alles is mogelijk, denkbaar en bespreekbaar!


meer weten?

Wilt u meer weten over hoe een beter begrip van data, statistiek en kansrekening en meer concreet geluk, pech en toeval kunnen bijdragen aan meer stabiliteit, realiteitszin en vooral rust binnen uw organisatie? Ik denk graag met u mee en neem u graag bij de hand! Vul a.u.b. onderstaand formulier in dan neem ik z.s.m. contact met u op!

op zoek naar praktische voorbeelden en concrete toepassingen? scroll nog even verder...

Gerhard van Dijkhuizen - Independent Football Data Scientist


voorbeelden en praktische toepassingen

klik op de pijltjes voor meer tekst en uitleg!

hoe modelleer je de onvoorspelbaarheid van een voetbalwedstrijd

Voetbal is een sport van kansen, maar óók van toeval. Achter het ogenschijnlijk willekeurige verloop van een wedstrijd schuilt vaak een strakke wiskundige structuur. Een van de krachtigste modellen om dit toeval te vangen, is de Poisson-verdeling. Deze beschrijft de kans op een bepaald aantal toevallige gebeurtenissen binnen een vaste tijdseenheid op basis van een gemiddelde (bijvoorbeeld 1,7 goals per wedstrijd). Simulaties met dit model leveren soms bizarre maar realistische scenario’s op: je team kan 7 expected goals genereren, maar toch met 1-0 verliezen. Niet omdat het model niet klopt maar juist omdat het de rol van toeval correct inschat.

De Poisson-verdeling is nauw verwant aan de exponentiële verdeling, die het tijdsinterval tussen twee toevallige gebeurtenissen modelleert. Deze verdeling is “geheugenloos”: of je nu al 5 minuten wacht op een goal of net bent begonnen — de kans dat er nú gescoord wordt blijft hetzelfde. Dat klinkt abstract, maar je hebt het vast gevoeld: denk aan Mens Erger Je Niet, waar je eindeloos zit te wachten op een zespitter om überhaupt je pion op het bord te krijgen. Elke worp voelt alsof je “er nu wel recht op hebt” maar wiskundig gezien begin je steeds opnieuw.

In het voetbal betekent dit dat je je nooit rijk moet rekenen op basis van alleen expected goals. Ook al is jouw team dominant, met 7 tegen 1 xG, dan nog kun je verliezen. De kansverdeling laat zien dat kleine waarschijnlijkheden (zoals 1-0 verlies) écht voorkomen — en niet zelden. Coaches, analisten en beleidsmakers doen er goed aan de impact van toeval serieus te nemen. Niet elke nederlaag is een ramp, soms is het gewoon domme pech. En dat geldt ook als je al drie rondjes hebt gegooid en je pion nog steeds niet op het bord staat.

ontwikkeling eigen voorspelmodel op basis van historische uitslagen

Sinds enige tijd ben ik bezig ben met de ontwikkeling van een eigen voorspelmodel voor voetbaluitslagen dat op elke willekeurige voetbalcompetitie (en daarmee dus ook in het amateurvoetbal - zelfs tot het allerlaagste niveau aan toe) kan worden toegepast omdat het enkel gebruik maakt van uitslagen uit het verleden en dus niet van meer geavanceerde data (in het bijzonder expected goals) die momenteel nog enkel voor topcompetities beschikbaar zijn. Mijn model heeft de bijzondere eigenschap dat het zijn parameters (gemiddeld twee per team) zodanig onderling op elkaar afstemt dat de kans op de waargenomen set uitslagen gemaximaliseerd wordt.

 

Inmiddels heb ik een viertal versies van het model draaien die in twee dimensies van elkaar verschillen. De eerste dimensie betreft de aard van het voorspellingsmechanisme: het ene model is "multiplicatief" van aard (waardoor het wat beter in staat is om grote uitslagen te voorspellen), het andere model is juist "logistisch" (waarin extremen juist wat worden afgezwakt). De andere dimensie betreft de periode waarover de krachtsverhoudingen worden bepaald: het ene model kijken alleen naar het lopende seizoen, het andere model weegt ook de uitslagen van vorig seizoen mee. Dat levert 2 x 2 = 4 combinaties op.

 

Het ene model is niet per se (laat staan altijd) beter dan het andere en daarom is het interessant om te onderzoeken hoe ze zich tot elkaar verhouden in verschillende competities. Voor de Eredivisie en de Premier League ontlopen de vier modellen elkaar niet zoveel (maar dat komt natuurlijk ook omdat het huidige seizoen al een tijdje bezig is), voor de eerste ronde van de Champions League presteren de logistische modellen beter. Dat heeft waarschijnlijk te maken met de structuur van deze competitie, waarin 36 ploegen elk maar 8 wedstrijden spelen, waardoor er in vergelijking met reguliere competities weinig kruisverbanden te leggen zijn.

 

In alle modellen is overigens een voorziening getroffen die ervoor zorgt dat wedstrijden in het verleden minder zwaar meewegen. Momenteel is deze zogenaamde "uitdijfactor" ingesteld op 1% per dag, hetgeen zoveel betekent dat een wedstrijd van 3 maanden geleden ongeveer nog voor 40% meeweegt ten opzichte van een wedstrijd die vandaag of gisteren gespeeld is. Voor de goede orde: deze uitdijfactor geldt ook voor wedstrijden in het lopende seizoen. Hieronder zijn de verschillende modellen toegepast op de 14e speelronde van de Eredivisie (het speelweekeinde van 28 t/m 30 november 2025).

het scorende vermogen van een spits op basis van (expected) goals

Vandaag de dag is het niet ongebruikelijk om het scorende vermogen van een spits te beoordelen op basis van het aantal doelpunten gedeeld door het aantal expected goals (xG). Een ratio van ruim boven de 1? Dan heb je blijkbaar een klinische afmaker in huis. Maar zo simpel is het helaas niet. Wie écht wil begrijpen wat een spits toevoegt, moet dieper graven.

 

Laten we een voorbeeld nemen: een spits scoort 21 doelpunten uit 14 xG, oftewel 50% boven verwachting. Indrukwekkend, maar de cruciale vraag is: is dat verschil echt toe te schrijven aan kwaliteit, of zou zelfs een doorsnee afmaker dat met wat geluk ook kunnen bereiken? In een wereld waar beslissingen miljoenen waard zijn, is het essentieel dat we niet alleen naar gemiddelden kijken, maar ook naar (on)zekerheden.

 

Door betrouwbaarheidsintervallen - of liever nog volledige kansverdelingen - te berekenen rondom deze ratio, kunnen we zien of een prestatie écht boven verwachting is. Dat voorkomt dat een kwalitatief gemiddelde spits met een toevallige opleving wordt gekocht voor een veel te hoog bedrag, of dat een stabiele maar juist wat ongelukkige spits voortijdig en onterecht wordt afgeschreven.

 

De kansverdeling van "goals per xG" kan helpen bepalen of iemands prestatie statistisch significant afwijkt van het gemiddelde. Een piek bovenin zegt iets, maar hoe uitzonderlijk is het? Bevindt die prestatie zich buiten het 95%-interval? Dan is er mogelijk écht iets bijzonders aan de hand. Maar als de score binnen dat interval valt, moeten we voorzichtig zijn met conclusies – hoe spectaculair de cijfers ook lijken. Zonder dit besef is het risico groot: clubs trekken voor veel geld een ‘wonderboy’ aan die vervolgens instort, of laten een waardevolle spits vertrekken omdat zijn rendement tijdelijk wat tegenvalt.

 

Statistisch slecht onderbouwde paniekbesluiten liggen dan op de loer. Data zonder duiding is gevaarlijk. Data mét inzicht voorkomt paniekvoetbal. Laten we dus niet alleen kijken wat een spits presteert, maar ook hoe zeker we daarvan kunnen zijn.

simulatie van het (restant) verloop van een voetbalcompetitie

Hoe ontwikkelt een voetbalcompetitie zich verder vanaf de huidige stand? Wat is de kans dat jouw club nog kampioen wordt of juist rechtstreeks degradeert, of dat die nu verrassende middenmoter uiteindelijk in de top-3 eindigt? Veel clubs en fans proberen daar gevoel bij te krijgen, maar met simulaties gebaseerd op een voorspelmodel kun je dit soort vragen onderbouwen met harde cijfers en verrassende inzichten.

 

Uitgangspunt hierbij is natuurlijk mijn eigen voorspelmodel dat op basis van onderlinge krachtverhoudingen aan elke wedstrijd voor elke mogelijk uitslag een kans van optreden berekent. Door het resterende wedstrijdprogramma nu duizenden keren te simuleren, ontstaat er een kansverdeling voor de eindstand. In plaats van te zeggen "wij staan nu vierde", kun je zeggen: "de kans dat we nog tweede worden is 28%, derde 37%, vierde 23%". Zulke inzichten helpen clubs strategische keuzes maken, van transfers tot rust in de tent bewaren na een ongelukkige nederlaag.

 

Minstens zo interessant wordt het als je diezelfde simulatie toepast op het verleden. Je simuleert dan opnieuw de competitie, maar vanaf de eerste speeldag, met de veronderstelling dat alle teams al die tijd de huidige sterkte (volgens het voorspelmodel) hebben gehad. Wat blijkt? De huidige stand komt dan lang niet altijd als meest waarschijnlijke scenario uit de bus. Misschien wint de huidige koploper in maar 11% van de simulaties de titel, ondanks de voorsprong van 5 punten. Of staat een club derde, terwijl die positie in slechts 7% van de herhaalde scenario’s voorkomt.

 

Dit soort analyses helpen om data niet alleen als achterafverklaring te gebruiken, maar als strategisch kompas. Ze maken zichtbaar hoe onzekerheid zelf een factor is. En vooral: hoe je met transparantie over kansverdelingen betere communicatie, besluitvorming én verwachtingen krijgt binnen een voetbalorganisatie. Want toeval regeert vaak meer dan we denken. Maar met de juiste modellen, simulaties en context kun je daar beter mee leren omgaan, zonder daarbij de magie van het spel uit het oog te verliezen.

slim inzetten op uitslagen van voetbalwedstrijden

Veel mensen gokken op voetbal, meestal met kleine soms met grote bedragen, maar vrijwel niemand wint structureel. Logisch ook: de wedkantoren hebben hun modellen, marges en ervaring zo ingericht dat ze op de lange termijn altijd winst maken. Toch is er één situatie waarin je als buitenstaander een serieus voordeel kunt behalen: wanneer jouw model betere inschattingen maakt dan dat van het wedkantoor. Hoe werkt dat precies?

 

Stel dat je voorspelmodel een team 40% kans geeft om te winnen, terwijl het wedkantoor op basis van hun odds slechts 30% kans toekent (uitbetaling bijvoorbeeld 3,50 keer je inzet). Dan is de verwachte waarde van die weddenschap 0,4 x 3,5 = 1,4. Dat betekent dat voor elke euro die je inzet je verwacht op lange termijn gemiddeld 1,40 euro terug te verdienen. Dat is een positief rendement van 40%. Deze weddenschap is wiskundig waardevol, wat nog niet wil zeggen dat je hem altijd wint.

 

Wedkantoren bouwen altijd een paar procent marge in, door de uitbetalingen net wat lager te houden dan de door hun ingeschatte kansen. Bovendien reageren ze ook nog op hoe mensen inzetten en passen ze hun kansen op basis daarvan steeds weer aan. De kunst is dus om precies die wedstrijden te identificeren de uitbetaling te hoog is en daar ook zo vroeg mogelijk bij te zijn. Daarmee ontstaat dus - ondanks de marge die wedkantoren aanhouden - een verdienmodel.

 

Een waarschuwing is natuurlijk wel op z’n plaats. Natuurlijk is wedden risicovol, en zelfs met een goed model heb je te maken met variantie. Bovendien vereist een succesvolle toepassing een grote steekproef, strakke discipline en constante modelvalidatie. Maar het idee dat winstgevend gokken mogelijk is, zolang je maar beter modelleert dan de markt, is een interessante gedachte - zeker voor data scientists, sportanalisten en ondernemers in de sportwereld.

onderzoek naar collectieve voetbalintelligentie

Hoe goed kun jij de uitslag van een voetbalwedstrijd voorspellen? En hoe goed kun jij de zogenaamde expected goals (xG's) van een voetbalteam tijdens een wedstrijd inschatten? Help mij/ons om de kracht van collectieve voetbalintelligentie uit te testen!

 

Samen met een oud-collega start ik een uniek data-gedreven onderzoek. We gaan proberen aan te tonen dat de gecombineerde kennis en intuïtie van een grote groep voetbalkenners kan tippen aan (of misschien zelfs wel beter presteert dan) de voorspel- en rekenkracht van de meest geavanceerde data- en AI-modellen in de voetbalwereld op dit moment.

 

Deelnemers voorspellen voorafgaand aan een wedstrijd de uitslag en/of geven na afloop van een wedstrijd aan wat zij een realistische uitslag hadden gevonden. Wij analyseren vervolgens hoe deze zogenaamde wisdom of the crowd zich verhoudt tot de voorspellingen en berekeningen van toonaangevende databureaus. Uiteindelijk willen we ook gaan onderzoeken of deze menselijke input zelfs de meest geavanceerde AI-modellen nog verder kan verbeteren.

 

Ben jij een voetbalkenner of -liefhebber en lijkt het je leuk om een bijdrage leveren aan dit onderzoek? Of ben je gewoon benieuwd naar hoe goed je het doet ten opzichte van anderen? Meld je dan nu alvast aan via onderstaand formulier! Je ontvangt dan binnen afzienbare tijd een uitnodiging voor onze app die wij hiervoor aan het ontwikkelen zijn. We beginnen met de Nederlandse Eredivisie van de KNVB maar willen dit zo snel als mogelijk uitrollen naar het amateurvoetbal en naar buitenlandse topcompetities!

 

Meld je aan via de3ds.nl/voetbalkenners!

hoe tactiek je kans op resultaat positief kan beïnvloeden

Eén van de krachtigste inzichten uit de moderne voetbaldata-analyse is de waarde van expected goals (xG): de kans op een doelpunt, gegeven de kwaliteit van een kans. Maar wat als je als team niet alleen passief wordt beoordeeld op je xG, maar die ook actief kunt manipuleren via je tactiek? Dat is precies wat slimme trainers en analisten steeds beter begrijpen: tactiek is niet alleen bedoeld om zelf meer kansen te creëren, maar ook om het totaalvolume van het spel te beïnvloeden. Met andere woorden: je kunt het spel bewust kleiner maken.

 

Stel je voor: je bent een underdog. De tegenstander heeft meer kwaliteit, meer snelheid, meer scorend vermogen. Ga je dan het open duel aan in de hoop zelf ook wat te creëren? Of kies je ervoor het spel dicht te smeren? Als je besluit om met een compact blok te spelen, diep in eigen helft, met weinig risico in balbezit, dan gebeurt er iets interessants. De expected goals van beide teams dalen: jij creëert minder, maar de tegenstander ook. De totale “xG-ruimte” van de wedstrijd wordt kleiner. En daarmee neemt de rol van toeval toe.

 

Want in een open wedstrijd met bijvoorbeeld 3.0 xG tegen 1.5 xG is het niet zo waarschijnlijk dat de mindere partij wint. Maar als je die aantallen terugbrengt naar 0.6 tegen 0.3, dan wordt het ineens spannend. Een gek carambolemoment, een verdwaalde counter of een lucky penalty en je schrijft geschiedenis. In extreme gevallen is de 0-0 zelfs een wapen. Als jij en je tegenstander nauwelijks kansen creëren, neemt de kans op een doelpuntloze puntendeling onevenredig toe. Voor ploegen die op papier weinig kans maken, kan dat enorm waardevol zijn zeker in toernooien waarin strafschoppen of uitdoelpunten meespelen.

 

Niet voor niets zie je bij grote toernooien kleine landen die hun xG actief omlaag trekken, met als doel simpelweg om het einde van de wedstrijd te halen met een score waarin het toeval eindelijk regeert. Critici noemen het "anti-voetbal". Maar dat is een miskenning van de strategie. Wat deze aanpak laat zien is dat voetbal niet alleen wordt gewonnen met balbezit en aanvallende flair, maar ook met een rekenmachine en discipline. Door het spel te verstikken, neem je controle over de variantie. Je verandert de spelregels van “de beste wint” naar “iedereen maakt kans”. En dat, hoe paradoxaal ook, is misschien wel de puurste vorm van tactisch meesterschap.

de hemeltergende statistiek achter een penalty shootout

Penalty shoot-outs. Het zenuwslopende toetje van menig voetbalavond. Iedereen kent het gevoel: je team is beter, de keeper staat bekend als penaltykiller, en je hebt een spits die ze er "altijd" inschiet. En toch… verlies je. Hoe dan? Welkom in de wereld van hemeltergend toeval en statistische onvoorspelbaarheid.

 

Laten we een voorbeeld nemen. Stel: jouw team heeft een scoringskans van 80% per penalty. De tegenstander komt maar tot 40%. Dat voelt alsof je gegarandeerd moet winnen, toch Helaas. Niet dus.

 

Een penalty shoot-out bestaat vaak uit 5 strafschoppen per team. In dat kleine aantal zit het venijn: het toeval heeft daar vrij spel. Als je dit scenario 10.000 keer simuleert, blijkt dat de ploeg met 80% scoringskans nog in ongeveer 1 op de 15 gevallen verliest van het team met 40%. Niet omdat het andere team beter is. Maar omdat toeval dominant is in kleine steekproeven.

 

Hetzelfde principe geldt in de topsport in het algemeen: de betere ploeg wint lang niet altijd. De grootste fout die coaches, bestuurders en fans maken, is denken dat een uitkomst gelijk staat aan een oordeel over kwaliteit. Maar in veel gevallen is het gewoon… pech.

 

Dus de volgende keer dat je je afvraagt hoe je een shoot-out kon verliezen ondanks al dat talent? Kijk dan niet alleen naar de traptechniek maar ook naar de statistiek.

 

Lees hier het volledige artikel op LinkedIn!

het mysterie van de angstgegner en de dobbelsteen paradox

In het voetbal denken we graag in kwalitatief betere en mindere teams volgens een soort vastomlijnde hiërarchie. Als Ajax meestal wint van Feyenoord en Feyenoord meestal wint van FC Utrecht dan zal Ajax ook wel meestal van FC Utrecht winnen. Helaas is de realiteit een stuk weerbarstiger. Sterker nog: er bestaan situaties waarin dit soort logica compleet onderuitgaat. En dat is precies waar de dobbelsteenparadox het veld betreedt.

 

Wat is de dobbelsteenparadox? Stel je hebt vier dobbelstenen: A, B, C en D. Elke steen heeft zes zijden, maar niet met standaardgetallen. Ze zijn zo ontworpen dat A meestal van B wint, B meestal van C, C meestal van D en (en nu komt het mirakel) D meestal van A. Een niet-transitieve relatie dus (vergelijkbaar met steen-papier-schaar), maar dan met dobbelstenen. Dit druist in tegen ons onderbuikgevoel. Want als A > B en B > C en C > D, dan moet A > D zijn. Toch?

 

In het voetbal zien we dit fenomeen terug bij zogenaamde "angstgegners". Dat zijn ploegen waar je het als team steevast lastig tegen hebt, terwijl die tegenstander tegen andere teams juist minder presteert dan jij. In termen van expected goals, balbezit of ranglijst lijkt dit onlogisch. Maar het gebeurt vaker dan je denkt. Soms ligt het aan tactische match-ups: een ploeg die drijft op balbezit wordt bijvoorbeeld kapot gecounterd door een team dat uitblinkt in omschakeling. Of psychologisch: spelers die zich bij bepaalde tegenstanders onzeker of gespannen voelen.

 

Waarom doet dit ertoe? Voor trainers, analisten en bestuurders is het cruciaal om te snappen dat voetbal geen lineaire optelsom is van kwaliteit. Een elftal is geen rating uit FIFA, maar een complexe combinatie van speelstijlen, dynamiek, mentale weerbaarheid en… ja, een beetje dobbelgeluk. Je wint het seizoen niet op basis van wie er "in theorie" beter is, maar door te snappen waar je écht kwetsbaar bent en waarom bepaalde tegenstanders jouw algoritme kraken.

 

De dobbelsteenparadox laat ons zien dat sport en voetbal in het bijzonder soms het boekje te buiten gaat. Dat logica niet heilig is. En dat een "mindere" ploeg op papier de juiste wapens kan hebben om reuzen te verslaan. Dus de volgende keer dat je jezelf afvraagt waarom je favoriete team het altijd verliest van dat ene grijze middenmoterclubje denk aan die vier dobbelstenen. En weet: het is geen toeval, het is wiskunde.

 

Lees hier het volledige artikel op LinkedIn!

een andere manier om iemands passnauwkeurigheid te berekenen

In de voetbalwereld wordt passnauwkeurigheid vaak gepresenteerd als een eenvoudig percentage: het aantal geslaagde passes gedeeld door het totaal aantal pogingen (x 100%). Maar hoe informatief is zo’n cijfer eigenlijk? Een speler met 92% passnauwkeurigheid klinkt indrukwekkend, totdat je ziet dat vrijwel al zijn passes over een afstand van 5 meter verstuurd zijn. Het is nu eenmaal een stuk eenvoudiger om een bal naar je buurman te spelen dan een strakke dieptepass over 40 meter te geven.

 

Daarom stel ik voor: weeg passnauwkeurigheid naar de afstand waarover een pass wordt verstuurd. Een geslaagde pass over 30 meter draagt dan simpelweg meer bij aan je nauwkeurigheidsscore dan een tikje opzij. Zo ontstaat een veel genuanceerder beeld van de kwaliteit van iemands passing. En het kan nog beter. Want net als bij andere statistieken zit er ruis in deze meting. Daarom kun je ook hier een kansverdeling of betrouwbaarheidsinterval berekenen voor de gewogen passnauwkeurigheid.

 

Omdat een speler gemiddeld veel meer passes geeft dan bijvoorbeeld doelpunten maakt, zijn deze betrouwbaarheidsintervallen relatief smal. Je krijgt dus een nauwkeurig en robuust beeld van iemands passing over meerdere wedstrijden heen. Resultaat: een metric die context biedt, kwaliteit meet én rekening houdt met onzekerheid. Een stap dichter bij een datagedreven kijk op voetbal waar we écht wat aan hebben.

de boeiende wiskunde en statistiek achter een tenniswedstrijd

Bij voetbal is het allang ingeburgerd: expected goals, kansverdelingen en simulaties die voorspellen hoe een wedstrijd (of zelfs een heel seizoen) kan verlopen. Maar ook tennis leent zich uitstekend voor een data driven benadering. Zeker als je één cruciale statistiek kent: het percentage punten dat beide spelers winnen op hun eigen service.

 

Ik heb een simulatiemodel ontwikkeld dat puur op basis van deze twee percentages een volledige tennismatch simuleert. Geen gokwerk, maar duizenden gesimuleerde wedstrijden, punt voor punt, game voor game, set voor set. Het resultaat? Een kansverdeling van de mogelijke eindstanden die verrassend veel zegt over de onderliggende verhoudingen én het belang van kleine verschillen.

Stel: speler A wint gemiddeld 55% van de punten in een rally, speler B 45%. Dat lijkt geen wereld van verschil, maar mijn simulaties laten zien dat bij zo’n verschil speler A in een best-of-5 match bijna niet meer kan verliezen. Dat komt doordat tennis – in tegenstelling tot bijvoorbeeld voetbal – geen klok heeft. Een iets betere speler krijgt eindeloos de kans om zijn voorsprong uit te bouwen. Statistisch is er geen ontsnappen aan.

 

In het moderne tennis zien we steeds vaker tennissers die door hun goede service nauwelijks te breken zijn. Onze simulaties tonen aan dat hoe dominanter de service wordt, hoe groter de rol van toeval. Want als je amper nog kunt breken, worden sets beslist in tiebreaks. En die zijn, zeker bij gelijkwaardige spelers, vaak een kwestie van toeval. Daarmee neemt de variantie toe en dus ook de spanning.

 

Wat als je tijdens een match net een paar procent beter gaat spelen? Bijvoorbeeld van 50% naar 53% puntwinst? Of als je tegenstander wat verslapt? Het model laat zien dat kleine procentuele verschillen enorme impact hebben op het wedstrijdverloop. Een wedstrijd is dus zelden écht gespeeld. Het kantelen van een match is geen fabeltje, het is statistisch verklaarbaar. Door wedstrijden te simuleren en te analyseren, helpen we spelers, coaches en fans om beter te begrijpen wat er op de baan en onder de oppervlakte gebeurt. Tennis is geen loterij maar wiskunde speelt wel een hoofdrol. 

 

Lees hier het volledige artikel op LinkedIn!

in welke mate zijn teamformaties afhankelijk van de tussenstand?

In het moderne voetbal wordt veel gesproken over tactiek, formaties en flexibiliteit. Maar hoe vaak wijzigt een team nu werkelijk van spelsysteem (denk aan 4-3-3, 4-4-2, 4-5-1) tijdens een wedstrijd? En belangrijker nog: wat triggert die verandering? Dit kun je onderzoeken door aan de hand van data een aantal elementen tegen elkaar af te zetten: de actuele tussenstand, de krachtverhouding tussen beide ploegen (bijv. topploeg tegen degradatiekandidaat of middenmoter tegen middenmoter) en of een team thuis of uit speelt.

 

Een bekend patroon is dat topploegen vaker aanvallender spelen, terwijl laagvliegers zich doorgaans wat meer ingraven. Het ligt voor de hand dat we dit ook terug gaan zien in de data. En dat is dan ook precies waarvoor we in een dergelijke analyse willen corrigeren. De hamvraag is: wijzigt een team daadwerkelijk zijn systeem als het achter- of voorstaat, onafhankelijk van zijn plek op de ranglijst?

 

Omdat er in een wedstrijd tientallen mogelijke tussenstanden zijn, maken we het meetbaar met behulp van een afgeleide variabele op de x-as: van 3 of meer doelpunten achterstand tot 3 of meer doelpunten voorsprong. Vervolgens kunnen we in elk van de 3x3=9 clusters analyseren hoe vaak het spelsysteem gedurende de wedstrijd afwijkt van de startformatie, afhankelijk van die doelpuntensituatie. Deze aanpak stelt ons in staat om statistisch significant vast te stellen of teams daadwerkelijk hun tactiek aanpassen bij een achterstand of voorsprong. En of dat ook consistent gebeurt per club, competitie, spelsituatie of zelfs per trainer.