Visa ett inlägg
Gammal 2012-12-19, 12:37   #19
droid
 
droids avatar
 
Reg.datum: apr 2012
Inlägg: 82
Sharp$: 1625
Standard

Varning för långt inlägg!

Som vi alla känner till vid det här laget krävs det att målen är slumpmässiga och inte beroende av tidigare händelser (t.ex. andra mål) för att Poisson-fördelningen teoretiskt sett skall fungera. Det går emellertid att modellera tillräckligt bra resultat med Poisson, men det brister i och med nämnda faktorer.

Något annat vi också kan konstatera i denna tråd är att man relativt enkelt kan förbättra värderingarna som kommer utifrån Poisson-fördelningen genom att vikta om värderingarna främst för de binära resultaten (0-0, 1-0, 0-1, 1-1) där effekten av att målen inte är slumpmässiga och oberoende av varandra är mest påtaglig. Det här ”Kryss-inflation” fenomenet kan stävjas tillräckligt bra genom att öka sannolikheten för 0-0 och 1-1 med en rimlig grad på bekostnad av 1-0 och 0-1 så länge sannolikhetssumman fortfarande blir 1 (100 %) efter genomförd Poisson-fördelning.

Modellen jag hittills har byggt kan med mycket bra pricksäkerhet uppskatta ”true odds” för O/U-mål marknaderna och med acceptabel precision värdera ”Correct score”. Jag vill dock göra ett försök att gå från ”acceptabel” till ”mycket bra” och har en teori för att göra det som vi kan kalla för Dynamisk Poisson-fördelning.

En grundförutsättning för att detta skall fungera är som alltid att den initiala Poisson-fördelningen har rätt förutsättningar. Med detta menar jag den första Poisson-fördelningen som genomförs baseras på antalet förväntade mål per lag, dvs. lagens relativa styrka.

Denna relativa styrka går bl.a. att få fram genom statistik och historisk data genom att beräkna fram lagens ”Attackstyrka” respektive ”Försvarsstyrka”. I dess enklaste form kan man utgå efter genomsnittligt antal mål respektive lag har gjort respektive släppt in under förra säsongen och sedan viktar värdena mot varandra.

Ett alternativ till ovanstående, som min modell baserar sig på, är att beräkna fram förväntat antal mål för respektive lag genom att använda oddsen på Betfair då marknaden väger in andra faktorer som historisk data inte gör, t.ex. eventuella skador eller motivation hos lagen.

När ovanstående ”grundjobb” är klart kan man genomföra en traditionell Poisson-fördelning som används för att värdera exempelvis marknaden ”Correct score”. I det här läget är vi dock fortfarande känsliga för Kryss-inflationen och det är här jag har tänkt mig att ”Dynamisk Poisson-fördelning” kommer in i bilden.

Dynamisk Poisson-fördelning

Idén går ut på att dela upp matchen i olika tidsintervall och för varje intervall ta hänsyn till förväntad målintensitet (t.ex. görs ca 40 % av målen görs sista 30 minuter i en match) och förväntad benägenhet att ”öppna upp matchen” och på så vis få fram en ”Målbenägenhetsfaktor” (MBF) som påverkar lagens förväntade antal mål och som beräknas om för varje nytt tidsintervall.

Exempelvis kan matchen delas upp i 15 minuters intervaller där varje intervall har sin egen ”konfigurationsuppsättning” och en simulering görs per tidsintervall. För närmare precision (då fler än ett mål kan ske inom varje intervall vill vi ha kortare intervall för att "konfigurera om" snabbare) kan matchen delas upp i ännu mindre intervall. MBF är vid matchstart lämpligtvis 1.0, dvs. enligt indata gällande förväntat antal mål. Då målintensiteten som fastställs av tidsskede i matchen enligt historisk data redan har MBF ”inräknat” (t.ex. minst mål sker i inledningen av matchen så inget syfte att justera ner MBF för att lagen spelar defensivt) tänker jag mig att MBF aldrig skall understiga 1.0.

Räkneexempel:

Två jämnlika lag spelar mot varandra i Premier League. I den 75:e minuten gör hemmalaget 1-0. I och med detta antas benägenhet att ”öppna upp matchen” öka. Därmed ökar vi värdet på MBF till något värde vi anser lämpligt (t.ex. 1.1), vilket innebär att takten (förväntat antal mål) för båda lagen ökar, vilket i sin tur innebär att det är högre sannolikhet än vanligt (MBF 1.0) att det blir ytterligare mål i matchen och som förhoppningsvis då bl.a. hjälper till att hämma Kryss-inflationen.

Förväntat antal mål hemmalag: 1.5
Förväntat antal mål bortalag: 1.4
MBF: 1.0

Observera att procentsatserna för utfall 1/X/2 är ungefärliga och inte exakta.
FFAM = Faktor Förväntat antal mål (baserat på målfördelning från aktuell tidpunkt till matchens slut)

Tabell:
Spoiler:


Notera alternativt scenario i fetstilt vid 75’ minuten när vi ”skruvar upp” förväntat antal mål så ökar sannolikheten för kryss även om båda lagen förväntas göra mer mål och inte bara det som ligger under.

Det som alltså behöver göras är i stora drag "bara" att:
  • Fastställa en matris för värdet på MBF baserat på:
    • Aktuellt tidsintervall
    • Aktuellt resultat
  • Simulering i tidsintervall med dynamisk indata till Poisson-funktionen
    • Förväntat antal mål för respektive lag med hänsyn till aktuellt tidsintervall och MBF

Givetvis får man se till att genomföra tillräckligt många simuleringar för att underlaget skall bli pålitligt. Detta kommer förhoppningsvis inte bara ge bättre spegling av de binära resultaten, utan även av andra resultat (t.ex. 3-0/0-3). För att säkerställa att man är på rätt väg vid framtagande av detta kan man ha MBF konstant på 1.0 med mål att få samma/väldigt nära resultatet av den ursprungliga Poisson-fördelningen.

Är detta något som skulle kunna fungera (med ytterligare förfining) eller är jag helt ute och cyklar nu? Ris och ros tas tacksamt emot!

Spontanta funderingar:
  • Vad är en lämplig ökning på MBF? Går kanske att hitta statistik över sannolikheten för fler mål när väl ett mål har gjorts?
  • Skall MBF gälla för båda lagen eller enbart det laget som ligger under?
  • MBF skall aldrig understiga 1.0?
// Droid
Följande användare gav Sharp$ för den här posten:
bftrader (+22), hobern (+10)
droid är inte uppkopplad   Ge poäng Svara med citat