|
LinkBack | Ämnesverktyg |
2012-01-22, 10:40 | #1 |
astvald utforskar statistiska modeller (NHL)
Jag har funderat av och till ett tag på att skriva ett datorprogram för att göra statistisk modellering av speldata, givetvis med förhoppning att kunna använda modeller för prediktion. De senaste dagarna gjorde jag slag i saken och har en betaversion för NHL (ishockey ger lagom många mål för att lämpa sig att modellera med Poissonprocesser och gamla data är lätt tillgängliga för NHL).
Jag har byggt en databas med matchdata för årets säsong och som en första enkel modell ser jag antalet mål hemma/borta för respektive lag som varsin Poissonprocess vars parameter jag skattar med data från redan spelade matcher. Det är välkänt att sådana modeller normalt underskattar antalet oavgjorda matcher, och det är också tydligt i mina första testkörningar. För tillfället kommer jag därför bara att visa uppskattade ML-odds. Planen är att så småningom utvidga modellen, antingen till att använda bivariata Poissonfördelningar eller med någon annan variant av korrelation. Här var mina ML-beräkningar för gårdagens matcher (2012-01-21). NJ-PHI 2.28/1.78 BOS-NYR 1.63/2.58 ANH-OTT 2.08/1.92 VAN-SJ 1.92/2.09 DET-CLS 1.22/5.53 NYI-CAR 1.80/2.25 TOR-MON 1.76/2.31 WPG-FLA 1.77/2.29 NSH-CHI 1.88/2.14 PHO-TB 1.50/3.02 STL-BUF 1.30/4.29 MIN-DAL 1.75/2.33 EDM-CGY 1.59/2.70 LA-COL 1.76/2.32 Observera att dessa är beräknade som "rättvisa" odds, i den meningen att de motsvarar en teoretisk återbetalning på 100%. För de flesta matcherna överensstämde mina beräkningar förvånansvärt väl med spelbolagens odds. Ett par stycken stack dock ut och jag testade att spela VAN-SJ @ 2.20 (beräknat 2.09) STL-BUF @1.42 (beräknat 1.30) EDM-CGY @2.05 (beräknat 1.59) LA-COL @2.45 (beräknat 2.32) Det enda matchen som verkligen stack ut var EDM-CAL, där jag hade Edmonton som klar favorit, medan den allmänna uppfattningen var CGY som liten favorit. (Resultat: STL och COL gick in, SJ och EDM gjorde inte det, för -0.13u) |
|
2012-01-22, 10:54 | #2 | |||||||
2012-01-22
Beräkningar för dagens matcher (2012-01-22) ger
PIT-WAS 1.58/2.73 PHI-BOS 1.64/2.55 ANH-COL 1.77/2.31 Den enda matchen som sticker ut är PHI-BOS, där mitt program har PHI som ganska klar favorit, medan bolagen håller BOS som knapp favorit. Jag följer givetvis mitt program, och sätter en slant på [email protected] (nordic bet).
Följande användare gav Sharp$ för den här posten:
Migge (+1) Senast redigerad av astvald den 2012-01-23 klockan 00:09. Anledning: stavfel |
||||||||
2012-01-22, 11:02 | #3 |
Hur ska man utläsa vilken match som är värd att rygga? Nu ser man bara oddsen för bägge lagen men inte vem man ska lira såvida du inte har skrivit det som i t.ex. Philadelfia...markera gärna med fet stil vilket lag man bör rygga!
|
|
2012-01-22, 11:12 | #4 |
Oddsen jag listade är mina simulerade odds. Om beräkningarna vore perfekta (vilket de naturligtvis inte är i närheten av att vara) så finns det värde i alla spel som ger bättre odds än de beräknade. Jag kommer själv inte att rygga programmet om jag inte hittar odds som är åtminstone 0.10 bättre än de beräknade. (Egentligen borde man nog sätta gränsen på 0.15 eller 0.20 tills alla parametrar är finjusterade.)
För PHI-BOS är det en klar rygg hursomhelst. Min modell ger ett odds på [email protected], men NB erbjuder 2.00, så vi har ett teoretiskt värde på +0.36u. |
|
2012-01-22, 11:21 | #5 | |
Citat:
|
||
2012-01-22, 11:30 | #6 |
Intressant läsning! Ska bli spännande att följa.
__________________
// SPADERMAN To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts. |
|
2012-01-22, 11:44 | #7 |
|
|
2012-01-22, 12:51 | #8 |
Kan vara en bra idé, dem har sågott som alltid bäst linor på NHL.
__________________
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts. train TJUU TJUUUUU |
|
2012-01-22, 21:37 | #9 |
Lite teori
Teorin bakom min (och många andra) statistiska modeller är att modellera t.ex. gjorda och insläppta mål som Poissonfördelade slumpvariabler. Poissonfördelningen passar bra för att beskriva händelser som är förhållandevis ovanliga, och som sker oberoende av varandra. Gjorda mål i många sporter (tex ishockey) uppfyller dessa antaganden åtminstone någorlunda väl. Däremot lämpar sig inte Poissonfördelningen så bra för att modellera (t.ex.) poäng i baseball -- det är mer sannolikt att få en andra poäng i en inning när man väl fått sin första.
Jag har knappt 700 matcher från årets NHL-spel i en databas. Vi roar oss med att låta X beteckna antalet gjorda mål för hemmalaget och Y antalet gjorda mål för bortalaget och antar vidare att X och Y är oberoende (se nedan!) Poissonfördelade slumpvariabler. Om vi anpassar X och Y till de 700 matcherna och bestämer parametrarna för X och Y med Maximum Likelihood-uppskattningar, finner vi att X är ungefär Poi(2.80) och Y är ungefär Poi(2.48). Dessa uppskattningar i sin tur skulle medföra att antalet gjorda mål för hemmalaget skulle fördela sig enligt: Kod:
Mål Modell Verkliga data 0 42.0 [43] 1 117.7 [130] 2 165.0 [164] 3 154.2 [120] 4 108.1 [122] 5 60.6 [73] 6 28.3 [25] 7 11.3 [9] 8 4.0 [4] 9 1.2 [3] 10 0.3 [0] 11 0.1 [0] Kod:
Mål Modell Verkliga data 0 57.8 [50] 1 143.5 [140] 2 178.3 [193] 3 147.7 [150] 4 91.7 [86] 5 45.6 [50] 6 18.9 [18] 7 6.7 [5] 8 2.1 [0] 9 0.6 [1] 10 0.1 [0] 11 0.0 [0] Kod:
H A: 0 1 2 3 4 5 0 3.50 [ 3] 8.69 [ 7] 10.80 [ 7] 8.95 [18] 5.56 [ 2] 2.76 [ 2] 1 9.81 [12] 24.38 [36] 30.29 [22] 25.08 [19] 15.58 [30] 7.74 [ 8] 2 13.75 [ 7] 34.17 [23] 42.46 [65] 35.17 [27] 21.85 [22] 10.86 [15] 3 12.85 [15] 31.94 [16] 39.68 [27] 32.87 [32] 20.42 [ 9] 10.15 [16] 4 9.01 [ 6] 22.39 [34] 27.81 [40] 23.04 [24] 14.31 [12] 7.11 [ 4] 5 5.05 [ 4] 12.55 [18] 15.60 [23] 12.92 [18] 8.02 [ 5] 3.99 [ 3] Sammanfattningsvis uppskattar den (oberoende) Poissonmodellen slutresultat enligt Kod:
1 322.6 [311] x 122.4 [152] 2 248.0 [230] Alla ovanstående beräkningar är gjorda kollektivt för alla lag tillsammans, men kan kan förstås göra dem lag för lag också. Då blir osäkerheten förstås lite större, eftersom datamaterialet är mindre, men i det stora hela för man motsvarande överensstämmelse. |
|
2012-01-22, 22:51 | #10 |
Direkt kommer Alice Cooper in i huvudet! Intressant projekt, kommer följas!
__________________
Den mätta dagen, den är aldrig störst. Den bästa dagen är en dag av törst. |
|
2012-01-22, 23:56 | #11 |
Reg.datum: jan 2011
Inlägg: 474
Sharp$: 3964Persas fotboll - 2013/2014 Stats: 6 - 2 - 0 ROI: 158.91% Vinstprocent: 75.00% |
Mycket intressant, gillar alltid när folk tar sig an statistik!
|
2012-01-23, 09:40 | #12 | |||||||||||||||||||||
2012-01-23
Stolpe ut i går, då Philadelphia förlorade på straffar.
Dagens beräkningar ser ut så här: CAR-WPG 1.74/2.36 TOR-NYI 1.66/2.52 DET-STL 1.38/3.60 NSH-CLS 1.49/3.04 EDM-SJ 2.17/1.86 LA-OTT 2.17/1.86 och jag har hittat ett par matcher som jag ger ett försök
Modellen har Detroit som större favorit än vad som syns i spelbolagens odds, Edmonton som mindre dog och Ottawa som favorit i stället för dog. |
||||||||||||||||||||||
2012-01-24, 15:53 | #13 | |||||||||||||||||||||
I natt blev det stolpe in i stället med EDM som vinnare på straffar. Dagens beräknade odds är
NYR-WPG 1.50/3.02 NYI-TOR 2.06/1.95 NJ-BUF 1.54/2.87 FLA-PHI 2.40/1.72 TB-CLS 1.57/2.77 STL-PIT 1.80/2.25 DAL-ANH 1.90/2.11 CGY-SJ 2.06/1.94 PHO-OTT 1.89/2.12 COL-MIN 1.84/2.19 VAN-EDM 1.48/3.07 WAS-BOS 2.44/1.69 CHI-NSH 1.67/2.49 Märkligt nog hittar jag inga ML-linor på WAS-BOS eller CHI-NSH. Jag har ingen aning varför (varken Pinnacle eller Unibet listar matcherna, Betson har trevägslinor, men inte ML). I dag överensstämmer mina beräkningar väldigt bra med Pinnacle. De enda som modellen ser lite värde i är
Min modell tycker uppenbarligen orimligt bra om Edmonton. Även om det verkar lite suspekt, så följer jag mina beräkningar. 3.79 ser trots allt ut som ett överodds, även om jag inte har så stora förhoppningar att den går in. [email protected] och [email protected] känns lite bättre. Senast redigerad av astvald den 2012-01-25 klockan 10:35. Anledning: (så att resultaten syns) |
||||||||||||||||||||||
2012-01-24, 18:28 | #14 |
Uppenbarligen väntade Pinnacle på att jag skulle posta mina beräkningar för WAS-BOS och CHI-NSH I alla fall stämmer de nästan på pricken med mina uppskattningar.
Följande användare gav Sharp$ för den här posten:
Persa (+5) |
|
2012-01-25, 11:22 | #15 |
Reg.datum: jan 2011
Inlägg: 474
Sharp$: 3964Persas fotboll - 2013/2014 Stats: 6 - 2 - 0 ROI: 158.91% Vinstprocent: 75.00% |
Dina beräkningar verkar funka bra. Du räddade nattens NHL-spel från ett totalt fiasko!
|
|