Citat:
Ursprungligen postat av solum
Tack för svaren.
Varför vill du att det ska vara andra matcher,utveckla det lite så är det bra. 
|
Om man anpassad över en mängd matcher så kan det inträffa att man har fått värden som passar bra till just den mängden matcher men som inte speglar helheten.
Ett mycket förenklat exempel är om två lag, Lag A och Lag B mötts 100 gånger. På 20 av dessa matcher så väljer vi att anpassa en sannolikhet för hur ofta Lag A vinner matchen. Vi får fram en siffra, och väljer vi ut samma 20 matcher för att kolla hur bra våra siffror stämmer överens så kommer vi märka att siffrorna också stämmer ihop bra. Vi vet dock inget om hur bra modellen är i helhet, detta vet vi först efter att vi jämfört med matcher som inte ingått i den mängd som vi använde för att optimera värdena.
Detta tillvägagångssätt, att inte använda samma matcher i optimering som testfas, är speciellt viktigt inom bettingsammanhang då det inte finns några "facit" om vilka faktorer som spelar roll och hur stor inverkan de har. Om man t.ex. skulle kolla något samband mellan en alligators vikt och längd så skulle man kunna motivera sin formel med biologiska motiv. Någon motsvarighet finns inte på samma sätt (inte alls lika klart) inom bettingen.
Studerar man exemplet ovan med de två lagen så kan man konstatera att modellen bör bli bättre och bättre ju fler matcher man tar hänsyn till. Har du t.ex. använt de två senaste säsongerna i någon liga för att anpassa modellen så finns det risker med att använda säsonger från längre tid tillbaka för att testa. Risken finns då att lagen har förändrats och att modellen, trots att den är riktig, kommer ge ett minusresultat. Då kan det vara bättre att testa på samma matcher som man använt för att optimera (bättre än inget trots allt). Sen får man på andra sätt försöka analysera och rimlighetsbestämma de faktorer man fått fram.