Mycket bra initiativ! Det som är allra viktigast för statistisk modellering är matchspecifik data. Varje match måste ha ett ID i databasen eller hur det nu funkar (som ni märker får jag hjälp med databaser) liksom varje lag och spelare. Oavsett sport behövs all tänkbar statistik som skulle kunna förklara resultatet. Jag är gärna med och tar informationen från datastadiet till en modell för prediktion. Det är där min styrka ligger.
Tänkbar data för fotboll:
Mål
Måltidpunkter (väldigt viktigt)
Mål tillvägagångssätt (hörna, frispark, spelmål osv)
Passnings%
Bollinnehav
Skott på mål
Skottkvalitet (var kom skottet ifrån?)
Hörnor
Varningar + tidpunkt
Utvisningar + tidpunkt
Speltid (spelarspecifikt)
Specifik målvaktsdata
Plus allt annat som jag har glömt som är av vikt för lags och spelares prestationer.
I hockey finns det betydligt mer statistik och jag tänker inte göra någon lista, men det ska vara betydligt enklare att modellera än fotboll. Varför? Främsta problemet med fotboll som jag ser det är att det går att byta offensiv mot defensiv och man gör det både under matcher som mellan matcher. När ett mål faller i fotboll förändras matchbilden betydligt mer än i hockey. Faktum är att när ett mål görs i fotboll går sannolikheten upp för att det ska bli ett mål till jämfört med innan. Dessutom spelar Teneriffa väldigt olika jämfört med om de möter Barcelona (backar hem) eller Sociedad (mer offensivt), ni förstår min poäng. Men, absolut inte sagt att det inte går att modellera. Jag har bara spånat lite på vad som kommer vara viktiga saker att se till när man sätter klorna i datan.
Trevlig onsdag!
Följande användare gav Sharp$ för den här posten:
|