Citat:
Ursprungligen postat av Juret
det sätt åtminstone jag vill ha data presenterad på är säsongsbaserad data som uppdateras för varje match. för prediktion av en match i omgång 7 i Premier League använder jag således de första 6 omgångarna för att få mina inputs i modellen. jag skapar ett average för varje statistik och varje lag för varje match i databasen. simpelt uppställt:
Hemmalag: 2.47 Goals For, 1.53 Goals Against osv
Bortalag: 1.45 Goals For, 1.78 Goals Against osv
sedan använder jag mig av tidigare säsongers data för att komma fram till hur en match med ovanstående lags styrkor (i form av GF och GA eller vilken statistik som nu är signifikant i modellen) borde sluta i genomsnitt (antingen som antal mål eller som sannolikheter). så snittdata för matcher spelade upp det till det datumet, den säsongen, är ett måste för bra modellering.
sen tror jag det bästa är att börja smått och se att det fungerar. som sagt, det viktigaste är prestationsdata.
|
Detta borde dock vara någonting som Asprilla kallar härledda attribut, som man kan beräkna själv mha. databasen. Alltså ingenting som ska finnas klart i den huvudsakliga databasen, om man ska gå på devisen att "så lite som möjligt ska finnas med i databasen, utan att rucka på mängden information", dvs bort med härledda data. Den devisen känns nästan som ett måste om man ska kunna göra upp någon standard för databasen.