Trevligt att du verkar någorlunda positiv!
Jag kan absolut tänka mig att dra ett tungt lass när det kommer till modellering av databasen samt att dela med mig av statistiska infall. Det kommer dock krävas hjälp från många håll för att ro detta i hamn, framför allt när det kommer till datainsamling.
Målet är att göra det enkelt för fotbolls- och spelintresserade att genomföra statistiska undersökningar. Tanken är att man ska ha möjlighet att undersöka precis de faktorer man är nyfiken på.
Målet nås genom att vi utvecklar en (eller flera) relationsdatabasmodell(er) för fotboll och strukturerar information i Excel-filer (.CSV) som blir tillgängliga för alla. Genom att strukturera informationen i CSV-filer blir det enkelt att för vem som helst lägga in dessa data i en egen databas. Det enda man behöver lära sig är att upprätta en databas på sin egen dator och sedan göra sökningar i databasen för att utvinna precis den information man vill undersöka statistiskt.
Vi kommer att behöva utveckla en standard för hur filerna ska vara uppbyggda, d.v.s. vilka kolumner etc. som ska finnas med och i vilken ordning dessa ska finnas med (för att man så enkelt som möjligt ska kunna plocka in dessa i den egna databasen). Jag är absolut ingen expert på databaser, men har läst på en aning. Kommer dock behöva respons på ER-modell o.s.v.
1. Först behöver vi veta exakt vilken information som är av intresse. Detta resulterar i en ER-modell av följande slag:
http://i41.tinypic.com/25s8wg5.jpg
Modellen beskriver vad som ska finnas med i databasen. Enkelt beskrivet kommer kvadraterna på bilden att bli tabeller i databasen. Cirklarna intill varje kvadrat kommer att bli kolumner. Tabellen "Match" kommer således att ha kolumner som ID (varje match har ett identifierande nummer), hemmalag, bortalag och datum. Vi kan garanterat hitta ännu mer information än den förenklade modellen där. För varje spelare räcker ju inte förnamn och efternamn. Vi vill ha reda på gula kort, röda kort och allt som överhuvudtaget går att få reda på. Först måste vi alltså slå våra kloka hjärnor ihop och ta reda på exakt vilken information vi behöver ini minsta detalj.
Hur vi lägger upp själva modellen avgör också vilka sökningar som sedan går att göra.
2. Näste steg (väldigt grovindelat) borde rimligtvis vara datainsamlingen. Någon kan få i uppgift att upprätta en Excel-tabell för samtliga spelare i La Liga 2009/2010. Till viss del går det att snabba på detta genom att använda importera-funktionen i Excel. (Det går säkert att göra allting med några musklick om man kan avancerad programmering, men eftersom jag inte kan det har jag behov av en databas). Hursomhelst gör man då så att man tilldelar varje spelare ett spelar-ID. I någon tabell, beroende på ER-modellen, skriver man också upp i exakt vilka matcher var och en av spelarna har deltagit, och vilka stats (mål, assist, röda gula, etc.) spelaren har i respektive match. Jag är rätt osäker på hur detta kommer att gå till, men varje spelare ska alltså kunna kopplas till sina matcher så att statistiken för spelarens enskilda matcher också summeras någonstans. Vill man söka upp ett speciellt lag ska det gå att få fram all statistik om varje spelare för det laget under den säsongen, ungefär såhär:
http://soccernet.espn.go.com/team/sq...united?cc=5739
Fördelen med att kunna ställa egna frågor till databasen är väldigt uppenbar. I nuläget kan du bara se den statistiken som hemsidan väljer att visa för dig. Du kan inte påverka strukturen. Du kan t.ex. inte få en proper lista på hur många placeringar det i genomsnitt skiljer mellan två lag för att matchen ska sluta oavgjort. Du kan heller inte lista alla spelare i en liga efter hur många minuter som i genomsnitt krävs för att en spelare ska göra mål. Du kan inte ens göra en så enkel sak som att rangordna lagen efter antal gjorda mål istället för på poäng. Allt detta är du tvungen att göra manuellt för att komma åt informationen. Genom att vi utvecklar denna databas blir detta möjligt genom enkla kommandon.
Vi börjar alltså med att föreslå behoven. Vilken statistik vill vi ha om en spelare eller om ett lag? Vad vill vi kunna ta reda på?
Vi kan göra små listor:
Lag
• Lagnamn
• Nationstillhörighet
• Antal gjorda mål (sorterat på matchtyp - liga, olika cuper - och på säsong)
• Antal insläppta mål (som ovan, + sorterat på matchminuter? + hemma/borta)
• Grundat (årtal?)
• Arena
• Nuvarande tränare (+ tidigare tränare?)
• Transfers (om vi orkar hålla reda på detta)
I sak kan alltså databasen innehålla både statistiskt användbar information och mer eller mindre onödigt vetande. Självklart kommer detta gå att applicera på andra sporter. Kom med förslag!