Sharps är skapad av experter inom spelbranschen och alla rankningar av operatörer på vår sida är gjorda med stor diskretion. Vi hoppas att de online spelbolagen som vi har valt ut faller dig i smaken. När du väljer att klicka på en utgående länk på vår sida, kan vi komma att erhålla provision, dock utan någon kostnad från din sida. Läs hela meddelandet här.
Logga in


Svara
 
LinkBack Ämnesverktyg
Gammal 2012-02-10, 12:36   #1
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 156
Sharp$: 779
Standard

Statistisk modellering


Tja!

Jag har funnit ett antal trådar startade av nykomlingar som vill ta steget fullt ut och bli professionella spelare. Detta är på sätt och vis ännu en sådan, men med den avgörande skillnaden att jag efterfrågar tips på hur man bygger statistiska modeller.

Följande tråd av Astvald är det närmaste jag kommer: https://www.sharps.se/forums/speldagb...-modeller-nhl/ - där han bl.a. presenterar lite information om Poisson-fördelning i samband med kod.

Jag har mycket små kunskaper både vad gäller programmering och statistik. Det jag söker är alltså tips på i vilken ände jag borde börja. Vilka kunskaper behövs för att bygga en statistisk modell?

1. Att jag behöver statistisk kunskap och programmeringsförmåga säger nog sig själv. Eller gör det? Behöver jag kunna invecklad PHP, eller dylikt, för att skapa en modell?

2. Eller räcker det om jag läser statistik på högskolenivå (förutsatt att den statistiska programvara jag får lära mig också låter mig bygga dessa modeller)? Rent spontant borde det räcka med att läsa statistik. Jag föreställer mig att man bygger modeller i statistisk programvara där man knappar in de formler (eller bara värden om formlerna göms under pedagogiska knappar) som skall tas hänsyn till i modellen?

3. Hur är det med databaskunskaper, ni som modellerar själva? Vilken typ av databas är att föredra för sina data (kan t.ex. MySQL kommunicera med statistisk programvara, eller finns en databasfunktion mer eller mindre inbyggd i dessa program)? (Jag känner mig ganska säker på vilka faktorer o.s.v. jag vill statistikföra i databasen, och modelleringen av denna är inte mitt största problem. Framför allt vill jag inte lägga ned onödiga terminer på programmering för att i slutändan upptäcka att statistikprogram gör hela jobbet.)

4. Går det att hämta data som redan existerar på webben och sätta upp i en egen databas? Hur går detta till? Astvald verkade ha hämtat data någonstans ifrån i sin modell där?

Jag vore mycket tacksam för vägledning vad gäller den tekniska biten. Om man vill lära sig mer eller mindre från scratch, och målet är en statistisk modell för fotboll - var börjar jag, och vilka kunskaper behöver jag?

Tack!

Edit: Jag hittade följande tråd som också handlar om modellering. Om än intressant så gav den inga direkta svar på mina frågor: https://www.sharps.se/forums/taenkarh...4-modellering/

Följande tråd gav ännu lite mera: https://www.sharps.se/forums/taenkarh...as-och-analys/ - Det var någon där som föreslog olika statistikprogram om man har stora datamängder (R, Matlab etc. räknades upp). Dessa verkar alltså räcka, varför jag inte behöver kunna någon programmering om jag läser statistik?

Dock kvarstår problemet om jag vill samla in data från befintliga databaser. Detta lär väl kräva ganska avancerade script, inte sant? Är PHP lösningen för det ändamålet?

Senast redigerad av Asprilla den 2012-02-10 klockan 12:56.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 13:29   #2
 
dgothes avatar
 
Reg.datum: mar 2010
Inlägg: 347
Sharp$: 1076

Sabermetrics-Test MLB
Stats: 236 - 128 - 4
ROI: 109.75%
Vinstprocent: 65.00%

Standard

Tycker astvalds tråd är väldigt intressant och inspirerande. Statistik-kunskap på högskolenivå behövs inte, och inte heller några fantastiska programmeringskunskaper.. däremot bör du ha lite erfarenhet om varje..

Har du en statistisk modell som du vill testa så går det ju i teorin att testa manuellt. Antingen på papper eller i Excel (alternativt Google Docs, min personliga favorit).

Jag kan försöka svara på dina frågor ur personlig erfarenhetssynpunkt.

1) Ja och nej. Jag har ingen statistisk bakgrund alls, men jobbar som systemutvecklare. För mig var det mer ett programmeringsprojekt och lite bollande med låtsasformler tills jag stötte på Sabermetrics (baseball-analys), vilket jag sedan började använda mer och mer och skruvade lite på existerande formler. Andra kan komma från andra hållet, dvs har statistisk bakgrund men aldrig programmerat.

2) Högskolestatistik är överkurs. Du blir inte sämre av det, men det finns redan färdiga statistiska modeller och om man sätter sig in i dem och förstår det så kan man vidareutveckla själv (om man har lite bakom pannbenet).

3) Jag använder mig av databaser, för det är min bakgrund. Jag har även nyttjat Excel vilket gör det relativt enkelt att hämta in data från websidor och göra slagningar i den. Men om datan skulle vara av varierad layout och komma från flera olika ställen, ja då kan det bli problem. I mitt baseballprojekt använder jag mySQL och har skrivit all kod för analys och formeluträkning i php. I hockeyn använder jag Google Docs Spreadsheet och har skrivit alla formler där.. hugget som stucket..

4) Som sagt, du måste hämta datan någonstans ifrån om du vill automatisera saker och ting. I Google Docs och Excel kan du "importera" HTML-tabeller från en URL, men om du programmerar en egen lösning får du ladda ner data och parsa den själv (finns bibliotek för sådant i de flesta språk).
__________________
"Alla kan inte som jag koppla bort känslorna och se siffrorna" - pilen

-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
dgothe är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 17:18   #3
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

det var väldigt mycket frågor på en gång, men det är förståerligt. när man modellerar dyker det alltid upp nya problem, nya frågor att besvara. men det är också det som är oerhört kul.

jag skulle läsa Conquering Risk som handlar om hur man kan modellera sport, finns på Amazon.com, och en grundkurs i statistik om du inte stött på statistik tidigare. annars är www.khanacademy.org superbra för självstudier i bland annat statistik och sannolikhet. komplettera med wikipedia eller annat på Internet.
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 17:42   #4
i hate bunnies
 
booreds avatar
 
Reg.datum: jan 2010
Ort: Akihabara
Inlägg: 1 452
Sharp$: 1188

mackapär ver.0.8.1
Stats: 2879 - 3456 - 618
ROI: 100.19%
Vinstprocent: 45.45%

Standard

Citat:
Dock kvarstår problemet om jag vill samla in data från befintliga databaser. Detta lär väl kräva ganska avancerade script, inte sant? Är PHP lösningen för det ändamålet?
De är ju mycket upp till vad du tycker är viktigt som bestämmer hur komplicerat det blir för att komma åt datan.

Jag tex anser inbördes möten inte är av nån vikt pga den lilla matchmängd sinsemellan under tex 10år, kan lika gärna vara varians så följaktligen behöver jag inte ha några resultat längre bak än pågående säsong.
Gamla säsonger buntar jag ihop en gång om året med klass indelning i excel där dom inte tar mer plats en ett par hundra rader per liga för 15 år. Inte precis nåt databas behov.

Alla har olika åsikter vad som är viktigt, tex vissa kan hjälpas åt att ladda upp saker som inte lätt går suga från sidor. En person läser Bundesliga rapporter med lite mer ingående stats och fyller i hörnor, offisides, ball possession, skott och whtever som kan tänkas ha betydelse på ett visst vis i ett online kalkylark, en annan gör en annan liga osv.
Var och en kan sedan suga in datan i sina egna program och använda den som de själva önskar. Datan är objektiv, användandet av datan är dock subjektivt.

Senast redigerad av boored den 2012-02-10 klockan 17:58.
boored är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 02:43   #5
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 156
Sharp$: 779
Standard

Spoiler:
Citat:
Ursprungligen postat av dgothe Visa inlägg
Har du en statistisk modell som du vill testa så går det ju i teorin att testa manuellt. Antingen på papper eller i Excel (alternativt Google Docs, min personliga favorit).

Jag kan försöka svara på dina frågor ur personlig erfarenhetssynpunkt.

1) Ja och nej. Jag har ingen statistisk bakgrund alls, men jobbar som systemutvecklare. För mig var det mer ett programmeringsprojekt och lite bollande med låtsasformler tills jag stötte på Sabermetrics (baseball-analys), vilket jag sedan började använda mer och mer och skruvade lite på existerande formler. Andra kan komma från andra hållet, dvs har statistisk bakgrund men aldrig programmerat.

2) Högskolestatistik är överkurs. Du blir inte sämre av det, men det finns redan färdiga statistiska modeller och om man sätter sig in i dem och förstår det så kan man vidareutveckla själv (om man har lite bakom pannbenet).

3) Jag använder mig av databaser, för det är min bakgrund. Jag har även nyttjat Excel vilket gör det relativt enkelt att hämta in data från websidor och göra slagningar i den. Men om datan skulle vara av varierad layout och komma från flera olika ställen, ja då kan det bli problem. I mitt baseballprojekt använder jag mySQL och har skrivit all kod för analys och formeluträkning i php. I hockeyn använder jag Google Docs Spreadsheet och har skrivit alla formler där.. hugget som stucket..

4) Som sagt, du måste hämta datan någonstans ifrån om du vill automatisera saker och ting. I Google Docs och Excel kan du "importera" HTML-tabeller från en URL, men om du programmerar en egen lösning får du ladda ner data och parsa den själv (finns bibliotek för sådant i de flesta språk).


Självklart går det att göra manuellt, men det kan effektiviseras rejält om man behärskar den tekniska biten. Ett exempel på det är en utredning jag företog mig. Jag ville veta hur antalet vilodagar påverkade utgången av engelska seriematcher (Premier League, Championship). Dels behövde jag jämföra lagens antal vilodagar sedan senaste match, samtidigt som jag noterar vilken matchtyp (seriematch eller cupmatch) som spelades i föregående match (eftersom somliga lag ställer över spelare i vissa matcher). Jag gjorde undersökningen på följande sida: http://soccernet.espn.go.com/fixture...=eng.2&cc=5739

Det tog ungefär en veckas heltidsarbete att göra manuellt för de tillgängliga säsongerna (2001-2012). På senare år blev dataunderlaget knapphändigt eftersom lagen allt oftare kom att ha samma antal vilodagar. Jag lyckades dock skönja tendenser. Om jag kunnat dra hem den rätta datan med ett script och rada upp i Excel eller dylikt så hade arbetet tagit ett par dagar på sin höjd. Jag hade då velat ha ett Excel-ark med följande data:

Kolumn 1: Hemmalag (t.ex. Brighton)
Kolumn 2: Bortalag (Plymouth)
Kolumn 3: Matchresultat (0-2)
Kolumn 4: Hemmalagets antal vilodagar sedan senaste match (2 st : 8+9 Augusti)
Kolumn 5: Bortalagets antal vilodagar sedan senaste match (2 st : 8+9 Augusti)
Kolumn 6: Vilken typ av tävlingsmatch hemmalaget spelade i föregående match (samma match som i kolumn 4) - Dessa kan vara Premier League, Championship, Carling Cup, FA Cup
Kolumn 7: Vilken typ av tävlingsmatch bortalaget spelade i föregående match (samma match som i kolumn 5) - Dessa kan vara Premier League, Championship, Carling Cup, FA Cup.

Hade det varit möjligt att hämta denna exakta data med hjälp av ett script? Hur pass invecklat hade det varit? Hade Excel klarat det med funktionen du nämner? Det känns som att jag behöver en hel del programmering för ändamålet...

2) Du nämner färdiga statistiska modeller. Sabermetrics? Är detta dataprogram som går att ladda ned? Jag fann wiki-sidan och förstår upplägget, men jag hittar inget program. När jag ser en modell framför mig ser jag ett program där jag matar in siffror och den spottar ur sig procentsiffror. Det går att utföra manuellt, men det tar evigheter när matchantalet ökar.

Spoiler:
Citat:
Ursprungligen postat av Juret Visa inlägg
det var väldigt mycket frågor på en gång, men det är förståerligt. när man modellerar dyker det alltid upp nya problem, nya frågor att besvara. men det är också det som är oerhört kul.

jag skulle läsa Conquering Risk som handlar om hur man kan modellera sport, finns på Amazon.com, och en grundkurs i statistik om du inte stött på statistik tidigare. annars är www.khanacademy.org superbra för självstudier i bland annat statistik och sannolikhet. komplettera med wikipedia eller annat på Internet.


Conquering Risk ska jag kolla närmare på. KhanAcademy verkade väl också bra. Han snackade jävligt snabbt bara, men det kommer man förstås in i (eller ja, klumpigt av mig att hoppa på Poisson-videon med en gång).

Spoiler:
Citat:
Ursprungligen postat av boored Visa inlägg
De är ju mycket upp till vad du tycker är viktigt som bestämmer hur komplicerat det blir för att komma åt datan.

Jag tex anser inbördes möten inte är av nån vikt pga den lilla matchmängd sinsemellan under tex 10år, kan lika gärna vara varians så följaktligen behöver jag inte ha några resultat längre bak än pågående säsong.
Gamla säsonger buntar jag ihop en gång om året med klass indelning i excel där dom inte tar mer plats en ett par hundra rader per liga för 15 år. Inte precis nåt databas behov.

Alla har olika åsikter vad som är viktigt, tex vissa kan hjälpas åt att ladda upp saker som inte lätt går suga från sidor. En person läser Bundesliga rapporter med lite mer ingående stats och fyller i hörnor, offisides, ball possession, skott och whtever som kan tänkas ha betydelse på ett visst vis i ett online kalkylark, en annan gör en annan liga osv.
Var och en kan sedan suga in datan i sina egna program och använda den som de själva önskar. Datan är objektiv, användandet av datan är dock subjektivt.


Jag håller nog med dig om att inbördes möten genom åren är en högst tvivelaktig faktor. Dock tror jag att returmöten kan ha en viss inverkan, där något lag förlorat senaste mötet (under samma säsong) och därför är extra taggade. Men att räkna med resultat från 2005 gör jag aldrig.

Tack till er alla för bra respons och överseende med många frågor!

Spelbolagen har förstås relativt perfekta kalkyler redan, där antalet vilodagar t.ex. redan lär vara en obligatorisk variabel. Dock är jag osäker på hur jag får fram spelbolagets procent för en match. Visst blir 100/2.00 = 50 %, men om oddset är 2.00 på hemmaseger så har väl spelbolaget dragit bort en del från den egentliga uträkningen, där oddset kanske landade på 2.10 (100/47.6). Alltså kan jag inte utgå från spelbolagens odds eftersom jag inte vet hur mycket eller litet ett specifikt spelbolag manipulerat sin beräkning i det synliga oddset. Därmed är det väl ganska svårt att jämföra sin modell med spelbolagens?

Senast redigerad av Asprilla den 2012-02-11 klockan 03:00.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 10:42   #6
 
Semicolons avatar
 
Reg.datum: okt 2011
Inlägg: 853
Sharp$: 1997


Stats: - -
ROI: %
Vinstprocent: %

Standard

Du kan ju ta en kik här?

http://www.pinnaclesports.com/bettin...otions/margins
Semicolon är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 11:35   #7
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 156
Sharp$: 779
Standard

Citat:
Ursprungligen postat av Semicolon Visa inlägg

Tack! Intressant, men jag känner mig osäker på hur marginalerna inverkar på slutoddset. Svenska Spel har följande linje på Sunderland - Arsenal idag:

3,40 - 2,15 - 2,00 =
29,4 % - 46,5 % - 50 % = Totalt 125,9 %

Kan jag räkna ut deras exakta marginal, och därmed den exakta chansen de beräknat för respektive tecken?

Betyder ovanstående att SvS har en marginal på 8,64 % (25,9 %/3 utfall) per tecken, och att deras beräknade chans för respektive tecken egentligen är:

20,76 % - 37,86 % - 41,36 %

Är jag säker på att de "lagt till" samma procentsats - i det här fallet 8,64 % per tecken, på varje tecken? Eller kan de ha lagt till 12 % på tvåan, 4 % på ettan o.s.v? Är det självklart att de lägger till lika mycket på varje tecken? Eller lägger de kanske till mera på ett tecken som spelas i större utsträckning (i detta fall tvåan)?

Svenska Spel är dessutom inte helt konsekventa, vilket väl talar för att olika utfall har olika marginaler (även i samma match)? Jag fick följande summor på dagens matcher i Championship:

Barnsley - Birmingham: 125,31
Hull - Bristol City: 125,78
Ipswich - Middlesbrough: 125,3
Leeds - Brighton: 125,2
Leicester - Cardiff: 125,38
Millwall - Derby: 125,9
Nottingham - Watford: 125,38
Reading - Coventry: 125,24
Southampton - Burnley: 125,84

Medel: 125,48

Summan skiljer sig alltså. Varför? Borde inte spelbolaget alltid använda exakt samma riskberäkning? Kan man säga att Svenska Spel är mest osäkra i sin bedömning av Millwall - Derby, eftersom denna summa är högst?

Senast redigerad av Asprilla den 2012-02-11 klockan 12:00.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 11:54   #8
 
LadyDeWinters avatar
 
Reg.datum: aug 2010
Inlägg: 156
Sharp$: 160


Stats: - -
ROI: %
Vinstprocent: %

Standard

Om du ska göra system kring fotboll rekomenderar jag:

http://www.football-data.co.uk

HELT fantastiskt bra hemsida. Där finns all historisk statistik för alla matcher och dessutom alla olika odds för dessa matcher. (Ex. Avg. Ö/U 2.5, 1x2, Max. Ö/U 2,5)-

Om du kör andra sporter finns det inte lika bra utbud av historiska odds och statistik.

För att få dessa odds så använder jag med lite simpel VBA-programmering en Webquery som uppdaterar sig själv och hämtar statistiken från alla matcher i vald liga. För detta går det använda valfri sida med historiska odds/statistik.

Jag har även en tråd i (https://www.sharps.se/forums/speldagb...-far-vara-med/) där jag visar hur jag sorterar min statistik lite.

Ska precis börja studera lite informationssystems-kurser (SQL o.s.v.) vid sidan av min examen, får hoppas att det går att integrera i dessa system.
LadyDeWinter är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 22:40   #9
 
dgothes avatar
 
Reg.datum: mar 2010
Inlägg: 347
Sharp$: 1076

Sabermetrics-Test MLB
Stats: 236 - 128 - 4
ROI: 109.75%
Vinstprocent: 65.00%

Standard

en statistisk modell är inget program, det är en uppsättning formler för det ena och det andra.. dessa formler går att, med rätt parametrar, göra manuellt, men givetvis blir det enklare om du har ett verktyg för att göra det.. men blanda inte ihop en statistisk modell med programmet som hjälper dig räkna ut sannolikheten.. se det som subtraktion och multiplikation är dina statiska modeller och verktyget är miniräknaren..

Sabermetrics är en samling analytiska formler för att värdera baseball i första hand, men vissa av dess formler kan användas till andra sporter också..
__________________
"Alla kan inte som jag koppla bort känslorna och se siffrorna" - pilen

-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
dgothe är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 00:20   #10
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

För en nybörjare skulle jag vilja påstå att Access är det enklaste och kanske även bästa programmet för att lagra statistik. Microsofts hjälpdokumentation är gigantisk och förklarar så att en person utan grundskolebetyg borde förstå, dessutom finns otaliga privata sidor med mer avancerade tips/guider.

"Programmet" som nämns tidigare i tråden måste nog Excel vara det enklaste och mest lättförståeliga på marknaden - samma sak här med Microsofts hjälpdokumentation och ett ännu större antal sidor på nätet som behandlar programmet.

Med väldigt lite kunskaper kan man enkelt få ut all tänkbar information/statistik från Access och implementera dessa i de matematiska formler man vill använda och X/% är ju lika med odds - klura en kväll så behöver du inte göra annat än att placera automatiskt utvalda spel
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 00:24   #11
i hate bunnies
 
booreds avatar
 
Reg.datum: jan 2010
Ort: Akihabara
Inlägg: 1 452
Sharp$: 1188

mackapär ver.0.8.1
Stats: 2879 - 3456 - 618
ROI: 100.19%
Vinstprocent: 45.45%

Standard

Citat:
Ursprungligen postat av Asprilla Visa inlägg

Betyder ovanstående att SvS har en marginal på 8,64 % (25,9 %/3 utfall) per tecken...
Svenska Spel är ett specialfall.
För att kringgå att staten nekar SvS höja återbetalningsprocenten(80%) till konkurrenskraftigare siffror tar man största marginalen på krysset, vilket höjer 1 och 2 till iaf närmare marknadens odds. Nåt i stil med 90%-50%-90%, istället för 80%-80%-80% som vore logiskt.
Särskilt i svenska ligor dumpar SvS X för att vara konkurrens kraftiga på dom andra tecknen, mindre så i utländska ligor men samma tendens.

Senast redigerad av boored den 2012-02-12 klockan 00:28.
boored är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 10:25   #12
 
Reg.datum: jan 2012
Inlägg: 12
Sharp$: 407
Standard

Enroth du får det att låta väldigt enkelt.

Säg att jag vill hämta statistik från ett lag och sedan analysera den, te.x Djurgården fotboll. Jag använder mig av Excel.

Då hittar jag te.x http://annabet.com/se/soccerstats/re...arden,191.html

importerar in den i excel och formaterar datan så den går att analysera.

sedan går det några veckor och jag vill analysera datan igen, så jag går in excel dokumentet och uppdaterar tabellen med de nya resultaten. Men då så uppdateras ju tabellen tillbaka till det vanliga formatet och jag får återigen formatera datan.

det känns som att det är svårt att hitta sidor som har tabeller som är helt optimala så man slipper formatera datan. Många sidor försöker väl också stoppa så man inte enkelt ska kunna scrapa deras information rakt av?

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?

Mvh
Kenneth15 är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 11:17   #13
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av Kenneth15 Visa inlägg
Enroth du får det att låta väldigt enkelt.

Säg att jag vill hämta statistik från ett lag och sedan analysera den, te.x Djurgården fotboll. Jag använder mig av Excel.

Då hittar jag te.x http://annabet.com/se/soccerstats/re...arden,191.html

importerar in den i excel och formaterar datan så den går att analysera.

sedan går det några veckor och jag vill analysera datan igen, så jag går in excel dokumentet och uppdaterar tabellen med de nya resultaten. Men då så uppdateras ju tabellen tillbaka till det vanliga formatet och jag får återigen formatera datan.

det känns som att det är svårt att hitta sidor som har tabeller som är helt optimala så man slipper formatera datan. Många sidor försöker väl också stoppa så man inte enkelt ska kunna scrapa deras information rakt av?

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?

Mvh
Det jag beskrev är väldigt enkelt. Och jag tror inte någon kan nämna ett enklare program att göra det i.


Men som du nämner kan det va svårt att hitta sidor som är enkla att plocka statistik utav. För att skriva ett sånt script kan man behöva läsa några guider om macros, eller liknande om man inte helt enkelt kör på att klippa och klistra in det enligt någon mall, direkt i accessdatabasen eller via en .txt som access hämtar ifrån.

Sen, som jag nämnde, tipsade jag om att använda en databas (Access) och låta Excel hämta information ifrån denna. Vill man backa är det ju bara att backa. Inte många siffror som behövs ändras för det.


Självklart finns det många program som utmärkt klarar det som Excel och Access klarar - säkerligen med råge. Men saknar man utbildning och erfarenhet inom ämnet tror jag som sagt inte att det finns någon enklare mjukvara att använda/lära sig.

Utbildade väljer ju så klart den mjukvara de är bildade i eller använder till vardags.
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 12:11   #14
 
Persas avatar
 
Reg.datum: jan 2011
Inlägg: 474
Sharp$: 3964

Persas fotboll - 2013/2014
Stats: 6 - 2 - 0
ROI: 158.91%
Vinstprocent: 75.00%

Standard

Att hämta ut information från webbsidor är relativt enkelt om man har lite programmeringskunskaper. Utmaningen är att filtrera och hitta mönster.

Låt oss ta ett exempel där vi vill ha lite speciell statistik som t.ex. hörnor, offsides, fouls etc. Vi använder oss av ESPN Soccernet.

Spoiler:
  1. Leta upp tabellen för ligan där det finns länkar till respektive lag:
    http://soccernet.espn.go.com/tables/...league?cc=5739
  2. Kolla källkoden och skriv nu kod som filtrerar bort allt förutom länkarna till respektive lag. Resultatet blir följande:
    http://soccernet.espn.go.com/team/_/...chester-united
    http://soccernet.espn.go.com/team/_/...anchester-city
    etc.
  3. Nu är länkarna i sig oanvändbara då dessa sidor inte innehåller informationen du vill ha. Det som dock är intressant är själva id:et och namnet som vi ska använda oss av för att hitta rätt sida.

    För Manchester United är id:et "360" och namnet "manchester-united".
    För Manchester City är id:et "382" och namnet "manchester-city".

    Den sida som innehåller alla spelade matcher (endast PL) för respektive lag har följande adress:
    http://soccernet.espn.go.com/team/fixtures/_/id/$ID/league/eng.1/$NAMN?cc=5739

    Spara undan den nya adressen med korrekt id och namn i en array.
    http://soccernet.espn.go.com/team/fi...united?cc=5739
    http://soccernet.espn.go.com/team/fi...r-city?cc=5739
    etc.
  4. Nu har vi en array som är 20 lång, det vill säga en länk för respektive lag. Hämta hem varje länk och filtrera så att endast länkar som startar med "/report/_/id/" finns kvar. Nu har du ett gäng länkar som börjar med "/report/_/id/" och slutar med ett ID. Detta ID ska läggas in i följande länk
    http://soccernet.espn.go.com/match?id=$ID&cc=5739

    För Manchester Uniteds första match (borta mot WBA) får vi:
    http://soccernet.espn.go.com/match?id=318256&cc=5739
  5. Spara undan all nödvändig data i en SQL databas och glöm inte datum och match_id från föregående punkt. Anledningen att spara match_id är att inte spara dubblicerade rader i SQL databasen. Kolla därför alltid om databasen redan har respektive match_id inlagt eller inte innan du sparar.

Senast redigerad av Persa den 2012-02-12 klockan 12:14.
Persa är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 13:46   #15
ALA
 
Reg.datum: jul 2010
Inlägg: 227
Sharp$: 1528
Standard

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?



Har du prövat att lägga upp ett makro som sköter formateringen?
__________________
ALA
ALA är inte uppkopplad   Ge poäng Svara med citat
Svara



td