|
LinkBack | Ämnesverktyg |
2012-07-17, 20:03 | #1 |
Hjälp mig med poissonfördelning och statistisk analys!
Hej sharps. Jag hade inte tänkt på det här förut, men det skrivs ju en hel del om poissonfördelning i trådar där Kellys formel nämns. Jag håller själv på med ett examensarbete på högskolenivå, där jag nu tvingas konfrontera poissonfördelning, poissonregression och liknande. Jag tänkte att eftersom det finns en bunt användare här som förstår sig på det där med poissonfördelning kanske det finns NÅGON som använt sig av det i vetenskapliga sammanhang också. Hoppas kan man ju alltid!
Jag förstår nämligen ingenting av vad jag ska göra. Jag klistrar in texten jag skrev i en tråd på flashback! Ja nu sammankopplar jag ju förresten själv det här kontot med ett konto på flashback, men det gör mig inget. Jag är snäll på båda forumen. Här kommer textmassan: Jag gör ett arbete på högskolenivå. Jag har så fruktansvärt svårt att förstå vilken statistik jag ska använda mig av, jag är inte direkt en stjärna på statistik. Jag har hört att jag bör kolla på poissionfördelning och GLM. Kanske var det Poissionregression till och med. Jag vet inte. Jag ska använda mig av R i alla fall. Jag slänger ihop ett fiktivt exempel som är ganska fånigt, men som skulle behöva precis samma statistik som mitt riktiga arbete: Jag har gått 100 m längs 10 olika gator i olika svenska städer. Jag har längs denna sträcka noterat hur många människor som äter glass. Resultatet för de tio olika gatorna i de olika städerna ser ut såhär: Stockholm: 5, 2, 4, 7, 3, 4, 6, 3, 5, 4. Göteborg: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0. Sveg: 0, 0, 0, 2, 0, 0, 1, 0, 0, 0. Orsa: 2, 1, 3, 1, 0, 0, 0, 2, 1, 1. Borgholm: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0. Jag vill nu testa statistiskt om mina resultat från Stockholm är signifikant högre än övriga. Vad tycker ni jag ska använda mig av? --- (och som sagt, glass-exemplet är inte mitt riktiga arbete, men siffrorna är ungefär likvärdiga och jag söker samma statistik) |
|
2012-07-17, 21:13 | #2 |
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540greedys betting Stats: 141 - 122 - 17 ROI: 107.69% Vinstprocent: 53.61% |
Först vill jag inleda med att säga att jag inte har läst statistik på högskolenivå, men kan åtminstone starta en diskussion med mitt material. Kommer att prenumerera på din tråd både här och på FB i alla fall.
Först kan man ju diskutera om antalet glassätare inträffar helt slumpmässigt i tiden. Man går ofta i par eller grupper och köper glass tillsammans, men då det inte var ditt egentliga exempel så kan vi frångå från det. Formeln för Poisson lyder ju: P(X=x) = e^(-Y)*Y^(x)/x!, Y>0, x=0,1,2... där Y vanligtvis brukar betecknas med den grekiska bokstaven lambda och som mitt tangentbord saknar. Det speciella för en poissonfördelad stokastisk variabel är att väntevärdet = lambda. En teori är ju att få fram funktionen P(X=x) för alla städer och beräkna lambda och därmed väntevärdet hos varje stad. Sedan kan man jämföra väntevärdet hos varje stad och komma fram till om Stockholm är "signifikant högre". Hur man beräknar P(X=x) i R har jag inte en aning om, men om programspråket är liknande som Matlab så har jag en metod nedan för stockholm just. Vet inte hur legitim denna metod är så får lämna ett frågetecken för den just. Tanken i scriptet är helt enkelt att anpassa lambda med en minstakvadratmetod. Frekvensen för hur ofta det är x antal människor beräknas från datan. Sedan minstakvadratanpassar man en poissonfunktion utifrån det. Koden följer inom spoiler: Spoiler:
Beräknade värden som är av vikt: Lambda = väntevärdet = 4,4469 med fyra decimaler. standardavvikelsen = sqrt(Lambda) = 2.1088. Att jämföra med standardavvikelsen hos datan som är 1,4944. Kan få en att fundera om datan följer en Poissonfördelning. Vidare en bild på fördelningen och motsvarande funktion: http://ladda-upp.se/bilder/yafealbetuziba/ Följande användare gav Sharp$ för den här posten:
Rehn108 (+20) Senast redigerad av greedy den 2012-07-17 klockan 21:19. |
2012-07-19, 13:39 | #3 |
Jag känner mig taskig som inte svarat på det här än, men jag har inte haft tid. Tack för ett bra svar. Jag ska i mån av tid, förhoppningsvis idag, ge lite bättre återkoppling på ditt svar! Men tack ska du ha i alla fall, redan nu!
|
|
2012-07-20, 09:05 | #4 |
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875Hockey-VM 2013 Stats: 11 - 8 - 6 ROI: 113.31% Vinstprocent: 57.89% |
För Poisson-regression används Maximum Likelihood och inte Least Square. Jag tycker SPSS är mest användarvänligt för estimation (jag är ingen programmerare).
|
2012-07-21, 14:31 | #5 |
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540greedys betting Stats: 141 - 122 - 17 ROI: 107.69% Vinstprocent: 53.61% |
Det stämmer nog, hade det i bakhuvudet. Har ingen erfarenhet av MLE så använde minstakvadrat för att visa mina tankegångar. Har du någon länk som går igenom MLE grundligt?
|
2012-07-25, 18:57 | #6 |
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875Hockey-VM 2013 Stats: 11 - 8 - 6 ROI: 113.31% Vinstprocent: 57.89% |
Nej tyvärr, min erfarenhet sträcker sig bara till användare av statistikprogram och en förståelse för hur modellerna fungerar. Är varken matematiker eller programmerare; men Wikipedia är väl som alltid en bra start?
|
|