VAD JAG GJORT
De två formler jag använt är alltså
Pythagorean Win% och
Log5, två formler som appliceras mer på laget än på individen (vilket de flesta SABR-formler faktiskt gör). Mitt mål var att sätta en styrkefaktor på två lag som möts och sedan avgöra hur stor sannolikheten att det ena laget slår det andra var.
Den första formeln, Pythagorean Win % är en variant av den vanliga vinstprocenten, det vill säga Wins/Games Played, men istället för att bara ta wins så räknar man ut en Win% baserat på Runs Scored och Runs Allowed, en slags "Så här bra BORDE lagets Win% vara baserat på hur många runs dom gör kontra släpper till"..
Pythagorean Win% formeln i sitt ursprungsformat ser ut så här:
Runs Scored är ju en rätt enkelt variabel att ta fram, det är helt enkelt så många runs scored laget har hittills under säsongen. Runs Allowed däremot är ju lite märkvärdigare i Baseball.. vi kan ju inte ta hela säsongens Runs Allowed för att applicera på en individuell match då starting pitcher är så oerhört påverkande.
Det var alltså med Runs Allowed som jag stötte på min första utmaning. Hur tar jag Pitcherns ERA och använder som bas, men tar samtidigt i beaktande att han inte spelar alla 9 innings, samt att lagets försvarsspel utöver pitchningen påverkar?
Så jag testade lite och landade till slut på följande:
((SP_ERA/9) * 5) + ((TEAM_ERA/9) * 4)
TEAM_ERA blev helt sonika lagets runs allowed per match, oavsett om det var beroende på error eller starting pitcher eller bullpen. Hypotesen var att starting pitchern går ca 5 innings, sedan tar bullpen vid och eftersom jag räknar in oavsett error med mera i den andra variabeln så får jag med de extra runs som inte syns annars. Perfekt? Knappast, men åtminstonde mer trovärdigt än att endast använda Starting Pitcherns ERA.
Låt oss kalla min ERA-variabel för modERA. Därmed har vi följande startvariabler för RUNS ALLOWED som är faktor två i Pythagorean Win %.
För att slutligen få samma scope på siffrorna måste vi antingen multiplicera modERA med antalet spelade matcher, eller dividera Runs Scored med antalet matcher. Det spelar ingen roll vad man väljer, resultatet blir det samma, men man måste ändå tänka på scopet.
Det ger oss följande variant av ovanstående formel:
Win = (RunsScored^2) / ((RunsScored^2) + (modERA^2))
Detta skulle med andra ord vara lagets Win% om dagens starting pitcher startat varje match under året.. en slags styrkeindikator för laget med just denne killen på kullen.