LUCK의 소계는 다음을 보시기 바랍니다.

1st Ver.

2nd Ver.


2번째 버전 완성한 기념으로 뜬금없이(!) 작년 시즌 선발투수 기록을 계산해보기로 했습니다. 이왕 이렇게 된 거 자체적으로 윤석민상도 한 번 뽑아보도록 하죠.(아..정말 뜬금없다..)

KBO의 경우 기록 관련 사이트가 너무나도 안 좋은 관계로 선발투수와 불펜투수 스플릿은 그냥 제가 직접 KBO 홈페이지를 찾아가서 직접 더하면서 구하였습니다. 그래서 계산에 착오가 있을 수도 있습니다. 그리고 파크펙터(BPF)의 경우 각 구장에서의 결과를 알기 전에는 계산할 수 없기 때문에 그냥 일괄적으로 1로 생각하고 계산하기로 하였습니다. FIP 계산의 경우 KBO의 런밸류를 알지 못하기 때문에 그냥 MLB와 같이 13,2,2로 적용하여 계산했습니다. FIP는 팬그래프 방식입니다.


험험..사진 재활용(..)

순위를 매기기 위해서 저는 선발 100이닝 이상 던진 선수들의 선발 스플릿 성적에 대해서만 생각하기로 하였습니다.


그러면 먼저 FIP를 기반으로 볼 때 LUCK 순위를 매겨보기로 합시다.


WAR의 경우는 어떻게 계산했나면...2nd Ver.에서 나오는 ExTmWPCT에서 0.380을 뺀 걸 가지고 계산한 겁니다...이런 식으로 계산하면 상위권의 선발투수들은 팬그래프 방식이랑 꽤나 비슷하지만 하위권의 선수들은 조금 더 높은 경향성을 보이게 됩니다. 그건 그렇고...

계산 결과 이브랜드가 영광(?)의 1위를 차지했습니다. FIP가 계산 결과 3.72로 FIP-가 86이나 나오더군요. 그 결과 fWAR도 3.1이나 될 정도로 높습니다. ExW은 11.3승에 ExL 8.9패, ExWPCT 0.560으로 계산됐네요. 하지만 실제로 나타난 결과는 ERA가 5.54에 6승 14패...하하하 LUCK은 -10.4점이네요. 2위는 4승 11패의 에릭 해커...LUCK은 -8.6으로 계산되었습니다. 그 외에 리즈, 밴덴헐크, 레이예스 등이 FIP를 기준으로 볼 때 불운한 선발투수로 계산되었습니다.


다음은 ERA를 기반으로 한 계산의 결과입니다.



에릭, 리즈가 거의 비슷하네요. 에릭은 LUCK -10.2점, 리즈는 -9.9점..ㄷㄷㄷ 그 외 찰리, 밴덴헐크, 이브랜드 등이 불운한 선발투수로 계산되었습니다. 이브랜드는 ERA가 엄청 높음에도 불운하다고 계산되는군요.


결과적으로 FIP로 본다면 이브랜드가, 그리고 ERA로 본다면 에릭이 가장 불운한 선발투수였다고 계산되네요. 올해 제가 생각했던 거랑 그렇게 크게 다르게는 나오지 않은 결과였습니다. 


FIP LUCK -10.4점으로 자체적으로 뽑은 윤석민상의 영광(...)을 안은 이브랜드(..)



마지막으로 자체적으로 윤석민상 뽑는 게 남아 있는데... 저는 개인적으로 운을 계산하는 것에서는 ERA보다 FIP가 더 낫다고 생각하기 때문에 FIP LUCK 기준으로 생각하기로 하였습니다. 그러므로, 저는 2013년 KBO에서 가장 불운했던 선발투수로 이브랜드를 뽑겠습니다.

Posted by 야구고물상

댓글을 달아 주세요

모든 기록은 팬그래프베이스볼 레퍼런스에서 얻었습니다.

아래 식에 나오는 sta는 선발을 뜻하고 rel은 불펜투수를 뜻합니다. IPDEC은 선발투수가 디시전이 되는 비율을 뜻하며 '선발이닝/선발투수 디시전 횟수'로 구합니다. 아래 나오는 계산결과는 다운 받으셔서 확인하셔도 됩니다.


사실상 이거 하는 가장 큰 이유-이브랜드 LUCK 구하기...


소개

 

작년에 쓴 글 중에 간단히 해보는 선발투수 운(Luck)의 계량이란 글이 있었습니다. 그 글에서 저는 다음과 같이 LUCK 툴의 네 가지 문제점을 말한 바 있습니다.

 

1. 아직 커리어를 대상으로 적용해본 사례가 없기 때문에 커리어의 경우 운의 요소가 많이 줄어드는지를 확인해본 적이 없다.

2. RS,RA가 독립변수로써 투수의 디시전 결과 예측에서도 통계적 유의미성을 지녔는지에 대한 증명이 생략되어 그 근거가 미약하다.

3. 실제 전체 선발투수의 승률은 0.500보다 약간 낮게 나타나지만 이 툴을 이용하면 0.500 부근으로 형성될 것이다.

4. 1999년 페드로 마르티네즈와 같이 엄청난 FIP를 기록한 경우 페드로가 나온 경기에서 팀이 이길 수 있다고 계산되는 승수보다 페드로가 기록할 것이라고 생각되는 기대승수가 더 크게 나오는 문제점을 가지고 있다.(이는 후에 다시 한 번 생각해볼 문제입니다.)

 

위의 문제점을 보면 제가 4번에 후에 대시 생각해볼 문제라고 쓴 걸 보실 수 있을 겁니다. 1999년 페드로의 경우 FIP가 무지 낮아서 (선발 한정 1.33) 위와 같은 괴상한 문제점이 발생하게 됩니다. 그리고 이는, 결국 LUCK의 첫 번째 버전이 선발투수의 퍼포먼스에 해당하는 적정한 승수를 과대평가하거나, 혹은 과소평가한다는 뜻이기도 합니다. 그래서, 저는 아예 방향을 달리해서 기대승수를 계산하기로 했습니다. , 선발투수가 나온 경기에서 승리한 횟수에서 선발투수의 기대승수를 생각하는 방식으로 계산하는 것입니다. 그리고 잘 던지는 선수들의 경우 어느 정도 경기에 나와서 디시전이 될 확률이 적어질 것이라고 생각해서 이전에 사용한 IPDEC항목도 수정을 가하기로 하였습니다. 그러니까, 선발투수마다 IPDEC을 달리 적용하는 방식을 사용하기로 한 것입니다.

 

과정

 

1. 가설

 

(1) 선발투수의 실점률이 낮아질수록 그 투수 이후 나온 중간계투들의 승률이 좋아질 것이고, 꽤나 높은 신뢰도를 가질 것이다.

(2) 이닝과 디시전의 비율인 IPDEC()은 선발투수의 경기당 평균이닝(IPAVG)가 높을수록 커질 것이고 선발투수의 실점률이 높아질수록 낮아질 것이다. 그리고 그것을 통해 IPDEC의 식을 계산할 수 있을 것이다. 이를 BWPCT(Bullpen WPCT)라고 부르기로 합시다.

 

2. 가설 증명

(?..이걸 증명이라 할 수 있나...??)

 

(1) BWPCT의 경우 2002년 이후 선발투수 중 선발로만 규정이닝 이상 투구한 선수들에 대하여 조사하였습니다.

 

선발투수 ERA에 대한 BWPCT의 그래프


이를 통해서 보면, 선발투수의 실점률이 낮아질수록(계산은 ERA로 했습니다. 예전에 아무 생각 없이 했던 거라;;) 그 경기에 나온 중간계투들의 그 경기 승률이 좋아진다거나 나빠지는 경향성은 사실상 없는 것으로 보입니다. 위에서 보듯이 R^2이 0.0029가 될 정도로 너무나 낮기 때문에 그 신뢰도가 낮다는 것이죠.


(2)IPDEC의 경우 2002년 이후 선발로 나온 모든 선수들에 대해서 조사하였습니다.

 

IPDEC.xlsx


IPAVG에 대한 IPDEC의 그래프


RA에 대한 IPDEC의 그래프


위의 그래프와 엑셀 파일에서 확인할 수 있듯이, IPAVGRAIPDEC과 꽤나 상관 있어 보입니다. 각각 R^2이 0.2107과 0.1222나 되니 적어도 R0.3은 넘는다는 걸 알 수 있습니다. 그래서 전, 두 항목을 IPDEC 계산하는 데 사용할 것입니다. 이 때 계산된 IPDEC을 IPDEC_raw라고 하고 LgIPDECsta(선발들의 IPDEC)을 IPDEC_raw로 나눈 것을 상수 C로 정의하겠습니다.

(참고: 위의 IPDEC 엑셀파일에서는 2002시즌부터 2013시즌까지의 IPDEC과 관련된 그래프와 계산된 IPDEC(IPDECEXP로 표기함)와 실제 IPDEC의 그래프도 있습니다.)

 

3. 계산식 만들기

 

우선 위에서 보듯이 선발투수의 실점률과 그 경기에 나온 중간계투들의 승률과의 관계는 없는 것으로 보입니다. 그래서, 사실상 모든 선발투수에게 선발투수 디시전이 기록되지 않은 경기에서 그 시즌 중간계투가 기록한 승률을 대입하여 선발투수가 나온 경기의 총 승리에서 빼도 되겠다는 확신이 들었습니다.

그러니까, (선발투수의 전체경기-선발투수의 디시전이 기록되지 않은 경기)*전체 중간계투의 승률을 선발투수가 나온 경기에서의 승에서 빼면 선발투수가 기록할 기대승수를 계산할 수 있다는 생각입니다.

IPDEC의 경우 그래프에서 IPDEC=1.4543IPAVG-0.0335, IPDEC=-0.3122RA+9.6393의 식이 나왔습니다. 그래서, 우선 각각의 기울기의 비율을 구하였습니다. 대략적으로 (Slope of IPAVG)=-4.66(Slope of RA)가 나왔습니다. 그리고 이 기울기의 비율의 합이 1이 되도록 만들었습니다. 이것을 통해 IPAVG와 RA에 대한 weight를 구했는데, 대략 0.82와 0.18이 나왔습니다. 그리고 그 외에 절편들에 weight를 곱하여 더한 결과 다음과 같은 계산식이 완성되었습니다.

IPDEC_raw=1.19IPAVG-0.056RA+1.71

 

그래서, 결과적으로 계산식은 다음과 같아졌습니다.


(1)팀 승리 관련



(2)IPDEC 계산



(3)디시전 관련



(4)LUCK



적용


적용은 간단하게 해봅시다. 이전에 해 본 2010~2012시즌을 한 번 해보고, 다음에 2013시즌 한 번, 그리고 몇몇 선수들(은퇴했거나 현역인)에 대하여 적용해보기로 합니다. 사실 사진을 올리는 게 좋겠지만 귀차니즘 발동(...)으로 엑셀 파일을 올리겠습니다.

 

1.2010~2012시즌

LUCK 2010~2012.xlsx


2.2013시즌

2013 MLB_SECOND.xlsx


3.몇몇 선수들의 커리어

Players-Examples.zip


결과


이번에 LUCK을 개량하여 LUCK이 이전에 가지고 있던 몇 가지 문제점을 조금 줄일 수 있었습니다. 선발투수 승률에 조금 조정을 가할 수 있었다는 점, 일괄적으로 적용되던 IPDEC의 문제점을 해소할 수 있었다는 점, 그리고 피타고리안 승률을 이용해 계산되는 이론적 팀의 승수보다 선발투수의 디시전 승수가 적어지는 점, 과대평가되거나 과소평가되던 선발투수의 기대승률이 조정되는 점 등등이 있습니다. 아직 갈 길은 멀지만(..)그래도 2번째 버전이 이전보다 나은 툴이라는 생각이 듭니다. 물론 이 툴이 맘에 안 드시면 이전 툴로 그냥 계산하셔도 됩니다. 이전 계산방식은 여기에서 확인하실 수 있습니다.

Posted by 야구고물상

댓글을 달아 주세요

#참고: 과거 MLBNATION에 썼던 글로 다나카글을 올린 겸 같이 올립니다.


재미로 한 번 해 본 겁니다. 저는 이 글에서의 수학적 엄밀성을 보장할 수 없습니다. 재미로 봐 주시면 감사하겠습니다.

모든 데이터는 팬그래프(fangraphs.com)에서 얻은 것입니다.

한 때 윤석민상이라는 게 유행했던 적이 있습니다. 2007년 윤석민은 162이닝을 던지면서 2완투 1완봉 3.78의 평균자책점을 기록했습니다. 기록 자체는 아주 솔리드하다고 볼 수 없었지만, 이닝을 보면 준수한 2선발급의 활약은 하였다고 볼 수 있는 성적이었죠. 하지만 윤석민의 성적에는 심각한 문제가 있었습니다. 디시전이 7승 18패였던 것이죠. 이 7승 18패라는 성적에 고무된(!) 네티즌들은 그 때부터 윤석민상이라는 걸 만들어서 시상하기 시작했습니다. 최근에는 열기가 많이 식어서 그런 상이 있는지 모르는 분들이 더 많겠지만, 그 때 한국 프로야구를 봤던 분들이라면 윤석민의 불운을 기억하고 있을 겁니다. 제가 하고 싶은 계산은 바로 그 '불운'을 계산해보는 겁니다.

한 때 정말 불운했던 윤석민. 함정이라면 이 사진은 2008시즌 평균자책점 1위한 시즌의 사진이라는 것;; 실제로 이 시즌은 14승 5패로 전혀 불운하지 않았습니다.

사실 운을 계산하는 툴은 이미 나와 있습니다. 바로 베이스볼 프로스펙터스에서 개발한 툴로 2009 시즌이 끝나고 김형준 기자가 칼럼을 통해 소개한 적이 있습니다. 하지만 저와 같이 스탯 계산에 취미를 가진 사람들에게 그 툴은 중대한 문제점이 있었습니다. 너무 어렵다는 점이었죠. 영어의 압박도 압박이지만 이해하기 위해서는 처음부터 그 많은 사례들을 일일이 체크해가면서 이해해야 하는 어려움이 있었습니다. 다른 할 일이 많은 상황에서, 그리고 알고 있는 배경 지식이 적다는 점에서 매우 힘든 일이었죠. 그래서 더 쉬운 툴을 개발하기로 결심하였습니다. 오래 전에, 아마 고등학교 입학할 즈음에. 하지만 완성본은 그로부터 3년도 더 지난 오늘에서야 만들었습니다.;;(단언컨대 게으름은 인간의 가장 큰 적입니다..)


이 툴을 개발하기에 앞서 우선 이 툴을 계산할 때 사용할 데이터에 대하여 정리할 필요성이 있습니다. 먼저 이 툴은 선발투수만을 대상으로 한정한 계산법입니다. 불펜투수는 그 이닝수 자체가 적기 때문에 불운을 판단할 근거가 미약하다고 판단하였기 때문이죠. 이 툴은 운을 계산하기 위해 투수의 승패, 혹은 디시전이라 불리는 것을 사용할 것입니다. 이유는 간단합니다. 윤석민의 불운을 판단한 근거는 '나쁘지 않은 평균자책점+7승 18패라는 최악의 디시전'이었고, 작년의 류현진도, 그리고 그 류현진을 비웃고 계시는 리선생님의 불운도 그 디시전 때문에 판단된 것이라고 생각했기 때문입니다. 그리고 사용할 계산 방법으로는 피타고리안 승률을 이용하기로 하였습니다. 우선 저는 피타고리안 승률을 사랑하며(저는 가끔 피타고리안 승률로 WAR을 계산하곤 합니다. 그 방식으로 계산하면 상위권 성적의 피처들은 fWAR과 비슷한 값이 도출되는데, 하위권 성적의 피처들은 그에  비해 더 높은 WAR이 도출되곤합니다.) 팀의 성적도 피타고리안 승률로 예측할 수 있다면 선발의 디시전도 피타고리안 승률로 예측할 수 있지 않을까라는 막연한 질문에서 시작하였죠. 그래서 저는 RS^C/(RS^C+RA^C)=WPCT라는 식을 이용하기로 하였습니다.(과연 이 식으로 신뢰할 수 있는 선형적 관계를 유도할 수 있느냐의 문제가 남았습니다만, 그 과정은 아래에 설명하겠습니다.) 앞에서 말한 피타고리안 승률식에서 RS는 선발투수의 득점지원률을, RA는 선발투수의 실점률을 의미합니다. 왜냐고요? 투수의 디시전을 생각할 것이므로 경기 자체의 득점과 실점으로 승률을 예측하는 건 어렵다고 판단했기 때문입니다.(그러면 구원이 얼마나 선발의 승리와 패배를 날려먹는지에 대한 연구가 동시에 수반되어야 하죠..그러면 PBP 데이터도 얻어야 하고 여튼 복잡합니다.;;) 그리고 ERA에 해당하는 계산은 FIP로 대체하였습니다. 말 그대로 불운을 판단하기 위해서죠.(물론 FIP도 완전한 스탯은 아닙니다만, ERA에 비해서 노이즈가 적은 스탯이라는 판단 하에 사용하였습니다. xFIP를 사용할 수도 있지만 과연 모든 투수의 홈런 허용률이 리그 평균으로 고정할 수 있는지에 대해서는 좀 회의감이 들고, 무엇보다 타구에 대한 계산이 수반되어야 하므로 FIP를 사용하기로 한 겁니다.)


이 작업을 위해 가장 중요한 과정은 RS/9와 RA/9를 이용하여 피타고리안 승률의 계산식을 얻어내는 것입니다. 저는 이 작업을 수행하기 위하여 2002~2012년 규정이닝 이상 투구한 선발투수(선발경기 한정)의 피칭 데이터를 사용하였습니다. 우선 피타고리안 승률을 계산하기 위한 C가 필요합니다. 각각 경우에 대한 C의 계산은 다음과 같습니다.


 


이를 통해 각 선수별 C값을 구할 수 있었습니다. RS/RA=1인 경우 자연로그값이 0이 나오기 때문에 이런 경우 C는 0으로 처리해야 했습니다. 이번에는 그 C값의 평균을 구할 차례입니다. 평균은 각 값에 확률밀도 P(continuous한 함수가 아니라 discrete한 밸류)를 곱한 값을 더함으로써 계산할 수 있습니다. P는 각 투수의 이닝을 투수들의 이닝을 합한 총이닝으로 나눈 값을 이용하였습니다. 평균은 두 가지를 이용하였습니다. 1. 그냥 원래 평균과 2. 절대값들의 평균. 원래는 2번에 RMS(Root Mean Square)로 하려고 했지만 계산을 계속 이상하게 해서 미봉책으로 사용한 계산입니다. 그리고 아래에 왜 그랬는지를 설명하겠지만 사용한 값은 1과 2의 평균값으로 사용하였습니다.


그렇다면 왜 1과 2의 평균을 사용하였는지 설명하겠습니다. 저는 위와 같은 방식의 계산으로 으로 1.C=2.06, 2.C=2.97의 결과를 얻었습니다. 그 C를 이용하여 기대승률을 예측한 후, x축에는 실제 승률을, y축에는 기대승률을 플로팅하여 그래프를 그려보았습니다. 이 그래프를 통해 제가 원하는 것은 '1.R^2>0.5일 정도의 신뢰도를 가진 추세선을 가질 것과 2. 그 추세선의 기울기가 1과 유사해야 할 것'입니다.
1번의 경우


http://i.imgur.com/Ly0k31f.jpg

와 같은 그래프를 얻을 수 있었습니다. R^2=0.7317로 충분한 신뢰도를 확보하였습니다.(즉, 피타고리안 승률로 예상해도 어느 정도 괜찮은 것 같다는 결론에 도달하였습니다.) 하지만 그 식이 y=0.8625x+0.0985로 기울기가 1에서 저 멀리 떨어져 있었기 때문에 문제가 생겼습니다. 
2번의 경우

http://i.imgur.com/bTxYyvi.jpg



와 같은 그래프를 얻을 수 있었습니다. 이번에도 R^2=0.7293으로 충분한 신뢰도를 확보하였습니다만, 식이 y=1.1593x-0.0388로 기울기가 1과 저 멀리 떨어져버린 문제가 생겨버렸습니다.
그래서 평균을 구해서 C=2.51을 사용하기로 하였죠.
그 결과


http://i.imgur.com/SN1waNP.jpg

만세입니다! R^2=0.731이면서도 기울기가 1에 매우 근접한 식(y=1.0184x+0,0263)을 얻을 수 있었습니다. 그래서 C=2.51로 사용하기로 결정하였습니다. 즉, WPCT=RS^2.51/(RS^2.51+RA^2.51)입니다.


다음은 IP/DEC(줄여서 IPDEC으로 표기하겠습니다.)의 관계를 살펴볼 차례입니다만..1974~2012년 50이닝 이상의 선발투구를 펼쳤던 모든 투수의 데이터를 이용하니 다음과 같은 이상한 그래프를 얻게 되었습니다;;(x축: 선발경기당 평균이닝 y축: 디시전 당 평균이닝)


http://i.imgur.com/MvP3hbO.jpg

FAIL입니다.ㅠㅠ R^2이 무려 0.0766의 대단한 그래프를 얻어낼 수 있었죠ㅠㅠ. 이는 규정이닝 이상 선발투구로 조건을 바꿔도 마찬가지였습니다. 그래서 IPDEC은 그냥 그 해 리그평균을 일괄적으로 적용하기로 결정하였습니다.
결과적으로 식은 다음과 같아졌습니다.(sta: 선발의 약자 rel: 구원의 약자)

 


마지막으로 우리가 원했던 운(LUCK으로 표기하도록 합시다.)은 다음과 같이 계산됩니다.



이제 식을 완성했습니다. 그 식의 적용만 남았군요. 적용은 간단합니다. 2010~2012년간 어떤 투수가 운이 좋았고, 어떤 투수가 운이 나빳는지를 LUCK으로 판별하는 작업을 하기로 한 거죠. 그 결과는 다음과 같았습니다.(규정이닝 이상 선발투구 투수 순위,*는 그 시즌 사이영상 수상자)

 

2010 AL LUCK 상위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

 Trever Cahil

2.97

4.19

18 

8

11.6

12.2

+10.6

 2

Earvin Santana

3.92

4.28

17

10

12.5

14.4

+8.8

 3

Phil Hughes

4.23

4.30 

17

8

10.7

10.4

+8.7


2010 AL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

 Zack Greinke 

 4.17

3.34

10 

14

17.2 

9.8

-11.9

 2

Cliff Lee

 3.18

2.58

12

9

19.8

5.8

-11.0

 3

Doug Fister 

 4.11

3.65 

6

14 

11.5

9.1 

-10.4

 *

Felix Hernandez

2.27

3.04

13

12

19.8

10.5

-8.5


2010 NL LUCK 상위 TOP3 

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Bronson Arroyo

3.88

4.61

18 

10

11.1 

14.7 

+10.6

 2

Tim Hudson

2.83

4.09

17

9

13.4

13.9

+8.4

 3

 Jon Garland 

3.47

4.41 

14

12 

9.4

14.4

+7.0 

Roy Halladay 

2.44 

3.01 

21 

10 

20.2 

9.7 

+0.5 


2010 NL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

 Randy Wells

 4.26

3.93

14

12.5

10.7

-7.7

 2

Josh Johnson

 2.30

2.41

11

6

17.3

4.6

-7.7

 3

Tommy Hanson

3.33

3.31 

10

11 

15.1

9.1 

-7.1

 

2011 AL LUCK 상위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

 Ivan Nova

 3.66

4.01

16 

3

10.6

8.9

+11.3

 2

Derek Holland

 3.95

3.94

16

5

13.6

10.0

+7.4

 3*

Justin Verlander

2.40

2.99 

24

21.0

8.9 

+6.9


2011 AL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Doug Fister

 2.87

3.03

10 

13

17.2

8.2

-12.0

 2

Jeff Francis

4.82

4.10

6

16

11.4

10.4

-11.0

 3

Brandon McCarthy

3.32

2.86 

9

14.3

6.0 

-8.3


2011 NL LUCK 상위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

 Aaron Harang

3.64

4.17

14 

7

8.2

11.7

+10.5

 2

Ian Kennedy

2.88

3.22

21

4

16.7

9.1

+9.4

 3

Bronson Arroyo

5.07

5.71 

9

12

6.7

16.4 

+6.7

 *

Clayton Kershaw

2.28

2.47

21

5

18.8

7.2

+3.4


2011 NL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Derek Lowe

5.05

3.70

17

11.6

10.2

-9.4

 2

Madison Bumgarner

3.21

2.67

13

13

16.5

7.3

-9.2

 3

Matt Latos

3.47

3.16 

9

14 

13.1

9.5 

-8.7

 

2012 AL LUCK 상위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Jered Weaver

2.81

3.75

20

5

13.3

10.3

+12.1

 2

Jason Vargas

3.85

4.69

14

11

11.0

16.2

+8.2

 3

Derek Holland

4.72

4.75 

12

10.2

11.3

+7.1

4 *

David Price

2.56

3.05

20

5

17.7

8.7

+6.0


2012 AL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Jon Lester

4.82

4.11

9

14

14.4

11.3

-8.1

 2

Felix Hernandez

3.37

3.73

11

12

16.5

10.8

-6.7

 3

Jake Peavy

3.37

3.73 

11

12 

16.5

10.8 

-6.7


2012 NL LUCK 상위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Barry Zito

4.15

4.47

15

8

8.9

13.5

+11.6

 2

Kyle Lohse

2.86

3.51

16

3

14.5

11.1

+9.6

 3

Lance Lynn

3.67

3.47 

17

11.8

8.7 

+8.9

5*

R.A. Dickey

2.67

3.22

20

6

17.2

11.0

+7.8


2012 NL LUCK 하위 TOP3

Rank 

 Name

 ERA

 FIP

 W

 L

 ExW

 ExL

 LUCK

 1

Josh Johnson

3.81

3.40

8

14

14.0

9.2

-10.9

 2

Cliff Lee

3.16

3.13

6

9

16.6

9.0

-10.7

 3

Jeff Samardzija

3.94

3.55 

9

13

12.6

8.6 

-8.1



아...아니..내가 2012시즌 최고의 불운남이 아니라니..(by 클리프 리)

결과를 대략적으로 살펴보면 의외의 선수들도 가끔 포함되어 있고(예를 들어 2010년 헛슨이나 2011년 데릭 로) 우리가 너무나도 당연히 알고 있던 선수들도 포함되어 있습니다.(클리프 리, 킹 펠릭스 등등) 특히 킹의 경우 LUCK이 최근 3년간 -8.5(2010 AL 하위 6위), -7.5(2011 AL 하위 4위), -7.6(2012 AL 하위 2위)의 극심한 불운에 시달리는 중입니다. 클리프 리도 2번이나 하위 3위 안쪽에 이름을 올렸고요. 그리고 2012년의 지토는....역시 법력 대마왕이었습니다.(지그니토!) 그리고 사이영상 수상선수들은 대체적으로 +를 기록하였군요.(킹 지못미ㅠ)

마지막으로 이 툴의 단점들을 소개해야겠습니다.

1. 아직 커리어를 대상으로 적용해본 사례가 없기 때문에 커리어의 경우 운의 요소가 많이 줄어드는지를 확인해본 적이 없다.
2. RS,RA가 독립변수로써 투수의 디시전 결과 예측에서도 통계적 유의미성을 지녔는지에 대한 증명이 생략되어 그 근거가 미약하다.
3. 실제 전체 선발투수의 승률은 0.500보다 약간 낮게 나타나지만 이 툴을 이용하면 0.500 부근으로 형성될 것이다.
4. 1999년 페드로 마르티네즈와 같이 엄청난 FIP를 기록한 경우 페드로가 나온 경기에서 팀이 이길 수 있다고 계산되는 승수보다 페드로가 기록할 것이라고 생각되는 기대승수가 더 크게 나오는 문제점을 가지고 있다.(이는 후에 다시 한 번 생각해볼 문제입니다.)


+덧붙여서

이 글은 순전히 재미를 위한 글입니다. 잘 아시겠지만 이 툴로는 절대로 투수를 평가할 수 없음을 잘 아실 겁니다.(즉, 참고용으로도 의미는 그리 크지 않다는 뜻입니다. 뭐, 윤석민상처럼 MLB에 블라일레븐상 같은 걸 만들어서 수여할 게 아니라면 말이죠...) 만약 이 툴을 계산하실 때 FIP를 이용하는 게 싫으시다면 FIP를 사용하는 부분에서 ERA, SIERA, xFIP등등의 스탯들을 이용하셔도 됩니다.


Posted by 야구고물상

댓글을 달아 주세요

MLBNATION회원들이라면 아시겠지만, 예전에 제가 쓴 글에 '간단히 해보는 선발투수 운(Luck)의 계량'이라는 글이 있었습니다. 이 포스팅은 그 분들, 그리고 그 외에도 윤석민 어워드에 관심이 많으신 분들을 위한 많은 야구팬을 위한 것으로, 제가 지금까지 독점해왔던(흠...허접하기 때문에 별 의미는 없긴 하지만서도ㅎㅎ) LUCK 지수 계산을 위한 엑셀 파일을 공유하기 위한 포스팅입니다. 아래 엑셀파일 링크를 참조하시길 바랍니다.

LUCK_공유용.xlsx


우선 간단히 어떤 식으로 사용하면 되는지 설명해드리겠습니다. 우선 위의 파일은 2013년 LUCK지수 계산을 위해 사용한 파일의 재활용(;;)입니다. 뭐 AL과 NL에 특별히 할 언급은 없고요 IP_FAN이라는 항목은 팬그래프 기록을 사용한 흔적이라고 보시면 됩니다.(팬그래프는 이닝항목이 0.1씩 나와서 엑셀로 계산하면 ERA와 FIP에 오차가 생기게 되죠.) 그리고 League 항목은 간단히 필요한 리그에 대한 기초적인 자료(다만 필요없는 것도 있기는 합니다만 저것도 팬그래프 걸 그대로 사용하다보니 그렇게 됐습니다. 그리고 맨 위의 FIP의 경우 FIPC입니다.)를 위한 시트고요, BPF는 2013년 득점 파크팩터에 대한 시트입니다. 지금까지 저는 모든 자료를 팬그래프 것을 중심으로 하였기 때문에 모든 자료는 팬그래프의 정렬방식을 따랐습니다만, 계산하실 때 너무 불필요한 것이 많다고 생각되시면 필요한 것만 취하시면 됩니다. 그리고 FIP 기반이 아니라 ERA 기반으로 계산을 진행하고 싶으시다면  ExRA의 수식에서 Z열에 해당하는 부분을 E열로 바꾸시면 됩니다. 물론 RS도 리그 RS가 아니라 리그 FIP_RS로 사용하고 싶으시다면' League!$P$()/League!$G$()'(괄호 안은 번호)에 해당하는 부분을 ;League!$Y$()*League!$P$()/League!$Q$()'로 하시면 됩니다.

그럼 이상으로 LUCK 엑셀자료 공유에 대한 설명을 마치겠습니다. 궁금하신 것이 있다면 아래에 댓글에 문의해주세요. 감사합니다.

Posted by 야구고물상

댓글을 달아 주세요

  1. Bench Wannabe 2013.09.30 20:28 신고  댓글주소  수정/삭제  댓글쓰기

    수능 끝나고 역대로 해서 노트북 한 번 터뜨려 볼까 합니다