상세 컨텐츠

본문 제목

간단한 타자들의 선구안 비교

야구-칼럼/SaberMetrics

by 야구고물상 2014. 8. 28. 00:37

본문

반응형


2013시즌 공포의 출루 듀오.. 안타깝게도 이번 시즌은 둘다 부진하네요,



오랜만에 돌아왔습니다. (3개월 이상 들어오지 않았다고 휴면계정이었다네요.ㅋㅋ) 하하;;근데 하필 돌아오니까 정말 필요 없는 거 하나 만드네요...

 

이 포스팅에서 다룰 것은 제가 만든 APD, Adjusted Plate Discipline으로 조정된 선구안이라는 개념으로 만든 겁니다. (근데 사실 선구안을 보고 싶으면 팬그래프에서 Plate Discipline란을 보는 게 나을 겁니다..)

 

1. 개념

 

말 그대로 Plate Discipline의 조정으로 한국말로 하자면 조정 선구안(...)쯤 되는 개념으로 만들었습니다. 저는 선구안을 주로 보고 싶기 때문에 고의4구를 제외한 4구를 취급할 것입니다. 그리고 사구의 경우 선구안이라기보다는 타석에서의 approach와 관련된 것이라고 생각하여 사구를 제외한 타석에 대하여 LIBB%를 구한 후 이것을 투수 이외의 선수들 평균에 대하여 계산할 것입니다. 이 때 타격이 좋은 선수들은 원래 선구안이 좋은 것도 있겠지만 타격이 좋기 때문에 투수들이 선수들을 피할 것이기 때문에 이에 대하여도 조정을 가할 것입니다.

 

2. 타격 조정

 

타격에 대하여 조정을 가하는 이유는 배리 본즈와 같이 홈런을 칠 수 있는 슈퍼스타들을 상대하는 투수들은 최대한 홈런을 맞지 않기 위해 피하는 방식의 피칭을 하여 많은 고의4, 혹은 그에 준하는 4구를 기록할 것이지만 에디 요스트(통산 0.254/0.394/0.371, 1614볼넷으로 별명이 Walking Man이었음) 같은 타자들은 투수들이 최대한 출루를 시키지 않기 위한 피칭을 할 것이므로 4구가 파워히터에 비해 적을 것이기 때문입니다. 즉 순수한 능력의 선구안 이상의 볼넷 기록을 배리 본즈 같은 유형의 타자들은 얻을 것이고, 그에 비해 에디 요스트 유형의 타자들은 그와는 반대의 상황에 직면할 것이므로 타격에 대하여 조정을 해야 한다는 것이 저의 생각입니다.

 

-약간의 연구(?)

다음과 같은 스탯들에 대하여 LIBB%와의 상관관계를 조사할 것입니다. 이 때 타자마다 선구능력이 다르기 때문에 약한 상관관계를 찾을 것입니다. (r=0.3~0.5,R^2=0.09~0.25) 아래는 제가 조사한 스탯들에 대한 목록입니다. 모든 리그 스탯은 투수들을 제외한 스탯이며, 조사할 때는 AL, NL을 분리하여 계산하였습니다. 샘플은 AL에서 지명타자 제도를 도입한 1973시즌부터 40시즌간의(1973~2012) 정규타석을 채운 선수들에 대하여 모았습니다.

 

LIBB%: (4-고의4)/(타석-고의4-사구)

BA+: 타율/리그 타율

SLG+: 장타율/리그 장타율

ISOP+: 순수장타율/리그 순수장타율

ISOPHR+: 홈런에 대한 경우를 제외한 순수장타율/리그 순수장타율(홈런 제외)

AXBH%+: (순수장타율/장타율)/(리그 순수장타율/리그 장타율)

HR%+: (홈런/타수)/(리그 홈런/리그 타수)

LIBB%+: LIBB%/리그 LIBB%

 

저는 위의 스탯들에서 BA+,SLG+,ISOP+,ISOPHR+,AXBH%+,HR%+에 대해 LIBB%가 가지는 상관관계를 엑셀의 추세선 툴을 통해 알아냈고 그로 인해 ISOP+,HR%+LIBB%에 대해 약한 상관관계를(각각 r^2=0.0927,0.1043) 가짐을 알 수 있었습니다. 하지만 저는 타격조정을 할 때 ISOP+에 대하여는 조정하지 않기로 하였습니다. 왜냐 하면, ISOP의 경우 HR이 같이 계산되는 스탯이며 만약 ISOP에서 HR을 제외하여 LIBB%와의 상관관계를 조사할 경우(ISOPHR+) r^2=0.0004로 사실상 없다는 결론이 나기 때문입니다. 그러니까 사실상 HR의 비율이 LIBB%와의 약한 상관관계를 가지며, 그러므로 HR%에 대하여 4구비율의 조정을 가하기로 하였습니다. 아래는 이와 관련된 엑셀 파일입니다.


APD.xlsx

 

다음에는 각각의 HR%+에 대하여 평균 LIBB%+를 계산하고 그 그래프의 추세선을 통해 타격조정식을 만드는 것을 조사할 것입니다. 이 때 HR%+의 경우 round함수를 이용하여(안 그러면 0.01차이로 끊어서 그래프를 만들기가 제 실력으로는 힘들기 때문입니다..;;) 그에 대응하는 타자들의 LIBB%+의 평균을 계산하고 그걸로 그래프를 그린 후 추세선을 찾아서 타격조정식을 만들 것입니다.

 

그 결과 타자의 ExLIBB%+로 계산하는 것으로 하였습니다.

이 때 앞의 상수를 

으로 한 이유는 HR%+가 1인 경우 ExLIBB%+도 1이 되어야 하기 때문입니다.

 

3. 계산식

 

ExLIBB%+:

APD: LIBB%+/ExLIBB%+

이 때 리그는 AL, NL을 따로 계산하는 것으로 하였습니다. 또한 HR%+를 계산하는 경우 홈런 파크펙터를 사용하여 계산하는 것으로 합니다.

 

4. 적용

 

우선 아주 가볍게 AL, NL 구별하지 않고 계산하여 APD의 분포 그래프를 그려 보았습니다. 예상대로 평균적인 정규분포곡선을 따르는 것으로 보입니다.



 

다음으로 최근 5년간 리그 1위 리스트입니다.


 Season

 AL

NL 

 2009

Chone Figgins 

185 

Nick Johnson 

211 

 2010

Daric Barton 

207 

Jason Heyward 

172 

 2011

Bobby Abreu 

177 

Carlos Pena 

172 

 2012

Carlos Santana 

185 

Dan Uggla 

180 

 2013

Carlos Santana 

170 

Joey Votto 

209 

 

참고로 2013시즌 추신수는 204를 기록하였습니다. (리그 2위) 작년 추신수, 보토가 정말 엄청나게 볼을 골랐음을 이 허접한 스탯으로도 알 수 있습니다.


다음은 2014시즌 기록 엑셀 파일입니다. 스탯은 한국시간으로 2014826일 기준입니다.

 

2014 APD.xlsx


다음은 몇몇의 전·현역 선수들의 기록입니다. 참고로 조 모건/마이크 슈미트/리키 헨더슨/배리 본즈/블라디미르 게레로/스즈키 이치로/알버트 푸홀스/추신수/조이 보토에 대하여 계산하였습니다. (사실 에디 요스트, 베이브 루스, 테드 윌리엄스에 대해서도 계산해보고 싶었습니다만 각각 IBB가 기록되지 않는 시즌이 있었기 때문에 계산을 하지 않았습니다.) 계산 결과 각각 통산 197/135/195/145/60/57/95/145/155로 계산되었습니다. 현역 선수의 경우 위와 같은 시간 기준가지 스탯을 계산하였습니다. (참고로 홈런 파크펙터는 팬그래프에서 1974시즌부터 참고되므로 조 모건과 마이크 슈미트의 초기 스탯의 경우 휴스턴의 홈런 파크펙터는 85, 필라델피아는 105로 고정하여 계산하였습니다.) 예상 외로 푸홀스가 100이 안 되었으며 추신수와 배리 본즈가 비슷한 수준의 선구안을 가진 것으로 계산되는 군요;; 그리고 조 모건과 리키 헨더슨은 정말 엄청난 수준의 선구능력을 보여준 것으로 계산되네요.


Batters.xlsx

 

다음으로 KBO에 적용할 경우입니다. 파크펙터는 적용하지 않았습니다. 각각 시즌 출루율 1위 선수들과 이외 제가 관심이 가던 선수들을 위주로 계산하였습니다. 물론 MLB 기준으로 만든 툴로 KBO에 정확히 똑같이 적용하기는 힘들기는 하지만 한 번 해 볼만하다고 생각했기에 적용해 보았습니다. 그리고 2006시즌 100볼넷을 넘긴 양준혁은 대단하군요..(195)

 

KBO 타자들(2004~2013).xlsx


위의 계산들을 보면 정규타석을 기록한 선수들 중 약 120정도의 APD를 기록하는 경우 수준급의 선구안을 가진 것으로 생각할 수 있다고 생각할 수 있겠고(대략적으로 한 팀당 1~1.5명 정도 수준입니다.), 160 이상이면 대략적으로 시즌 1위급 정도로 생각됩니다.

 

5. 끝마치며


이상으로 이 허접한 선구 능력 스탯 글을 끝마치도록 하겠습니다. 한 가지 아쉬운 점은 위의 파일에서 확인할 수 있듯이 푸홀스나 배리 본즈 같은 경우를 보면 이 툴이 강타자들에 한해서는 APD가 실제보다 낮게 측정될 가능성도 있다고 생각된다는 점입니다. 다만 제 생각에는 exponential 식을 쓰는 게 맞다고 생각되므로(...) 저의 직관이 틀렸을 수도 있다는 생각이 듭니다.

 

 

 

MLB 스탯은 Fangraphs를 참고하였고 KBO 스탯은 Baseball-Reference한국야구위원회에서 참고하였습니다.

반응형

관련글 더보기

댓글 영역