상세 컨텐츠

본문 제목

이 주의 Hot&Cold 소개

이 주의 Hot&Cold

by 야구고물상 2022. 5. 3. 23:00

본문

반응형

좀 재밌을 수도 있는 상상을 했습니다. 제가 PSodds 사이트를 통해 매일매일의 포스트시즌 진출 확률을 서비스하고 있는데, 이를 통해 어떤 플레이가 이 주에 가장 포스트시즌 진출 확률을 올렸는지 생각해 볼 수 있지 않을까 하는 겁니다. 각 경기마다 승리 확률 기여는 WPA로 얻을 수 있으니 PS oddsWPA를 잘 조합하면 재밌겠다는 생각이 들었습니다. WPA는 STATIZ에서 얻을 수 있을 거고요. 가끔 스포츠 채널이나 지상파 스포츠 뉴스에서 하이라이트 필름을 보여주지 않습니까? 이걸 시즌 단위에서, 어떤 상황이 팀의 포스트시즌 진출 확률을 가장 올렸는지 계산해 볼 수 있지 않을까 하는 상상을 한 겁니다.

하지만 위 상상을 현재 완벽히 재현할 수 없는 제약 조건이 있습니다. 제 계획을 실현시키기 위해서는 모든 시간대에 대해 플레이 로그가 다 필요합니다. 정확히 말하자면 매일 하는 다섯 경기의 모든 플레이 로그에 대한 순서를 알아야 할 필요가 있다는 겁니다. 그렇다면 그 당시의 승리 확률에 따라 각 팀별 기대 승률을 구하고 그걸 일일이 반영하면서 그 플레이가 얼마나 포스트시즌 진출 확률을 올리는지 계산할 수 있기 때문입니다. 이게 정석입니다. 문제는 아직 그런 데이터를 제공하지 않는다는 문제죠. 그렇기 때문에 저는 좀 우회해서 비슷하게 '흉내' 내 보려고 합니다.

경기를 하기 전 기대 승률은 0.500일 겁니다. (WPA 계산할 때 그렇게 합니다.) 그러면 한 경기를 해서 올리거나 내리는 팀 전체 WPA0.500이 될 겁니다. 그리고 한 경기 당 평균 타석은 대략 80타석이 좀 안 되니 한 팀 당 40타석 정도가 기대됩니다. 그렇다면 이긴 팀은 한 타석 당 평균 0.0125WPA를 기대할 수 있고, 진다면 -0.0125를 기대할 수 있을 겁니다. 그리고 포스트시즌을 진출하는 팀은 평균적으로 1 경기 당 0.5/144씩 진출 확률을 올리고, 진출 못 하는 팀은 그만큼을 떨어뜨릴 것입니다. 저는 이를 이용해서 정규화 시키기로 했습니다. 그러니까, 한 플레이의 평균을 0.0125 * 0.5/144 = 1/20340으로 계산하기로 한 것입니다. 그렇다면 어떤 식으로 정규화를 시키려 하느냐고 물으실 겁니다. 저는 엄청 간단하게 계산하기로 했습니다. 그 플레이의 WPA와 팀이 이 경기를 통해 올리거나 내린 PS Odds를 곱한 값을 위에서 계산한 20340을 곱함으로 계산하기로 한 것이죠. 그리고 이를 ‘뜨거움 척도’ 로 정의하도록 했습니다. (, 영어로는 Hotness Scale이라고나 할까요?) 예를 들어 보겠습니다.

홈팀 A팀의 B 선수는 1회 말 첫 타석에 들어서 WPA 0.05를 획득했다고 합시다. 경기가 끝난 후, 전 경기 포스트시즌 진출 확률이 52.3%였던 A 팀은 경기를 승리해 포스트시즌 진출 확률이 53.6%가 되었다면 다음과 같이 뜨거움 척도를 계산할 수 있습니다.

$0.05 \times \left|0.536-0.523\right| \times 23040 = 14.976$

만약 A 팀의 C 선수가 6말 초 타석에서 WPA 0.27을 기록했다면, 다음과 같이 계산되겠죠.

$0.27 \times \left|0.536-0.523\right| \times 23040 = 80.874$

그리고 A팀의 상대팀(이자 원정팀) DE 선수가 5회 초 타석에서 아웃되면서 WPA -0.03을 했다고 가정해 봅시다. 뜨거움 척도는 다음과 같을 겁니다.

$0.03 \times (\left|0.536-0.523\right|) \times 23040 = 5.5296$

그런데 제가 왜 위에서 홈팀과 원정팀을 구분해서 이야기 했을까요? 거기에다 D팀의 E 선수는 기대승률을 떨어뜨렸음에도 불구하고 뜨거움 정도를 양수로 계산하는 걸까요? 저는 그 경기를 달아오르는 플레이를 홈 팀이 크게 이기게 해 줄 확률이라고 정의하기로 했습니다. 홈경기에 그 팀 팬들이 많이 들어올 거니까요. 그래서 만약 홈팀의 포스트시즌 진출 확률이 올라갈 플레이라면 그게 뜨거운 플레이고, 아니라면 차가운 플레이로 정의하기로 한 겁니다. 그렇기에 그 플레이가 뜨겁냐, 차갑냐는 홈팀을 기준으로 정의 내립니다. 만약 홈 팀의 포스트시즌 진출 확률을 높였다면 그게 바로 뜨거운 플레이고 반대면 그게 바로 차가운 플레이입니다.

저는 이를 누적 개념으로 생각하지 않기로 했습니다. 하라면 정의할 수는 있는데, 진짜 공허한 정의로 끝날 겁니다. 왜냐 하면, 제가 위에서 내린 계산 식이 실제 그 팀이 포스트시즌 진출 확률을 얼마나 올렸는지에 대한 정확한 계산이 아니기 때문입니다. 그 때문에 누적 개념을 정의하면 할 수록 실제로 얻어내야 할 계산 값에서 멀어질 확률이 큽니다. 만약 모든 플레이들의 순서를 알 수 있다면 누적 개념처럼 만들어서 진짜 그럴싸한 값을 얻을 수 있겠지만 지금은 그렇지 않습니다. 그렇기 때문에 매 주의 가장 뜨거운/가장 차가운 플레이들을 다섯 개 씩만 보여주려고 하는 겁니다.

그러면 시작하겠습니다. 이 주의 가장 뜨겁고, 그리고 차가운 플레이들, 이 주의 Hot&Cold!

 

PS. 이 시리즈에서 KBO 클립까지 사용할 수 있다면 더할 수 없이 좋겠지만 그럴 수 없을 겁니다. 어찌 됐든 현재 adsense를 사용하는 중인데, KBO 클립을 이용할 수는 없겠지요. 아쉽지만, 클립은 이 블로그를 보시는 여러분들이 직접 찾아봐 주셔야 합니다. 카카오나 네이버를 사용해 주시기 바랍니다. 죄송합니다.

반응형

댓글 영역