모든 기록은 STATIZ에서 얻었습니다.


어제 KBO 올스타전이 열렸습니다.



KBO리그 전반기가 끝나고 올스타 주간입니다. 전반기가 끝났으니 전반기 결산을 한 번 해 봐야겠죠. 보통 결산은 팀의 성적을 중심으로 팀이 좋았던 점과 나빴던 점을 제시하면서 글을 진행할 겁니다. 제가 하고 싶은 건 좀 다릅니다. 역시나, 숫자를 보여주는 게 전 좋아요. 그래서 준비했습니다. 조금 이른 감이 있지만, 원래 섣부른 판단이 재밌는 법입니다.(... 흑역사 창조!!) 전반기가 끝난 시점에서 KBO 각 팀들이 포스트시즌에 올라갈 확률을 계산해 봅시다.

 

우리의 목표?

 

다시 한 번 되새겨봅시다. 우리가 원하는 것은 KBO 각 팀들이 포스트시즌에 올라갈 확률을 계산하고 결과를 얻는 것입니다. 우리 모두가 알듯이 KBO리그는 한 시즌에 네 번 시리즈를 진행합니다. 4위와 5위는 와일드카드를, 3위는 준플레이오프를, 2위는 플레이오프, 그리고 1위는 한국시리즈에 직행하게 되죠. 제 목표는 현 시점에서 예상되는 각각 시리즈 직행 확률을 계산해 보는 겁니다. 계산 결과는 각각 1) 포스트시즌 진출 확률, 2) 준플레이오프 직행 이상 확률, 3) 플레이오프 직행 이상 확률, 4) 한국시리즈 직행 확률로 나눠 보여드리기로 계획했습니다.

 

계산 방법

 

사실 이 글은 제가 예전에 썼던 글과 꽤 비슷합니다. 다른 점이라면 이 글을 썼을 때는 4위 예상 확률이라는 좀 더 좁은 목표가 있었을 뿐이죠. 하지만 그 때 쓴 은 계산에서 좀 실수가 있었습니다. 각 확률을 더한 값이 1이 안 됐었죠. 그래서 이번에는 방법을 조금 바꿨습니다. 아주 조금요...

 

Log5 시스템

 

우선 Log5 확률을 계산합니다. 리그 평균승률은 역시 0.500입니다. 전에는 A라는 팀이 0.600 승률을 기록했으면 0.500인 팀을 상대로 한 것으로 계산하였습니다. 하지만, 리그에 0.600인 팀이 있으면 필연적으로 나머지 상대팀 승률 평균은 0.500이 안 됩니다. 그러니, Log5로 계산되는 Talent0.5할이 아닌 나머지 팀들의 승률 평균에 해당하는 팀과 대결한 경우를 가정하고 계산하는 것이 좀 더 옳은 방향으로 보입니다. 그러니 팀의 Talent는 나머지 팀 승률을 통해 역으로 계산하기로 합시다.

 

예를 들어서 보여드리겠습니다. 승률이 0.500인 팀을 상대로 했을 때의 Log5 계산은 이 글을 참조해 주세요. 4팀이 한 리그를 이룬다고 가정합시다. A라는 팀은 0.600을 기록한다고 가정한다면, 나머지 C,D,E 팀 평균 승률은 모든 팀이 같은 경기를 소화하고 무승부가 없다고 가정할 때 1.4/3=0.467이 됩니다. 그렇다면 A팀에서 계산되는 상대팀 Talent0.5*0.467/(1-0.467)=0.438이 됩니다. 그러면 A팀의 Talent0.438*0.6/0.4=0.656이 되는 겁니다. 만약 팀들이 늘어난다면, 0.600인 팀이 가지는 Talent는 더 높아지게 되고, 상대팀은 거의 0.500에 가까워지게 되겠죠.


승률 보정과 기대승률 계산

 

이제 보정이 필요합니다. 전반기에 각 팀들이 상대로 경기 한 횟수는 일률적이지 않습니다. 예를 들어 두산은 NC12경기를 했지만 LG와는 5경기만 했습니다. 진행한 경기가 균일하지 않았다는 겁니다. 그러니 계산이 조금 달라지겠죠. 그래서 상대팀 승률을 각 팀별 경기수*각 팀별 승률을 더한 값에 진행경기로 나눠서 계산하기로 했습니다. 이 때, 앞으로 각 팀들이 기록할 승률은 피타고리안 승률을 따를 것이라고 가정하여 피타고리안 승률을 이용하기로 하였습니다.[각주:1] 이제 각 팀의 Talent 값을 계산할 수 있습니다.

 

Talent를 계산했으니 팀별 상대승률을 계산할 수 있게 되겠죠. 간단히 A팀의 Talenta, B팀의 그것을 b로 한다면 Pa=a/(a+b)로 계산할 수 있습니다. 그러면 이 값을 토대로 남은 경기에서 계산되는 기대승수를 계산할 수 있습니다. 남은 경기에서 기대되는 승률은 다음과 같이 계산되었습니다.

 

승률의 분포

 

기대승률을 계산하긴 했지만 아직 결과를 얻기는 이릅니다. 왜냐하면 앞으로 기대되는 승률은 일정한 분포를 따를 것이기 때문입니다. 그러니 기대승률을 이용해 기대승률의 분포를 계산할 필요성이 생기게 되죠.

 

분포는 간단하게 계산할 수 있습니다. 만약 기대승률이 0.600이고 앞으로 남은 경기가 60경기라면, 30경기를 이길 확률은



이 되겠죠. 40경기를 이길 확률은 



이 되고요. 이렇게 각 팀마다 승률의 분포를 계산할 수 있습니다. 아래 그래프는 그렇게 계산해서 얻은 승률의 분포를 보여주는 그래프입니다.


승률 분포


 

순위 계산

 

이제 단순 노동의 시간입니다. 이제 우리는 앞으로 기대되는 승률의 분포를 얻어냈기 때문에 기대순위를 계산할 수 있겠죠. 여기에서 필요한 건 두 가지입니다. 다른 팀들이 해당 승률을 넘기지 못할 확률과 넘길 확률이 필요한 겁니다. 예를 들자면 아래의 표와 같은 것이 필요합니다.


각 해당승률당 각 팀들이 해당승률을 넘을 수 없는 확률 관련 표


 

이제 모든 순위에 대하여 확률을 계산합니다. 1위를 할 확률은 모든 팀이 해당승률보다 낮은 경우를 의미합니다. 10위를 할 확률은 모든 팀들이 해당 승률보다 높은 경우를 의미합니다. 1위와 10위의 확률을 계산할 때는 경우의 수가 1이기 때문에 해당승률을 기록할 확률과 각 팀들이 기록할 해당 확률을 다 곱한 후 더하면 전체 확률을 구할 수 있습니다. 2위를 할 경우의 수는 9가지 경우의 수가 생깁니다. 3위를 할 경우의 수는 36가지가, 4위는 84가지, 5위는 126가지가 필요합니다. 이렇게 2~9위를 할 경우는 각 순위를 할 경우에 해당하는 확률을 다 더함으로써 해당 순위를 할 확률을 최종적으로 구할 수 있습니다.

 

계산결과


계산을 했으니 결과가 나오겠죠. 이번에는 제대로 계산을 했는지 각 팀들이 1위부터 10위까지 할 확률을 더하면 1이 나오고 각 순위마다 각 팀들의 확률 합 또한 1이 나왔습니다. 다행입니다.,,,

 

포스트시즌 진출 확률

 

먼저 아래 표는 각 팀들이 포스트시즌에 진출할 확률입니다.



 

준플레이오프 직행 이상 확률

 

이번 표는 각 팀들이 준플레이오프 직행 이상을 할 확률입니다. , 3위거나 3위보다 더 좋은 순위를 기록할 확률을 뜻합니다.



 

플레이오프 직행 이상 확률

 

이번 표는 각 팀들이 플레이오프 직행 이상을 할 확률입니다. , 2위거나 2위보다 더 좋은 순위를 기록할 확률을 뜻합니다.



 

한국시리즈 직행 확률

 

이번 표는 각 팀들이 한국시리즈에 직행할 확률입니다.



 

역시 좋은 전반기를 보낸 두산과 NC가 눈에 띄는 결과입니다. 넥센 또한 굉장히 눈에 띄네요.

 

결론

 

결과적으로, 역시나 순위가 높은 팀들일수록 포스트시즌에 올라갈 확률은 주로 높습니다. KIA 같은 경우는 좋은 득실차를 기록하고 있기 때문에 현재 순위보다 좋은 결과가 기대됩니다. 물론 그렇게 되지 않을 가능성도 무시할 수는 없습니다. 덧붙여 위 결과는 숫자적 예측이기 때문에 절대적이지 않다는 것 또한 다 아실 것이라 믿습니다. 또한 계산할 때 몇 가지 가정이 부정확할 수 있기 때문에 플레이오프에 갈 확률들은 명확한 값으로 이해하기보다는 어떤 특정한 범위를 중심으로 이해하는 것이 훨씬 더 좋은 해석법이라고 할 수 있습니다.

 

이제 대략 60% 정도 일정이 소화했습니다. 그 말인즉슨, 아직도 많은 경기가 남아있다는 뜻이죠. 10팀 모두 남은 일정 부상 없이 열심히 소화해 최선의 결과를 얻어낼 수 있으면 좋겠습니다.

 

 

  1. c=(RS/G+RA/G)^0.287, W%=RS^C/(RS^c+RA^c) [본문으로]
Posted by 야구고물상

댓글을 달아 주세요