2017, 28
(6)
,1501–1509
2016 KBO 최고 타자의 타격능력선수는?
-대체선수대비승수 (WAR)을 중심으로
기
ᆷ현규
1
·이제영2
·조규태3
12영남대학교 통계학과 · 3영남대학교 건설시스템공학과
ᄌ ᅥ
ᆸᄉ ᅮ 2017ᄂ ᅧ ᆫ 9ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 1ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 14ᄋ ᅵ ᆯ
요 약
ᄋ
ᅣᄀ ᅮᄉ ᅥ ᆫᄉ ᅮᄃ ᅳ ᆯ ᄋ ᅴ ᄂ ᅳ ᆼᄅ ᅧ ᆨᄋ ᅳ ᆯ ᄎ ᅳ ᆨᄌ ᅥ ᆼᄒ ᅡᄂ ᅳ ᆫ ᄆ ᅡ ᆭᄋ ᅳ ᆫ ᄉ ᅦᄋ ᅵᄇ ᅥᄆ ᅦᄐ ᅳᄅ ᅵ ᆨᄉ ᅳ ᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼᄃ ᅳ ᆯ ᄌ ᅮ ᆼ ᄋ ᅦᄉ ᅥ ᄃ ᅢᄎ ᅦᄉ ᅥ ᆫᄉ ᅮᄃ ᅢᄇ ᅵᄉ ᅳ ᆼ ᄉ ᅮ (WAR)ᄋ ᅳ ᆫ ᄀ ᅡ ᄌ
ᅡ ᆼ ᄆ ᅡ ᆭᄋ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄂ ᅳ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼᄋ ᅵᄃ ᅡ. WARᄋ ᅴ ᄌ ᅡ ᆼᄌ ᅥ ᆷᄋ ᅳ ᆫ ᄐ ᅮᄉ ᅮᄋ ᅪ ᄐ ᅡᄌ ᅡᄎ ᅥᄅ ᅥ ᆷ ᄉ ᅥᄅ ᅩ ᄃ ᅡᄅ ᅳ ᆫ ᄑ ᅩᄌ ᅵᄉ ᅧ ᆫᄋ ᅵ ᆷᄋ ᅦᄃ ᅩ ᄇ ᅮ ᆯ ᄀ ᅮᄒ ᅡᄀ ᅩ ᄉ ᅥ ᆫ ᄉ
ᅮᄃ ᅳ ᆯ ᄋ ᅴ WARᄋ ᅳ ᆯ ᄇ ᅵᄀ ᅭᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡᄂ ᅳ ᆫ ᄌ ᅥ ᆷᄋ ᅵᄃ ᅡ. ᄒ ᅡᄌ ᅵᄆ ᅡ ᆫ WARᄋ ᅳ ᆫ ᄇ ᅩ ᆨ ᄌ ᅡ ᆸᄒ ᅡ ᆫ ᄒ ᅧ ᆼᄐ ᅢᄅ ᅩ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄌ ᅦᄀ ᅩ ᆼ ᄃ ᅬᄂ ᅳ ᆫ ᄀ ᅵᄅ ᅩ ᆨ ᄆ
ᅡ ᆫᄋ ᅳᄅ ᅩ ᄀ ᅮᄒ ᅡᄀ ᅵ ᄋ ᅥᄅ ᅧ ᆸᄃ ᅡ. ᄄ ᅡᄅ ᅡᄉ ᅥ ᄌ ᅵᄂ ᅡ ᆫ ᄋ ᅧ ᆫᄀ ᅮ (Leeᄋ ᅪ Kim, 2016)ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ 2013-2015ᄂ ᅧ ᆫ KBO ᄀ ᅵᄅ ᅩ ᆨᄋ ᅳ ᆯ ᄇ ᅡᄐ ᅡ ᆼ ᄋ
ᅳᄅ ᅩ WARᄋ ᅦ ᄀ ᅡᄌ ᅡ ᆼ ᄀ ᅳ ᆫᄌ ᅥ ᆸᄒ ᅡ ᆫ ᄐ ᅡᄌ ᅡᄋ ᅴ ᄐ ᅡᄀ ᅧ ᆨᄂ ᅳ ᆼᄅ ᅧ ᆨᄌ ᅵᄉ ᅮᄅ ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄇ ᅡᄐ ᅡ ᆼᄋ ᅳ ᄅ
ᅩ 2016ᄂ ᅧ ᆫ KBO ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ 2016ᄂ ᅧ ᆫ ᄎ ᅬᄀ ᅩᄐ ᅡᄌ ᅡᄅ ᅳ ᆯ ᄉ ᅥ ᆫᄎ ᅮ ᆯ ᄒ ᅡᄀ ᅩ, BAIᄋ ᅦ ᄄ ᅡᄅ ᅳ ᆫ ᄐ ᅡᄌ ᅡᄃ ᅳ ᆯ ᄋ ᅴ ᄌ ᅥ ᆫᄎ ᅦ ᄉ ᅮ ᆫ ᄋ ᅱ ᄅ
ᅳ ᆯ ᄉ ᅡ ᆯᄑ ᅧᄇ ᅩᄋ ᅡ ᆻᄃ ᅡ. ᄀ ᅳᄅ ᅵᄀ ᅩ ᄎ ᅬ ᄀ ᅳ ᆫ ᄉ ᅥ ᆫᄉ ᅮᄅ ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡ ᆷᄋ ᅦ ᄋ ᅵ ᆻᄋ ᅥ ᄀ ᅡᄌ ᅡ ᆼ ᄀ ᅡ ᆨ ᄀ ᅪ ᆼ ᄇ ᅡ ᆮᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ WAR ᄀ ᅪ BAIᄋ ᅴ ᄇ ᅵᄀ ᅭᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ BAIᄀ ᅡ ᄆ ᅢᄋ ᅮ ᄄ ᅱᄋ ᅥᄂ ᅡ ᆷᄋ ᅳ ᆯ ᄒ ᅪ ᆨ ᄋ ᅵ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄃ ᅢᄎ ᅦᄉ ᅥ ᆫᄉ ᅮᄃ ᅢᄇ ᅵᄉ ᅳ ᆼ ᄉ ᅮ, ᄉ ᅦᄋ ᅵᄇ ᅥᄆ ᅦᄐ ᅳᄅ ᅵ ᆨᄉ ᅳ, ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫ ᄒ ᅬᄀ ᅱᄇ ᅮ ᆫᄉ ᅥ ᆨ.
1. 서론
2016년 한국프로야구 (Korea baseball organization; KBO) 정규시즌이 종료됐다. 정규시즌성적으 ᄅ
ᅩ는두산이 우승을차지하였고 NC, 넥센, LG, KIA, SK, 한화, 롯데, 삼성, KT 순으로 순위가 매겨졌 ᄃ
ᅡ. 야구에서 승리를하기 위해 여러 가지 조건들이 필요하다. 예컨대 ‘좋은타자들이 많다’ 혹은 ‘좋은 ᄐ
ᅮ수들이 많다’라는것이다. 그러한 좋은선수를선별하기 위해 경기를토대로 나온기록들을 분석하고 ᄋ
ᅧᆫ구한다. 단순히 일차원적으로 자료를연구하는 것이 아니라 고차원적으로 자료를 분석하는 것을 세 ᄋ
ᅵ버메트릭스 (sabermetrics)라고 한다. 그리고 이와 같은방법으로 분석하는사람들을세이버메트릭션 (sabermetrician)이라 부른다 (Hong 등, 2016). KBO에서도 세이버메트릭스 분야의 중요성은점차 강 ᄌ
ᅩ되고 있고 (Kang 등, 2014; Cho 등, 2007),세이버메트릭스 통계량을 통한 연구가 Kim (2012), Lee와 Cho (2009), Lee (2014), Lee와 Kim (2016) 등을 통해활발히 진행 중이다. 그 중에서 선수들을평가 ᄒ
ᅡᆷ에 있어 최근 많이 사용하는 것이 대체선수대비승수 (wins above replacement; WAR)이다. Lee와 Kim (2016)은 2013년부터 2015년까지 KBO 데이터를 기반으로 WAR에 가장 근접한 타자능력지수 (batter ability index; BAI)를제안하였다. WAR에 대해 설명하자면 WAR은평균적인 선수를대신 투
1
(38541) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 280, ᄋ ᅧ ᆼᄂ ᅡ ᆷᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄉ ᅥ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.
2
(38541) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 280, ᄋ ᅧ ᆼᄂ ᅡ ᆷᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
3
ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (38541) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 280, ᄋ ᅧ ᆼᄂ ᅡ ᆷᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅥ ᆫᄉ ᅥ ᆯᄉ ᅵᄉ ᅳᄐ ᅦ ᆷᄀ ᅩ ᆼ ᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
이
ᆸ했을때 팀 승리에 얼마나 도움이 되는지를알아보는지표로 가령 WAR이 3.2인 선수가 있다면 이 선 ᄉ
ᅮ를투입하였을때 팀이 3.2승을더 기록할 것이라는 뜻이다. 이 지표는투수와 타자를함께 평가할 수 이
ᆻ다는점에서큰장점을가지고 있으며, 최근방송매체에서도 자주 등장하는값으로 현재 선수를평가 ᄒ
ᅡᆷ에 있어서 가장 각광받고 있음을알 수 있다. 하지만 기본적으로 제공되는자료만으로는 일반인이 구 ᄒ
ᅡ기 어렵다. 따라서 케이비레포트에 제시되어 있는세이버메트릭스를 사용하여 WAR에 가장근접한 ᄐ
ᅡ자의 타격능력지수 (Batting ability index; BAI)를제안 (Lee와 Kim, 2016)하였다. 본연구에서는 ᄌ
ᅮ루지수를보완하여 새로운데이터인 2016년 KBO 타자들의 기록을적용하여 BAI에 따른전체 순위 르
ᆯ살펴보고, 최근선수를평가함에 있어 가장 각광받고 있는 WAR과 BAI의 비교를 통해 BAI가 타자 ᄋ
ᅴ 타격능력을잘 나타내는지확인하고자 하였다. 본연구에서는 Lee와 Kim (2016)이 제안한 BAI 공 시
ᆨ을 보정하여 2016년 KBO 최고타자를 선출해내려고 한다. 데이터는 케이비리포트 (kbreport.com) ᄀ
ᅵ록실에 게시되어 있는 2016년 데이터를이용하였다. 본연구의 구성은다음과 같다. 2절에서는세이 ᄇ
ᅥ메트릭스 변수에 대한 설명과 연구에 사용된 분석방법을설명한다. 3절에서는보완된 BAI 공식을설 며
ᆼ하고 2016년 타자들의 기록을 공식에 적용시켜 BAI를 계산하고 2016년 최고타자를선출한다. 마지 ᄆ
ᅡ
ᆨ 4절에서는연구의 결과를요약하고 결론을맺는다.
2. 연구방법
2.1. 데이터 소개
2016년도 최고타자를선출하기 위해 Lee와 Kim (2016)이 개발한 타격능력지수 공식에 스피드 스코 ᄋ
ᅥ를추가하여 보완한 타격능력지수를이용하여 2016년 KBO에서 규정타석을만족한 55명의 타자들을 ᄃ
ᅢ상으로 분석을 진행하였다. 분석에 사용된 변수는타자의 경기력을 분석하는데 필요한 지수로 제한하 ᄋ
ᅧᆻ다 (Yang 등, 2015; Lee와 Kim, 2016). 그리고 주루능력을나타내는 스피드 스코어를추가하여 총 14개의 세이버메트릭스 통계량을이용하였다.
공격공헌도 (On base plus slugging; OPS) ᄀ
ᅡ장 보편화되고 잘 알려진 세이버메트릭스 통계량으로서 출루율과 장타율의 합으로 구할 수 있어 쉽게 ᄀ
ᅨ산할 수 있는 장점이 있다. 단점으로는 단순히 출루율 (OBP)과 장타율 (SLG)을 더한다는점인데, ᄋ
ᅵ는 장타율에 치중된값이라고 볼수 있다. 하지만 많이 사용되는 이유는 아무래도 간편한 식 때문이 ᄃ
ᅡ.
총생산평균 (Gross production average; GPA)
OPS의 단점을보완한 통계량으로 출루율에 1.8의 가중치를두고 계산한다. 따라서 장타율이 과대평가 ᄃ
ᅬ는단점을보완할 수 있다.
수정타율 (Secondary average; SECA) ᄋ
ᅡᆫ타를타수로 나누는타율의 공식이 갖는가장큰단점은장타와 단타의 가치를 동일 시 하면서 볼넷은 ᄋ
ᅵᆫ정하지 않으므로 SECA는장타율의 가중치에 4사구와 도루의 가치를고려해 만든지수이다.
종합공격력 (Total average; TA) ᄎ
ᅩᆼ 진루수를 총아웃수로 나눈것으로 한 시즌동안 타자가 한 번의 공격기회에서 얼마만큼 진루했는가를 ᄂ
ᅡ타내는지수이다.
득점생산력 (Run created; RC) ᄉ
ᅦ이버메트릭스의 창시자인 빌 제임스가 고안한 것으로 타자의 출루능력과 주자를 진루시키는 능력을 ᄐ
ᅡ자의 득점에관한 창출능력으로 보고 한 타자가 팀이 득점을 올리는데 있어서 어느 정도 기여했는지를 ᄂ
ᅡ타낸다.
경기당 득점기여도 (Run created per 27 outs; RC/27)
RC가 타자가 몇 점을만들어냈는지를의미하는것이라면 RC/27은한 타자로 9명이 구성된팀이 한 경 ᄀ
ᅵ를치르면 몇 점이나 뽑을것인가를평균수치화 한 것이다.
추정득점력 (Extrapolated runs; XR)
RC와 유사한 개념으로 팀의 득점에 얼마나 공헌했는지를 타나내며 RC와의 차이점으로는 1955년부 ᄐ
ᅥ 1997년까지 메이저리그 공식기록을 회귀분석하여 도출한 선형공식이라는 점으로 정확도 면에서는 RC보다 낫다고 알려져 있다.
득점공헌도 (Batting runs; BR) ᄅ
ᅵ그 타자들의 평균공격력을 0으로 놓은상태에서 상대적으로 타자의 팀 공격기여도를수치화 한 지수 ᄋ
ᅵ다.
순수장타율 (Isolated power; ISO) ᄐ
ᅡ자의 파워히팅 능력을나타낸 것으로 장타율에 타율 (AVG)이 포함되어 있는것을고려해서 고안된 ᄌ
ᅵ수이다.
호타준족 (Power speed number; PSN) ᄐ
ᅡ자의 호타준족정도를나타낸 지수로 도루실패를감안하지 않는다는단점을지니고 있다.
타석 당 득점기대 (Weight on base average; wOBA) ᄐ
ᅡ자가 타석에 들어섰을때의 여러 가지 상황에 따른 득점 가치를고려하여 타자의 생산력을나타낸 것 ᄋ
ᅳ로 득점과의 상관관계가 매우 높고, 출루율의 가치가 저평가 받는 문제점을개선하였지만 구장효과를 바
ᆫ영하지 못하며 주루와 타격을 분리하지 못했다는단점을지닌다.
공격기대승률 (Offensive winning percentage; OW%) ᄅ
ᅵ그의 평균 득점과 한 타자의 RC/27을고려해서 한 타자만으로 이루어진 타선이라면 몇 %의 승률을 ᄀ
ᅡ지는지를나타내는지수로 리그평균의 변화를고려하여 한 타자의 한 시즌의 리그 지배력을알 수 있 ᄃ
ᅡ.
인플레이타구비율 (Batting average on balls in play; BABIP) ᄐ
ᅡ자가 친 공이 페어지역 안에 떨어진 경우만을 나타내는 지수로 타자와 투수에게 모두 적용이 가능 ᄒ
ᅡ다. 본인의 타격 스타일에 따라 자신만의 고유한 BABIP를 가지게 되며, 라인드라이브>그라운드 보
ᆯ>플라이볼 순으로 BABIP 값이 높게 형성된다.
스피드 스코어 (Speed score; SPD) ᄉ
ᅥᆫ수의 스피드를평가하는방법으로 도루 성공과 도루 실패 등의 고전 스탯을바탕으로 한 선수의 스피 ᄃ
ᅳ를정량화할 수 있어 현재까지도 유용하게 사용되고 있는 통계량이다. Spd는과거 빌 제임스에 의해