2019.12.18 데이터 사이언스

야구 데이터 분석 #24 데이터 분석을 위한 24가지 상태와 사건 Part 4

세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!

이전 연재에서 기대득점표(Run Expectancy Matrix)와 득점확률표(Run Probability Matrix)를 소개해 드렸는데요. 오늘은 이 둘을 비교해 보겠습니다. 참고로 기대득점 및 득점확률 계산은 엔씨소프트 AI Center 이준수 님의 도움을 받았습니다. ^^


야구 데이터 분석 #24 데이터 분석을 위한 24가지 상태와 사건 Part 4

기대득점표는 아웃카운트와 주자 유무로 정의한 24개의 상황에서 이닝 종료 때까지 몇 점의 득점을 ‘기대’할 수 있는지를 나타낸 표였습니다. 2016-2018 3년간의 기대득점표는 아래와 같은 모습이었지요.

야구 데이터 분석 #24 데이터 분석을 위한 24가지 상태와 사건 Part 4

한편, 같은 시기의 득점확률표는 다음과 같았습니다. 기대득점은 ‘몇 점을 득점할 수 있는가’였지만, 득점확률은 몇 점인지는 고려하지 않고 오직 득점과 무득점의 가능성만을 따진 결과물이지요.

야구 데이터 분석 #24 데이터 분석을 위한 24가지 상태와 사건 Part 4

무사 2루의 상황을 생각해 보겠습니다. 위의 표에 의하면, 2016-2018 시즌의 타고투저 환경에서 기대득점은 1.35점이고, 득점확률은 0.68이었습니다. 바꿔 말하면, 무사 2루를 만들면 평균적으로 1.35점을 득점할 수 있었고, 득점에 성공한 경우는 전체 경우의 68%였다는 이야기이지요.

여기서 벤치가 희생번트를 지시하고 타자가 작전을 성공시켜서 1사 3루가 되었다고 가정하면, 기대득점은 1.11로 낮아지지만, 득점확률은 0.71로 올라갑니다. 장타가 쉽게 나오는 타고투저의 환경에서 번트와 같이 아웃과 진루를 바꾸는 작전은 인기가 없게 마련입니다.

하지만, 9회 동점과 같이 팽팽한 후반전 상황에서, 1점으로 승부를 낼 수 있는 상황이라면, 이야기가 완전히 달라지지요. 번트를 통해 다득점을 할 가능성은 줄어들지만, 1점이라도 득점할 가능성을 높이는 것이 합리적인 선택이 됩니다.

야구 데이터 분석 #24 데이터 분석을 위한 24가지 상태와 사건 Part 4

수비의 측면에서도 생각해 보겠습니다. 1사 2, 3루 상황에서 기대득점(실점)은 1.6점이고, 득점(실점) 확률은 0.72 입니다. 이 상황에서 벤치가 만루 작전을 지시하여 고의사구로 타자를 내보내면, 1사 만루가 되어 기대득점(실점)이 1.74점으로 올라가지만, 득점(실점) 확률은 0.69로 떨어집니다.

후속 타자에게 안타 한 방을 맞으면 대량 실점이 될 수도 있지만, 점수를 주지 않고 이닝을 마무리할 확률은 올라가는 것이지요. 위의 번트와 마찬가지로, 경기 후반의 승부처라면, 이런 선택이 훨씬 합리적일 수 있습니다.

기대득점표와 득점확률표는 어디까지나 평균적인 상황이므로, 지금 타석에 서 있는 타자와 후속 타자의 타격 능력 차이에 따라, 작전이 더욱 설득력을 얻을 수도 있고, 강공이 더 유리할 수도 있습니다. 또한, 야구 선수도 사람이므로, 그날 그날의 컨디션도 큰 영향을 미칩니다. 무조건 번트가 나쁘다 좋다는 식의 기계적인 적용보다는, 벤치의 판단이 중요한 이유입니다. ^^

다음에는 기대득점표가 어떻게 야구 분석의 근간이 되는지를 설명 드리겠습니다.


임선남

임선남

대기업 사무직 직원으로 살다가
엔씨소프트 데이터정보센터(DIC)를 거쳐
현재 NC 다이노스 데이터팀 팀장으로 재직 중입니다.
스스로 야구 덕후라고 생각해 본 적이 없습니다.
그냥 야구를 좋아하고 데이터를 좋아하다보니
자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
세이버메트릭스는 야구를 합리적, 객관적으로
잘 이해하기 위한 노력으로 이러한 이해가
야구를 더 재미있게 해 줄 수 있다고 믿습니다.

TOP