2019.09.27 데이터 사이언스

야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’!

지난 연재에서는 24가지의 상태(24 States)와 상태를 변화시키는 사건(Events)을 활용한 분석 과정에서 기대득점 표(Run Expectancy Matrix)를 소개해드렸는데요. 오늘은 비슷하지만 조금 다른 득점확률 표(Run Probability Matrix)를 살펴보겠습니다.


야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

기대득점 표는 아웃 카운트와 주자 유무로 정의한 24가지의 상황에서 이닝이 종료될 때까지 몇 점의 득점을 ‘기대’할 수 있는지를 나타낸 표였습니다. 2016-2018 3년간의 기대득점 표는 아래와 같은 모습이었는데요.

야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

그런데 경기의 흐름이 팽팽하게 후반으로 가면 여러 점의 득점은 큰 의미가 없고, 한 점이라도 득점하는 것으로 승부를 결정짓기도 합니다. 예를 들어 2-2 동점에서 9회를 맞는다면, 어떻게든 한 점을 만들어서 이기는 게 목표가 되겠죠.

이럴 때 생각해볼 수 있는 것이 득점확률입니다. 기대득점은 ‘몇 점을 득점할 수 있는가’였지만, 득점확률은 몇 점인지는 고려하지 않고 오직 득점과 무득점의 가능성만을 따집니다. 앞의 연재에서 들었던 예를 다시 보겠습니다.

어떤 리그에서 한 달 동안 100번의 무사 1루 상황이 있었고, 이 상황으로부터 이닝 종료까지 각 이닝에서 몇 점의 득점이 이루어졌는지 조사해보니 아래와 같았다고 하겠습니다.

야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

위의 모든 상황을 가중 평균한 기대득점 값은 0.75였습니다. 그러나 득점확률은 무득점이 50번, 득점이 50번이었으니 0.5가 됩니다. 이해가 되시는지요? ^^

위와 같이 2016-2018 3시즌의 득점확률 표를 만들어보면 아래와 같습니다. (이 표는 지난번처럼 엔씨소프트 AI Center 이준수 님께 도움을 받았습니다.)

야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

위의 표를 보시면, 같은 아웃 카운트일 때 2루와 1, 2루 상황의 득점확률이 거의 같고, 3루와 1, 3루, 2, 3루, 만루의 득점확률도 거의 같습니다. 앞에서 보여드린 기대득점 표와 비교해보시기 바랍니다.

주자가 쌓이면 쌓이는 만큼 늘어나는 기대득점과 달리, 득점확률은 선행 주자의 위치에 절대적인 영향을 받는 것을 알 수 있습니다. 접전 상황의 경기 후반에서 벤치가 어떻게든 주자를 진루시키려는 이유를 아시겠죠? ^^

상대적으로 득점이 감소한 2019 시즌의 득점확률 표도 보여드립니다. (계산은 NC 다이노스 데이터팀 박광영 매니저가 수고해주셨습니다.)

야구 데이터 분석 #23 데이터 분석을 위한 24가지 상태와 사건 Part 3

지난번 기대득점 표와 마찬가지로, 대부분의 상황에서 득점확률이 감소한 것을 확인하실 수 있습니다. 다만, 무사에서 선행 주자가 3루에 있는 경우는 별 영향이 없는 것이 흥미롭습니다.

다음 글에서 계속됩니다.


임선남

임선남

대기업 사무직 직원으로 살다가
엔씨소프트 데이터정보센터(DIC)를 거쳐
현재 NC 다이노스 데이터팀 팀장으로 재직 중입니다.
스스로 야구 덕후라고 생각해 본 적이 없습니다.
그냥 야구를 좋아하고 데이터를 좋아하다보니
자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다.
세이버메트릭스는 야구를 합리적, 객관적으로
잘 이해하기 위한 노력으로 이러한 이해가
야구를 더 재미있게 해 줄 수 있다고 믿습니다.

TOP