R&D

야구 데이터 분석 #22 데이터 분석을 위한 24가지 상태와 사건 Part 2
데이터 사이언스

야구 데이터 분석 #22 데이터 분석을 위한 24가지 상태와 사건 Part 2

세이버메트릭스를 기반으로 야구 경기를 더 재미있게 관람할 수 있도록 도와드리는 ‘야구 데이터 분석’! 지난 연재에서 24가지의 상태(24 States)와 상태를 변화시키는 사건(Events)에 대해 알아보았는데요. 이번 시간에는 이를 활용하여 분석하는 과정을 보여드리고자 합니다. 선두타자가 볼넷으로 출루하여 무사 1루의 상황을 만들었습니다. 아직 뒤의 과정을 모르기 때문에 이 주자가 득점에 성공할지, 다음 타자들까지 득점하는 빅 이닝이 될지, 아니면 후속타자의 병살로 기회가 무산될지는 모릅니다. 하지만 그 동안 무사 1루의 상황에서 출발한 이닝은 매우 많을 것이고, 각 이닝에서 몇 점을 득점했는지 모두 조사해보면, 무사 1루의 상황에서의 득점에 대한 ‘기댓값’을 계산할 수 있을 것입니다. 예를 들어 보죠. 어떤 리그에서 한 달 동안 100번의 무사 1루 상황이 있었고, 이 상황으로부터 이닝 종료까지 각 이닝에서 몇 점의 득점이 이루어졌는지 조사해보니 아래와 같았다고 하겠습니다. 이 리그에서 무사 1루의 득점 기댓값은 얼마일까요? 위의 결과들을 가중 평균 해보시면 0.75가 나옵니다. 볼넷이나 안타 등으로 선두타자가 무사 1루를 만들면 0.75점을 ‘기대’할 수 있는 것이죠. 이제 24가지의 상태 전체에 대해 위와 같은 방식으로 기댓값을 구해봅니다. 엄청나게 방대한 작업일 수도 있겠지만, 계산은 컴퓨터가 해주니까요. ^^ KBO 리그는 지난 몇 년간 극심한 타고투저 양상을 보였는데요. 2016-2018 3시즌의 기대득점 표를 만들어보면 아래와 같습니다. (엔씨소프트 AI Center 이준수 님께서 큰 도움을 주셨습니다. ^^) 지난 3년간의 KBO 리그는, 무사 1루를 만들었을 때의 기대득점이 1점을 넘는 리그였습니다. 선두타자의 출루가 갖는 의미가 매우 컸지요. 무사 1루의 기대득점은 2사 만루보다도 큽니다. 올 시즌은 공인구의 변화 등으로 인해 득점이 감소하는 모습인데요. 실제로 그런지 비교해보겠습니다. 2019 시즌 8월 20일까지의 기대득점 표입니다. (이번엔 NC 다이노스 데이터팀의 박광영 매니저가 계산을 담당하였습니다.) 위의 표와 비교해보시면, 대부분의 상황에서 기대득점이 감소한 것을 확인할 수 있습니다. 타고투저 양상이 약화된 것이죠. 참고로, 탐 탱고(Tom Tango)의 명저 『The Book』에 소개된, 메이저리그 1999-2002 시즌의 기대득점 표를 같이 보여드립니다. 맨 위의 2016-2018 KBO 리그 표와 비교해보시기 바랍니다. 메이저리그에서 이 시대는 타자들이 약물의 힘을 빌려 홈런을 뻥뻥 치던, MLB 역사상 최고의 타고투저 시절이었습니다. 그런데 2018 시즌까지의 KBO 리그는, 그보다도 기대득점이 더 높은 리그였답니다. ^^ 얼마나 타고투저가 심했는지 느낌이 오시나요? 다음 글에서 계속됩니다. 임선남 대기업 사무직 직원으로 살다가 엔씨소프트 데이터정보센터(DIC)를 거쳐 현재 NC다이노스 데이터팀 팀장으로 재직 중입니다. 스스로 야구 덕후라고 생각해 본 적이 없습니다. 그냥 야구를 좋아하고 데이터를 좋아하다보니 자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다. 세이버메트릭스는 야구를 합리적, 객관적으로 잘 이해하기 위한 노력으로 이러한 이해가 야구를 더 재미있게 해 줄 수 있다고 믿습니다.

2019.08.30
TOP