야구 데이터 분석 #3. 세이버메트릭스의 발전

다년간 쌓인 통계 자료를 이용해 야구 기록을 분석하는 ‘세이버메트릭스’.

지난 편에서는 세이버메트릭스 여명기의 선구자들을 만나 보았는데요, 이번에는 세이버메트릭스의 어원과 세이버메트릭스를 유행시킨 주인공들을 소개하겠습니다.

 


SABR (The Society for American Baseball Research)

SABR(http://sabr.org/)은 야구 역사와 통계에 대한 연구를 목적으로 하여 1971년에 창립된 단체입니다.

야구를 좋아하고 특히 야구에 대해 이야기하는 것을 즐기는 사람이라면 누구나 가입이 가능하답니다. (다만 약간의 연회비가 있어요!!)

SABR이라고 하면 마치 수학/통계 덕후 집단 같은 이미지가 있는데요. 사실 수학적인 분석을 하는 사람들은 SABR에서 일부에 불과합니다.

덕질은 모여서 전문적으로..☆

SABR은 시대별/지역별 야구 발전사, 야구에서 인종/성별의 의미 등 야구와 관련된 광범위한 주제에 대해 연구를 하고 있답니다.

이렇게 연구한 결과를 매년 학술지로 발표하기도 하고, 컨벤션 행사를 통해 모여서 같이 야구도 보고 친목을 나누기도 하지요.

 

# 세이버메트릭스(Sabermetrics) 라는 단어의 탄생

세이버메트릭스라는 단어는 빌 제임스(Bill James)가 1980년에 처음 사용했습니다.

Sabermetrics의 “Saber”는 단체명 SABR을 소리나는 대로 읽은 것이고, “Metrics”는 측정(Measurement)에서 온 것입니다.

즉, 직역하면 “SABR 사람들이 하는 숫자 놀음” 정도의 의미가 되겠습니다.

빌 제임스는 초창기에 세이버메트릭스를 “야구 기록에 대한 수학적, 통계적 연구(the mathematical and statistical analysis)”라고 정의합니다만, 나중에는 “야구의 객관적 지식을 추구하는 것(The search for objective knowledge about baseball)”이라는 보다 넓은 개념으로 수정합니다.

꼭 고도의 수학이 동원되어야만 세이버메트릭스라고 인정받는 것은 아니라는 거죠!

그럼 ‘세이버메트릭스’라는 단어를 발명한 빌 제임스에 대해 좀 더 알아볼까요?

 

# 빌 제임스 (Bill James)

빌 제임스 – 성공한 야구 덕후.jpg

 

한때 주한미군에서 근무한 적도 있는 빌 제임스는 1970년대 중반부터 식품회사의 경비원으로 일하고 있었습니다.

야근을 하면서 하면서 취미 삼아 야구 데이터를 분석한 글을 하나 둘 모아 직접 책으로 펴낸 것이 바로 <1977 Baseball Abstract> 였는데, 당시 75부가 팔렸다고 합니다.

매일매일 꾸준히 하다보면..

그 이후에도 빌 제임스는 매년 “Baseball Abstract”를 발간하였습니다.

야구 데이터에 대한 신선한 접근 방법이 입소문을 타고 점점 유명해지고, 스포츠 일러스트레이티드(Sports Illustrated)지에 소개되면서, 1982년부터는 매년 수천 부씩 책을 판매할 정도로 인기가 높아집니다.

덕질의 결과물 ^^

빌 제임스는 왕성한 저술 활동을 지속하는 한편, 80년대 중반에는 자원봉사자들이 직접 야구 기록을 수집하여 집대성하는 “프로젝트 스코어시트(Project Scoresheet)”를 조직했습니다.

이 덕분에 보다 많은 사람들이 야구 데이터를 접할 수 있었습니다.

 

빌 제임스가 야구 데이터 분석을 위해 도입한 새로운 개념들은 너무 많아서 일일이 열거하기가 힘들 정도입니다.

대표적인 것으로는,

  • 득점-실점 기록으로 팀 승률을 추정하는 피타고리언 기대 승률(Pythagorean Winning Percentage),
  • 선수별 득점 기여 수준을 계산하는 RC(Runs Created),
  • 야수의 수비력을 평가하는 레인지 팩터(Range Factor),
  • 선수의 종합 기여 수준을 측정하는 윈 셰어(Win Shares),
  • 팀 수비력을 측정하는 DER(Defensive Efficiency Rating)

등이 있습니다.

야구는 그깟 공놀이가 아니었던 거야.. ༼ ༎ຶ ෴ ༎ຶ༽

빌 제임스는 수학적인 엄밀함이 다소 부족할 때도 있었지만, 반짝이는 직관과 재치, 기존의 고정관념에 얽매이지 않는 자유로운 사고, 그리고 유려한 글솜씨를 통해 많은 독자를 확보하였고, 그 결과 세이버메트릭스의 대중화에 결정적인 공헌을 하였습니다.

빌 제임스의 애독자였던 보스턴 레드삭스 구단주 존 헨리(John Henry)는 2003년 그를 구단의 자문 위원으로 위촉합니다.

이것은 오클랜드의 “머니볼”과 더불어 세이버메트릭스가 메이저리그 주류에 편입된 상징적인 사건으로 꼽히곤 하는데요, 제임스는 2017년 현재까지도 레드삭스 구단의 “Senior Advisor” 직함을 유지하고 있답니다.

 

# 피트 팔머 (Pete Palmer)

OPS를 고안한 피트 팔머

 

비록 빌 제임스만큼 유명하지는 않지만, 세이버메트릭스의 발전 과정에 있어서 피트 팔머의 공헌은 매우 큽니다.

군수업체의 레이더 엔지니어이자 프로그래머였던 팔머는 1960년대부터 근무시간 후 밤에 혼자 회사에 남아 회사 컴퓨터를 이용하여(!) 야구 데이터를 분석하기 시작했습니다.

그는 1984년 존 쏜(John Thorn)과 함께 “The Hidden Game of Baseball”이라는 책을 발표했습니다.

 

The Hidden Game of Baseball

이 책에서 그는 빌 제임스의 계산 방법들을 비판하면서 조지 린지의 연구를 계승하여 “선형가중 계산법(The Linear Weights System)”을 소개합니다.

기대득점 표를 바탕으로 안타, 볼넷, 홈런, 도루 등의 절대 가치를 계산하고, 이를 통해 선수의 기여 수준을 측정하는 그의 계산법은 wOBA 및 WAR 등 현대 세이버메트릭스를 대표하는 스탯들로 이어지고 있습니다.

요즘 가장 널리 쓰이는 타격 스탯 중 하나인 OPS(=출루율+장타율)를 고안한 것도 바로 피트 팔머입니다.

 

# 빌리 빈 (Billy Beane)과 오클랜드의 머니볼

영화 머니볼에서 단장 빌리 빈 역할을 한 빵횽 

책으로, 그리고 영화로 너무나 잘 알려진 이야기입니다.

재정이 넉넉하지 못한 오클랜드 어슬레틱스의 단장 빌리 빈이 폴 디포데스타(Paul DePodesta) 등 세이버메트릭스 덕후 참모진의 도움을 받아 2000년대 초반 당시 가성비 갑이었던 “출루율”에 주목하여 좋은 성적을 거두었다는 것.

 

폴 디포데스타 – 영화 속에서는 너드 이미지의 캐릭터로…

 

현실은 그렇게 한두 가지 스탯에만 치중해서 우승을 노릴 수 있을 만큼 단순하지는 않았고, 책이나 영화에서 드라마틱하게 묘사를 하느라 사실을 왜곡한 부분들도 꽤 있었으나, 어쨌든 당시의 오클랜드가 기대치를 훌쩍 뛰어넘는 성공을 거두었던 것은 분명합니다.

머니볼의 핵심은 객관적/합리적인 분석을 통해 남들이 아직 모르는 가성비 좋은 영역을 찾아서 성과를 내는 것이라고 할 수 있는데요. 그러한 도구로서의 세이버메트릭스가 더욱 주목받는 계기가 되었지요.

 

세이버메트릭스

사진 출처
빌 제임스: Photo By Colette Morton and Dan Holden – DSCF0551, CC BY-SA 2.0, https://commons.wikimedia.org/w/index.php?curid=16358673
피트 팔머: Photo: http://sabr.org/
Baseball Abstract: http://www.ebay.com/itm/like/262998858206?vectorid=229466
폴 디포데스타: By Bill Sheridan from Saint Louis, United States – 2011 CCH User Conference, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=21473994

 

지난 글

야구 데이터 분석#1 야구의 아버지, 헨리 채드윅

야구 데이터 분석 #2 데이터 분석의 선구자들

 


임선남팀장님_프로필임선남  대기업 사무직 직원으로 살다가, 엔씨소프트 데이터정보센터(DIC)를 거쳐 현재 NC다이노스 데이터팀 팀장으로 재직 중입니다. 스스로 야구 덕후라고 생각해 본 적이 없습니다. 그냥 야구를 좋아하고 데이터를 좋아하다 보니 자연스럽게 야구 데이터가 업이 된 것이 아닌가 합니다. 세이버메트릭스는 야구를 합리적, 객관적으로 잘 이해하기 위한 노력입니다. 이러한 이해가 야구를 더 재미있게 해 줄 수 있다고 믿습니다.