본문 바로가기
메트로폴리탄/MLB 수다

바우만: WAR가 MVP 논쟁을 망쳤나?

by 그리핑 2024. 11. 18.

MVP 투표 논쟁의 중심에 섰던 디그롬

MVP 투표가 WAR 줄세우기가 됐다는 일부 비판자들에 대한 반론성 칼럼. WAR가 도입되었다고 해서 MVP 투표가 단순히 WAR 순위표를 따라가지는 않았고, 오히려 더 나은 평가를 위한 도구와 더 많은 정보가 제공되면서 MVP 투표가 정교해졌다는 점을 이야기한다.

https://blogs.fangraphs.com/did-war-ruin-the-mvp-conversation/

수요일에 나는 내가 가장 좋아하는 주제 중 하나를 다뤘다: 세이버메트릭스가 야구의 실전과 분석에 미친 영향에 대해서다. 특히 이번에는 파이어 조 모건 시대(Fire Joe Morgan era) 이후 MVP 투표자들의 행동 양상에 대해 다뤘다. 그리고 2,000자가 넘는 그 글을 읽고도 부족함을 느낀 독자들에게 좋은 소식이 있다! 사실 이것은 내가 이 주제를 처음 고민하기 시작했을 때 실제로 답하고자 했던 질문이 아니었다.

파트 2를 시작하겠다.

MVP 상이라는 이름 자체가 투표자들에게 특정 선수의 기여도의 가치를 고려하도록 한다. 거의 100년 동안, 이는 까다로운 과제였다. 포지션의 차이, 플레이 스타일, 구장 요인, 타격과 투구와 수비와 주루를 어떻게 비교 평가할 것인가? 이는 머리를 복잡하게 만드는 일이었다.

세이버메트릭스 운동의 가장 초기이자 가장 지속적인 프로젝트 중 하나는 전체 그림을 담아낼 수 있는 종합 지표를 찾는 것이었다. 모든 선수의 생산성을 측정하고, 맥락 속에서 평가하여, 그가 X만큼의 득점이나 Y만큼의 승리에 기여했다는 단일 숫자로 도출해내는 것이다. 이러한 숫자가 특정 시즌 리그의 가장 가치 있는 선수를 식별하는 작업에 미치는 영향은 분명하다.

과거의 비평가들 - 혹은 현재의 비평가들 중에서도 너무 시대에 뒤떨어져서 마치 과거에서 온 것처럼 들리는 이들 - 은 WAR를 수치 분석가들에 대한 허수아비 논리로 활용했다. "WAR를 믿는다면, 왜 그냥 WAR 순위대로 투표하지 않는가?"

답은 WAR가 승리의 10분의 1 단위까지 계산되긴 하지만, 그 정도의 정밀도까지 유지되지 않을 수 있는 가정들을 기반으로 한 모델이라는 것이다. 이는 좋은 출발점이지만, 특히 접전에서는 전체 대화의 전부가 될 수는 없다.

게다가 WAR가 확립된 과학이 아니라는 것은 세이버메트릭스 전문가들조차 WAR가 무엇인지 합의하지 못한다는 점에서 알 수 있다. 팬그래프스는 당연히 자체 WAR를 가지고 있고, 나는 회사의 충실한 직원으로서 그것을 사용한다. 하지만 수십 명의 MVP 투표자들이 있고, 수천 명의 사람들이 대중을 위해 야구 분석을 발행한다. 안타깝게도, 그들 중 일부는 다른 출처에서 정보를 얻는다. (하지만 우리가 그것을 개선하고 있다고 약속하겠다.)

사람들이 WAR를 이야기할 때, 그들은 팬그래프스 WAR, 베이스볼 레퍼런스 WAR, 또는 베이스볼 프로스펙터스의 WARP를 말하는 것이다. (끝의 'p'는 PECOTA를 의미하는 것 같다.) 각각은 투수 평가에서 수비의 역할에 대해 서로 다른 가정을 하는데, 이는 차이점 중 하나일 뿐이다. 따라서 세 가지 주요 WAR가 대체로 비슷한 결론에 도달하긴 하지만, 완전히 같은 결론에 도달하지는 않는다. 이는 "WAR 순으로 정렬"이 일관된 수상 투표 전략이 되기 위해 필요한 것이다.

나는 2000년 이후 MVP 투표에서 10위 안에 든 모든 선수들과 그 해의 fWAR, bWAR, WARP 총계를 정리했다 - 총 481개 시즌이다. 단 한 번의 경우에만 - 2017년 저스틴 터너 - 세 가지 주요 WAR가 모두 승리의 10분의 1 단위까지 선수의 가치에 대해 동의했다. 그래서 나는 터너가 2017년에 정확히 5.6 WAR의 가치가 있었다고 꽤 확신한다. 다른 모든 것은 해석의 여지가 있다.

여기에는 또 다른 복잡한 요소가 있다: 세 가지 WAR 지표 모두 때때로 업데이트된다. WAR는 신들이 인류에게 완벽하게 전달한 불변의 개념이 아니기 때문이다. 결국 이는 통계적 모델이고, 새로운 정보가 나타날 때마다 업데이트되어야 한다. 따라서 지금 보는 WAR 총계는 당시 투표자들이 각 사이트의 순위표를 볼 때와 정확히 같지 않을 수 있다.

그래서 WAR와 MVP 투표가 얼마나 밀접하게 일치하는지에 대한 질문에는 여러 가지 답변 방식이 있다. 규범적 관점에서 보면, 투표자들이 질문에 올바르게 답했다고 볼 수도 있고, WAR에 대한 검증으로 볼 수도 있다 - 수치가 우리 눈으로 보는 것과 일치하는가, 아니면 이 수학이 통제를 벗어난 것인가?

2000년부터 2023년까지(올해 MVP 투표 결과는 아직 나오지 않았으므로), 134개의 개별 리그 WAR 1위가 있었다. 이는 24시즌 × 2개 리그 × 3개 WAR 유형에서 BP가 WAR 데이터를 발표하지 않은 5년(2000-2004)을 뺀 수치다.

이 134개의 개별 선수 시즌 중, WAR 1위는 - 각 리그와 WAR 유형별로 - 120번 MVP 투표 10위 안에 들었다. 예외는 다음과 같다.

선발투수들이 여기에 많이 포함된 것은 전혀 놀랍지 않다. MVP 투표자들은 내게는 전혀 명확하지 않은 이유로 투수들을 싫어한다. 선발투수가 WAR 1위를 기록해도 투표자들은 거들떠보지도 않는다. 그레인키는 두 가지 WAR에서 1위를 했는데도 무시당했다.

수요일에 나는 1967년 칼 야스트렘스키에 대해 유일한 반대표를 던진 맥스 니콜스를 비난했다. 오늘은 또 다른 특이한 투표자를 칭찬하고 싶다: 2018년 애리조나 리퍼블릭의 닉 피에코로다.

그 해 크리스찬 옐리치는 MVP 투표에서 압도적으로 승리했다. 홈런 2개와 타점 1개가 부족해 트리플 크라운을 놓쳤던 시즌에서 29개의 1위표를 받았다. 그는 타율 .326, 출루율 .402, 장타율 .598을 기록했는데, 이는 옐리치 개인에게 패러다임을 바꾸는 도약이었을 뿐만 아니라 팀에게도 혁신적인 것이었다. 전 겨울 마이애미에서 밀워키로 트레이드된 옐리치는 주목받지 못하던 브루어스를 내셔널리그 1위로 이끌었다. 이야기 구조상으로는 1967년 야스트렘스키와 비슷했다: 리그 최고의 팀 스토리의 중심에서 믿을 수 없는 개인 시즌을 보냈다.

하지만 제이콥 디그롬이 훨씬 더 뛰어났다. 이는 수많은 밈을 낳았고 믿기 힘들게도 투표자들에게 과소평가된, 10승 9패 평균자책 1.70의 시즌이었다. 메츠의 에이스는 세 가지 WAR 지표 모든 곳에서 리그 1위였고, 모든 경우에서 옐리치보다 1승 이상 앞섰으며, B-Ref 기준으로는 최종 MVP보다 2.6 WAR나 앞섰다. 그러나 그는 5위에 그쳤다.

모든 MVP 논쟁에 옳고 그른 답이 있는 것은 아니다. 이 경우에는 있었고, 피에코로만이 그것을 찾아냈다.

무시된 WAR 리더들의 대부분은 WARP에서 1위를 차지했는데, WARP는 다소 인색할 수 있고 때때로 예상치 못한 결과를 내놓는다. 그럼에도 이는 2022년 부진한 시즌에서도 소토가 정말 좋았다는 것과, 맥캔이 전반적으로 크게 과소평가되었다는 것을 상기시켜준다.

마카키스를 강조하고 싶은데, 실례가 될 수 있지만, 그는 내가 예상한 마지막 인물이었다. 그는 2008년에 어떤 면에서 전형적인 마카키스 시즌을 보내며 bWAR 1위를 기록했다: 타율 .300 정도에 홈런 20개와 2루타 40여개를 치고 우익수로서 좋은 수비를 했다. 특이했던 점은 커리어 하이인 99개의 볼넷을 얻어 출루율을 .406으로 끌어올렸고, DRS에서 평균 이상 22점의 수비 기여를 인정받았다는 것인데, 이는 엄청난 수치다. 이는 매우 좋은 시즌을 7.4 bWAR(그리고 6.1 fWAR, 즉 B-Ref만 특이값을 보인 게 아니다)로 끌어올리기에 충분했고, 약세였던 그 시즌 AL에서 1위를 차지했다.

이는 이 연구에서 내가 가장 좋아하는 순간이었다. 마카키스가 한 번 WAR 1위를 했다는 것을 알게 된 것은 마치 세자르 토바르가 실제로 1967년에 야스트렘스키보다 더 나았다는 것을 알게 된 것과 같았다. 말할 필요도 없이, 투표자들은 이를 알아채지 못했다. 마카키스는 MVP 투표 10위 안에 들지 못했을 뿐만 아니라, 어느 누구에게서도 단 한 표도 받지 못했다.

이제 WAR 리더들이 MVP 투표자들에게 인정받지 못한 경우를 봤으니, 방정식의 다른 쪽을 보자: 어떤 WAR에서도 1위를 하지 못했는데 MVP를 받은 경우다. 2000년 이후 18건의 그런 사례가 있었다. (흥미롭게도, 그 목록에는 최근 두 명의 트윈스('쌍둥이'들) MVP와 최근 세 명의 필리스(치즈스테이크의 도시) MVP가 포함되어 있어서, WAR를 싫어하는 투표자들이 적어도 말장난과 고기 샌드위치는 좋아하는 것이 분명해 보인다.)

그 18명에는 2000년의 두 MVP와 2000년부터 2009년 사이의 20명의 MVP 중 9명이 포함된다. 그 변곡점은 고급 통계의 역사적 확산과 일치하는 것으로 보인다. 파이어 조 모건 시대는 2008년에 끝났고, 2010년대 초반은 반지성주의 투표자들에게 있어 나폴레옹의 백일천하와 같았다. 여기에는 잭 모리스 명예의 전당 논쟁과 2012년, 2013년 미겔 카브레라 대 마이크 트라웃의 MVP 캠페인이 포함된다.

하지만 최근의 역사도 WAR 리더보드와 일치하지 않는다. 2020년부터 2022년까지, 6명의 MVP 중 4명 - 호세 아브레우, 프레디 프리먼, 브라이스 하퍼, 폴 골드슈미트 - 은 어떤 WAR 리더보드에서도 1위를 하지 못했다. 물론 이 모든 경합은 어려운 사례였다: 2020년은 60경기 시즌이었고, 2021년과 2022년은 투수가 지배한 분산된 WAR 리더보드 때문이었다.

실제로, 이러한 소위 WAR가 부족한 MVP들 중 대부분은 승리의 일부 분수 차이로만 리그 1위를 놓쳤다. 그래서 그 그룹을 좁혀서, 다른 선수가 적어도 두 가지 WAR 지표에서 각각 1승 이상의 차이로 리그를 이끈 해에 MVP를 받은 경우만 보자.

이 목록에는 2000년 AL 경합이나 2006년 두 경합과 같은 경우는 포함되지 않는다. 순전히 WAR 기반 투표자라면 실제 수상자에게 MVP를 주지 않았을 것이 명확하지만, 리더보드 상위권이 너무 근접해서 어떤 선수가 이겼어야 했는지가 덜 명확했기 때문이다. (예를 들어, 나는 2001년 제이슨 지암비와 2006년 카를로스 벨트란이 얼마나 좋았는지를 잊고 있었다.)

이 사례들 각각에는 강력한 내러티브적 근거가 있다. 카브레라는 2012년에 트리플 크라운을 획득했다. 도널드슨, 알투베, 옐리치는 성장하는 팀들을 강호로 탈바꿈시켰다. 아무도 투수나 A-Rod를 존중하지 않았고, 어떤 이유에서인지 트라웃은 야구계의 데이터 분석 논쟁이 막바지에 이르렀을 때 양 진영 사이를 오가는 논쟁의 대상이 되었다.

2000년부터 2004년까지, 팬그래프스와 베이스볼 레퍼런스 WAR는 10번의 기회 중 9번 같은 1위를 보였다. 이는 방법론적 수렴 때문일 수도 있지만, 아마도 그 시기에 배리 본즈와 알렉스 로드리게스가 단순히 리그의 다른 모든 선수들을 압도했기 때문일 것이다. 투표자들 - 그 당시에는 대부분 WAR에 대해 들어본 적도 없었을 것이다 - 은 그 9번의 기회 중 5번 WAR 합의 1위에게 MVP를 수여했고, 다른 2번은 2위로 투표했다.

이후 19시즌 동안, 한 선수가 세 가지 WAR 모두에서 리그 1위를 차지한 경우가 15번 있었다. 투표자들은 10번 동의했다.

이 중 세 경우 - 2013년과 2015년의 트라웃, 2017년의 저지 - WAR 합의 1위는 2위를 차지했다. 나머지 두 경우는 투수와 관련되어 있다: 2018년의 디그롬과 2020년의 비버는 MVP를 받지 못했지만, 최근 순수 투수로서 5위 안에 든 두 명이다.

비평가들이 예측했던 대로 WAR가 MVP 투표를 순위표 읽기 운동으로 바꿔버렸나? 그렇지 않다. WAR를 산출하는 세 기관의 미묘한 방법론 차이 덕분에, 그렇게 될 수도 없었을 것이다. 합의가 있을 때는 투표자들이 보통 그것을 따른다(다시 말하지만, 투수가 관련된 경우는 제외). 하지만 이는 20년 전에도 마찬가지였는데, 그때는 출루율이 최첨단이었다.

2020년대에 MVP 투표가 예측 가능해졌다면, 그리고 그것이 세이버메트릭스와 온라인 미디어가 가져온 압력과 혁신의 결과라면, 나는 그것이 모든 사람이 맹목적으로 WAR를 따르기 때문이라고 생각하지 않는다. 우리는 이제 더 나은 정보를 얻고 있고, 클럽하우스 접근권과 수상 투표권을 가진 사람들은 그 정보를 더 잘 활용할 수 있게 되었다. 그것이 획일성으로 이어지는지는 분석의 질에 비해 부차적인 문제다.

1960년대에도 다수와 다른 의견을 내면 집단적인 공격의 대상이 될 수 있었다 - 불운한 맥스 니콜스에게 물어보라. 그리고 몰아세우기에 대한 두려움은 그 이후로 엄청나게 커졌다. 이는 합의에 동의하지 않는 것을 막는 인센티브이기도 하지만, 사실을 제대로 파악하는 더 큰 인센티브이기도 하다. 확실히 2024년에는 아무도 11-WAR 장타자보다 리그 평균 수준의 유틸리티 선수를 MVP 투표에서 더 높이 평가하지 않을 것이다. (그렇다고 해도, 일주일 후에 누군가가 AL MVP 투표에서 저지보다 맷 비얼링에게 투표했다는 것을 알게 된다면 나는 더할 나위 없이 기쁠 것이다. 실제로 파티를 열 것이고, 여러분 모두를 초대하겠다.)

그렇다면 이는 투표자들이 더 이상 자신의 신념을 따를 용기가 없어서일까, 아니면 단순히 그들이 요즘에는 더 나은 신념을 가지게 되었기 때문일까?

728x90
반응형