Some people think football is a matter of life and death. I assure you, it's much more serious than that.

Mostrando postagens com marcador WAR. Mostrar todas as postagens
Mostrando postagens com marcador WAR. Mostrar todas as postagens

terça-feira, 16 de julho de 2013

O verdadeiro All-Star Game da MLB

Aproveitando que ontem terminamos o preview da AFC East pra temporada 2013 da NFL e que hoje tem All-Star Game da MLB, vamos dar um tempinho (calma, amanhã tem mais!) pra falar um pouco de baseball e tentar trazer um retrato do que foi essa primeira fase de temporada regular. 

Todo ano, os prêmios do baseball apresentam um simples problema em praticamente todos os prêmios individuais: os votantes, muitas vezes, não fazem ideia do que olhar e do que observar (se você é um desses e/ou não faz ideia do que estamos falando, recomendo dar uma lida no nosso post explicativo sobre as regras do baseball e, principalmente, nesse post sobre como usar estatísticas no baseball pra ter uma idéia geral do que está acontecendo aqui) e votam com base em critérios totalmente absurdos e no "teste visual" que tem mais falhas que a defesa da seleção do Tahiti. Isso gera alguns absurdos e um grande número de injustiças que acabam revoltando os estatísticos do esporte e as pessoas que sabem que votar em um jogador que rebate muitos Home Runs e não faz mais nada de util é ridículo. Baseball é o esporte mais fácil de se medir com estatísticas da história da humanidade se você souber pra onde olhar, mas mesmo assim, toda santa vez tem um monte de gente que sequer olha pra elas na hora de votar, e isso gera um sem-número de absurdos que precisam ser corrigidos.

Então a idéia aqui é simples: olhando as estatísticas pra avaliar os melhores jogadores da MLB até aqui, ao invés dos conceitos subjetivos da hora de votar de 70% das pessoas, quais seriam os All-Star Teams das duas Ligas? Em outras palavras, se fossemos montar um time com os melhores jogadores por posição na temporada até aqui, como seria? Vamos eleger apenas um jogador por posição, mas eventualmente podemos citar alguns jogadores que mereciam consideração que vocês podem interpretar como os reservas da posição. Da mesma forma, se tivermos dois jogadores virtualmente empatados, a escolha vai seguir meu critério pessoal para a montagem do time, mas pelo menos vou explicitar a decisão a ser tomada. Elegeremos 9 Fielders, um DH, e apenas um arremessador titular em cada Liga.

Então sem mais delongas, vamos começar com...

American League All-Star Team

Catcher: Joe Mauer, Minnesota Twins (3.9 WAR, .320/.402/.473)

Essa talvez seja a posição mais fácil de preencher de toda essa coluna. Um pouco esquecido em meio a um monte de lesões, e ao fato de que o Twins é um dos times menos importantes de toda a MLB, está o fato de que Joe Mauer ainda é um dos melhores jogadores da Liga, que continua chegando em base a níveis épicos e rebatendo doubles pra todos os lados do campo. Mas mais do que a performance espetacular de Mauer (stat line acima), o que torna essa posição tão fácil de preencher é o fato de que a AL não tem nenhum outro Catcher pra competir com ele. O segundo melhor C da AL é Jason Castro, do Astros, mas mesmo assim o WAR dele (2.3) nem se compara. Nem mesmo Carlos Santana, que tem bons números ofensivos (seu wRC+ de 137 é o quarto maior da MLB entre Cs, atrás de Buster Posey, Yadier Molina e Mauer) mas é um dos piores jogadores defensivos da Liga. Então nenhuma controvérsia pra começar o time.

Menção honrosa: Jason Castro, Houston Astros.


First Baseman: Chris Davis, Baltimore Orioles (5.1 WAR, .315/.392/.717, 37 HRs)

Outra extremamente fácil, embora por um outro motivo: Chris Davis tem sido a grande história da temporada com sua barragem de Home Runs, seus 37 sendo a segunda melhor marca na história antes do All-Star Game. Embora a AL tenha alguns outros 1B interessantes, nenhum teve nem de longe o impacto que Davis teve, e nenhum chega perto do seu .717 em slugging ou seu .402 em isolated power (ambas lideram a MLB).

Menções honrosas: Edwin Encarnacion, Toronto Blue Jays; James Loney, Tampa Bay Rays.


Second Baseman: Dustin Pedroia, Boston Red Sox (3.7 WAR, .316/.396.436)

Se as duas anteriores foram as mais fáceis da coluna, essa foi a mais difícil de longe: Dustin Pedroia ou Robinson Cano? Os WARs são virtualmente idênticos (3.7 e 3.8, respectivamente) e cada um trás coisas diferentes ao jogo: Cano é um rebatedor superior, mas Pedroia é um defensor e baserunner muito melhor. Então fica mais por conta da sua avaliação pessoal, e a minha vai pra Pedroia por dois motivos: ele tem sido o melhor jogador do melhor time da American League, e meu time já tem força suficiente no bastão mas precisa de mais defesa. Normalmente eu não uso performance dos times pra uma honra individual como All-Star Game, mas serve aqui como critério de desempate porque os dois jogadores são tão próximos que não da pra separar um como sendo melhor.

Uma alternativa aqui seria colocar Jason Kipnis. Seus números ofensivos superam até mesmo Cano, embora ele seja o pior defensor do três. Seu WAR é de 3.4 mesmo com 10 jogos a menos que seus rivais, então Kipnis seria sem dúvida um candidato válido à vaga. Pra uma AL que foi absurdamente fraca em 2Bs ano passado tirando Cano, é uma safra muito boa.

Menções honrosas: Robinson Cano, New York Yankees; Jason Kipnis, Cleveland Indians.


Shortstop: Yunel Escobar, Tampa Bay Rays (2.3 WAR, .251/.312/.367, 8.3 UZR)

Essa era uma corrida entre três jogadores: Escobar, Jed Lowrie e Jhonny Peralta. Peralta seria a escolha lógica pelo WAR (2.7) e seus números ofensivos superiores (wRC+ 121, o mesmo de Lowrie), mas Peralta deve ser suspenso muito em breve pelo uso de PEDs ligado ao escândalo da Biogenesis (um pouco suspeito esse salto de produtividade pra um shortstop de 31 anos com um wRC+ de 88 ano passado, não?) e deve regredir grosseiramente seu BABIP de infinito (.385) que não é sustentado por nenhuma métrica. E como Lowrie é um defensor horrendo, acabei escolhendo Escobar pela sua defesa (8.3 de UZR o qualifica como melhor shortstop defensivo da MLB não chamado Andrelton Simmons) e pelo fato de que, depois de um primeiro quarto horrendo de temporada no bastão, seus números subiram recentemente para patamares aceitáveis. Escolha difícil mas, novamente, com tantos bastões nesse time, um pouco de defesa no infield é algo importante.

Menções honrosa: Jhonny Peralta, Detriot Tigers; Jed Lowrie, Oakland Athletics

Third Baseman: Miguel Cabrera, Detroit Tigers (6.0 WAR, .365/.458/.674)

Sabia que, dos 12 melhores jogadores da MLB em WAR, quatro são 3B da American League (cinco do Top20)?? Essa posição é incrivelmente profunda na AL, e mesmo assim Miguel Cabrera continua supremo na posição. Pense assim: Só pelo que ele fez até ano passado provavelmente já seria um Hall of Famer, e ele ainda está tendo a melhor temporada da sua carreira! Ele lidera a AL em aproveitamento, em OBP e segundo em slugging e, embora seja o pior jogador defensivo de toda a MLB, lidera com muita folga a MLB em wRC+ (204) e WAR. Então mesmo com a incrível quantidade de talentos pra essa posição, não tem como NÃO dar essa vaga pro Miguelito. Ele está simplesmente em um outro nível como rebatedor mesmo com Chris Davis por ai. E btw, é um crime Josh Donaldson não ter sido um All-Star reserva)

Menções honrosas: Evan Longoria, Tampa Bay Rays; Josh Donaldson, Oakland Athletics; Manny Machado, Baltimore Orioles.

Outfielders: Mike Trout, Los Angeles Angels (5.7 WAR, .322/.399/.565); Jacoby Ellsbury, Boston Red Sox (3.5 WAR, .305/.368/.422, 8.7 BsR); Colby Rasmus, Toronto Blue Jays (3.5 WAR, .263/.332/.484, 10.0 UZR).

Escolhendo outfielder sem ligar para posição, Trout, Ellsbury e Rasmus são de longe os que mais se destacaram na temporada, embora criminosamente Ellsbury tenha sido deixado de fora do All-Star Game também apesar de liderar toda a MLB em BsR (corridas geradas com as pernas). Trout é o único jogador da MLB que está no mesmo nível de Miguel Cabrera como jogador (ele foi assaltado do MVP ano passado, inclusive), um dos melhores rebatedores da MLB que ainda causa estragos com as pernas como poucos outros (apesar de sua defesa ter piorado essa temporada), então não deve existir qualquer dúvida que ele merece ser o leadoff hitter desse time. Mas os outros dois tem sido criminalmente underrated essa temporada: mesmo perdendo o poder mostrado em 2011, Ellsbury ainda tem sido um dos monstros mais completos da MLB causando estragos rebatendo, correndo e defendendo; e embora Rasmus seja um jogador que produz muitos outs, ele tem um poder impressionante e tem sido o melhor defensor de outfielder da AL. Eu considerei Jose Bautista pra esse OF pra aumentar seu poder no bastão, mas seu WAR (3.0) é consideravelmente menor que o dos demais e seus números ofensivos estão muito pouco melhores do que os de Rasmus.

Menções honrosas: Jose Bautista, Toronto Blue Jays; Brett Gardner, New York Yankees; Desmond Jennings, Tampa Bay Rays; Adam Jones, Baltimore Orioles.

Designated Hitter: David Ortiz, Boston Red Sox (2.8 WAR, .317/.402/606)

Ortiz é o quarto melhor rebatedor da AL depois de Miggy, Trout e Davis, redefiniu a posição de DH e foi o símbolo dela na AL por quase 10 anos. Tem como ser outra pessoa? Não. Sem chance. Zero.

Menção honrosa: Raul Ibanez, Seattle Mariners

Pitcher: Felix Hernandez, Seattle Mariners (4.1 WAR, 2.53 ERA, 2.66 FIP)

Outra decisão extremamente difícil entre King Felix e Max Scherzer. Felix lidera a AL em FIP e WAR à frente de Scherzer, ,as ambas são por diferenças extremamente pequenas: 2.68 FIP e 4.0 WAR pra Scherzer, embora o xFIP de Felix seja 2.71 contra 2.88 de Max. Então aqui é realmente um cara ou coroa pra escolher qual o melhor dos dois. Eu escolhi Felix por um simples motivo: Ele arremessou mais entradas, e isso é um fator extremamente underrated. Os primeiros 90 jogos da temporada foram melhores pra Felix que pra Scherzer, e por isso ele será meu titular. Por um fio, mas enfim

Menções honrosas: Max Scherzer, Detroit Tigers; Chris Sale, Chicago White Sox; Derek Holland, Texas Rangers.


National League All-Star Team

Catcher: Yadier Molina, Saint Louis Cardinals (4.2 WAR, .341/.386/.489)

Esse é outro debate ingrato: Molina ou Buster Posey? Posey é muito melhor ofensivamente (162 wRC+ contra 145 de Molina), e Molina é melhor defensivamente (embora UZR não seja uma boa medida para medir catchers defensivamente). Essa é difícil porque eu realmente acho Posey o melhor jogador e acho que teve o melhor começo de temporada (os WARs idênticos dos dois, 4.2, se deve ao fato do UZR de Posey ser -2.6 e o 6.2 de Molina), mas se a idéia é seguir pelos números, os dois estariam iguals e Molina ganha a dianteira pelos critérios de desempate que tenho usado até aqui: Ele é melhor defensivamente, e é o melhor jogador do melhor time da AL. Então vamos de Molina.

Menções honrosas: Buster Posey, San Francisco Giants; Russell Martin, Pittsburgh Pirates.

First Baseman: Paul Goldschmidt, Arizona Diamondbacks (4.2 WAR, .313/.395/.557)

Goldschmidt seria meu 1B titular do "Grandes jogadores que ninguém repara All-Stars". Ele tem sido espetacular desde o começo do ano, tem 21 HRs no All-Star Break e ainda tem sido muito bom defensivamente, o que o separa de seu maior concorrente, Joey Votto, um melhor jogador ofensivo que não tem mostrado a mesma capacidade com a luva. Goldschmidt é daqueles jogadores que deveriam ser um no-brainer pra ser titular e rebater em terceiro no All-Star Game mas que as pessoas insistem em não reparar. Fico com muita pena do Votto ficar de fora desse time, mas a temporada de Goldschmidt está sendo espetacular.

Menção honrosa: Joey Votto, Cincinatti Reds.

Second Baseman: Matt Carpenter, Saint Louis Cardinals (4.3 WAR, .321/.394/.497)

Yeah, yeah, eu sei, Carpenter não é o 2B de tempo integral, um jogador que joga em várias posições de acordo com a necessidade da equipe. Mas ele vai ser o 2B titular da NL por dois motivos. Primeiro, seu wRC+ de 151 e seu WAR de 4.3 o colocam como um dos melhores jogadores de toda a MLB em 2013, e ele precisa estar nesse All-Star Team, e como as outras duas posições que ele joga (3B e OF) estão lotadas de bons candidatos, esse é o melhor encaixe pra ele. Além disso, a NL está muito carente de bons 2Bs, apenas outros passam os 2.0 de WAR e nenhum deles passa de 2.2 além de Carpenter. Então arrumamos lugar no time para um dos melhores jogadores da temporada e cobrimos uma necessidade. Done and done.

Mençoes honrosas: Brandon Phillips, Cincinatti Reds; Marco Scutaro, San Francisco Giants.

Shortstop: Troy Tulowitzki, Colorado Rockies (3.5 WAR, .332/.400/.608 em 60 jogos)

Esse é mais complicado, mas por outro motivo. Ian Desmond lidera os SS da NL em WAR com um bom 3.6 em 94 jogos. Mas ele estaria virtualmente empatado com Everth Cabrera se o segundo tivesse ficado saudável. Enquanto isso, Troy Tulowitzki teve um WAR quase identico de 3.5 em apenas 60 jogos, sendo de longe o melhor rebatedor do grupo (wRC+ de 160) além de ser um defensor superior para a posição. Embora Tulo tenha saido dos jogadores "qualificados" por conta da sua lesão, ele vai ser o titular aqui porque foi em 60 jogos um shortstop melhor do que qualquer outro da MLB inteira foi em 95. Se achar que a lesão longa de Tulo o tira de qualificação, o que é justo, então deem o lugar para Desmond, que também está tendo uma temporada fantástica tanto rebatendo como defendendo e correndo e merece reconhecimento.

Menções honrosas: Ian Demond, Washington Nationals; Jean Segura, Milwaukee Brewers; Everth Cabrera, San Diego Padres;

Third Baseman: David Wright, New York Mets (4.9 WAR, .304/.396/.507)

Wright lidera a NL em WAR e o jogo é no seu estádio. Como Wright NÃO estaria aqui? Não é culpa dele que o Mets seja uma droga, ele tem sido o melhor jogador da NL nessa primeira parte da temporada, um dos melhores jogadores all-around da MLB e que ainda joga numa posição carente de depth na NL. Muito fácil.

Menção honrosa: Pedro Alvarez, Pittsburgh Pirates.

Outfielders: Carlos Gomes, Milwaukee Brewers (4.6 WAR, .296/.336/.534, 12.3 UZR); Carlos Gonzalez, Colorado Rockies (4.5 WAR, .302/.370/.610); Andrew McCutchen, Pittsburgh Pirates (4.3 WAR, .302/.376/.471).

Holy crap, olha esse grupo de outfielders, três dos Top10 WARs da MLB inteira. Por algum motivo, seja ele falta de pedigree ou simplesmente porque seu time está uma droga, a temporada espetacular do Carlos Gomes (mais um hitter a dar um salto aos 27 anos - Chris Davis é o outro dessa lista) está passando desapercebida, mas seus números são reais: ele é o segundo melhor OF defensivo da MLB (atrás de Gerardo Parra), uma ameaça pra roubar bases, e embora ainda faça um pouco de outs demais, ele compensa com sobras com boa taxa de contato e um poder bastante acima da média. Os outros dois são figuras mais tradicionais, o brilhantismo all-around de McCutchen com o poder no bastão espetacular de Carlos Gonzalez, cujos números ofensivos são espetaculares mesmo ajustando para o Coors Field, o mais favorável a rebatedores da MLB (é o segundo em wRC+ entre OFs atrás de Trout). Esse trio oferece tudo: defesa (UZR combinado de 24,3), baserunning (13,1 combinado de BsR), rebatidas pra contato, OBP, força... Espetacular.

Menções honrosas: Starling Marte, Pittsburgh Pirates; Gerardo Parra, Arizona Diamondbacks; Shin-Soo Choo, Cincinatti Reds; Hunter Pence, San Francisco Giants.

Designated Hitter: Buster Posey, San Francisco Giants (4.2 WAR, .325/.395/.536)

Me doeu muito deixar um dos meus jogadores favoritos, Joey Votto, de fora desse time: ele é uma máquina de OBP que lidera a MLB em Walk% (16.6%, um numero obsceno) e é o segundo melhor rebatedor de toda a NL, caindo em WAR pelas deficiências defensivas (pequenas, mas o suficiente pra deixá-lo abaixo da media defensivamente pra temporada). O problema é que o melhor rebatedor da NL - o único acima de Votto - está brigando com ele por essa vaga, e Buster Posey é simplesmente um fenômeno no bastão, um jogador com excelente contato que sabe trabalhar contagens, chegar em base e tem mostrado mais poder que Votto até aqui mesmo jogando no pior estádio pra rebatedores da MLB. É bem provável que Votto ainda esteja sentindo a lesão que o tirou de grande parte da temporada passada, visto que seus números (particularmente os de força) cairam consideravelmente desde o ano passado, mas com o que vimos até aqui, não tem como justificar deixar Posey de fora desse time.

Menções honrosas: Joey Votto, Cincinatti Reds; Michael Cuddyer, Colorado Rockies.

Pitcher: Adam Wainwright, Saint Louis Cardinals (4.6 WAR, 2.45 ERA, 2.23 FIP) 

Espetacular disputa entre Wainwright, Matt Harvey e Clayton Kershaw por essa vaga. Wainwright ganha uma mínima vantagem sobre Harvey apesar de ter um FIP menor (2.23 contra 2.17 de Harvey) por ser um pitcher mais eficiente: seu Strikeout-to-walk ratio é quase obsceno (acima de 8) e arremessou quase 17 entradas a mais que Harvey por precisar de menos arremessos pra avançar nas entradas, o que explica a diferença de WAR (4.6 contra 4.2) - além de Harvey arremessar em um lugar mais favorável a arremessadores, mas enfim. Qualquer um dos dois é um candidato digno aqui, embora Wainwright tenha tido uma temporada um pooouco melhor até aqui.

Menções honrosas: Matt Harvey, New York Mets; Clayton Kershaw, Los Angeles Dodgers.

quarta-feira, 1 de agosto de 2012

Baseball e as estatísticas

Vamos dar um passeio pelo livro que começou a mudar a história do baseball


Pra quem não sabe, fizemos algum tempo um post aqui no blog chamado "As regras do Baseball". A ideia era simples: Apresentar não só as regras de um jogo de baseball, mas também o funcionamento de uma partida, para que alguém que nada conhecesse do esporte pudesse assistir a uma partida e pelo menos entender o que estava acontecendo. Entender o que era marcado e o papel de cada jogada ou jogador em campo. E, pra mim, o post cumpriu essa finalidade.

No entanto, como eu sempre digo, baseball as vezes pode ser um pouco chato de assistir, especialmente um jogo inteiro. Mas ele tem uma grande vantagem: Ele pode ser medido, mais eficientemente do que qualquer outro esporte, em estatísticas. O baseball, de certa forma, é um esporte individual disfarçado de esporte coletivo, e tem as estatísticas capazes de medir com uma precisão absurda tudo que acontece num campo de baseball. Se você me mostrar as estatísticas de um jogo de NBA, é possível ter uma boa noção de como esse jogador joga... Mas isso não diz tudo. Tem muita coisa que eu preciso assistir pra poder entender, porque cada jogador afeta a partida de formas que nenhum número capta. Se for uma estatística de futebol americano, me diz ainda menos - sabia por exemplo que 50% dos Quarterbacks que passam de 300 jardas perdem o jogo? Mas no baseball não, se eu souber olhar os números corretos, eu sei interpretar de forma muito eficiente praticamente todas as formas como um jogador afetou o jogo e no que ele é capaz de colaborar para um time.

Um dos motivos disso acontecer é que a temporada regular da MLB é absurdamente grande (162 jogos), e portanto a amostra dos dados também é absurdamente grande, nos dando assim dados amostrais com variância muito menor. Hmm, não entendeu? Ok, deixa eu elaborar. Por exemplo, Ted Williams uma vez teve uma temporada com .420 de aproveitamento no bastão (42,0%, pros leigos), e ninguém chegou perto disso desde então (foi lá por 1942). Mas em uma série de 7 jogos de playoffs, já tivemos jogadores rebatendo coisas como .667 (66,7%). Porque? Porque esse ritmo que está muito acima do normal pode ser mantido por 7 jogos, mas nunca por 162. Com um numero enorme de jogos, as estatísticas tendem a regredir para sua média verdadeira. E mesmo assim, as estatísticas do baseball são tão boas (e o esporte tão propício a isso) que são capazes até de medir quando uma estatística está fora do seu número "correto", ou quando um jogador deve sofrer uma "regressão" em determinada categoria. Isso vai fazer 257% mais sentido quando chegarmos na parte de estatísticas dos arremessadores.

Então o objetivo desse post é continuar de onde paramos no antigo: Se antes ensinamos a acompanhar o jogo, como ele funciona e o que acontece dentro de campo, agora vou mostrar um pouco das estatísticas usadas no baseball, o que significa cada uma e como interpretá-las (e também como essa avaliação mudou ao longo dos anos, mas sem aprofundar demais pra não ficar chato). Dividi essas estatísticas em quatro tipos, dependendo do que elas são usadas para medir: Ataque, defesa, arremesso e geral. Isso vai fazer sentido em alguns parágrafos. (By the way, estou considerando que se você está lendo esse post, então você conhece o básico do jogo de baseball, como Home Runs, Walks, Strikeouts e tudo mais - o que pode ser alcançado lendo o post linkado lá em cima. Algumas explicaçōes adicionais serão dadas ao longo do post).

Ah sim, eu acrescentei uma pequena seção antes disso para explicar um pouco da história das estatísticas avançadas - chamada Sabermetrics - e sua aplicação na MLB. Se não tiver interesse, pode pular pra seção de Estatísticas de Ataque direto que não tem problema.


Moneyball e as estatísticas avançadas

Quem já viu o filme (ou melhor ainda, leu o livro) Moneyball - um dos meus favoritos - sabe que, até o Oakland Athletics do GM Billy Beane começar a usar estatísticas e números para avaliar o verdadeiro valor dos jogadores para o time (e usar isso para descobrir quais eram os atributos que mais contribuiam para a vitória e que eram menos valorizados pelo mercado, o segredo do time para montar equipes competitivos com o segundo time mais pobre da Liga em uma MLB sem teto salarial mesmo perdendo seus melhores jogadores quase todo ano para times que pagavam mais) lá pelo ano 2000, a avaliação de jogadores - seja pra Draft, seja para negociar salários, seja para trocas/contrataçōes, whatever - ainda era extremamente primiva. Essa avaliação era baseada nas mesmas estatísticas usadas desde 1900 (A velha historia do "Sempre foi feito asim!") e com base no "conhecimento empírico" dos envolvidos, um conceito bem arrogante dos GMs, olheiros, técnicos e afins mais influentes na Liga, em geral ex-jogadores ou pessoas criadas nos meios do baseball. Eles simplesmente "sabiam" por causa dos seus "conhecimentos do esporte" e "experiência". Depois perguntam porque o baseball sempre foi o esporte com mais busts...

Mas o engraçado é, as estatísticas (mais elaboradas, muitas vezes com sua importância determinada a partir de regressōes econométricas) usadas como forma predominante de avaliar jogadores e o jogo em si já existiam desde o final de 1970, quando o agora lendário Bill James - um cidadão comum que simplesmente gostava de basquete - começou a compilar estatísticas e interpretá-las a cada temporada, evoluindo cada vez mais nas estatísticas e análises, muitas vezes se beneficiando do crescente poder tecnológico à sua disposição (Vocês vão entender quando chegarmos no UZR). E isso acabou virando uma grande tendência... Entre os fãs! Essas novas estatísticas e interpretaçōes foram amplamente adotadas por - wait for it... - jogadores de fantasy (!) e entusiastas ao redor do país, amplamente discutidas... Mas os dinossauros que compunham a cartolagem da MLB continuavam ignorando essas tendências como "subversivas" ou "não se comparam à experiência de anos de prática", ou até mesmo a minha favorita, "os números tentam destruir a pureza do jogo". Enquanto eles continuavam usando os metodos primitivos para avaliar jogadores de forma menos eficiente do que os fãs, o GM do pobre Athletics decidiu aplicar isso para construir seu time que não tinha direito.

Se funcionou? Bem, o segundo time mais pobre da Liga (e segundo menor folha salarial) teve o melhor record da temporada regular por três anos consecutivos, o Red Sox foi campeão em 2004 após adotar o mesmo modelo, e desde então todos o adotam. Eu diria que sim, e por isso eu estou fazendo esse post.


Estatísticas de ataque
Principais estatísticas: OBP, SLG%, OPS, OPS+, wRC+

Antes de surgir o Moneyball e revolucionar como olhamos pras estatísticas que medem a produtividade dos jogadores no bastão, apenas três estatísticas eram observadas de verdade: Média de rebatidas (Identificada por Avg.), Home Runs (HRs) e corridas impulsionadas (RBIs).

(Um pouco de paciência aqui, vou dar umas voltas pra chegar nas estatísticas novas a partir das velhas, pra poder explicar de forma mais intuitiva pra quem não conhece tanto o esporte. Se tiverem sem paciência, sigam os negritos. A partir da próxima seção vou acelerar um pouco mais)

Essas três estatísticas são na verdade bem simples. Avg. é uma estatística que era usada para medir o aproveitamento de um jogador como rebatedor. Ou seja, você pega o número total de rebatidas de um jogador, e divide isso pelo total de vezes que ele foi ao bastão e ou tentou a rebatida ou foi eliminado por três strikes (o chamado Strikeout). Essa medida leva em consideração apenas as vezes que o rebatedor foi ao bastão e teria acontecido uma chance de rebatida, descartando portanto quando o jogador chega em base por um Walk, considerado uma falta do arremessador, e nesse caso o rebatedor não teria tido a "chance" de rebater. Então se eu rebato 100 bolas e em 30 delas eu consigo chegar em base sem um erro dos adversários (já vamos explicar na proxima seção os erros), seja uma rebatida simples, dupla, tripla, Home Run, o que quer que seja, então meu Avg. é .300, ou 30%.

O Home Run é mais simples, é o número de vezes que você rebateu um HR e ponto. Essa estatística era usada pelos times pra medir a força de um jogadores, já que o Home Run é a rebatida de mais "força" de um jogo, que anota mais corridas e que gera mais bases ao rebatedor (quatro).

Por fim, o RBI é a estatística mais estúpida da história do baseball. Basicamente, ele mede quantas vezes um dado rebatedor, ao rebater, fez uma corrida ser anotada. Por exemplo, um jogador vai ao bastão e tem um companheiro na segunda base. Esse rebatedor da uma rebatida simples, e o seu companheiro consegue correr até o home plate e anotar uma corrida. Assim o rebatedor ganha um RBI, pois sua rebatida fez uma corrida ser anotada. Se esse rebatedor conseguisse um Home Run, por exemplo, ele ganha dois RBIs: Um pela corrida anotada pelo companheiro em base, e outra pela corrida que ele anotou ele mesmo, ambas por causa da sua rebatida. Acho que eu não preciso explicar porque essa estatística realmente não diz nada, certo? Ela depende demais da produção dos seus companheiros! Se dois jogadores que joga em times diferentes e rebatem na mesma posição do lineup tem exatamente os mesmos números, um deles podem ter o dobro de RBIs do outro simplesmente porque seus companheiros chegam muito em base e portanto as rebatidas desse jogador impulsionarão mais corridas do que a do outro. Mas isso de forma alguma reflete a produção de um jogador individual, embora fosse usada como uma medida de produtividade. Eu digo que as estatísticas antigas eram estúpidas, mas enfim...

Bem, acontecem que o peso enorme que se dava para Avg. e HRs não refletia, de forma alguma, o quanto um jogador contribui para a vitória de um time.

Concentrando primeiro na questão do aproveitamento dos jogadores, os estatisticos começaram a fazer regressōes envolvendo diversos aspectos do jogo e chegaram a uma simples conclusão: Que no ataque, o mais importante era evitar ter jogadores eliminados. Isso faz todo o sentido do mundo. Baseball não é um esporte medido por tempo, como basquete ou futebol, e sim por eliminaçōes. Um jogo acaba quando um dos times tem 27 eliminados (3 a cada uma das 9 entradas, tirando prorrogaçōes e afins), e portanto evitando eliminaçōes, você mantém seu time no jogo por mais tempo para anotar mais corridas.

Considere agora o seguinte cenário: Dois jogadores, A e B, que foram ao bastão 100 vezes. Jogador A rebateu todas essas bolas, e 30 delas viraram rebatidas. Jogador B rebateu 80 delas bolas e conseguiu 20 rebatidas válidas, mas nas outras 20 vezes que foi ao bastão ele trabalhou a contagem, evitou a eliminação, não rebateu bolas ruins, e conseguiu vinte Walks. Portanto, o jogador B foi eliminado menos vezes e chegou mais em base, sendo assim mais útil para seu time. Mas os números nos indicariam que jogador A teve .300 de aproveitamento e o jogador B teve .250 (lembrando que, para Avg., Walks não são computados como idas ao bastão), e portanto seria concluido - erroneamente - que o jogador A foi um rebatedor mais eficiente que o jogador B. E isso estaria errado, porque o jogador A foi eliminado 70 vezes e o jogador B foi eliminado apenas 60.

E aí ficou claro que a estatística de Avg., ainda que mostrasse como um jogador era capaz de conseguir rebatidas, isso não era exatamente a melhor coisa para o time. Para um time vencer, era muito mais importante o quanto o jogador chegava em base - e portanto evitava eliminaçōes. Por isso, uma nova estatística começou a aparecer como uma medida mais eficiente do que a antiga Avg., a chamada On Base Percentage (OBP), que mede exatamente isso: De todas as vezes que um jogador subiu ao bastão, em quantas ele chegou em base, seja por rebatida ou por walk. Usando o exemplo anterior, o jogador A teria um OBP de .300, enquanto o jogador B teria um OBP de .400. Então os números me diriam algo diferente: O jogador A era melhor conseguindo rebatidas, mas o jogador B era mais eficiente no bastão porque sabia chegar em base e evitar eliminaçōes. OBP, portanto, é um indicador melhor de eficiência no bastão do que Avg.

Mas tem uma outra coisa a ser levada em conta, que é a força dos jogadores. Se dois jogadores conseguem 10 rebatidas em 30 tentativas, só que um deles rebate 10 Home Runs e o outro 10 rebatidas simples, ambos teriam o mesmo aproveitamento e o mesmo OBP, mas o primeiro teria sido um jogador muito mais importante pro seu time. Por isso Home Runs é uma boa medida de força, certo?

Hmm, não. Imagine o seguinte cenário: Jogadores A e B, cada um foi ao bastão 150 vezes e teve 50 rebatidas. O jogador A acertou 10 Home Runs, e o jogador B acertou 5 HRs e mais 20 rebatidas duplas. Ambos teriam o mesmo aproveitamento e o OBP, mas o jogador A teve mais Home Runs... Mas será que sua força ao rebater 10 HRs foi mais útil do que a força do jogador B, que rebateu apenas 5 Home Runs mas teve outras 20 rebatidas duplas? Por isso foi criada uma medida chamada Slugging Percentagem (SLG%), que é calculada como o Avg, mas com uma diferença: Ao invés de dividirmos o número de rebatidas pelo número de at bats, dividimos o número de bases que esse jogador conseguiu com suas rebatidas. Portanto cada rebatida simples ganha 1 base, rebatidas duplas ganham 2 bases, triplas 3 bases, e Home Runs ganham quatro bases. Essa estatística serve pra mostrar a habilidade do jogador para rebater pra ganhar bases (portanto não faz sentido incluir walks), e no nosso exemplo, teriamos que o jogador A ganhou 80 bases em 150 rebatidas (.533) e o jogador B ganhou 85 para um SLG% de .567. Portanto, o jogador B rebateu por força melhor que o jogador A, apesar de ter tido menos Home Runs.

Agora temos duas medidas eficientes pra medir o valor de um jogador no bastão: OBP pra medir a capacidade do jogador pra chegar em base e evitar eliminaçōes, e SLG% pra medir a produção de bases extras desse jogador. Como podemos combinar, portanto, essas duas coisas em uma só? Somando as duas, é claro! Surgiu assim a chamada On Base Plus Slugging (OPS) que é simplesmente a soma da OBP com a SLG% de um jogador. Portanto se um jogador tem um OBP de .350 e um SLG de .550, seu OPS será um bom .900. Essa medida tem falhas (ja vamos chegar nelas), mas é uma medida simples, fácil e eficiente de medir como o jogador é capaz de conseguir as duas coisas mais importantes pra um ataque: Chegar em base, e conseguir rebatidas extras.

Também temos o On Base Plus Slugging Ajustado (OPS+), cujo cálculo é muito difícil pra explicar em detalhes, mas que corrige os três últimos problemas do OPS simples: Os jogadores rebatem em campos com dimensōes diferentes, e portanto isso influenciar (e influencia bastante) os números de um jogador (quem rebate em um campo menor tem maior facilidade em rebater Home Runs, por exemplo) na hora de conseguir rebatidas; .100 em SLG% e .100 em OBP não significam a mesma coisa para um ataque em termos de contribuição, mas no OPS elas são tratadas com o mesmo peso (estudos mostram que OBP tem um peso entre 2 e 3 vezes maior do que SLG%. Vale citar também, porém, que o máximo que pode se ter em OBP é 1.000 - chega em base a cada vez que vai ao bastão - mas o máximo que se pode ter em SLG% é 4.000, conseguindo quatro bases - ou HRs - cada vez que rebater); e por fim, a dificuldade de usar OPS para comparar jogadores de diferentes eras, principalmente por causas nas diferenças no jogo (e sim, especialmente a era dos esteroides). Portanto, OPS+ usa o OPS normal, msa com pesos diferentes para SLG% e OBP e com um termo de ajuste para estádio e para o resto da Liga naquela temporada. É uma fórmula mais complicada, mas mais precisa que OPS, pra medir o valor individual de um jogador como rebatedor.

Por fim, foi criada uma estatística chamada Weighted Runs Created Ajustada (wRC+). Essa estatística é uma forma de aperfeiçoar o OPS+, mas utiliza os mesmos princípios: ela considera os dois fatores mais importantes de um rebatedor, capacidade de chegar em base e de conseguir rebatidas extras, combina esses dois fatores, e ajusta para todo tipo de fator externo (como estádio, por exemplo). Para finalizar, a estatística ainda é ajustada com base no resto da liga, tendo o mesmo efeito do OPS+ para comparar diferentes eras, se tornando assim um indicador sobre quantas corridas um jogador gerou com seu bastão relativo ao "médio" na liga. Então sendo 100 a "média" de qualquer normalização, se um jogador termina a temporada com wRC+ de 150, isso significa que ajustando para o estádio no qual jogou metade de seus jogos, ele gerou 50% a mais de corridas do que um jogador médio na liga. Da mesma forma, se ele teve um wRC+ de 80, ele foi 20% menos produtivo no bastão do que um jogador comum. É a forma mais condensada e avançada para medir, em um vácuo, a produção no bastão de um jogador em comparação com o resto da MLB.


Estatísticas de defesa
Principal estatística: UZR

Se você acha que as estatísticas usadas antigamente (ou nem tão antigamente por GMs) pra medir a eficiência ofensiva dos jogadores era primitiva, esperem até ver essa aqui. Ate Bill James, a única estatística defensiva que existia eram os chamados Erros.

Muito simplesmente, um Erro é quando um jogador comete algum erro que resulta em uma vantagem para o adversário, seja um jogador que deveria ser eliminado e não foi, um errou de lançamento que resultou em uma base extra para um jogador, etc. Por exemplo, se eu rebato a bola para o Shortstop de forma que ele possa me eliminar antes de chegar na primeira base, mas o shortstop fura a bola e eu consigo chegar em base, ele cometeu um erro (e isso não conta como rebatida válida para mim). Se eu consigo uma rebatida simples, mas na hora de jogar a bola de volta o RF lança a bola longe e eu consigo correr até a segunda base (o que eu não conseguiria se ele não errasse o arremesso), conta como uma rebatida simples pra mim e um erro do RF. E por ai vai.

Ok, por onde eu começo a falar dos problemas dessa estatística?? Primeiro, ela é extremamente subjetiva, quem determina o que "deveria" ter acontecido é o juiz da mesa, e ele que vai portanto interpretar se a jogada foi um erro, merito do rebatedor, e por ai vai. Duas pessoas podem interpretar diferente o mesmo lance, e por ai vai. Mas segundo e muito mais importante, ela é extremamente limitada! Se você cometeu um erro, é porque estava na bola no primeiro lugar, então você tem algum mérito por isso. Eu posso ter feito uma excelente jogada, lido perfeitamente a rebatida, me movimentado numa velocidade sobre humana pra chegar numa bola... Só que na hora que eu pulei pra pegar a bola e fazer a eliminação, a bola bateu na minha luva e caiu, e o juiz me deu um erro. Isso é extremamente injusto, pois com qualquer defensor da Liga alem de mim teria sido uma rebatida simples, mas por causa da minha habilidade superior, eu consegui chegar na bola... E fui penalizado por isso. Antigamente, os erros eram somados e quem cometia menos era o melhor defensor, mas imagine a seguinte situação: Numa temporada, dois RFs terminam com zero erros. Só que um deles é extremamente rapido, inteligente, chega em mais bolas do que nenhum outro jogador chega... E o outro é um gordão, lento e preguiçoso, que não comete erros simplesmente porque nunca chega em nenhuma bola por conta da sua falta de habilidade. Como você diferencia entre os dois? Como é possível saber, sem assistir a um jogo, qual o melhor defensor? Será que um jogador com mais erros as vezes não é um defensor melhor, e comete erros porque faz mais jogadas?

Por isso foi criado o Ultimate Zone Rating (UZR), a minha segunda estatística preferida depois de WAR, uma daquelas estatísticas que é extremamente difícil de calcular, mas extremamente precisa e extremamente fácil de entender. Para calcular o UZR, você divide o campo em 64 zonas e computa onde cada bola rebatida foi cair, com que velocidade e com que inclinação. E dai, a cada jogada que envolve um jogador defensivo, usasse essa base de dados pra ver qual foi o resultado da jogada envolvendo esse jogador em relação a todas as outras jogadas defensivas que envolveram essa bola sendo rebatida dessa forma para o mesmo lugar, e ve como essa jogada defensiva - em relação ao "normal" desse tipo de jogada - afetou as chances do adversário de anotar uma corrida.

Um exemplo pra ilustrar: Imagine que o primeiro rebatedor de um jogo sobe ao bastão. Nessa situação (nenhum eliminado, bases vazias), um time marca em média cerca de 0,5 corridas (não tenho o número exato aqui). Agora o primeiro rebatedor rebate a bola para o campo direito, com velocidade/ângulo e para um certo lugar onde, 95% das jogadas, ele é eliminado. No entanto, o RF estava desatento e saiu atrasado, permitindo que a bola passasse por ele para uma rebatida dupla. Nesse caso, o UZR computa para o RF a diferença entre o que aconteceu nos casos casos computados anteriormente (uma média ponderada entre todas as situaçōes, mas na grande maioria dos casos seria um eliminado e nenhum em base, e nessa situação um time anota em média 0,35 corridas) e o que aconteceu de fato (uma rebatida dupla - nessa nova situação, nenhum eliminado e um homem na segunda base, um time anota em média 1,2 corridas). Nesse caso, portanto, o jogador sairá da jogada com um UZR igual a 0,35 - 1,2 = - 0,85. Em outras palavras, defensivamente, esse RF custou ao time (estatisticamente) 0,85 corridas em relação a um jogador "médio".

Portanto, o UZR é dificil de calcular, mas bem fácil de interpretar: Ele representa o número de corridas que a defesa daquele jogador impediu (estatisticamente!) em relação a um jogador médio da mesma posição. Quando eu digo que o melhor defensor da MLB em 2011 é o Brendan Ryan com um UZR de 15,2, isso significa que ter Ryan no seu time ao invés de um Shortstop "médio" evitou que fossem marcadas 15,2 corridas contra o Mariners. Quando eu digo que o Curtis Granderson é o pior CF defensivo da MLB com um UZR de -15,9, é fácil entender que sua defesa é tão ruim que substituindo-o defensivamente por um CF médio teria evitado quase 16 corridas contra o Yankees. E por ai vai. Facil de entender, muito preciso e muito útil - eu realmente adoro essa estatística.


Estatísticas de arremesso
Principais estatísticas: ERA, BABIP, FIP

Tradicionalmente, arremessadores sempre foram medidos por uma estatística muito útil chamado ERA (e antigamente, bons arremessadores só eram bons se tivessem bolas muito rápidas - mais uma estupidez dogmática que faz a gente entender porque a MLB era a Liga que pior aproveitava talento nos EUA).

O ERA - Earned Runs Average - pega todas as Earned Runs (Quando um pitcher está arremesando e cede uma corrida, é computado uma Earned Run  A NÃO SER QUE essa corrida pudesse ter sido evitada, em algum momento, mas não foi por causa de um Erro da defesa - seja esse erro pra ele chegar em base, pra eliminar um terceiro jogador que teria encerrado a entrada antes dessa corrida, e por ai vai. Se for o caso, é uma Unearned Run, e não conta no ERA) cedidas por um pitcher, divididas pelo número de entradas arremessadas, multiplicadas por 9. Em outras palavras, mede quantas corridas um arremessador cede a cada nove entradas (ou um jogo completo) arremessado, e é uma boa medida de avaliar a produção de um pitcher até um dado momento.

Mas o ERA tem uma limitação: Ele mede apenas o que aconteceu, mas não separa exatamente o que nisso foi graças ao arremessador ou aos demais fatores. Dois pitchers exatamente iguais, mas um jogando com uma excelente defesa e outro jogando com uma defesa ruim, provavelmente vão ter ERAs diferentes mesmo se jogarem igualmente bem, porque a quantidade de corridas cedidas por um time certamente será menor quanto melhor for a defesa, mesmo que a ruim não cometa Erros. E além disso, tem o fator sorte: O quanto ela influencia na produção de um arremessador? E se, ao longo de uma temporada, essa sorte normalmente "zera" (mas nem sempre), quando ela vai mudar e como isso influencia o arremessador (quem joga fantasy sabe do que eu falo)?

Essa última de "sorte" parece um pouco forçada, não é? Então volte comigo pro final dos anos 90, quando um cara chamado Voros McCracken - um fã de baseball que brincava com estatísticas nas horas vagas - concluiu que tinha apenas três fatores em um jogo de baseball que o arremessador controlava: Home Runs cedidos, Walks, e Strikeouts (quando um jogador é eliminado com três strikes). Em outras palavras, ele concluiu que, sobre as bolas que os rebatedores colocavam em jogo (Home Run tecnicamente não entra em jogo), os arremessadores não tinham nenhum controle.

Parece um absurdo, certo? Afinal, grandes arremessadores, com grandes arremessos, deveriam ser capazes de segurar os adversários a um aproveitamento menor uma vez que a bola é colocada em jogo. A comunidade da MLB achou um absurdo sem tamanho, e mesmo a comunidade das Sabermetrics achou algo ridículo, e o próprio Bill James começou a coletar dados pra mostrar que Voros estava errado. Mas ele não estava. E foi aí que surgiu a estatística chamada BABIP - Bating Average for Balls in Play (Ou aproveitamento das rebatidas pras bolas em jogo). Os estudos de Voros - futuramente comprovados pela comunidade estatística - mostram que o valor dessa estatística (a proporção das bolas colocadas em jogo que efetivamente viram rebatidas) tende a ser praticamente igual pra todos os pitchers, geralmente em torno dos .300 (pitchers cujo jogo depende mais de bolas que caem - bolas de curva, sinkers, splitters, knucleball, etc - tendem a ter um BABIP um pouco mais baixo, mas nao tanto).  Ainda que as vezes tenhamos alguns pitchers com uma temporada acima ou abaixo dessa média, nunca isso se manteve ao longo das demais temporadas. Portanto, o BABIP é bem simples de interpretar: Se um pitcher está com um BABIP muito fora da curva, é porque a sorte tem interferido bastante nesse tipo de jogada - seja acima (tendo azar) ou abaixo (tendo sorte) do nível normal, isso indica que dificilmente o pitcher vá continuar com esse tipo de atuação por muito tempo.

Adição rapida sobre BABIP: Alguns fatores podem afetar o BABIP de um pitcher, principalmente a composição das suas eliminaçōes (eliminaçōes pelo chao, pelo ar, etc), então alguns sites tem um BABIP "projetado"ou "normal" para o pitcher de acordo com essa composição. Essas variaçōes não são enormes, mas podem afetar de forma significante em alguns casos mais extremos, então em alguns casos vale ver o BABIP "projetado" pra um pitcher ao invés de usar o da Liga como referencia. Exemplo rapido - Em 2009, Andy Pettitte teve um BABIP de .297 e Joel Pineiro um BABIP de .295. No entanto, examinando os tipos de rebatidas que eles induziam, Pineiro foi o principal pitcher da Liga eliminando jogadores por bola rasteira - que tem maior chance de eliminação - de forma que era normal que ele tivesse um BABIP mais baixo, de forma que ele possivelmente teve azar no ano. PEttite, ao contrario, eliminou mais jogadores por lineuots - que tem menor chance de eliminação - e portanto seu BABIP deveria ter sido acima do normal, de forma que ele provavelmente teve sorte em 2009.

Mas o BABIP explica apenas a parte da sorte nas bolas em jogo que o arremessador tem. Isso não é a única coisa que influencia o ERA de um arremessador. A defesa da equipe, por exemplo, tem um papel importante nisso. Por isso foi criado o FIP - Fielding Independent Pitching - que mede exatamente o que o nome sugere, o seu ERA uma vez removidas as influências da defesa e demais fatores (inclusive sorte) focando exatamente nas três coisas que um pitcher é capaz de controlar: Strikeouts, Walks e Home Runs. A conta é complicada e alguns centros ainda divergem no melhor método pra calcular o FIP, mas a interpretação é simples: Quanto seria, aproximadamente, o ERA de um pitcher levando em conta APENAS a sua performance individual, e não fatores como sorte ou defesa. Portanto se um pitcher está com um ERA de 3.30, você pode olhar e pensar "nossa, esse cara ta destruindo!"... Mas ai você ve que ele também está com um BABIP de .270 e um FIP de 4.4, e percebe que não é exatamente assim, e que ele tem tido uma boa ajuda tanto da sua defesa como da sorte e demais fatores que ele não controla, e provavelmente vai sofrer uma regressão conforme a temporada avança pois esses fatores tendem a nivelar. Da mesma forma, um pitcher com um ERA de 3.8 mas com um BABIP de .300 e um FIP de 3.7 tem um mérito individual muito maior que o outro, mas não tem sido tão ajudado.

Tangente rápida/curiosidade: Como voces devem ter percebido, isso é extremamente util quando se está jogando fantasy. Ano passado, Josh Beckett estava com um ERA de 2.10 e vindo de três one-hitters consecutivos lá pelo meio da temporada e meu amigo aproveitou isso pra pular pra primeiro na nossa Liga de fantasy baseball. Eu imediatamente liguei pra ele e avisei "Cara, troque Beckett agora pela melhor oferta que voce tiver (Albert Pujols e algum pitcher que eu não lembro) antes que ele mude de ideia!". Ele achou que eu estava louco ou zuando com a cara dele, mas eu tinha meus motivos: Beckett estava com um BABIP de .220 e um FIP de 3.1 praticamente gritando "REGRESSÃO!" na minha cara, enquanto que Pujols voltava de lesão devagar mas tava com um BABIP - não confiem em BABIP pra rebatedores a não ser em casos muito extremos, btw - abaixo de .200. e o pitcher que vinha junto na troca tinha um FIP respeitavel. Ele fez a troca, Beckett regrediu e não voltou a arremessar naquele nível, Pujols pegou fogo, e meu amigo ganhou a Liga de fantasy. A lição, como sempre: As vezes fãs realmente sabem mais que GMs, até em times de fantasy.


Estatísticas gerais
Principais estatísticas: VORP, WAR

Ok, estamos quase acabando. Agora que temos estatísticas eficientes para medir a produtividade e eficiência de jogadores em termos de arremessos, rebatidas e defesa, ta na hora de juntar tudo isso em uma só medida para a produtividade geral de um jogador num campo de baseball. E pra isso temos duas estatísticas principais, VORP e WAR.

Embora eu não seja muito fã de Value Over Replacement Player (VORP), algo como valor acima de um jogador substituto, por não levar em conta defesa, eu decidi colocar ela aqui por um simples motivo: Ela é precisa e é extremamente fácil de entender. Ela basicamente mede a capacidade de um jogador de produzir corridas (ou, no caso dos arremessadores, evitá-las) acima do que produziria um jogador de Replacement Level (Algo como "Nível de substituição"), que geralmente é definido como sendo entre 70 e 85% de um jogador médio daquela posição, com a porcentagem dependendo da posição. Portanto, se eu te digo que o VORP do Jose Bautista ano passado foi de 77, quer dizer que ele produziu 77 corridas a mais para o seu time no ataque (Rebatendo, chegando em base, correndo nas bases, tudo) do que um RF um pouco abaixo da média (no caso dos pitchers, o contrário, evitou X corridas a mais do que um arremessador assim). Simples, direto, leva em conta quase todos os aspectos relevantes (tirando defesa) como roubos de base, velocidade nas bases, jogos perdidos, etc e é bem fácil de entender, bom pra comparar jogadores... Pena que seja dificílimo calcular. Mas tudo bem, tem sites que calculam pra gente.

Então ok, VORP é uma boa estatística pra comparar jogadores. Mas mesmo assim, nao ganha de WAR - Wins Above Replacement. Outra estatística difícil de calcular, mas que pega o VORP e leva a um outro nível, incorporando defesa e qualquer outro aspecto presente no jogo de um determinado jogador e nos diz quantas vitórias um certo jogador da a um time sobre o famoso "Replacement Player". Ou seja, ele é mais preciso que o VORP porque o VORP é uma medida apenas ofensiva e o WAR mede todos os aspectos desse jogador e no que ele afeta o jogo, mas ao invés de nos dizer em corridas, nos diz em vitórias, mais fácil impossível. Portanto se ano passado Jose Bautista (8.3) foi o lider em WAR, isso quer dizer que se tirassemos ele do Jays e colocassemos no lugar um substituto um pouco abaixo da média da posição, o Jays teria 8.3 vitórias a menos, levando em conta ai também o quanto ele perdeu de jogos e tudo mais. E ela é minha favorita porque, se você pegar uma lista de WAR de uma temporada, vai ver que não necessariamente ela te da os melhores jogadores, mas te da os mais valiosos de uma forma as vezes sutil: Por exemplo, em 2009 o melhor WAR da Liga (8.6) foi do Ben Zobrist, acima dos MVPs Joe Mauer (8.1) e Albert Pujols (8.5). Apesar de Mauer e Pujols terem números ofensivos melhores, Zobrist (que também teve bons números ofensivos e um OBP quase ofensivo de .406) provavelmente foi mais valioso pra Tampa por dois motivos: Primeiro, ele não perdeu nenhum jogo na temporada inteira; e segundo, ele jogou em SETE posiçōes diferentes ao longo da temporada, passando a maior parte do tempo mudando entre 2B e RF... E teve um UZR positivo em todas elas, inclusive 15 e 10 em 2B e RF, respectivamente. Ele cobria qualquer buraco do time, e isso significava demais pra flexibilidade do time.

WAR tem apenas um pequeno problema: Como as duas Ligas possuem regras diferentes quanto ao DH, o WAR normaliza a AL e a NL de forma separada pra tirar essa diferença. O problema é que isso assume que o talento nos dois lados é aproximadamente igual... E quanto não é o caso e temos uma clara disparidade, fica um pouco difícil usar WAR pra comparar jogadores de diferentes Ligas - especialmente pitchers. Ainda assim, um problema pequeno pra uma estatística sensacional.


Resumo final

Ufa, ta acabando. Então vamos lá ver o que vimos hoje:

Principais estatísticas de ataque: OBP (Aproveitamento para chegar em base e evitar eliminaçōes), SLG% (Medida de força pra quantas bases um jogador consegue por rebatida), OPS (produtividade total no bastão), OPS+ (OPS ajustada por estádio, era e com pesos adequados) e wRC+ (medida condensada do valor de um jogador rebatendo, ajustado por era e estádio); são as medidas usadas pra verificar a produtividade de um jogador no bastão e como ele contribui assim para a equipe.

Principal estatística de defesa: UZR (Quantas corridas um jogador cede a menos defensivamente que um jogador "médio" na mesma situação) é usada pra medir a eficiência defensiva de um jogador.

Principais estatísticas de arremesso: ERA (Corridas cedidas por nove entradas), BABIP (Bolas em jogo que viram rebatidas) e FIP (ERA tirando tudo que não está no controle do arremessador); são usadas pra avaliar a produtividade real de um arremessador e o quanto ele tem sido ajudado por sorte e demais fatores além do seu controle.

Principais estatísticas gerais: VORP (Quantas corridas a mais - ou a menos - um jogador  - ou pitcher -gera para seu time em relação a um jogador de RL), WAR (Quantas vitórias um certo jogador te da acima de um jogador de RL); são usadas pra avaliar o valor total de um jogador a um determinado time.

Deu pra entender tudo? Espero que sim, porque deu um trabalho do cão. Foi mal se ficou muito longo, mas queria fazer o mais detalhado e intuitivo o possível pra quem está vendo isso pela primeira vez, e também pra servir caso alguém precise consultar os detalhes algum dia. Espero que tenham aproveitado e que se interessem mais agora por baseball e pelo que os números nos dizem. Até a próxima.