Some people think football is a matter of life and death. I assure you, it's much more serious than that.

quarta-feira, 1 de agosto de 2012

Baseball e as estatísticas

Vamos dar um passeio pelo livro que começou a mudar a história do baseball


Pra quem não sabe, fizemos algum tempo um post aqui no blog chamado "As regras do Baseball". A ideia era simples: Apresentar não só as regras de um jogo de baseball, mas também o funcionamento de uma partida, para que alguém que nada conhecesse do esporte pudesse assistir a uma partida e pelo menos entender o que estava acontecendo. Entender o que era marcado e o papel de cada jogada ou jogador em campo. E, pra mim, o post cumpriu essa finalidade.

No entanto, como eu sempre digo, baseball as vezes pode ser um pouco chato de assistir, especialmente um jogo inteiro. Mas ele tem uma grande vantagem: Ele pode ser medido, mais eficientemente do que qualquer outro esporte, em estatísticas. O baseball, de certa forma, é um esporte individual disfarçado de esporte coletivo, e tem as estatísticas capazes de medir com uma precisão absurda tudo que acontece num campo de baseball. Se você me mostrar as estatísticas de um jogo de NBA, é possível ter uma boa noção de como esse jogador joga... Mas isso não diz tudo. Tem muita coisa que eu preciso assistir pra poder entender, porque cada jogador afeta a partida de formas que nenhum número capta. Se for uma estatística de futebol americano, me diz ainda menos - sabia por exemplo que 50% dos Quarterbacks que passam de 300 jardas perdem o jogo? Mas no baseball não, se eu souber olhar os números corretos, eu sei interpretar de forma muito eficiente praticamente todas as formas como um jogador afetou o jogo e no que ele é capaz de colaborar para um time.

Um dos motivos disso acontecer é que a temporada regular da MLB é absurdamente grande (162 jogos), e portanto a amostra dos dados também é absurdamente grande, nos dando assim dados amostrais com variância muito menor. Hmm, não entendeu? Ok, deixa eu elaborar. Por exemplo, Ted Williams uma vez teve uma temporada com .420 de aproveitamento no bastão (42,0%, pros leigos), e ninguém chegou perto disso desde então (foi lá por 1942). Mas em uma série de 7 jogos de playoffs, já tivemos jogadores rebatendo coisas como .667 (66,7%). Porque? Porque esse ritmo que está muito acima do normal pode ser mantido por 7 jogos, mas nunca por 162. Com um numero enorme de jogos, as estatísticas tendem a regredir para sua média verdadeira. E mesmo assim, as estatísticas do baseball são tão boas (e o esporte tão propício a isso) que são capazes até de medir quando uma estatística está fora do seu número "correto", ou quando um jogador deve sofrer uma "regressão" em determinada categoria. Isso vai fazer 257% mais sentido quando chegarmos na parte de estatísticas dos arremessadores.

Então o objetivo desse post é continuar de onde paramos no antigo: Se antes ensinamos a acompanhar o jogo, como ele funciona e o que acontece dentro de campo, agora vou mostrar um pouco das estatísticas usadas no baseball, o que significa cada uma e como interpretá-las (e também como essa avaliação mudou ao longo dos anos, mas sem aprofundar demais pra não ficar chato). Dividi essas estatísticas em quatro tipos, dependendo do que elas são usadas para medir: Ataque, defesa, arremesso e geral. Isso vai fazer sentido em alguns parágrafos. (By the way, estou considerando que se você está lendo esse post, então você conhece o básico do jogo de baseball, como Home Runs, Walks, Strikeouts e tudo mais - o que pode ser alcançado lendo o post linkado lá em cima. Algumas explicaçōes adicionais serão dadas ao longo do post).

Ah sim, eu acrescentei uma pequena seção antes disso para explicar um pouco da história das estatísticas avançadas - chamada Sabermetrics - e sua aplicação na MLB. Se não tiver interesse, pode pular pra seção de Estatísticas de Ataque direto que não tem problema.


Moneyball e as estatísticas avançadas

Quem já viu o filme (ou melhor ainda, leu o livro) Moneyball - um dos meus favoritos - sabe que, até o Oakland Athletics do GM Billy Beane começar a usar estatísticas e números para avaliar o verdadeiro valor dos jogadores para o time (e usar isso para descobrir quais eram os atributos que mais contribuiam para a vitória e que eram menos valorizados pelo mercado, o segredo do time para montar equipes competitivos com o segundo time mais pobre da Liga em uma MLB sem teto salarial mesmo perdendo seus melhores jogadores quase todo ano para times que pagavam mais) lá pelo ano 2000, a avaliação de jogadores - seja pra Draft, seja para negociar salários, seja para trocas/contrataçōes, whatever - ainda era extremamente primiva. Essa avaliação era baseada nas mesmas estatísticas usadas desde 1900 (A velha historia do "Sempre foi feito asim!") e com base no "conhecimento empírico" dos envolvidos, um conceito bem arrogante dos GMs, olheiros, técnicos e afins mais influentes na Liga, em geral ex-jogadores ou pessoas criadas nos meios do baseball. Eles simplesmente "sabiam" por causa dos seus "conhecimentos do esporte" e "experiência". Depois perguntam porque o baseball sempre foi o esporte com mais busts...

Mas o engraçado é, as estatísticas (mais elaboradas, muitas vezes com sua importância determinada a partir de regressōes econométricas) usadas como forma predominante de avaliar jogadores e o jogo em si já existiam desde o final de 1970, quando o agora lendário Bill James - um cidadão comum que simplesmente gostava de basquete - começou a compilar estatísticas e interpretá-las a cada temporada, evoluindo cada vez mais nas estatísticas e análises, muitas vezes se beneficiando do crescente poder tecnológico à sua disposição (Vocês vão entender quando chegarmos no UZR). E isso acabou virando uma grande tendência... Entre os fãs! Essas novas estatísticas e interpretaçōes foram amplamente adotadas por - wait for it... - jogadores de fantasy (!) e entusiastas ao redor do país, amplamente discutidas... Mas os dinossauros que compunham a cartolagem da MLB continuavam ignorando essas tendências como "subversivas" ou "não se comparam à experiência de anos de prática", ou até mesmo a minha favorita, "os números tentam destruir a pureza do jogo". Enquanto eles continuavam usando os metodos primitivos para avaliar jogadores de forma menos eficiente do que os fãs, o GM do pobre Athletics decidiu aplicar isso para construir seu time que não tinha direito.

Se funcionou? Bem, o segundo time mais pobre da Liga (e segundo menor folha salarial) teve o melhor record da temporada regular por três anos consecutivos, o Red Sox foi campeão em 2004 após adotar o mesmo modelo, e desde então todos o adotam. Eu diria que sim, e por isso eu estou fazendo esse post.


Estatísticas de ataque
Principais estatísticas: OBP, SLG%, OPS, OPS+, wRC+

Antes de surgir o Moneyball e revolucionar como olhamos pras estatísticas que medem a produtividade dos jogadores no bastão, apenas três estatísticas eram observadas de verdade: Média de rebatidas (Identificada por Avg.), Home Runs (HRs) e corridas impulsionadas (RBIs).

(Um pouco de paciência aqui, vou dar umas voltas pra chegar nas estatísticas novas a partir das velhas, pra poder explicar de forma mais intuitiva pra quem não conhece tanto o esporte. Se tiverem sem paciência, sigam os negritos. A partir da próxima seção vou acelerar um pouco mais)

Essas três estatísticas são na verdade bem simples. Avg. é uma estatística que era usada para medir o aproveitamento de um jogador como rebatedor. Ou seja, você pega o número total de rebatidas de um jogador, e divide isso pelo total de vezes que ele foi ao bastão e ou tentou a rebatida ou foi eliminado por três strikes (o chamado Strikeout). Essa medida leva em consideração apenas as vezes que o rebatedor foi ao bastão e teria acontecido uma chance de rebatida, descartando portanto quando o jogador chega em base por um Walk, considerado uma falta do arremessador, e nesse caso o rebatedor não teria tido a "chance" de rebater. Então se eu rebato 100 bolas e em 30 delas eu consigo chegar em base sem um erro dos adversários (já vamos explicar na proxima seção os erros), seja uma rebatida simples, dupla, tripla, Home Run, o que quer que seja, então meu Avg. é .300, ou 30%.

O Home Run é mais simples, é o número de vezes que você rebateu um HR e ponto. Essa estatística era usada pelos times pra medir a força de um jogadores, já que o Home Run é a rebatida de mais "força" de um jogo, que anota mais corridas e que gera mais bases ao rebatedor (quatro).

Por fim, o RBI é a estatística mais estúpida da história do baseball. Basicamente, ele mede quantas vezes um dado rebatedor, ao rebater, fez uma corrida ser anotada. Por exemplo, um jogador vai ao bastão e tem um companheiro na segunda base. Esse rebatedor da uma rebatida simples, e o seu companheiro consegue correr até o home plate e anotar uma corrida. Assim o rebatedor ganha um RBI, pois sua rebatida fez uma corrida ser anotada. Se esse rebatedor conseguisse um Home Run, por exemplo, ele ganha dois RBIs: Um pela corrida anotada pelo companheiro em base, e outra pela corrida que ele anotou ele mesmo, ambas por causa da sua rebatida. Acho que eu não preciso explicar porque essa estatística realmente não diz nada, certo? Ela depende demais da produção dos seus companheiros! Se dois jogadores que joga em times diferentes e rebatem na mesma posição do lineup tem exatamente os mesmos números, um deles podem ter o dobro de RBIs do outro simplesmente porque seus companheiros chegam muito em base e portanto as rebatidas desse jogador impulsionarão mais corridas do que a do outro. Mas isso de forma alguma reflete a produção de um jogador individual, embora fosse usada como uma medida de produtividade. Eu digo que as estatísticas antigas eram estúpidas, mas enfim...

Bem, acontecem que o peso enorme que se dava para Avg. e HRs não refletia, de forma alguma, o quanto um jogador contribui para a vitória de um time.

Concentrando primeiro na questão do aproveitamento dos jogadores, os estatisticos começaram a fazer regressōes envolvendo diversos aspectos do jogo e chegaram a uma simples conclusão: Que no ataque, o mais importante era evitar ter jogadores eliminados. Isso faz todo o sentido do mundo. Baseball não é um esporte medido por tempo, como basquete ou futebol, e sim por eliminaçōes. Um jogo acaba quando um dos times tem 27 eliminados (3 a cada uma das 9 entradas, tirando prorrogaçōes e afins), e portanto evitando eliminaçōes, você mantém seu time no jogo por mais tempo para anotar mais corridas.

Considere agora o seguinte cenário: Dois jogadores, A e B, que foram ao bastão 100 vezes. Jogador A rebateu todas essas bolas, e 30 delas viraram rebatidas. Jogador B rebateu 80 delas bolas e conseguiu 20 rebatidas válidas, mas nas outras 20 vezes que foi ao bastão ele trabalhou a contagem, evitou a eliminação, não rebateu bolas ruins, e conseguiu vinte Walks. Portanto, o jogador B foi eliminado menos vezes e chegou mais em base, sendo assim mais útil para seu time. Mas os números nos indicariam que jogador A teve .300 de aproveitamento e o jogador B teve .250 (lembrando que, para Avg., Walks não são computados como idas ao bastão), e portanto seria concluido - erroneamente - que o jogador A foi um rebatedor mais eficiente que o jogador B. E isso estaria errado, porque o jogador A foi eliminado 70 vezes e o jogador B foi eliminado apenas 60.

E aí ficou claro que a estatística de Avg., ainda que mostrasse como um jogador era capaz de conseguir rebatidas, isso não era exatamente a melhor coisa para o time. Para um time vencer, era muito mais importante o quanto o jogador chegava em base - e portanto evitava eliminaçōes. Por isso, uma nova estatística começou a aparecer como uma medida mais eficiente do que a antiga Avg., a chamada On Base Percentage (OBP), que mede exatamente isso: De todas as vezes que um jogador subiu ao bastão, em quantas ele chegou em base, seja por rebatida ou por walk. Usando o exemplo anterior, o jogador A teria um OBP de .300, enquanto o jogador B teria um OBP de .400. Então os números me diriam algo diferente: O jogador A era melhor conseguindo rebatidas, mas o jogador B era mais eficiente no bastão porque sabia chegar em base e evitar eliminaçōes. OBP, portanto, é um indicador melhor de eficiência no bastão do que Avg.

Mas tem uma outra coisa a ser levada em conta, que é a força dos jogadores. Se dois jogadores conseguem 10 rebatidas em 30 tentativas, só que um deles rebate 10 Home Runs e o outro 10 rebatidas simples, ambos teriam o mesmo aproveitamento e o mesmo OBP, mas o primeiro teria sido um jogador muito mais importante pro seu time. Por isso Home Runs é uma boa medida de força, certo?

Hmm, não. Imagine o seguinte cenário: Jogadores A e B, cada um foi ao bastão 150 vezes e teve 50 rebatidas. O jogador A acertou 10 Home Runs, e o jogador B acertou 5 HRs e mais 20 rebatidas duplas. Ambos teriam o mesmo aproveitamento e o OBP, mas o jogador A teve mais Home Runs... Mas será que sua força ao rebater 10 HRs foi mais útil do que a força do jogador B, que rebateu apenas 5 Home Runs mas teve outras 20 rebatidas duplas? Por isso foi criada uma medida chamada Slugging Percentagem (SLG%), que é calculada como o Avg, mas com uma diferença: Ao invés de dividirmos o número de rebatidas pelo número de at bats, dividimos o número de bases que esse jogador conseguiu com suas rebatidas. Portanto cada rebatida simples ganha 1 base, rebatidas duplas ganham 2 bases, triplas 3 bases, e Home Runs ganham quatro bases. Essa estatística serve pra mostrar a habilidade do jogador para rebater pra ganhar bases (portanto não faz sentido incluir walks), e no nosso exemplo, teriamos que o jogador A ganhou 80 bases em 150 rebatidas (.533) e o jogador B ganhou 85 para um SLG% de .567. Portanto, o jogador B rebateu por força melhor que o jogador A, apesar de ter tido menos Home Runs.

Agora temos duas medidas eficientes pra medir o valor de um jogador no bastão: OBP pra medir a capacidade do jogador pra chegar em base e evitar eliminaçōes, e SLG% pra medir a produção de bases extras desse jogador. Como podemos combinar, portanto, essas duas coisas em uma só? Somando as duas, é claro! Surgiu assim a chamada On Base Plus Slugging (OPS) que é simplesmente a soma da OBP com a SLG% de um jogador. Portanto se um jogador tem um OBP de .350 e um SLG de .550, seu OPS será um bom .900. Essa medida tem falhas (ja vamos chegar nelas), mas é uma medida simples, fácil e eficiente de medir como o jogador é capaz de conseguir as duas coisas mais importantes pra um ataque: Chegar em base, e conseguir rebatidas extras.

Também temos o On Base Plus Slugging Ajustado (OPS+), cujo cálculo é muito difícil pra explicar em detalhes, mas que corrige os três últimos problemas do OPS simples: Os jogadores rebatem em campos com dimensōes diferentes, e portanto isso influenciar (e influencia bastante) os números de um jogador (quem rebate em um campo menor tem maior facilidade em rebater Home Runs, por exemplo) na hora de conseguir rebatidas; .100 em SLG% e .100 em OBP não significam a mesma coisa para um ataque em termos de contribuição, mas no OPS elas são tratadas com o mesmo peso (estudos mostram que OBP tem um peso entre 2 e 3 vezes maior do que SLG%. Vale citar também, porém, que o máximo que pode se ter em OBP é 1.000 - chega em base a cada vez que vai ao bastão - mas o máximo que se pode ter em SLG% é 4.000, conseguindo quatro bases - ou HRs - cada vez que rebater); e por fim, a dificuldade de usar OPS para comparar jogadores de diferentes eras, principalmente por causas nas diferenças no jogo (e sim, especialmente a era dos esteroides). Portanto, OPS+ usa o OPS normal, msa com pesos diferentes para SLG% e OBP e com um termo de ajuste para estádio e para o resto da Liga naquela temporada. É uma fórmula mais complicada, mas mais precisa que OPS, pra medir o valor individual de um jogador como rebatedor.

Por fim, foi criada uma estatística chamada Weighted Runs Created Ajustada (wRC+). Essa estatística é uma forma de aperfeiçoar o OPS+, mas utiliza os mesmos princípios: ela considera os dois fatores mais importantes de um rebatedor, capacidade de chegar em base e de conseguir rebatidas extras, combina esses dois fatores, e ajusta para todo tipo de fator externo (como estádio, por exemplo). Para finalizar, a estatística ainda é ajustada com base no resto da liga, tendo o mesmo efeito do OPS+ para comparar diferentes eras, se tornando assim um indicador sobre quantas corridas um jogador gerou com seu bastão relativo ao "médio" na liga. Então sendo 100 a "média" de qualquer normalização, se um jogador termina a temporada com wRC+ de 150, isso significa que ajustando para o estádio no qual jogou metade de seus jogos, ele gerou 50% a mais de corridas do que um jogador médio na liga. Da mesma forma, se ele teve um wRC+ de 80, ele foi 20% menos produtivo no bastão do que um jogador comum. É a forma mais condensada e avançada para medir, em um vácuo, a produção no bastão de um jogador em comparação com o resto da MLB.


Estatísticas de defesa
Principal estatística: UZR

Se você acha que as estatísticas usadas antigamente (ou nem tão antigamente por GMs) pra medir a eficiência ofensiva dos jogadores era primitiva, esperem até ver essa aqui. Ate Bill James, a única estatística defensiva que existia eram os chamados Erros.

Muito simplesmente, um Erro é quando um jogador comete algum erro que resulta em uma vantagem para o adversário, seja um jogador que deveria ser eliminado e não foi, um errou de lançamento que resultou em uma base extra para um jogador, etc. Por exemplo, se eu rebato a bola para o Shortstop de forma que ele possa me eliminar antes de chegar na primeira base, mas o shortstop fura a bola e eu consigo chegar em base, ele cometeu um erro (e isso não conta como rebatida válida para mim). Se eu consigo uma rebatida simples, mas na hora de jogar a bola de volta o RF lança a bola longe e eu consigo correr até a segunda base (o que eu não conseguiria se ele não errasse o arremesso), conta como uma rebatida simples pra mim e um erro do RF. E por ai vai.

Ok, por onde eu começo a falar dos problemas dessa estatística?? Primeiro, ela é extremamente subjetiva, quem determina o que "deveria" ter acontecido é o juiz da mesa, e ele que vai portanto interpretar se a jogada foi um erro, merito do rebatedor, e por ai vai. Duas pessoas podem interpretar diferente o mesmo lance, e por ai vai. Mas segundo e muito mais importante, ela é extremamente limitada! Se você cometeu um erro, é porque estava na bola no primeiro lugar, então você tem algum mérito por isso. Eu posso ter feito uma excelente jogada, lido perfeitamente a rebatida, me movimentado numa velocidade sobre humana pra chegar numa bola... Só que na hora que eu pulei pra pegar a bola e fazer a eliminação, a bola bateu na minha luva e caiu, e o juiz me deu um erro. Isso é extremamente injusto, pois com qualquer defensor da Liga alem de mim teria sido uma rebatida simples, mas por causa da minha habilidade superior, eu consegui chegar na bola... E fui penalizado por isso. Antigamente, os erros eram somados e quem cometia menos era o melhor defensor, mas imagine a seguinte situação: Numa temporada, dois RFs terminam com zero erros. Só que um deles é extremamente rapido, inteligente, chega em mais bolas do que nenhum outro jogador chega... E o outro é um gordão, lento e preguiçoso, que não comete erros simplesmente porque nunca chega em nenhuma bola por conta da sua falta de habilidade. Como você diferencia entre os dois? Como é possível saber, sem assistir a um jogo, qual o melhor defensor? Será que um jogador com mais erros as vezes não é um defensor melhor, e comete erros porque faz mais jogadas?

Por isso foi criado o Ultimate Zone Rating (UZR), a minha segunda estatística preferida depois de WAR, uma daquelas estatísticas que é extremamente difícil de calcular, mas extremamente precisa e extremamente fácil de entender. Para calcular o UZR, você divide o campo em 64 zonas e computa onde cada bola rebatida foi cair, com que velocidade e com que inclinação. E dai, a cada jogada que envolve um jogador defensivo, usasse essa base de dados pra ver qual foi o resultado da jogada envolvendo esse jogador em relação a todas as outras jogadas defensivas que envolveram essa bola sendo rebatida dessa forma para o mesmo lugar, e ve como essa jogada defensiva - em relação ao "normal" desse tipo de jogada - afetou as chances do adversário de anotar uma corrida.

Um exemplo pra ilustrar: Imagine que o primeiro rebatedor de um jogo sobe ao bastão. Nessa situação (nenhum eliminado, bases vazias), um time marca em média cerca de 0,5 corridas (não tenho o número exato aqui). Agora o primeiro rebatedor rebate a bola para o campo direito, com velocidade/ângulo e para um certo lugar onde, 95% das jogadas, ele é eliminado. No entanto, o RF estava desatento e saiu atrasado, permitindo que a bola passasse por ele para uma rebatida dupla. Nesse caso, o UZR computa para o RF a diferença entre o que aconteceu nos casos casos computados anteriormente (uma média ponderada entre todas as situaçōes, mas na grande maioria dos casos seria um eliminado e nenhum em base, e nessa situação um time anota em média 0,35 corridas) e o que aconteceu de fato (uma rebatida dupla - nessa nova situação, nenhum eliminado e um homem na segunda base, um time anota em média 1,2 corridas). Nesse caso, portanto, o jogador sairá da jogada com um UZR igual a 0,35 - 1,2 = - 0,85. Em outras palavras, defensivamente, esse RF custou ao time (estatisticamente) 0,85 corridas em relação a um jogador "médio".

Portanto, o UZR é dificil de calcular, mas bem fácil de interpretar: Ele representa o número de corridas que a defesa daquele jogador impediu (estatisticamente!) em relação a um jogador médio da mesma posição. Quando eu digo que o melhor defensor da MLB em 2011 é o Brendan Ryan com um UZR de 15,2, isso significa que ter Ryan no seu time ao invés de um Shortstop "médio" evitou que fossem marcadas 15,2 corridas contra o Mariners. Quando eu digo que o Curtis Granderson é o pior CF defensivo da MLB com um UZR de -15,9, é fácil entender que sua defesa é tão ruim que substituindo-o defensivamente por um CF médio teria evitado quase 16 corridas contra o Yankees. E por ai vai. Facil de entender, muito preciso e muito útil - eu realmente adoro essa estatística.


Estatísticas de arremesso
Principais estatísticas: ERA, BABIP, FIP

Tradicionalmente, arremessadores sempre foram medidos por uma estatística muito útil chamado ERA (e antigamente, bons arremessadores só eram bons se tivessem bolas muito rápidas - mais uma estupidez dogmática que faz a gente entender porque a MLB era a Liga que pior aproveitava talento nos EUA).

O ERA - Earned Runs Average - pega todas as Earned Runs (Quando um pitcher está arremesando e cede uma corrida, é computado uma Earned Run  A NÃO SER QUE essa corrida pudesse ter sido evitada, em algum momento, mas não foi por causa de um Erro da defesa - seja esse erro pra ele chegar em base, pra eliminar um terceiro jogador que teria encerrado a entrada antes dessa corrida, e por ai vai. Se for o caso, é uma Unearned Run, e não conta no ERA) cedidas por um pitcher, divididas pelo número de entradas arremessadas, multiplicadas por 9. Em outras palavras, mede quantas corridas um arremessador cede a cada nove entradas (ou um jogo completo) arremessado, e é uma boa medida de avaliar a produção de um pitcher até um dado momento.

Mas o ERA tem uma limitação: Ele mede apenas o que aconteceu, mas não separa exatamente o que nisso foi graças ao arremessador ou aos demais fatores. Dois pitchers exatamente iguais, mas um jogando com uma excelente defesa e outro jogando com uma defesa ruim, provavelmente vão ter ERAs diferentes mesmo se jogarem igualmente bem, porque a quantidade de corridas cedidas por um time certamente será menor quanto melhor for a defesa, mesmo que a ruim não cometa Erros. E além disso, tem o fator sorte: O quanto ela influencia na produção de um arremessador? E se, ao longo de uma temporada, essa sorte normalmente "zera" (mas nem sempre), quando ela vai mudar e como isso influencia o arremessador (quem joga fantasy sabe do que eu falo)?

Essa última de "sorte" parece um pouco forçada, não é? Então volte comigo pro final dos anos 90, quando um cara chamado Voros McCracken - um fã de baseball que brincava com estatísticas nas horas vagas - concluiu que tinha apenas três fatores em um jogo de baseball que o arremessador controlava: Home Runs cedidos, Walks, e Strikeouts (quando um jogador é eliminado com três strikes). Em outras palavras, ele concluiu que, sobre as bolas que os rebatedores colocavam em jogo (Home Run tecnicamente não entra em jogo), os arremessadores não tinham nenhum controle.

Parece um absurdo, certo? Afinal, grandes arremessadores, com grandes arremessos, deveriam ser capazes de segurar os adversários a um aproveitamento menor uma vez que a bola é colocada em jogo. A comunidade da MLB achou um absurdo sem tamanho, e mesmo a comunidade das Sabermetrics achou algo ridículo, e o próprio Bill James começou a coletar dados pra mostrar que Voros estava errado. Mas ele não estava. E foi aí que surgiu a estatística chamada BABIP - Bating Average for Balls in Play (Ou aproveitamento das rebatidas pras bolas em jogo). Os estudos de Voros - futuramente comprovados pela comunidade estatística - mostram que o valor dessa estatística (a proporção das bolas colocadas em jogo que efetivamente viram rebatidas) tende a ser praticamente igual pra todos os pitchers, geralmente em torno dos .300 (pitchers cujo jogo depende mais de bolas que caem - bolas de curva, sinkers, splitters, knucleball, etc - tendem a ter um BABIP um pouco mais baixo, mas nao tanto).  Ainda que as vezes tenhamos alguns pitchers com uma temporada acima ou abaixo dessa média, nunca isso se manteve ao longo das demais temporadas. Portanto, o BABIP é bem simples de interpretar: Se um pitcher está com um BABIP muito fora da curva, é porque a sorte tem interferido bastante nesse tipo de jogada - seja acima (tendo azar) ou abaixo (tendo sorte) do nível normal, isso indica que dificilmente o pitcher vá continuar com esse tipo de atuação por muito tempo.

Adição rapida sobre BABIP: Alguns fatores podem afetar o BABIP de um pitcher, principalmente a composição das suas eliminaçōes (eliminaçōes pelo chao, pelo ar, etc), então alguns sites tem um BABIP "projetado"ou "normal" para o pitcher de acordo com essa composição. Essas variaçōes não são enormes, mas podem afetar de forma significante em alguns casos mais extremos, então em alguns casos vale ver o BABIP "projetado" pra um pitcher ao invés de usar o da Liga como referencia. Exemplo rapido - Em 2009, Andy Pettitte teve um BABIP de .297 e Joel Pineiro um BABIP de .295. No entanto, examinando os tipos de rebatidas que eles induziam, Pineiro foi o principal pitcher da Liga eliminando jogadores por bola rasteira - que tem maior chance de eliminação - de forma que era normal que ele tivesse um BABIP mais baixo, de forma que ele possivelmente teve azar no ano. PEttite, ao contrario, eliminou mais jogadores por lineuots - que tem menor chance de eliminação - e portanto seu BABIP deveria ter sido acima do normal, de forma que ele provavelmente teve sorte em 2009.

Mas o BABIP explica apenas a parte da sorte nas bolas em jogo que o arremessador tem. Isso não é a única coisa que influencia o ERA de um arremessador. A defesa da equipe, por exemplo, tem um papel importante nisso. Por isso foi criado o FIP - Fielding Independent Pitching - que mede exatamente o que o nome sugere, o seu ERA uma vez removidas as influências da defesa e demais fatores (inclusive sorte) focando exatamente nas três coisas que um pitcher é capaz de controlar: Strikeouts, Walks e Home Runs. A conta é complicada e alguns centros ainda divergem no melhor método pra calcular o FIP, mas a interpretação é simples: Quanto seria, aproximadamente, o ERA de um pitcher levando em conta APENAS a sua performance individual, e não fatores como sorte ou defesa. Portanto se um pitcher está com um ERA de 3.30, você pode olhar e pensar "nossa, esse cara ta destruindo!"... Mas ai você ve que ele também está com um BABIP de .270 e um FIP de 4.4, e percebe que não é exatamente assim, e que ele tem tido uma boa ajuda tanto da sua defesa como da sorte e demais fatores que ele não controla, e provavelmente vai sofrer uma regressão conforme a temporada avança pois esses fatores tendem a nivelar. Da mesma forma, um pitcher com um ERA de 3.8 mas com um BABIP de .300 e um FIP de 3.7 tem um mérito individual muito maior que o outro, mas não tem sido tão ajudado.

Tangente rápida/curiosidade: Como voces devem ter percebido, isso é extremamente util quando se está jogando fantasy. Ano passado, Josh Beckett estava com um ERA de 2.10 e vindo de três one-hitters consecutivos lá pelo meio da temporada e meu amigo aproveitou isso pra pular pra primeiro na nossa Liga de fantasy baseball. Eu imediatamente liguei pra ele e avisei "Cara, troque Beckett agora pela melhor oferta que voce tiver (Albert Pujols e algum pitcher que eu não lembro) antes que ele mude de ideia!". Ele achou que eu estava louco ou zuando com a cara dele, mas eu tinha meus motivos: Beckett estava com um BABIP de .220 e um FIP de 3.1 praticamente gritando "REGRESSÃO!" na minha cara, enquanto que Pujols voltava de lesão devagar mas tava com um BABIP - não confiem em BABIP pra rebatedores a não ser em casos muito extremos, btw - abaixo de .200. e o pitcher que vinha junto na troca tinha um FIP respeitavel. Ele fez a troca, Beckett regrediu e não voltou a arremessar naquele nível, Pujols pegou fogo, e meu amigo ganhou a Liga de fantasy. A lição, como sempre: As vezes fãs realmente sabem mais que GMs, até em times de fantasy.


Estatísticas gerais
Principais estatísticas: VORP, WAR

Ok, estamos quase acabando. Agora que temos estatísticas eficientes para medir a produtividade e eficiência de jogadores em termos de arremessos, rebatidas e defesa, ta na hora de juntar tudo isso em uma só medida para a produtividade geral de um jogador num campo de baseball. E pra isso temos duas estatísticas principais, VORP e WAR.

Embora eu não seja muito fã de Value Over Replacement Player (VORP), algo como valor acima de um jogador substituto, por não levar em conta defesa, eu decidi colocar ela aqui por um simples motivo: Ela é precisa e é extremamente fácil de entender. Ela basicamente mede a capacidade de um jogador de produzir corridas (ou, no caso dos arremessadores, evitá-las) acima do que produziria um jogador de Replacement Level (Algo como "Nível de substituição"), que geralmente é definido como sendo entre 70 e 85% de um jogador médio daquela posição, com a porcentagem dependendo da posição. Portanto, se eu te digo que o VORP do Jose Bautista ano passado foi de 77, quer dizer que ele produziu 77 corridas a mais para o seu time no ataque (Rebatendo, chegando em base, correndo nas bases, tudo) do que um RF um pouco abaixo da média (no caso dos pitchers, o contrário, evitou X corridas a mais do que um arremessador assim). Simples, direto, leva em conta quase todos os aspectos relevantes (tirando defesa) como roubos de base, velocidade nas bases, jogos perdidos, etc e é bem fácil de entender, bom pra comparar jogadores... Pena que seja dificílimo calcular. Mas tudo bem, tem sites que calculam pra gente.

Então ok, VORP é uma boa estatística pra comparar jogadores. Mas mesmo assim, nao ganha de WAR - Wins Above Replacement. Outra estatística difícil de calcular, mas que pega o VORP e leva a um outro nível, incorporando defesa e qualquer outro aspecto presente no jogo de um determinado jogador e nos diz quantas vitórias um certo jogador da a um time sobre o famoso "Replacement Player". Ou seja, ele é mais preciso que o VORP porque o VORP é uma medida apenas ofensiva e o WAR mede todos os aspectos desse jogador e no que ele afeta o jogo, mas ao invés de nos dizer em corridas, nos diz em vitórias, mais fácil impossível. Portanto se ano passado Jose Bautista (8.3) foi o lider em WAR, isso quer dizer que se tirassemos ele do Jays e colocassemos no lugar um substituto um pouco abaixo da média da posição, o Jays teria 8.3 vitórias a menos, levando em conta ai também o quanto ele perdeu de jogos e tudo mais. E ela é minha favorita porque, se você pegar uma lista de WAR de uma temporada, vai ver que não necessariamente ela te da os melhores jogadores, mas te da os mais valiosos de uma forma as vezes sutil: Por exemplo, em 2009 o melhor WAR da Liga (8.6) foi do Ben Zobrist, acima dos MVPs Joe Mauer (8.1) e Albert Pujols (8.5). Apesar de Mauer e Pujols terem números ofensivos melhores, Zobrist (que também teve bons números ofensivos e um OBP quase ofensivo de .406) provavelmente foi mais valioso pra Tampa por dois motivos: Primeiro, ele não perdeu nenhum jogo na temporada inteira; e segundo, ele jogou em SETE posiçōes diferentes ao longo da temporada, passando a maior parte do tempo mudando entre 2B e RF... E teve um UZR positivo em todas elas, inclusive 15 e 10 em 2B e RF, respectivamente. Ele cobria qualquer buraco do time, e isso significava demais pra flexibilidade do time.

WAR tem apenas um pequeno problema: Como as duas Ligas possuem regras diferentes quanto ao DH, o WAR normaliza a AL e a NL de forma separada pra tirar essa diferença. O problema é que isso assume que o talento nos dois lados é aproximadamente igual... E quanto não é o caso e temos uma clara disparidade, fica um pouco difícil usar WAR pra comparar jogadores de diferentes Ligas - especialmente pitchers. Ainda assim, um problema pequeno pra uma estatística sensacional.


Resumo final

Ufa, ta acabando. Então vamos lá ver o que vimos hoje:

Principais estatísticas de ataque: OBP (Aproveitamento para chegar em base e evitar eliminaçōes), SLG% (Medida de força pra quantas bases um jogador consegue por rebatida), OPS (produtividade total no bastão), OPS+ (OPS ajustada por estádio, era e com pesos adequados) e wRC+ (medida condensada do valor de um jogador rebatendo, ajustado por era e estádio); são as medidas usadas pra verificar a produtividade de um jogador no bastão e como ele contribui assim para a equipe.

Principal estatística de defesa: UZR (Quantas corridas um jogador cede a menos defensivamente que um jogador "médio" na mesma situação) é usada pra medir a eficiência defensiva de um jogador.

Principais estatísticas de arremesso: ERA (Corridas cedidas por nove entradas), BABIP (Bolas em jogo que viram rebatidas) e FIP (ERA tirando tudo que não está no controle do arremessador); são usadas pra avaliar a produtividade real de um arremessador e o quanto ele tem sido ajudado por sorte e demais fatores além do seu controle.

Principais estatísticas gerais: VORP (Quantas corridas a mais - ou a menos - um jogador  - ou pitcher -gera para seu time em relação a um jogador de RL), WAR (Quantas vitórias um certo jogador te da acima de um jogador de RL); são usadas pra avaliar o valor total de um jogador a um determinado time.

Deu pra entender tudo? Espero que sim, porque deu um trabalho do cão. Foi mal se ficou muito longo, mas queria fazer o mais detalhado e intuitivo o possível pra quem está vendo isso pela primeira vez, e também pra servir caso alguém precise consultar os detalhes algum dia. Espero que tenham aproveitado e que se interessem mais agora por baseball e pelo que os números nos dizem. Até a próxima.

18 comentários:

  1. wow. bem, costumo ver alguns jogos da MLB de vez em quando e nem imaginas a ajuda que me deste com este post...simplesmente conheço as regras do jogo, mas não fazia a mínima ideia de como interpretar as estatisticas. obrigado.

    ResponderExcluir
  2. Sensacional. Parabéns pelo post, muito bom mesmo

    ResponderExcluir
  3. Parabéns, Vitor! Adoro o blog e com ele estou começando a entender um pouco mais de baseball. Gostaria de sugerir um post: "porque eu odeio os Yankees". Obrigado, abraço!

    ResponderExcluir
  4. Muito bom o texto, valeu mesmo cara.

    ResponderExcluir
  5. Respostas
    1. www.fangraphs.com é o meu favorito. Tem o www.baseballprospectus.com e www.baseball-reference.com.

      Excluir
  6. Muito boa a matéria!
    Mas vem cá, vc não gosta de WHIP? Aprendi a gostar dessa variável pra avaliar pitcher.
    Outra coisa. Estava lendo sobre o GM que contratou J. Robinson para os Dodgers, e li que ele já usava estatísticas diferente do povo da época, dentre ela o OBP. Isso tudo lá na década de 40... oO ... fiquei bolado... heheh...

    ResponderExcluir
    Respostas
    1. Não gosto muito de WHIP, ele deixa muitas variáveis importantes de fora e é muito afetado por fatores como BABIP, boa defesa, para citar alguns. Então não sou fã.

      E sim! O Rickey já usava stats nos anos 40, e o seu Dodgers foi o primeiro time a empregar um estatístico profissional! Não a toa ganhou sua parcela de glórias na época. FAlei um pouco mais a respeito no Guia MLB que está para sair, mas pretendo explorar o assunto mais a fundo em uma coluna futura!

      Excluir
  7. Vitor, tem algum e-mail de contato que é possível entrar em contato com você? Estou trabalhando em um projeto e acho que você poderia contribuir. Abs

    ResponderExcluir
    Respostas
    1. Breno perdão, não vi essa mensagem. Pode me mandar no vitorlscamargo@hotmail.com !

      Excluir
  8. Então o SLG% serve só para medir a porcentagem de bases extras conseguidas, e o OBP% mede a porcentagem de vezes que o jogador chegou em base?

    ResponderExcluir
    Respostas
    1. SLG% é mais ou menos total de bases por passagem no batão. OBP é como você disse, o percentual de aproveitamento chegando em bases.

      Excluir
  9. Melhor artigo em português que eu já encontrei na internet! Ótimo trabalho e ótima explicação!

    ResponderExcluir
  10. Parabéns e muito obrigado! Esclareceu diversos pontos e ensinou muitas coisas!

    ResponderExcluir
  11. Cara, você doutrinou muito nesse texto.
    Parabéns.
    Você poderia dizer a partir de quanto os dados indicam se ele é um bom jogador?
    Ex: Um OPS de 0,750 seria bom?

    ResponderExcluir
    Respostas
    1. Valeu!!

      Isso varia muito de era pra era. Em média um OPS de .780 pra cima é sólido, mas depende muito do campo também. No Colorado, por exemplo, que tem o ar rarefeito e os ataques ão muito favorecidos, um OPS abaixo de .800 não é bom. No estádio do Giants e suas dimensões gigantes, acima de .750 pode ser bom.

      Por isso em geral recomendo olhar mais pro wRC+, porque já faz esse ajuste por era/estádio, e ele já te diz de forma mais simples onde o jogador está em relação à média (a média sendo 100).

      Excluir