Some people think football is a matter of life and death. I assure you, it's much more serious than that.

quinta-feira, 30 de julho de 2015

A ciência por trás do bunt

Hora de descobrir se você deve usar ou não essa camisa fantástica


Vamos falar hoje de estatísticas. Por falar em estatísticas, já conhece nossa promoção para ganhar o livro Moneyball?! Sua última chance de concorrer a duas edições de um dos livros mais importantes da história do esporte!!!
------------------------------------------------------------

Um dos maiores preconceitos que eu vejo as pessoas do baseball tendo em relação a "Sabermetrics" vem do fato de que elas não fazem ideia do que sabermetrics é de verdade. A maior parte delas acha que é sobre criar estatísticas bonitinhas com um nome cheio de letras maiúsculas, como WAR ou SIERA, dai colocar elas em prática e pronto. É um erro grosseiro. Sabermetrics sequer trata de criar estatísticas, especificamente, embora isso seja um subproduto do processo. Você quer saber exatamente do que se trata sabermetrics? Ok, eu te conto.

Sabermetrics é sobre aplicar métodos analíticos científicos ao baseball. 

Viu? Simples, no papel. No fundo, sabermetrics é isso: parar de tratar o baseball como um "achismo" e começar a analisá-lo como uma ciência. Você acha que aproveitamento no bastão é a melhor medida da performance ofensiva de um jogador? Ótimo, então vamos analisar isso cientificamente para descobrir se é verdade ou não. Hmm, não é, acontece que OBP é um indicador melhor. E SLG ainda mais. E nesse processo você acaba tentando criar um indicador que seja ainda melhor do que esses. Foi nisso que criamos OPS, Runs Created, OPS+, e eventualmente, wRC+. Sempre querendo melhorar o indicador anterior, achar algum que - de acordo com as evidências científicas, não por palpites - seja o mais próxima possível de uma relação perfeita.

Então sim, pessoas criarão estatísticas em sabermetrics. Sempre queremos achar uma forma mais precisa de medir algo do que a que já temos. E, quando alguém inventa uma estatística nova, ele não simplesmente joga ela na internet e ela começa a ser usada - ela passa por um processo intenso de análise e escrutínio da comunidade científica associada ao assunto (incluindo, sim, as maiores universidades do mundo como Harvard e MIT). Ela será testada, analisada e testada novamente. E, como em qualquer universo científico, ela não vai sobreviver se não for sustentada por evidências fortes. Assim como na medicina ninguém vai levar a sério se eu falar que, digamos, comer grama aumenta a expectativa de vida a não ser que eu consiga sustentar esse argumento com análises, estudos e evidências sólidas, no baseball ninguém vai levar uma estatística a sério se ela não for sustentada por evidências científicas, técnicas e estatísticas - e mesmo ai ela vai estar sujeita a todo tipo de revisão para achar falhas e melhorá-la ainda mais. É inocente - ou ignorante - achar que sabermetrics se limita a ficar inventando fórmulas bonitinhas no computador e jogar na marra, e não são coisas com provas concretas e científicas sustentando-as. 

Então sim, criar novas estatísticas é parte do processo envolvido com a ciência sabermetrics. Mas não se limita a isso. Analisar o esporte de maneira científica também significa descobrir a verdade por trás de certos eventos. Na nossa vida, tomamos "verdades" com muita facilidade. Sua avó deve ter te falado sobre como comer, sei lá, leite com manga faz mal. Nos esportes não é diferente. São criados "dogmas" com muita facilidade: canhotos são mais dotados para o baseball que destros; jogador que da muitos tocos é um bom defensor; Wide Receivers precisam ser rápidos para ter sucesso na NFL; etc. Baseball tem mais desses velhos dogmas do que qualquer outro esporte, talvez por estar ai a mais tempo. E parte dessa revolução analítica tratou de olhar para essas "verdades" do esporte e ver se, no final das contas, eram verdades mesmo ou se estavam atrapalhando a vida dos times.

Bem, aonde eu quero chegar em toda essa discussão? Nos bunts. Especificamente, nos bunts de sacrifício, quando você intencionalmente cede uma eliminação para avançar os corredores em base (quando eu falar em bunts ao longo do texto, estou me referindo especificamente ao de sacrifício, não a fazer bunt para conseguir uma rebatida contra o shift, por exemplo. Espero que fique claro).

Você provavelmente já ouviu em algum lugar sobre como a mentalidade "analítica" despreza bunts, enquanto a "velha escola" adora. Você provavelmente já ouviu algum narrador ou comentarista na TV falando que tal jogador "tem que ir pro bunt" um número absurdo de vezes, ou viu alguém (tipo eu) surtando quando algum jogador bom foi para o bunt sem necessidade. Então ao invés de ficar no "achismo" - eu acho que bunt é bom, eu acho que bunt é ruim - vamos olhar as evidências, e ver em que direção as provas empíricas apontam.

Para começar, precisamos de um conceito que chama Expected Runs.


Expected Runs

Expected Runs é muito simples: em baseball, você tem 27 "estados" diferente nas quais o ataque pode se encontrar antes de uma jogada começar. Elas dependem de dois fatores: quantas pessoas estão em base, e quantos já foram eliminados. Então, ao começar uma jogada, você pode ter as seguintes situações nas bases: Ninguém nas bases; um na primeira base; um na segunda base; um na terceira base; homens na primeira e segunda bases; homens na primeira e terceira bases; homens na segunda e terceira bases; e bases lotadas. São 9 ao todo, e cada uma delas pode acontecer com 0, 1 ou 2 eliminados. Cruzando ambas você tem ao todo 27 estados ofensivos

Expected Runs nada mais é do que calcular quantas corridas um ataque tende a anotar em cada um desses 27 "estados". Um exemplo, para ilustrar: ao iniciar uma entrada, com ninguém em base e nenhum eliminado, um time tende a anotar 0.47 entradas em média. Se o primeiro jogador vem e acerta uma rebatida dupla, então seu novo "estado" é zero eliminados e um homem na segunda base. Nesse "estado", os times tendem a anotar em média 1.1 corridas no resto dessa entrada. Se esse jogador fosse eliminado, então no novo "estado" (um eliminado, zero em base) os times tendem a anotar 0.26 corridas. E por ai vai.

Como isso é calculado? Empiricamente, é claro. Pegando uma amostra suficientemente grande, mas com distribuição suficientemente semelhante para evitar grandes flutuações, calculando em média quando time anota em cada "estado", e depois testando se esse valor se sustenta cientificamente. Tem diferentes modelos para Expected Runs no mundo, e você pode fazer a mesma análise a seguir com cada um deles. Eu estou usando o mais aceito, que abrange um período de quase 56 anos de dados cuidadosamente selecionados, conforme descrito por Jeff Zimmerman, do Fangraphs. Esse modelo é o mais usado por apresentar os valores estatísticos mais significativos, e por ser o que mais se aproxima dos valores atuais do esporte, também de forma estatisticamente significativa. Então ele tem maior utilidade prática para nós no momento. 

Agora que temos as Expected Runs para os 27 cenários ofensivos do baseball, podemos ver exatamente os efeitos práticos do bunt em um jogo de baseball.


A matemática por trás do bunt

O ataque no baseball tem uma única função em um jogo: anotar o máximo de corridas possível para dar ao seu time o máximo de chances possíveis de ganhar. Existe uma óbvia e sustentável correlação entre corridas anotadas e a chance de você vencer um jogo. Então cada decisão no ataque tem que ser tomada de forma a maximizar as chances do time anotar o máximo de corridas possível. 

Então vamos começar da situação básica do esporte. O homem de leadoff conseguiu chegar em base, então com um homem na primeira base e zero eliminados, você tem uma expectativa de anotar 0.86 corridas nessa entrada. 

Então agora o técnico chama um bunt, e ele é bem sucedido. O novo estado ofensivo agora é um homem na segunda base, e um eliminado. Nesse novo cenário, a expectativa de corridas a serem anotadas pelo ataque agora é de... 0.68 corridas.

Pare para pensar um pouco nisso por um minuto. Você chamou uma jogada (o bunt), ela deu CERTO... e você custou ao seu time cerca de 0.18 corridas no processo. E a verdade é que mesmo esse número pode enganar, porque isso é o resultado de um bunt bem sucedido, o que nem sempre acontece. A taxa de sucesso de bunts na MLB nos últimos três anos foi de 84%, o que significa que tem 16% de chance de você nem acabar com esse cenário, e sim com um pior, uma eliminação e um homem na primeira base (estou deixando de lado queimadas duplas e erros defensivos por enquanto porque eles pouco mudam nos cálculos). Encorporando no cálculo a chance de que o bunt acabe dando errado, e considerando os dois "cenários" pós-bunt (e suas chances de acontecerem), então a expectativa de corridas anotadas pós-bunt é de 0.65 - 0.23 abaixo do que era antes. Simplesmente por chamar uma jogada de bunt, o técnico custou ao seu time 0.23 corridas em média. Só por empregar essa estratégia nesse cenário. Então os dados apontam que, nesse cenário, ir para o bunt é algo que prejudica o seu time, e portanto não deveria ser feito. 

É importante lembrar que o técnico não controla o que vai acontecer durante um at bat normal. Esse segundo jogador pode rebater um HR e anotar duas corridas (mais os 0.47 da nova situação de bases vazias e zero eliminados), ou pode sofrer uma queimada dupla ou um strikeout. Se ele for eliminado, certamente que alguém pode pensar "puxa, se era pra ser eliminado, então era melhor ter feito o bunt", mas isso é estúpido porque o técnico não tem como saber disso de antemão. Ele tem que analisar as chances de cada coisa acontecer, e decidir pela ação que vai trazer maior retorno para o time. Nesse caso, decidindo pelo bunt ele custou ao seu time, em média, 0.23 corridas. O que é muito. 

Vamos ver então para outros cenários, ver se essa situação se inverte. Talvez com um homem na segunda base e nenhum eliminado.

Bem, se o jogador de leadoff chegou na segunda base, a expectativa agora é de 1.1 corridas. Se um bunt for feito, e o jogador impulsionado até a terceira base (agora com 1 eliminado), o novo estado tem média de... 0.94 corridas. .016 mais baixo do que antes do bunt. E isso, de novo, se o bunt der certo. Não consegui achar se a taxa de sucesso nessa situação segue aqueles 84% (eu assumo que seja maior, já que não tem a possibilidade do forceout), mas podemos estimar: se a taxa for de 84%, então ir para o bunt vai gerar em média 0.90 corridas; se for um pouco acima (digamos, 90%), fica em .91. Então, indo para o bunt nessa situação, você custou ao seu time .19 ou .20 corridas. 

Você vai ver que essa situação se repete em qualquer "estado": ir para o bunt sempre vai diminuir a expectativa de corridas anotadas daquela entrada. Em outras palavras, ir para o bunt praticamente SEMPRE (espere as próximas seções) vai fazer seu time anotar, em média, menos corridas do que teria anotado se tivesse deixado o time rebater normalmente. Para deixar isso mais claro, eu fiz as duas tabelas abaixo. Nelas, temos os seis cenários que os times fazem rebatidas de sacrifício, a expectativa de corridas anotadas naquele "estado", a nova expectativa de corridas anotadas quando o time vai para o bunt (usando aquele aproveitamento de 84% antes descrito), e por fim quantas corridas essa decisão custou ao ataque.

Se você acha que esses 84% não são muito precisos (e não são mesmo, já que o número é uma média de todas as situações. O número, imagino eu, deve ser maior quando você não tiver uma oportunidade de forceout, e menores quando tiver), não tem problema. Logo abaixo, você tem a segunda tabela, que ao invés de usar a expectativa na hora do bunt (considerando os cenários de sucesso e fracasso) considera a expectativa no caso de um bunt bem sucedido. 

Eis então as tabelas que mostram o resultado no total de corridas esperadas de uma entrada ao usar o bunt:








Como você pode ver, ir para o bunt não é uma estratégia boa. Na verdade, ela é bastante prejudicial. 0.2 corridas pode não parecer muita coisa, mas em uma temporada de 162 jogos, é coisa pra cacete. Em 162 jogos, isso somaria 34 corridas, o que da mais de 3 vitórias (10 corridas, em média, equivalem a uma vitória). Então só por ir para um bunt todos os jogos, você está basicamente jogando três vitórias na temporada no lixo. É muita coisa, e uma diferença bastante significativa. 

Então pessoas da área mais "analítica" do esporte não desgostam de bunts por princípios, ou por que acham algo ruim. Elas desgostam porque em algum momento alguém decidiu questionar se o bunt - algo usado no baseball desde o começo - era realmente algo que valia a pena ser usado e que ajudava o time, e usando métodos científicos e analíticos, obteve evidências suficientes para concluir que não, que é uma estratégia que na verdade atrapalha a equipe. Nós acabamos de passar por um processo semelhante, usando evidências empíricas para calcular e mostrar na prática o impacto negativo de usar tal manobra. Claro, é uma forma mais simples e rústica de mostrar isso - se procurar na internet vai achar exemplos mais complexos que chegam à mesma conclusão - mas a ideia é essa: usar dados para achar evidências que comprovam ou desmentem alguma coisa. Mesmo que sejam dados pouco refinados, ainda são evidências concretas de um ponto de vista: de que bunts são prejudiciais. A diferença é grande e significativa demais, e outros estudos já entraram em cenários mais complexos e situações para diferentes times/jogadores, e chegaram no mesmo resultado de forma conclusiva.

Então quando você ouvir um narrador ou comentarista falar sobre a importância dos bunts, ou que todo jogador tem que saber fazer bunt, ele está simplesmente repetindo algo que ouviu, e que muitas pessoas já provaram que ele estava errado. Isso não é conhecimento, é ignorância. Nunca acredite cegamente no que for dito a você, sempre questione, procure a verdade, busque provas ou evidências do que aquele cara está falando. Esse é o espirito científico que, para o desespero de muitos, tem tomado cada vez mais conta do mundo esportivo. 

(Nota importante: esse mesmo raciocínio numérico tem o mesmo resultado se você separar entre AL e NL as Expected Runs, então mesmo em um ambiente como o da NL onde se anota menos corridas de maneira geral, o resultado ainda é o mesmo)


Quando devemos usar bunts?

"Espere um pouco", você está provavelmente pensando, "isso quer dizer que não tem NENHUMA situação onde um bunt possa ou deva ser usado?!". Bem, não, e é nisso que vamos entrar agora.

Você provavelmente, ao perguntar isso, estava pensando em pitchers rebatendo. Se for o caso, vou pedir que espere mais um pouco. No momento, quero falar de outra coisa: existe alguma situação normal (ou seja, que não envolva um extremo como um pitcher rebatendo) que as evidências mostrem que ir para o bunt é uma estratégia vantajosa?

Na verdade, existe sim. Uma.

Voltando ao cenário mostrado anteriormente, se você está na segunda base com nenhum eliminado, a tendência é que anote 1.1 corridas na entrada. Se você faz o bunt, agora tem um jogador na terceira base e um eliminado, e a tendência é que anote 0.94. Obviamente, em uma situação normal de jogo, isso é prejudicial, pois agora seu ataque vai anotar, em média, menos corridas do que antes. Então você não deveria fazê-lo.

No entanto, imagine que agora está na parte de baixo da nona entrada, e o jogo está empatado. Nesse cenário, não importa QUANTAS corridas você anote - o jogo acaba no momento que você anotar a primeira. Nesse caso, a nova variável mais importante não é anotar o máximo de corridas possível, e sim maximizar sua chance de anotar pelo menos uma corrida (ou, analogamente, minimizar a chance de não anotar nenhuma corrida). E nesse cenário, é o que acontece. A chance de sair sem nenhuma corrida com um homem na segunda base e zero eliminados é de 38.3%. Avançando o corredor para a terceira base às custas de uma eliminação, a chance de anotar 0 corridas agora é de 34.9%. Então nesse cenário ultra-específico (que até pode ser "extrapolado" pra outras situações onde o time busque anotar apenas uma corrida, como por exemplo tentando empatar um jogo de uma corrida na entrada final), o resultado do bunt é positivo, e não negativo.

O problema é aquele velho: nem todo bunt funciona. Você pode tentar fazer o bunt e sofrer um pop up, pode rebater forte demais e o corredor não conseguir correr até a terceira base, pode sofrer um strikeout, ou pode até mesmo acabar eliminando o corredor na terceira base. A taxa de sucesso de bunts na MLB é de 84%. Calculando a diferença entre a chance de anotar uma corrida nos diferentes estados envolvidos - homem na segunda e zero eliminados; homem na segunda com um eliminado; homem na terceira e um eliminado - você vai obter que só é vantajoso ir para o bunt nessa situação se conseguir convertê-lo a uma taxa de sucesso de 85.7%, um número ainda maior que a média do esporte em geral. Não é tão simples assim, então.

Eu tentei longamente achar a taxa de sucesso para bunts nessa situação específica, e até recrutei a ajuda de um pesquisador profissional, mas infelizmente não consegui chegar a um resultado confiável para qual seria essa taxa específica. Usando os 84% como base, eu diria que provavelmente a taxa de sucesso do bunt com um jogador na segunda base, mas nenhum na primeira, é maior do que 84%, pela não-existência da possibilidade do forceout, o que torna mais difícil eliminar alguém que não seja o rebatedor (da mesma forma, espero que a probabilidade com homens na primeira e segunda base seja inferior a 84%). O melhor que eu consegui achar foi um estudo que colocou em 88% a taxa de sucesso nessa situação, mas usando dados do baseball universitário, não profissional, e de modo geral as taxas de sucesso da NCAA são mais altas que na MLB.

Então é difícil usar como base para qualquer conclusão sem uma evidência mais significativa. O verdadeiro número possivelmente está na casa dos 85.7% exigidos para que exista uma vantagem.

Mas a verdade é que, nesse caso, a diferença é pequena demais para ser significativa. Isso significa que, estatisticamente, não é possível provar que ir para o bunt ou não ir para o bunt tenha alguma diferença nesse cenário. Os números são próximos o suficiente para justificar o bunt como sendo uma estratégia válida nessa situação, mas não grande o suficiente para justificá-la como sendo vantajosa. Em outras palavras, não temos evidência de que ir para o sacrifício nesse cenário é bom, mas também não temos para dizer que não é. Acaba se tornando uma questão mais situacional - você obviamente não vai mandar alguém como, digamos, Joey Votto para o bunt, mas se for Juan Lagares, é outra questão. 


O que fazer com um rebatedor ruim?

Enfim, chegamos aonde todo mundo deve ter imaginado. É muito comum em jogos na National League os times preferirem por mandar um arremessadores, quando sobe ao bastão, fazer um bunt se possível ao invés de rebater normalmente. A ideia por trás é muito simples: Expected Runs opera na média, mas se você tem um rebatedor muito abaixo da média, ele pode desequilibrar os cenários o suficiente (com menos probabilidade de algo bom acontecer) para tornar a opção do out construtivo (o bunt) mais vantajosa para a equipe. Isso não se aplicaria apenas para pitcher, mas também para rebatedores ruins de modo geral. Ou pelo menos é o que dizem na teoria.

Então vamos passar da teoria para a prática, e ver como isso funciona estatisticamente. Vou usar OBP (On Base Percentage) para esse cálculo, pois ela não só é mais fácil de calcular na prática (envolve menos cenários), como também um walk pode fazer o papel de um "bunt" e impulsionar o jogador uma base a mais (sem o custo da eliminação). Com base nos três diferentes cenários - quando o jogador sobe ao bastão, indo para o bunt, e rebatendo normalmente - vamos tentar calcular qual o limite do OBP que esse jogador precisa ter para que ir para o bunt passe a ser a estratégia mais vantajosa para a equipe.

Começando do nosso cenário base: zero eliminados, homem na primeira base. Corridas esperadas: 0.86. Nós já vimos que, indo para o bunt (e assumindo aquela taxa de sucesso de 84%), a expectativa de corridas para a entrada que esse novo estado gera é de 0.65 corridas. Se o jogador conseguir chegar em base, no novo cenário (1st and 2nd, zero eliminados) o ataque tende a anotar 1.47 corridas em média. Se o jogador for eliminado sem impulsionar o companheiro (homem na primeira, 1 eliminado), esse valor cai para 0.52 (por enquanto estou considerando apenas o cenário chegar em base vs ser eliminado).

Usando esses dados, para justificar ir para o bunt ao invés de deixar o jogador rebater, seu OBP teria que ser abaixo de .170.

Para começar, essa é uma figura patética para um rebatedor de MLB. Nenhum rebatedor qualificado no baseball na história da Live Ball Era teve uma temporada com OBP abaixo de .220, bem acima dos .170 que precisaria ter para o bunt começar a valer a pena estatisticamente. Isso praticamente já serve para eliminar o bunt para qualquer rebatedor normal.

No entanto, para pitchers a história é diferente. Dos 90 pitchers que entre 2010 e 2015 tiveram pelo menos 70 at bats em uma temporada, apenas 43 deles tiveram OBP acima de .170. O OBP coletivo dos pitchers rebatendo em 2015 é de .157, abaixo desse limite. Então no caso de pitchers indo ao bastão, realmente é - na média - mais vantajoso mandar o cara ir para o sacrifício... mas não sempre.

No entanto, não é da eliminação que os times tem medo quando um arremessador sobe ao bastão em situação de bunt - é da queimada dupla. Então para ter um valor mais preciso desse OBP, vamos incorporar a queimada dupla no nosso modelo, computando o valor de corridas esperadas em caso de uma DP - dois eliminados e ninguém em base geram na média 0.1 corridas por entrada. Esse modelo ainda não incorpora outros eventos comparativamente positivos na ida do rebatedor ao bastão (como rebatidas multi-base, uma eliminação além do bunt que avance o corretor, ou uma rebatida simples que impulsiona o corredor até a 3B), mas é o mais próximo que podemos chegar sem entrar em cálculos excessivamente complicados.

Tentando chegar em um número confiável, cheguei a alguns valores para a porcentagem de queimadas duplas em situações como essa. Através de pesquisas empíricas, cheguei em 8% a taxa da MLB em double plays em situações semelhantes (menos de 2 eliminados, homem na primeira base) nas últimas duas temporadas. No entanto, usando alguns dados do Baseball Prospectus com pesos lineares, o grande Ben Lindbergh chegou algo mais próximo de 13% em situações gerais de double plays (incluindo a situação descrita antes, mas não se limitando a ela). Como não da pra saber exatamente qual desses números é o mais certo, vamos usar os dois separadamente para chegar em um resultado mais preciso para o OBP mínimo a partir do qual o bunt não se justifica mais.




Ainda é muito pouco. Eu inclui a figura de 20% de DPs - um número bem mais alto do que eu consegui achar para qualquer rebatedor qualificado - para mostrar que você precisaria de uma taxa de DPs extremamente alta simplesmente para chegar no nível dos PIORES OBPs da história do esporte. Você precisaria de uma taxa de OBPs de quase 40% para chegar perto do nível médio de OBP da MLB hoje em dia, e isso antes de você lembrar que esse exercício inclui só OBP e não SLG - em outras palavras, ele ignora uma série de fatores favoráveis (rebatidas multibase, principalmente). Em outras palavras, a evidência é extremamente forte de que é impossível achar um jogador qualificado na MLB ruim no bastão o suficiente para justificar para ir para o bunt, você precisaria ser historicamente ruim em termos de OBP E ainda não adicionar muito valor em termos de SLG para justificar. Não existe um rebatedor qualificado na história do esporte que corresponda a esses critérios, então a evidência é bastante forte de que mandar para o bunt rebatedores "fracos" ainda é bastante danoso para o time.

No caso de pitchers, obviamente, é diferente. Em geral, pitchers são extremamente mais fracos rebatendo do que jogadores de campo, e portanto não só é muito mais fácil achar arremessadores com OBPs baixos que se encaixem nesse critério, como também a taxa de DPs para eles seria muito maior do que para rebatedores normais. Infelizmente, não consegui achar a taxa de queimadas duplas para arremessadores rebatendo, provavelmente porque na grande maioria dessas situações o jogador iria para o bunt.

Então vamos fazer uma estimativa desse número, usando as taxas anteriores (8% e 13%). Vou ajustar a taxa dos rebatedores "normais" para pitchers considerando dois números: a taxa de groundballs (afinal, a grande maioria das DPs vem em bolas rasteiras) e a taxa de infield hits de ambos (uma noção da capacidade do jogador de conseguir chegar na primeira base a tempo com as pernas). No caso, a taxa média de groundballs para rebatedores de campo na MLB foi de 45.4% esse ano e 44.8% ano passado, e de infield hits, 6.7% e 6.5%, respectivamente. Para pitchers, esses números foram de 61.9% e 5.6% esse ano, e 63.4% e 4.4% ano passado. Então usando os últimos dois anos de amostra e considerando a proporção entre infield hits e GB%, fizemos as estimativas abaixo, que nos levaram aos seguintes OBPs:



Ou seja, dependendo de qual dos dois números que achamos vocês acham que é o "certo" para índice de queimadas duplas na liga, o ajuste leva a 15% ou 25%, aproximadamente (como sempre, imagino que o número "real" esteja em algum lugar entre os dois).

De cara, é bem fácil perceber que o OBP "mínimo" nessas condições subiu bastante, e considerando o nível mais baixo dos pitchers no bastão fica claro que mandar seu arremessador fazer um bunt não é algo ruim. Dos 90 arremessadores com 70+ at bats em uma temporada desde 2010, apenas 8 tiveram OBP acima de .249, e 22 tiveram mais que .208. Nessa temporada até aqui (min. 20 at bats), apenas 7 (10%) pitchers tem OBP superior a .249.

Então realmente temos evidências de que, na maior parte do tempo, é realmente melhor você mandar seu arremessador para o bunt... mas não em todos os casos, certamente. Considerando que esse "modelo" não inclui outs "produtivos", esses números (.208 ou .249) provavelmente superestimam o OBP necessário para tornar o bunt algo prejudicial, e isso antes de lembrar que não estamos incluindo slugging. Mesmo que essa figura de .249 seja a real, você não vai mandar para o bunt alguém como Madison Bumgarner ou Travis Wood, jogadores cujo OBP nos últimos três anos está nessa faixa (.249 para MadBum, .248 para Wood) mas que possuem um ótimo SLG% (acima de .340 ambos) e que portanto tem melhores condições de impulsionar jogadores mais do que o normal. E DEFINITIVAMENTE não deveria mandar para o bunt Zack Greinke, que tem uma linha de .241/.299/.321 nesse período.

As evidências apontam que de fato é benéfico ao seu ataque ir para o bunt com um rebatedor no bastão na maioria do tempo, mas também sugerem fortemente que existe alguns casos de rebatedores que NÃO deveriam ir para o bunt quando sobem ao bastão (o que está alinhado com o resultado de pesquisas recentes feitas pelos sites Beyond the Box Score e Baseball Prospectus). Só porque é um rebatedor no bastão não quer dizer que o bunt seja automaticamente a melhor jogada - depende do manager saber com quais pitchers adotar essa estratégia, e quais deve deixar rebater normalmente.


Um desafio

Para finalizar, o meu amigo Vinicius Veiga, do SpinballNet, me propôs um desafio para essa coluna. Ele me ofereceu uma situação de jogo específica, que ele achava que o bunt seria uma opção vantajosa, e queria que eu testasse para descobrir o que uma análise científica diz sobre a questão. O cenário era o seguinte:

Parte de baixo da nona entrada, perdendo por um. O time tem zero eliminados, e homens na primeira e na segunda base. No bastão, um rebatedor abaixo da média, com alta taxa de groundballs, o que aumentaria a chance de uma queimada dupla (ele citou Nori Aoki, mas acabamos mudando para Ben Revere). Considerando que o bunt permitira que o jogo fosse empatado com um sac fly, e a maior probabilidade de um evento negativo com um rebatedor fraco no bastão, ele disse que nesse cenário um bunt provavelmente seria melhor para o time. E então é esse cenário que iremos agora testar.

Para começar, vocês devem ter reparado que esse cenário é semelhante ao descrito algumas seções atrás como um cenário favorável de bunt - homem na segunda base, zero eliminados, precisando de uma corrida. Eu propositalmente deixei de entrar demais nos méritos do cenário com homens na primeira e segunda base por ser um cenário mais complexo, que envolve mais fatores. Mas a matemática é igual, e o resultado (taxa de sucesso acima de 85% para ser vantajoso) é o mesmo. Então nessa situação do Vinicius, o resultado provavelmente seria o mesmo - ir para o bunt tenderia a aumentar a chance do time de empatar o jogo, especialmente com um caso mais "extremo" de ground balls no bastão.

No entanto, ainda é um cenário bastante interessante porque envolve uma variável diferente: ir para o bunt diminuiria suas chances de anotar de sair da entrada zerado (ou seja, aumenta as chances de anotar uma única corrida), mas também diminui suas chances de anotar mais de uma corrida na entrada. Anotar uma única corrida evita sua derrota, mas você ainda precisa ganhar no resto das entradas extras, enquanto anotar duas corridas já te venceria o jogo imediatamente. Então ao invés de focar nas corridas esperadas, vou olhar algo diferente: a chance de você vencer o jogo ou não.

Então para começar, temos 2 em base e 0 eliminados. Nessa situação, em média, um time vai anotar zero corridas 37.2% do tempo, e nesse caso o time seria derrotado. O time vai anotar mais do que uma corrida 40% do tempo, então nesse caso o time sairia vencedor. E anotaria apenas uma corrida nos 22.8% do tempo restantes, e nesse caso o jogo iria para entradas extras. Estou assumindo que, se o jogo for para entradas extras, a chance de cada time sair com a vitória é de 50%. Dadas essas circunstâncias, podemos chegar nas probabilidades de cada resultado para a equipe nesse cenário:




Bem próximo a 50%, como vocês podem ver.

Agora vamos supor um bunt. Vamos usar nossa velha conhecida, 84%, como taxa de sucesso. Nesse caso, eis nosso novo cenário:



Bem, você na verdade diminuiu suas chances de vitória... mas bem pouco, o suficiente para a situação específica provavelmente ter um grande impacto na sua decisão de ir ou não para o bunt, já que é bem 50-50 (importante observar que, caso de um bunt bem sucedido, o adversário poderia lotar as bases com um walk intencional, o que diminuiria ainda mais as chances de vitória da equipe, mas a diferença é pequena).

Agora vamos incluir na equação nosso bravo Ben Revere, um rebatedor abaixo da média com tendências extremas de GB%. Usando seus números de 2014, Revere conseguiu strikeouts em 7.9% das suas passagens pelo bastão; chegou em base sem uma rebatida em 4%; conseguiu rebatidas simples em 26.2%; rebatidas multibase em 3.6%; e o resto envolveu eliminações normais. Através dessa distribuição, vamos calcular exatamente qual a chance de cada cenário acontecer depois do at bat do jogador e, a partir disso, a chance de vitória esperada ao deixar o jogador rebater.

Para padronizar, estou considerando algumas coisas:

- uma rebatida simples vai impulsionar a primeira corrida, e o homem atualmente na primeira base só vai chegar até a segunda
- uma rebatida dupla vai impulsionar ambos os jogadores, vencendo o jogo automaticamente. Assim como uma rebatida tripla ou um Home Run
- no caso de uma eliminação que não seja double-play, estou considerando que nenhum jogador avançou base para facilitar as contas
- no caso de uma DP, os eliminados foram os jogadores na segunda e primeira base.

Para incluir as double plays no cálculo, voltei em cada at bat dele dos últimos dois anos e calculei a média do jogador em situações de DP, e o resultado foi de 11% - consideravelmente superior à média de 8% da MLB. Então vamos ver agora como fica nossa chance de vitória se Revere rebater normalmente:



Um pouco pior do que indo para o bunt, mas por muito pouco - apenas um ponto percentual. Considerando os ajustes e simplificações que tivemos que fazer no modelo, e considerando que a taxa de sucesso de bunt nessa ocasião fosse de 84% (eu imagino que seria menos), e que Ben Revere é um rebatedor abaixo da média. É um exemplo extremo (Revere liderou a liga em GB%), é seguro afirmar que essa diferença não é estatisticamente significativa. Ou seja, nesse cenário específico, a diferença estatística entre ir para o bunt e não ir é pequena o suficiente para ser irrelevante. Nesse caso, não existe uma resposta certa - depende muito mais do contexto (jogadores envolvidos, por exemplo) do que de uma diferença na situação em si. Um exemplo bastante interessante e instrutivo.


Conclusão

Então deixando o achismo para trás e aplicando métodos de análise científicos em situações de bunt, chegamos a algumas conclusões.

Primeiro, e mais importante, o bunt é bastante prejudicial em situações normais de jogo, e não deve ser feito exceto em situações muito específicas. Mesmo com as simplificações e trabalhando com menos cenários, a diferença ainda é muito grande e bastante significativa mesmo considerando diferentes times e jogadores envolvidos - muitos outros estudos já foram por caminhos menos simplificado e mais complexos, ajustando por outros fatores, e chegaram aos mesmos resultados.

Além disso, vimos que, mesmo no caso de um rebatedor bastante ruim no bastão, ainda não é vantajoso ir para o bunt. O nível de OBP de um jogador para justificar ir para o bunt ao invés de rebater normalmente é baixo demais para qualquer rebatedor qualificado da história do baseball, e é virtualmente impossível achar um jogador de campo ruim o bastante para justificar essa ação. Excesso em situações muito específicas, sempre é melhor ir para a rebatida do que para o bunt com rebatedores usuais.

No entanto, com pitchers o assunto é diferente. Temos evidências de que, dado que pitchers costumam ser muito inferiores no bastão (e mais propensos a DPs), de modo geral é vantajoso mandar seu rebatedor fazer um bunt do que deixar que ele rebata. E, ainda assim, nossos resultados também indicam que isso não é verdade para todos os casos, e que existe pitchers que tendem a ajudar mais o time rebatendo normalmente do que indo para o bunt - algo que também está alinhado a estudos recentes.

Por fim, encontramos algumas situações específicas que funcionam como exceções, nas quais os bunts não são prejudiciais. No caso de situações extremas de fim de jogo onde você precisa anotar especificamente uma corrida por algum motivo, por exemplo, vimos que o bunt pode aumentar ligeiramente suas chances de anotar essa uma corrida. Também analisamos um exemplo extremo de fim de jogo com uma corrida, de um rebatedor abaixo da média com tendências extremas de GB%, onde verificamos que ir para o bunt poderia ter um efeito positivo mínimo.

Nesses casos, as evidências e as diferenças numéricas são pequenas demais para serem consideradas estatisticamente significantes, então não podemos dizer que nessas situações especificas ir para o bunt é vantajoso, mas nossos dados também não dizem que seja prejudicial - em outras palavras, são duas situações extremamente específicas onde nossos dados apontam que não existe uma diferença quantitativa entre ir para o bunt ou não. Mas, como dissemos, são exceções muito específicas.

Em suma, o que fizemos aqui foi pegar um tópico de debate - a validade ou não do bunt - e aplicar métodos científicos para tentar chegar a uma resposta. É um estudo preliminar e rústico - estudos muito mais profundos e refinados foram feitos por outras pessoas ou instituições, e se tiverem interesse, recomendo que corram atrás dessas pesquisas - mas que deu resultados que estão de acordo com os achados da comunidade científica e que são baseados em evidências empíricas sólidas.

Se você discorda, ou se quiser aprofundar a questão, recomendo totalmente que corra atrás de suas próprias evidências e dados, porque é essa a essência das sabermetrics, e é isso que torna o debate muito mais rico e próximo da verdade. Quanto mais pessoas pesquisando e estudando o baseball de forma séria e competente, mais temos de base para falar com propriedade sobre o assunto, e chegamos cada vez mais longe em entender esse esporte - ou qualquer outro. Porque, como eu disse, sabermetrics se trata de aplicar métodos científicos no esporte, e esse mesmo pensamento pode ser aplicado em qualquer área que você quiser. Mantenha a cabeça aberta e uma mentalidade inquisitiva  e científica voltada para fatos e evidências, e um novo mundo se abre a sua frente. No caso em questão, um mundo dentro baseball, pronto para ser explorado e descoberto.


Os dados desse estudo vieram dos seguintes sites: Fangraphs, Baseball-Reference, Baseball Prospectus, Beyond the Box Score, Baseball Savant, gregstoll.com e Brooks Baseball. O alfa usado para os testes de significância foi de 5%. 

Agradecimentos especiais ao meu amigo Vinicius Veiga, pelo desafio e pela ajuda de modo geral, e aos meus ídolos Ben Lindbergh, do Grantland, e Daren Willman, fundador do excelente Baseball Savant, que me ajudaram com a pesquisa e com alguns dos dados mais trabalhosos dessa coluna.

3 comentários:

  1. Fala ae Vitor! Primeiramente, dou os parabéns pelo post. Muito explicativo, conseguiu esclarecer bem a situação do bunt e onde realmente executá-lo. Ótimo trabalho de pesquisa.

    Minha dúvida é a seguinte, conheço muito pouco de estatísticas avançadas ainda, então talvez esteja pensando em uma situação muito variável, mas fiquei pensando se não seria possível adicionar os pitchers nesse estudo (não como rebatedores, mas o pitcher da equipe que executou o bunt e que arremessa na entrada seguinte).

    Uma situação que pensei em que o bunt poderia se justificar: time na parte de baixo da oitava ou no topo da nona entrada com o jogo empatado, e repete-se a situação que você descreveu de utilidade do bunt para a parte de baixa da nona (com jogador na segunda base e nenhum eliminado). O time então tenta o bunt confiando que é alta a probabilidade do time anotar uma corrida e essa corrida significar a vitória.

    Nesse pensamento, o time confiaria plenamente no seu closer, mas acho que é um pensamento válido pelo menos para boa parte dos closers da liga (não conferi as estatísticas, mas imagino que a maioria dos closers confirme a vitória mesmo em situações de apenas uma corrida de diferença). Imaginei, portanto, uma outra aplicação lógica para o bunt, mas não sei se ela se justifica estatisticamente ou se seria muito forçado usar algo como porcentagem de saves em situações de uma corrida para explicar a decisão pelo bunt.

    Enfim, fica a minha dúvida para essa situação específica, mas também de maneira mais genérica se faz sentido ou não adicionar a confiabilidade dos relievers da equipe nesse estudo sobre a utilidade dos bunts.

    Valeu, abraços!

    ResponderExcluir
    Respostas
    1. Horácio, tudo bem? Que bom que gostou!

      Acho que nesse cenário que você descreveu, você pode argumentar que es encaixa no "precisar de apenas uma corrida".

      Mas queria frisar que nosso "modelo" mostra que não existe uma mudança significativa na probabilidade de anotar corridas indo para o bunt com homem na segunda base, mas que EXISTE uma queda significativa no total de corridas anotadas. Então acho que ainda seria o caso onde o bunt seria prejudicial, porque não diminui suas chances de sair da entrada sem corridas, mas também diminui a chance de anotar m´¨ltiplas corridas - e essa "garantia" sempre é bom. Então acho que ainda não seria o melhor caso para o bunt, estatisticamente ele ainda seria prejudicial a equipe.

      E eu tentei incluir pitchers no estudo, mas esbarrei em um problema de significância, então acabei tendo que abandonar por enquanto. Tentarei retomar essa linha futuramente, quando tiver tempo.

      Obrigado e espero ter esclarecido sua dúvida!

      Abraço!

      Excluir
    2. Esclareceu sim. Realmente, a hipótese que eu tinha pensado era bem pessimista, era anotar uma corrida só e se garantir arremessando na última (usei minha cabeça de torcedor dos Reds, que confia mais no Chapman do que em quase todo mundo do ataque hehehe). Mas você tem razão, isso não deixa de diminuir consideravelmente as chances de anotar mais corridas e encaminhar de verdade a vitória.

      Valeu pela resposta!

      Excluir