¿Qué es el WAR, por qué domina la MLB y frustra a los aficionados?

play
Dominio dominicano con el bate y venezolano en la lomita (3:59)

Analizamos en profundidad el pasado, el presente y el futuro del WAR, una estadística tan controvertida como poderosa en MLB


A principios de este mes, Roger Clemens visitó a los Milwaukee Brewers durante su reciente viaje a Houston, y entre los pitchers de los Brewers, visiblemente impresionados, se encontraba el veterano Brandon Woodruff, quien disfrutó la oportunidad de conversar sobre pitcheo con la leyenda.

"Soy un gran admirador de Roger Clemens y veo muchos de sus videos en YouTube", declaró Woodruff a ESPN. "Me gusta repasar sus mejores jugadas. Me encanta su actitud".

Tras el encuentro, Woodruff habló con MLB.com sobre la visita del lanzador. Al describir a Clemens, Woodruff tenía varios superlativos para elegir. Podría haber mencionado que Clemens pertenece al club de las 300 victorias o al de los 4,000 ponches, o simplemente aludir a los siete premios Cy Young que ostenta 'El Rocket'.

En cambio, Woodruff citó otra estadística: "Es decir, ése es el octavo WAR más alto en la historia del beisbol, entre bateadores y pitchers", dijo entonces. "Uno se queda asombrado. Este tipo es la personificación del pitcheo abridor".

Sí, entre todas las hazañas y reconocimientos históricos que rodean el legado de Clemens en el campo, Woodruff fue directamente al WAR. La clasificación histórica de Clemens en la tabla de Baseball Reference lo sitúa justo detrás de Hank Aaron y justo por delante de Tris Speaker.

Resulta que el WAR (victorias por encima del reemplazo) sirve para muchas cosas, incluso para describir la reacción de asombro de un pitcher al conocer a un colega legendario. Aun así, años después de que este sistema se popularizara en el beisbol, algunos creen que podría mejorarse y otros lo han rechazado por completo. Existen varias versiones públicas, principalmente el WAR de Baseball Reference (bWAR) y el WAR de FanGraphs (fWAR), y los equipos de la MLB también tienen sus propias cifras. Ni siquiera Woodruff es un verdadero fanático del WAR en lo que respecta a su propia carrera.

"Probablemente, me encuentro en un punto intermedio", dijo Woodruff cuando ESPN le preguntó sobre su opinión acerca del WAR. "Sé que diferentes sitios calculan el WAR de manera diferente. Algunos sitios simplemente valoran de forma distinta las métricas de los pitcheos o las de las pelotas bateadas, así que no les presto atención".

A medida que el WAR continúa evolucionando, vale la pena analizar qué lo ha hecho tan influyente y a la vez tan confuso, y cómo podría ser en el futuro. Por imperfecto que sea el WAR, se ha convertido, sin duda, en la estadística más importante del beisbol.


Cómo se popularizó el WAR

No hubo un momento específico en el que el WAR se convirtiera en la métrica principal del juego; ha sucedido de forma lenta y constante. FanGraphs lanzó su versión del WAR en 2008; Baseball Reference en 2010. Pero si hubo un momento clave para el WAR, cuando su existencia, usos y, sí, sus limitaciones, irrumpieron en el beisbol, probablemente fue en 2012.

Fue entonces cuando un novato con un talento extraordinario, el jardinero de Los Ángeles Dodgers, Mike Trout, arrasó con todos sus competidores con un bWAR de 10.1, el mejor de la MLB, más de dos victorias por encima de cualquier otro jugador. Sin embargo, a medida que avanzaba la temporada y el bateador de los Detroit Tigers, Miguel Cabrera, buscaba la primera Triple Corona de bateo del beisbol desde 1967, las discusiones se intensificaron.

Fue el debate definitivo entre la vieja y la nueva escuela, y fue un debate acalorado. Al final, Cabrera ganó tanto la Triple Corona como la votación para el MVP, obteniendo 22 de los 28 votos para el primer lugar. Aún se discute sobre esa contienda, aunque la persona más afectada comprende el caso de Cabrera.

"El tipo bateó para la Triple Corona, ¿verdad?". Aún maravillado por la hazaña de Cabrera, Trout comentó: "Es increíble".

Ninguno de los dos jugadores afirmaba comprender el WAR en aquel entonces, y para Trout, la situación no ha cambiado mucho, aunque el WAR lo señalaba como un futuro integrante del Salón de la Fama, incluso antes de cumplir las 10 temporadas requeridas en la MLB para ser elegible.

"Sin duda, lo conozco", dijo Trout. "No sabría decirte cómo lo calculan. Pero parece que en los últimos 10 o 15 años, cuando evalúan a los jugadores, se basan en eso".

Si bien el debate entre Trout y Cabrera por el MVP no resultó en una aceptación o rechazo universal del sistema WAR, sí aumentó su conocimiento.

Quizás su mayor popularidad se consolidó al año siguiente, en 2013, cuando Topps comenzó a incluir el WAR en el reverso de algunas de sus tarjetas, una práctica que desde entonces se ha convertido en estándar.


¿Por qué las dos versiones principales de WAR son tan diferentes y cómo poder entenderlas?

Para muchos, la confusión sobre el WAR comienza con el simple hecho de que los dos principales proveedores de esta métrica —Baseball Reference y FanGraphs— suelen llegar a conclusiones distintas. Las diferencias son mínimas, salvo en algunos casos. Algunos ejemplos de la temporada actual y posteriores:

• El desempeño de Shohei Ohtani como bateador y lanzador de Los Angeles Dodgers lo posiciona como uno de los jugadores más valiosos del beisbol. Este año, con 5.5 WAR combinados en Baseball Reference, lidera la MLB, pero recientemente superó en 0.3 WAR al pitcher abridor de los Philadelphia Phillies, Cristopher Sánchez. En FanGraphs (5.8 WAR combinados), Ohtani ha estado por delante por más tiempo, y ahora tiene casi una victoria de ventaja sobre Pete Crow-Armstrong de los Chicago Cubs (4.9), quien ocupa el segundo lugar.

• Sánchez es segundo en Baseball Reference con 5.2 WAR, pero es cuarto en FanGraphs (3.9), una diferencia considerable de 1.3 victorias.

• El bateador designado de los Houston Astros, Yordan Álvarez, ocupa el sexto lugar en FanGraphs (3.6). En Baseball Reference, su bWAR de 3.6 es el mismo total, pero se ubica en el puesto 16.

• En cuanto a su trayectoria, el bWAR de Walter Johnson, pitcher derecho del Salón de la Fama, con 168.4, es el segundo mejor de todos los tiempos, solo superado por Babe Ruth. En FanGraphs, incluso sumando su fWAR de bateo de 9.5, ocupa el puesto 13 de todos los tiempos, con 125.9.

Esto es una selección sesgada de datos, pero la idea se entiende. Los dos principales sistemas de WAR suelen obtener respuestas considerablemente diferentes a las mismas preguntas.

Las diferencias son producto de los distintos datos de entrada, las decisiones tomadas sobre cuáles usar y cómo usarlos. Se detallan aquí, y son numerosas. El investigador, analista y ex consultor de los Toronto Blue Jays, Sean Smith —conocido en internet como Rally Monkey— creó una versión del marco de WAR que fue adoptada por Baseball Reference, y observa los mayores contrastes en cómo los diferentes sistemas distribuyen el mérito y la responsabilidad entre el pitcheo y el fildeo.

"Casi siempre que se observa una diferencia entre jugadores, se debe a las estadísticas defensivas", afirmó Smith, cuyo libro "WAR in PIECES" explica el pasado, el presente y el posible futuro de cada aspecto de este marco de trabajo. Mantiene una versión revisada del WAR y otras métricas basadas en victorias en BaseballProjection.com.

Baseball Reference y FanGraphs consideran este contraste una ventaja, no un inconveniente, y puede que tengan razón.

"Sin duda, es una ventaja", declaró Tom Tango, arquitecto de bases de datos de estadísticas de MLB Advanced Media, cuyo trabajo pionero en el cálculo del WAR sentó las bases de las versiones actuales del sistema, accesibles al público. "No estoy aquí para decirles qué deben pensar. Simplemente digo: bueno, si les importa esto, así es como deben calcular el WAR, y si les importa lo otro, así es como deben calcularlo. FanGraphs y Baseball Reference han adoptado dos puntos de vista totalmente opuestos, lo cual me parece fantástico. Porque entonces sé que la respuesta correcta está en algún punto intermedio entre ambos".

En cuanto a explicar el WAR a un aficionado ocasional, es una desconexión difícil de ignorar, sobre todo porque, repito, el marco es el mismo, al igual que la etiqueta de la estadística: ambas son WAR.

"Es sólo una forma de que la gente asigne valor, que es de lo que se trata este juego ahora, porque si no puedes asignar un valor, entonces realmente no sabes cómo jugar hoy en día", dijo Vinnie Pasquantino, primera base de los Kansas City Royals, experto en análisis de datos. "Así que eso es todo. Es una herramienta para que el público pueda clasificar a los jugadores".

En los inicios de la disponibilidad del WAR en FanGraphs y Baseball Reference, las diferencias eran aún más profundas que ahora. Esto se debía al concepto de "reemplazo" del WAR: victorias por encima del nivel de reemplazo. En aquel entonces, ambos sitios utilizaban criterios muy distintos para definir el nivel de reemplazo, es decir, el rendimiento de los jugadores disponibles libremente, de esos que se pueden convocar desde la Triple-A cuando se necesitan.

En 2013, los responsables de ambos sitios llegaron a un acuerdo y adoptaron una medida similar del nivel de reemplazo. Así, existe un precedente para que los sistemas se acerquen. Sin embargo, un obstáculo para que esto vuelva a suceder es que, en cierto modo, los objetivos de las versiones rivales del WAR no son los mismos.

En resumen, el WAR de FanGraphs funciona como una estimación precisa del talento, útil para proyectar el futuro y realizar valoraciones económicas. La versión de Baseball Reference se centra más en la distribución del mérito, describiendo lo que realmente sucedió. Si bien es una simplificación, capta la esencia del problema. "FanGraphs se basa en el proceso", dijo Jerry Dipoto, presidente de los Seattle Mariners. "Se trata de lo que haces. Baseball Reference, en cambio, se basa en los resultados".

Entre quienes comparten esta opinión se encuentra Sean Forman, presidente de Sports Reference L.L.C., la empresa que gestiona Baseball Reference.

"No sé si (FanGraphs) estaría de acuerdo, pero para mí la principal diferencia es que la versión de B-R intenta explicar lo que sucedió en el campo", escribió Forman en un correo electrónico. "Mientras que FanGraphs se centra más en el nivel de habilidad de los jugadores".

Esta distinción crucial suele pasar desapercibida para quienes comparan los valores WAR de ambos sitios y creen que persiguen el mismo objetivo. Pero, en realidad, no es así.

El enfoque prospectivo de FanGraphs resulta ideal para quienes buscan tomar decisiones basadas en resultados proyectados, un amplio sector del mundo del beisbol que incluye a los numerosos aficionados al Fantasy Baseball.

"Una victoria en el WAR de FanGraphs es muy similar a una victoria en el WAR de los Mariners, y supongo que también a una victoria en el WAR de los White Sox", afirmó Dipoto. "Todos operamos con un sistema similar. Pero con el paso de los años, se aprecian las pequeñas diferencias".

Al filtrar la mayor cantidad posible de factores que escapan al control directo del jugador, FanGraphs ofrece una estimación más precisa de su nivel de talento subyacente. Los datos del fWAR son más estables desde el punto de vista de la proyección. Esto refuerza su utilidad como estimación del valor del jugador.

Y si te centras en estimar el valor de los jugadores, el concepto de nivel de reemplazo es ineludible. Esto convierte al fWAR tanto en un indicador económico como en una estadística de beisbol, algo muy útil para quienes piensan como ejecutivos de beisbol o analizan transacciones.

"Tenemos nuestra propia fórmula para el WAR", dijo el presidente de los Royals, J.J. Picollo. "Personalmente, la uso más en la temporada baja, cuando intentamos armar el roster. Cuando analizamos cómo nos comparamos con otros clubes. ¿Dónde somos más débiles? ¿Dónde necesitamos mejorar más?".

Pero esto no significa que la versión de WAR de FanGraphs sea mejor que la de Baseball Reference, ni que la de ningún equipo en particular. Simplemente son diferentes, y se podría argumentar que Baseball Reference hace el mejor trabajo al medir lo que ya ha sucedido en el campo, al no intentar contextualizar demasiados aspectos del historial de rendimiento de un jugador.

Este enfoque resulta útil al analizar aspectos como la candidatura a premios, el Salón de la Fama o cualquier tipo de investigación histórica.

"Animo a la gente a que examine las cifras subyacentes para comprender cómo llegamos al valor final", dijo Forman. "Mostramos todo nuestro proceso. Me gusta que el WAR pueda revelar actuaciones mucho mejores o mucho peores de lo que se pensaba en su momento".

Las principales diferencias entre las versiones de WAR de FanGraphs y Baseball Reference radican en la prevención de carreras. Baseball Reference basa su WAR de lanzador en las carreras permitidas, ajustadas según la defensa del equipo, en lugar del FIP (Fielding Independent Pitching), más teórico, en el que se basa FanGraphs para su versión del WAR de lanzador. Ésta es una diferencia fundamental en la filosofía.

"Existen muchas métricas diferentes para medir el valor de un pitcher", afirmó Matthew Boyd, abridor de los Chicago Cubs. "Está SIERRA, está FIP, está ERA, está WAR. Creo que la verdadera pregunta es si existe alguna que pueda resumir el valor total de un lanzador. Al fin y al cabo, todo se reduce a un algoritmo, ¿no? ¿Cuál es el sesgo? ¿Qué es lo que se valora más?".


¿Qué hace que el WAR sea tan atractivo para los equipos, e incluso para muchos jugadores?

Si nos alejamos un momento de los sistemas WAR actuales y pensamos de forma más general, quizás sea más fácil comprender su atractivo. Tenemos un sólo número que evalúa el rendimiento de todo tipo de jugador y permite compararlos entre equipos, ligas, estadios e incluso épocas. Y se expresa en la máxima expresión del beisbol: las victorias.

Esta expresión es el punto de partida perfecto para cualquier debate o investigación sobre beisbol. ¿Quién es el MVP? ¿Cómo comparamos a los diferentes tipos de jugadores? ¿Cómo decidimos quién merece entrar al Salón de la Fama? Es una herramienta para comprender y contextualizar, incluso para los profesionales del beisbol de más alto nivel.

"Comparar jugadores de diferentes posiciones es difícil", dijo Aaron Judge, tres veces MVP de los New York Yankees. "No sé si se puede cuantificar con precisión el valor que aporta cada jugador, comparando jardineros izquierdos, primera base, shortstops, jardineros centrales, catchers y pitchers. Creo que es complicado, pero da una idea general del valor que aportan al juego o al equipo".

Si bien los debates sobre la carrera por el MVP de la Liga Americana de 2024 no alcanzaron el nivel de la rivalidad entre Trout y Cabrera, la competencia entre Judge y el shortstop de los Royals, Bobby Witt Jr., fue un buen ejemplo de cómo el WAR cumple su función. Creó una medida común entre dos tipos de jugadores muy diferentes: el clásico bateador de poder contra el jugador utility, atlético. Judge se distanció en la carrera por el WAR hacia el final de la temporada y terminó siendo elegido MVP por unanimidad.

"Es difícil para los jugadores aceptar algo que los evalúa, y saben que no es 100 por ciento objetivo, ¿verdad?", dijo Pasquantino. "Cuando funciona bien, puede tomar a un jugador como Bobby, con todas sus habilidades, y luego a un jugador como Aaron Judge, y, como en la carrera por el MVP de hace dos años, puede hacer una comparación bastante interesante, aunque generen valor de maneras muy diferentes. Eso es lo que necesita lograr".

Witt, quien afirma que se remite a Pasquantino en todo lo relacionado con las métricas, sin duda ha estado expuesto al WAR con bastante frecuencia. Al fin y al cabo, ha aparecido en el reverso de las tarjetas de beisbol desde que Witt tenía 13 años, y es un ávido coleccionista.

"Realmente no sé qué hay detrás de esos números y demás, porque no puedo controlar nada de eso", dijo Witt. "Así que no quiero investigarlo y pensar: 'Si hago esto, conseguiré mi WAR'. Obviamente, como jugador, quieres tener un WAR alto porque así ayudas al equipo a ganar".

Si tienes alguna duda sobre la eficacia del WAR, confía en la palabra de quienes dirigen los equipos, arman los rosters y dependen de valoraciones precisas del talento beisbolístico para conservar sus puestos entre los principales ejecutivos del beisbol.

"Creo que estamos en una etapa de la historia del beisbol en la que cada club tiene algún tipo de estadística", dijo Dipoto. Cuando empecé en el mundo del scouting y el desarrollo de jugadores, se calificaba a cada jugador según el sistema de puntuación que se utilizara. Podía ser una A, una B o una C. Podía ser un 40, un 60 o un 80. Creo que ahora los 30 equipos tienen algún sistema para valorar a un jugador, y suele ser alguna variante del WAR (Victorias por encima del reemplazo).

En este contexto, es útil considerar el WAR más como un marco de referencia que como una estadística o métrica: un sistema de datos combinados para generar un cálculo que pretende medir el valor de la producción beisbolística. Los sitios web públicos que calculan el WAR utilizan datos diferentes. Y lo mismo ocurre con los 30 equipos de beisbol.

Por eso no existe un consenso claro sobre qué versión del WAR es la 'correcta', ni siquiera si alguna lo es. Los equipos utilizan este marco de referencia, o uno muy similar, pero más allá de eso, no podemos saber cómo lo adaptan a sus necesidades y culturas específicas, ya que esa información es clave para lo que los equipos esperan que se convierta en una ventaja competitiva.

"Lo único que intentamos es valorar a los jugadores como corresponde", dijo Matt Arnold, presidente de los Milwaukee Brewers. "Todos lo hacen, y luego se trata simplemente de cómo se hace. Eso implica muchísimos factores, ¿verdad?".

Si bien los equipos nunca serán transparentes sobre sus procesos internos, lo interesante de las versiones públicas del WAR es que intentan hacer muchas de las mismas cosas que los ejecutivos del beisbol. Así que, si seguimos de cerca el beisbol, o a un equipo en particular, es útil organizar nuestro pensamiento a través del prisma del WAR. Nos acerca a quienes toman las decisiones para los equipos que amamos.

Aunque no todos los jugadores están de acuerdo con el WAR, muchos lo siguen. Para alguien como Judge, quien dijo que su estadística favorita de niño era el promedio de bateo, es emocionante ver cómo se mide a las grandes figuras del pasado y dónde podría encajar él en ese contexto histórico.

"Siempre me parece genial ver el WAR de Barry Bonds, el WAR de Babe Ruth", dijo Judge. "Mike Trout, incluso después de 10 años en el beisbol, ya tenía un WAR de 80, y hay algunos miembros del Salón de la Fama que también lo tienen. Realmente no conozco todos los números que se usan para calcularlo, pero siempre me resulta fascinante ver las estadísticas de los miembros del Salón de la Fama."

Si bien todas las estadísticas de beisbol tienen su propio encanto, siempre hay espacio para más si contribuyen a nuestra comprensión del deporte. Sin embargo, el "si" en esa frase es importante.

Una versión perfecta del sistema WAR sería la estadística definitiva del beisbol. El problema, como muchos señalan, es que el marco/sistema/estadística/medición sigue siendo no sólo incomprensible para muchos jugadores y aficionados, sino que también está en desarrollo. Pero el trabajo, por innumerables razones, vale la pena.

"Creo que es genial ver, por ejemplo, a un jugador que no batea bien, pero cuya defensa es increíble, lo que demuestra cómo ayuda al equipo", dijo Witt. "Porque, en esencia, WAR es como: '¿Qué puedes hacer para ayudar al equipo?'"


¿Qué pasará en el futuro con el WAR?

Lo ames o lo odies, el WAR llegó para quedarse. No sólo está profundamente arraigado en la cobertura del beisbol y en las oficinas de los equipos, sino que está literalmente codificado en el convenio colectivo.

Esa versión del WAR, utilizada como mecanismo para distribuir el dinero de un fondo de bonos previo al arbitraje, es una misteriosa fórmula acordada entre la MLB y la Asociación de Jugadores de la MLB. Pero si crees que los jugadores no le prestan atención, te equivocas. Esto es especialmente cierto para los jóvenes relevistas, quienes se han dado cuenta de que no es fácil destacar en el marco del WAR. Esa realidad les está costando dinero.

"Los relevistas están en aprietos", dijo Pasquantino. "Es decir, están en aprietos, en general, pero sobre todo con esa estadística".

Si el WAR es una característica permanente del beisbol, debe seguir evolucionando, especialmente en una era donde la proliferación de Statcast y tecnologías relacionadas ha dado lugar a una explosión de mediciones hiperdetalladas que nos permiten ver aspectos del juego de una forma inimaginable hasta ahora.

En cuanto a la expresión de métricas basadas en victorias, es importante señalar que existen otras además de las que utilizan el nivel de reemplazo, como el WAR. Baseball Reference genera el bWAR, pero también utiliza las victorias por encima del promedio, aunque no se menciona con tanta frecuencia en la cobertura del beisbol. El WAR es la métrica preferida por la mayoría, pero si se desea ver las clasificaciones desde la perspectiva del WAA, también es fácil hacerlo.

Además, se podría argumentar que, a la hora de elegir ganadores de premios, equipos All-Star o miembros del Salón de la Fama, el promedio o el número absoluto de victorias deberían ser la medida a considerar. ¿Realmente queremos usar el valor de reemplazo al evaluar la candidatura de un jugador al Salón de la Fama?

"Creo que hay argumentos para usar el WAA en el contexto de los casos del Salón de la Fama", dijo Forman. "Se trata de identificar a los jugadores con su máximo potencial, en lugar de a aquellos que acumularon un rendimiento promedio durante mucho tiempo".

Todo se reduce a la moneda esencial del beisbol: las victorias, y la forma en que se miden siempre está sujeta a cambios.

"Debemos reevaluar y actualizar un par de áreas", dijo Forman. "Factores del estadio, confirmar nuestras estadísticas defensivas, dónde se encuentra el nivel de reemplazo actual y el valor relativo de las distintas posiciones defensivas. Estamos más enfocados en el pasado, así que me gustaría que sigamos completando nuestros datos históricos, especialmente, los de las Ligas Negras".

Mientras funcionen, las medidas basadas en victorias seguirán proliferando, aunque son sólo un punto de partida para el debate, no la solución definitiva. Todavía existen múltiples maneras de evaluar el valor de un jugador, incluso entre aquellos cuyo sustento se juzga mediante el WAR.

"Las carreras impulsadas... para mí suelen ser lo más importante", dijo Judge. "Se trata de carreras impulsadas y carreras anotadas. Si anoto muchas carreras al llegar al plato, creo que estaremos en una buena posición".

"OPS, porcentaje de embasamiento", dijo Trout. "Si tu OPS está en los .900, significa que estás haciendo algo. Y embasarse es fundamental".

Si el objetivo es crear una versión "real" del WAR —una definitiva que logre una aceptación casi universal—, MLB Advanced Media, gracias a la precisión de sus mediciones de Statcast, sería una fuente probable. El problema es que eso no es necesariamente la prioridad del grupo. Hay demasiadas áreas del juego que abarcar: un sinfín de preguntas que hasta ahora no se han respondido con precisión.

"Técnicamente, nada lo impide", dijo Mike Petriello, escritor y analista de MLB.com. "Siento que mucha gente pensó desde el primer día de Statcast que el objetivo era un único número clave que lo dominara todo. En realidad, el objetivo principal es cuantificar todos los aspectos interesantes que se presentan a lo largo del camino."

Bill James escribió que las estadísticas de beisbol han adquirido la fuerza del lenguaje. Podrías empezar a charlar con un completo desconocido sobre el juego y referirte a "un bateador de .300" sin necesidad de más explicaciones. La estadística había adquirido un significado tan específico que funcionaba como el lenguaje común.

El WAR del beisbol, o cualquier forma que adopte en el futuro, está lejos de eso, al menos no en el público general. Existe en los círculos internos del beisbol, donde se oye decir cosas como "lo considerábamos un jugador de cinco victorias", y quizás el resto de los aficionados al béisbol también lleguen a esa conclusión.

El propósito del archivo estadístico del beisbol no es sólo crear listas, zanjar discusiones y generar material para análisis avanzados y la valoración de jugadores. También sirve para compartir recuerdos e historias, para conectar el presente con el mayor tesoro del beisbol: su larga y gloriosa historia, tanto en el terreno de juego como en los libros de récords.

Si el WAR contribuye a ello, su existencia habrá valido la pena.