¿Y si Mourinho tuviera razón?

ilustración

(con J. Ignacio Conde-Ruiz) Recientemente el entrenador del Real Madrid, José Mourinho, ha manifestado que la Liga de Fútbol española esta manipulada porque el calendario de los partidos favorece al FC Barcelona frente al Real Madrid en términos de días de descanso previos a los partidos.

Se nos ha ocurrido escribir un post semiserio sobre el argumento porque creemos que la reacción a las declaraciones de Mourinho es un buen ejemplo de algo que ocurre a menudo en España: se gastan ríos de tinta sin hacer ningún esfuerzo para establecer si los hechos a los que se hace referencia son reales o no. Si este esfuerzo se hiciera, evitaríamos leer comentarios tan ridículos como que ambos equipos han tenido los mismos días de descanso (¿cómo podría ser de otra forma, si han jugado los mismos partidos en lo que llevamos de temporada?).

El argumento de Mou se basa en que la Liga de Fútbol  al determinar en que día del fin de semana (sábado o domingo) se juega el partido de liga podría estar favoreciendo a un equipo frente al otro. Para analizar la posible manipulación es importante no solo analizar cuantos días de descanso tiene cada equipo en los partidos de la Liga, sino también cuantos tuvo antes de partidos en otras competiciones. La razón es que si, por ejemplo, un equipo tiene un importante compromiso de Champions League, pongamos que el miércoles, de cara a la competición de Liga se le perjudica igual tanto si se le pone el siguiente partido de Liga el sábado (acortando los días de descanso) como si se le pone el partido de liga previo el domingo (dejándole menos días para descansar de cara al importante partido y obligándole a reservar jugadores en la Liga).

Por ello lo primero que vamos a hacer es  comparar los días de descanso previos a cada partido de ambos equipos. Para calcularlo hemos tenido en cuenta todos los partidos jugados por ambos clubs (Liga, Champions y Copa del Rey) así como los partidos jugados con las selecciones. Hemos decidido introducir los partidos de la selección ya que todos los titulares del Real Madrid y del Barcelona son internacionales.

Como ya hemos dicho antes,  y no puede ser de otra manera, ambos equipos han tenido los mismos días de descanso desde el inicio del campeonato: 154 días. Pero no es lo mismo jugar dos partidos seguidos que hacerlo de forma espaciada en el tiempo. Si partimos del hecho de que lo mejor deportivamente para un equipo es tener distribuidos uniformemente los partidos en tiempo, podemos decir que lo mejor para un equipo es tener la varianza en la distribución de días de descanso lo más pequeña posible. Ya que desde el principio del año se han jugado 48 partidos y ha habido 154 días descanso, el descanso promedio por partido es 154/48=3.208 días. La varianza mínima (0.2) entonces se alcanzaría si de cada cinco partidos jugados, cuatro partidos tuvieran 3 días de descanso previo y un partido tuviera 4 días de descanso previo. Evidentemente esta varianza es una cota inferior a la varianza que podría obtener la Liga de Futbol Profesional pues implicaría  tener poder para controlar los calendarios internacionales y posiblemente renunciar a ciertos ingresos por los  derechos televisivos.

Pues bien si nos fijamos en la distribución de los días de descanso previos a todos los partidos, el Real Madrid tiene una varianza mayor que la del FC Barcelona, 2,89 frente a 2,85.

En realidad, alguien podría pensar que es más relevante analizar cuantos días de descanso ha tenido cada equipo en dos o más partidos consecutivos, pues lo que realmente puede hacer daño a un equipo es tener que jugar varios partidos seguidos con tiempos de recuperación muy cortos. Para analizar esta posibilidad hemos calculado la distribucion de días de descanso para dos, tres y cuatro partidos consecutivos.

Los resultados principales están resumidos en la Tabla 1. Como se puede ver el Real Madrid tiene una varianza mayor en los días de descanso que el FC Barcelona.

Tabla 1. Varianza de descansos previos a 1, 2, 3 y 4 partidos consecutivos

 

1 partido 2 partidos 3 partidos 4 partidos
Real Madrid 2,98 4,93 7,50 10,11
FC Barcelona 2,85 4,47 6,00 8,70

La Tabla 1 por lo tanto indica que el calendario ha distribuido el total de días de descanso de manera menos uniforme para el Real Madrid que para el FC Barcelona.

Hay una forma sencilla de visualizar las diferencias entre las distribuciones de los días de descanso para el Real Madrid y el Barcelona y así confirmar la comparación que se deriva de las comparaciones de las varianzas. En la Figura 1 representamos las funciones de distribución de los días de descanso previos a los partidos (para 1 partido, y también para 2, 3 y 4 partidos). Lo que hay que destacar es que la distribución del Real Madrid siempre está por encima de la del FC Barcelona en la parte baja de la distribución. Esto quiere decir que el Real Madrid ha tenido más ocasiones en las que ha tenido que jugar un partido después de pocos días de descanso o se ha enfrentado a una secuencia de partidos (2, 3 o 4) con pocos días de descanso. Por ejemplo el primer panel indica que los jugadores del Real Madrid han jugado 37 partidos con 3 días de descanso o menos (es decir 3 ó 2 días) frente a los 35 partidos para los jugadores del FC Barcelona.

Figura 1. Función de distribución de los días de descanso previos a 1, 2, 3 y 4 partidos consecutivos


 

La Figura 2 a continuación es para el que prefiera ver un resumen de las frecuencias individuales de partidos.

Figura 2. Distribución de frecuencias de los días de descanso previos a 1, 2, 3 y 4 partidos consecutivos


 

 

Conclusiones

Ambos autores estamos de acuerdo que este simple ejercicio de contabilidad demuestra que el Real Madrid, hasta la fecha, ha tenido peor calendario que el FC Barcelona, en cuanto a la distribución de los días de descanso.

Pero no hemos conseguido ponernos de acuerdo en que ello implique que la competición esté manipulada. Quizás no es casualidad que el autor madridista cree probada la manipulación, mientras el anti-madridista piensa que las diferencias no son suficientemente grandes como para pensar en una manipulación.

Como hemos dicho al principio, este es un post semiserio (aunque posiblemente más serio de un estudio de ABN Amro del que el antimadridista habló en otro post). Esto quiere decir que únicamente queríamos hacer ver que a veces con poco esfuerzo es posible hablar de cosas basandose en hechos reales. No hemos querido ir más allá con nuestro análisis. Pero si alguien quisiera refutar nuestro ejercicio o hacer análisis más sofisticados, aquí dejamos los datos que hemos utilizado (y aprovechamos para dar las gracias a Manuel García y Roberto García en la recopilación de los mismos).

Hay 69 comentarios
  • Caray, dado que habeis hecho el recuento para las 48 observaciones hasta el momento, no es tan dificil ver, como dice Mou, si los dias de descanso del Madrid proceden de una "poblacion" diferente que los del Barça, en cuanto a su varianza. Ya os doy directamente el comando de Stata...

    sdtest DiasdeDescansoRM == DiasdeDescansoFCB

  • Permiteme refutar la siguiente conclusión: "Real Madrid, hasta la fecha, ha tenido peor calendario que el FC Barcelona". Haciendo un simple test de hipótesis sobre la igualdad de las varianzas, con las siguientes hipótesis:

    H0: varianza de descansos del madrid= varianza de descansos del barcelona
    Ha: varianza de descansos del madrid >=varianza de descansos del barcelona

    No podemos rechazar la hipótesis nula de que ambas varianzas sean iguales para casi cualquier nivel de significación (alfa>0.1). Por tanto, no existe ningún tipo de favoritismo hacía el Barcelona que sea estadísticamente significativo.

    Por cierto, buena iniciativa de los autores!

  • Muy interesante vuestro estudio. Me gustaria, si os parece oportuno, aportar los siguientes datos (calculados a partir de vuestros datos complementándolos con los horarios de los partidos celebrados):

    Hora media de comienzo de los partidos del Real Madrid de Liga y Copa: 20:45 h
    Hora media de comienzo de los partidos del Real Madrid de Liga y Copa en casa: 20:46h
    Hora media de comienzo de los partidos del Real Madrid de Liga y Copa fuera: 20:43h

    Hora media de comienzo de los partidos del Barcelona de Liga y Copa: 20:31 h
    Hora media de comienzo de los partidos del Barcelona de Liga y Copa en casa: 20:34h
    Hora media de comienzo de los partidos del Barcelona de Liga y Copa fuera: 20:26h

    Promedio de dias de descanso antes y despues de que el Real Madrid juegue un partido de Champions: 2.81 dias

    Promedio de dias de descanso antes y despues de que el Barcelona juegue un partido de Champions: 3.00 dias

    HECHOS (no bla, bla, bla, hipótesis rocambolescas, ocurrencias, o similares):

    1) El Real Madrid (según vuestro estudio donde se concluye que la varianza del número de dias de descanso es mayor en el caso del Real Madrid), tiene periodos de descanso más cortos que el Barcelona (junto con periodos más largos puesto que esto precisamente recoge la varianza, no es más que una medida de la dispersión de la media), lo cual es perjudicial para el Real Madrid y beneficioso para el Barcelona (esto último no es un hecho, es simplemente mi opinión)

    2) Los partidos del Real Madrid empiezan más tarde que los del Barcelona, la diferencia es mayor cuando juegan fuera. (Nuevamente, en mi opinión, es más perjudicial cuando juegan fuera ya que los jugadores tienen que, en la mayoria de las veces, coger un avión de regreso y llegan de madrugada a sus casas sin dormir ni descansar prácticamente nada)

    3) El número de días de descanso antes y después de los partidos de Champions (en mi opinión, los que requieren mayor intensidad por el mayor nivel de los equipos contrarios) es menor para el Real Madrid que para el Barcelona.

    En conclusión, en promedio, el Real Madrid juega más tarde , sus jugadores cuando juegan fuera tienen menos horas para descansar por coger sus vuelos de regreso más tarde, y tienen menos días de descanso antes y después de jugar Champions. ESTO SON HECHOS, insisto.

    ¿Se demuestra con esto que hay manipulación? No, en absoluto.

    Pero en mi opinión, con los hechos descritos anteriormente, no tengo duda de que el calendario del Real Madrid es peor que el del Barcelona y todos los hechos apuntan en la misma dirección, no es que unos favorezcan al Madrid y otros lo perjudiquen, es que en mi opinión, todos las diferencias importantes en el calendario perjudican al Real Madrid.

  • Marco:
    Personalmente, creo que entiendo el mensaje que queréis transmitir, y es que los periodistas (y los lectores) deberían aproximarse de una forma más científica a los datos. También tengo claro que no le dais la razón a Mourinho, aunque evidentemente cada uno lee lo que más le conviene.

    Ahora, tampoco estoy de acuerdo en el tema que habéis elegido ya que vuestra aproximación, aunque probablemente sea más científica en el método, sigue siendo un castillo de naipes. De ahí que señalara directamente a la premisa, de la que habría mucho que hablar. ¿Es realmente mejor? ¿Si lo es, a que grado afecta al rendimiento?
    ¿Luego, se puede asegurar que los jugadores están descansando durante los días de descanso (imagina 11 Gutis/Ronaldinhos)? ¿Que hay acerca de la preparación física y/o la dieta? ¿No habría que incluirlos también en la ecuación? ¿Como medimos las rotaciones en los equipos? ¿No habría que calcular el descanso por jugador y después contabilizar el descanso total? ¿El cansancio psicológico existe? ¿Afecta al rendimiento físico? ¿Incluimos los partidos de la selección? ¿Como se mide el cansacion de los viajes / jet lag (caso Messi, Marcelo, etc.)? ¿Que hay del cansacio acumulado? ¿Por que razón hay que empezar a calcular desde el inicio de liga? ¿Como afecta la edad de los jugadores? etc. etc. etc.

    Para mi, esto es como coger que la afirmación de Mourinho que los equipos no juegan al 100% contra el Barcelona y querer demostrarla de una forma científica, o como ya han hecho algunos ... calcular la temperatura del infierno! ... hay que hacer un acto de fe simplemente para aceptar las premisas y ya no te digo nada para aceptar los resultados.

  • Alfonso:

    Me dejas abrumado por varias razones.

    1) Así me gusta, mirando a los datos. ¿Podrías enviarme los horarios de los partidos?

    2) Sinceramente me ha sorprendido lo que me dices de los dias de descanso alrededor de los partidos de Champions. No nos habíamos fijado, porqué como empezamos por la idea de que la media tenia que ser la misma, pensamos que había que mirar a la varianza. Pero, claro, la media tiene que ser la misma para el conjunto entero, pero no para un conjunto de partidos aislados (no consecutivos a la vez que muy importantes). Lo miraremos con cuidado. Pero esto, cuantitativamente, podría ser incluso más importante que lo de la varianza de los descansos.

    3) Lo de las horas también es curioso. Aquí sí creo que se podría hacer un test para ver si las medias son significativamente distintas.

    4) No quiero precipitarme, pero, si es verdad lo que dices, podría ser verdad que "todas las diferencias importantes en el calendario perjudican al Real Madrid." "¿Se demuestra con esto que hay manipulación? No, en absoluto." Empiezo a preguntarme si no merece la pena mirarlo más detenidamente.

  • Harkonnen:

    Te resumen de lo que pretendiamos inicialmente es perfecto.

    Estoy de acuerdo en que puede ser importante tener en cuenta otros efectos que nosotros ignoramos deliberadamente. Pero me parece que entre lo que hizo la prensa (contar el total de los días) y tu teoría general del futbol y del descanso debería haber un termino medio más manejable.

  • Eduardo:

    Por lo que he podido comprobar el test que nos sugiere supone que las variables son iid y normales. Ninguna de estos supuestos se cumple en este caso. Que el numero de dias de descanso no es normal parece obvio. Pero, ademas, si te fijas en los histogramas tampoco se le acerca. Lo que es más grave es que los numeros de días de descanso no son independientes, por una simple razón: que en cada jornada en la que el RM y el B juegan el mismo día (como el sabado pasado) los totales de días de descanso tienen que ser identicos. Creo que existen otros tests en Stata que son robustos a la ausencia de normalidad. Pero no se si hay alguno para distribuciones que no solo no son normales sino que no además no son serialmente independientes.

  • Laurent:

    ¿Quieres decir que has hecho el test? ¿Cómo lo has hecho? ¿Cómo has resuelto el problema de la ausencia de normalidad y de la dependencia?

  • Marco,

    gracias por tu respuesta. Venga, vale "pulpo" como animal de compañía ...

    Al final este post es de los que más respuestas y entusiasmo ha levantado ... ¿alguna reflexión sobre esto?

    Gracias por el pasatiempo y un abrazo

  • Jose Pablo:

    1. "Venga, vale “pulpo” como animal de compañía … " Me encanta tu resumen.

    2. "Al final este post es de los que más respuestas y entusiasmo ha levantado … ¿alguna reflexión sobre esto?" No creas que no estamos pensando en ello. Ha habido muchos comentarios muy útiles. A mi personalmente me ha hecho reflexionar mucho sobre el asunto. La opinión que tengo ahora no es la misma que tenía al principio. Lo he dicho varias veces. Nacho y yo pensamos incialmente en un puro ejercicio de contabilidad y pensabamos que no daría más de sí. Pero ahora no somos tan escepticos como al principio.

  • Marco:
    Desde luego que me quedo con vuestra aproximación a los datos! 🙂

    Alfonso:
    Creo que parece que se escapa a la mayoría que aún suponiendo que el Madrid tenga menos tiempo de descanso eso NO significa que el calendario sea PEOR. Asumir eso implica que menos descanso afecta negativamente al rendimiento, siendo que está claro que no es único factor que afecta al rendimiento (de otro modo siempre ganaría la liga uno de los primeros equipos de primera división eliminados de la copa del rey y que no disputara competiciones europeas ), habría que cuantificarlo de algún modo para establecer cuál es el impacto real que tiene.

    Cuando podamos medir todo lo que afecta, quizás se vea que la diferencia en el descanso tiene un impacto despreciable ... o no ... o quizás tiene mucho más impacto tener 7 jugadores disputando un mundial en verano por lo que se podía pensar en una manipulación a favor del Madrid.

    Sobre todo, me interesaría mucho poder medir el impacto real en el rendimiento de los 17 minutos de media que el Barcelona juega más temprano. Además, quizás si lo que se prentende es medir es descanso real sería más acertado contabilizar a que hora aterriza el avión, o incluso mejor, a que hora los jugadores se meten en la cama.

  • Ahondando en el último comentario:

    Que Madrid esté en el centro de la península reduce la distancia media de los desplazamientos, de forma que puede salir más tarde para jugar y llegar a casa antes a la vuelta, reduciendo sin duda la diferencia horaria.

    Utilísima discusión 😀

  • Si los periodicos deportivos se ocuparan de estas cuestiones en esta manera, mereceria la pena comprarlos ... podrian ser mas interesantes que el FT.

  • Una iniciativa muy interesante. Gracias a los autores

    Quisiera añadir que desde el primer momento se asume que todos los partidos son iguales, solo se esta midiendo el lapso temporal entre ellos. Quizás puede que en términos de cansancio tanto mental como físico, sea lo mismo tener tres dias de descanso entre jugar con el Lyon y después en casa con el Hercules, que tener cuatro entre jugar con el Arsenal y después visitar Valencia (no se si este ejemplo es real, sería cuestión de encontrar un ejemplo parecido, que bien podría ser al contrario). Se está partiendo de la base de que todos los partidos exigen el mismo esfuerzo de preparación y desgastan por igual (..estamos acostumbrados a escuchar a Guardiola decir humildemente que va con mucho miedo a todos los campos de primera y luego gana en muchas ocasiones por goleada), lo cual no tiene porque ser cierto, en mi opinión.

    Saludos

    P

  • Vaya, hay un post al respecto, mucho mas elaborado de Harkkonen que no habia leido. Siento la duplicidad.

    Se me habia ocurrido esto mientras leia el articulo.

  • Pablo Ignacio:

    Efectivamente estoy de acuerdo contigo. Habría que tener en cuenta la dificultad del rival. Ha habido un par de comentarios al respecto (pero "repetita iuvant"). Alfonso Cucharilla ha ido incluso más allá y ha calculado las diferencias en los días de descanso antes y después de los partidos de Champions League y ha encontrado que existe una diferencia no despreciable a favor del Barcelona (a favor=más días de descanso).

  • Gracias Marco,

    Desde que he leido el post no he parado de pensar en el tema. Se me ha ocurrido que quizás se puede explorar el tema, alternativamente, mediante una bateria de test no paramétricos. Primero, un test de Kolmogorov para observar si efectivamente, podemos asumir o descartar normalidad, aunque sea con una muestra (se puede repetir el experimento con ambos clubes). Como el resultado sera previsiblemente que no, se podría utilizar un test de Mahn Whitney, donde no es requisito que las muestras esten pareadas, para ver si efectivamente ambas muestras son homogéneas o no. Se podría determinar, a un nivel simplificado, si efectivamente hay razones para construir un modelo explicativo donde ya habría que elucidar la composición del set de variables explicativas.

    Saludos,

    P

  • Pablo Ignacio:

    "Desde que he leido el post no he parado de pensar en el tema" es el comentario que más me halaga.

    Sobre el test de Mahn Whitney: No creo que sirva ya que ni las dos series de descansos son independientes (ya que los días en los que juegan Real Madrid y Barcelona no son independientes ya que, normalmente, juegan en días distintos), ni cada una de las dos series es serialmente independientes (si el Real Madrid tiene un día de descanso más antes de un partido, es probable que tendrá uno menos en el siguiente ya que presumiblemente ha jugado el partido anterior un día más tarde). ¿Me equivoco?

  • Tienes razón, habría un problema de dependencia serial dada la fijación del calendario por lo que no podría realizarse el contraste. Lo he consultado con un amigo y efectivamente me he venido bastante arriba (jeje). Me queda la duda de si se podria aplicar el test de Wilcoxon, aunque quizás la vía no paramétrica no nos conduzca a ningún resultado concluyente.

    P

Los comentarios están cerrados.