¿Quién ganará el mundial de fútbol?¿Alguien lo sabía de antemano?

Ganar un mundial de fútbol es un evento que al principio de la fase final tiene baja probabilidad para cualquier equipo. El equipo que más mundiales ha ganado, Brasil, tan solo ha ganado 5 a pesar de haber participado en todas las 19 fases finales. Menos del 25%. Antes de que empezara la competición de este año, creo que en ningún momento ni España ni Brasil han tenido unas odds mejores que 1:5 en Betfair, lo que implicaría que el mercado asignaba unas probabilidades de victoria menores del 20% para los equipos favoritos. Si es difícil ganar un mundial de fúbol, incluso para los mejores, necesariamente tiene que ser difícil predecir quien será el ganador, incluso para los que más saben de fútbol o de técnicas de predicción.

Es por esto que a mi me resulta sorprendente que unas instituciones para las que las técnicas de predicción cuantitativas son el pan de cada día se arriesguen a hacer predicciones y a publicarlas. No tengo del todo claro porque lo hacen. Pero lo hacen. Y esto ofrece una oportunidad de entretenimiento hasta que empiece la final del domingo.

A continuación voy a recopilar información que he encontrado en un artículo publicado en el blog del Financial Times dos semanas antes del principio del mundial.

En el artículo hay links a los documentos que dan detalles sobre las predicciones y las tecnicas empleadas.

  • Danske Bank
    • Ganador: Brasil.
    • Destacable: Italia gana al ganador de España-Portugal. Luego pierde con Alemania y Alemania pierde con Brasil en la final.
  • Evolution Securities
    • Ganador: Brasil.
    • Destacable: En cuartos llegan Holanda, Brasil, Nigeria, Inglaterra, Alemania, Argentina, Italia y España (5 de 8).
  • UBS
    • Ganador: Brasil
    • Destacable: Después de Brasil, los equipos con mayores posibilidades de ganar son en este orden: Alemania, Italia, Holanda (8%), Francia, Argentina, España (4%), Inglaterra. En 2006 acertaron con la victoria de Italia.
  • JP Morgan
    • Ganador: Inglaterra
    • Destacable: España segunda, Holanda tercera (han acertado dos de los primeros tres; ¿habrán acertado uno de los primero dos?).
  • Goldman Sachs:
    • Ganador: No especifica.
    • Destacable: Semifinalistas: Inglaterra, Argentina, Brasil y España (1 de 4).

¿Quién podría hacerlo mejor?

Puede que Reuters tenga mejores resultados con una técnica tan simple como una encuesta entre 74 economistas interesados en el fútbol. El equipo con mayor numero de predicciones como ganador ha sido España con 24 encuestados (esto sí, seguido por Brasil con 23). Hay que destacar también que 52 encuestados esperaban un equipo africano entre los primero 8 y que, sin embargo, las expectativas se centraban principalmente en Nigeria y Camerún, no en Ghana.  También merece la pena recordar que el historial de las encuestas de Reuters no es tan bueno: en 2006 tan solo 8 de los 96 economistas encuestados habían predicho la victoria de Italia.

La plataforma kaggle.com organiza competiciones de previsiones (supongo que con fines comerciales, tarde o temprano). De momento han completado tan solo tres competiciones. La primera era sobre los votos en Eurovisión y ha tenido 22 participantes. Las otras dos son sobre el mundial de fútbol.

“World Cup 2010 – Take on the quants” (70 participantes) anima explícitamente a los participantes a demostrar que pueden hacerlo mejor que los expertos cuantitativos mencionados por el Financial Times. El objetivo es predecir hasta que punto en la competición llega cada equipo.

“World Cup 2010 – Confidence challenge” (65 participantes) el objetivo es predecir hasta que punto en la competición llega cada equipo. En este caso, sin embargo, es necesario especificar el nivel de confianza en cada predicción. Las predicciones con un elevado nivel de confianza cuentan mas en la evaluación.

Me imagino que kaggle.com no perderá la oportunidad de aprovechar la exposición mediática que ha tenido con estas dos competiciones y que anunciará cuanto antes el ganador.

Bolao da Copa 2010 es la segunda edición de una porra promocionada por unos cuantos economistas con ninguna otra intención que pasar un rato divertido. Para participar hay que pagar 8 € y predecir todos los partidos del mundial y las predicciones se evalúan con un criterio (discutible, como todos los criterios de evaluación). Los primeros tres clasificados se reparten todo el dinero recaudado. Yo también he participado. De momento no estoy descontento con mis resultados. Soy el 35 de 133 participantes. He tenido el valor de eliminar a Italia relativamente pronto (en cuartos contra España).

Mi predicción

No se si a alguien le importa, pero después de poner en evidencia las predicciones de los quants, no me queda mas remedio que hacer una predicción de lo que queda: 1. España, 2. Holanda, 3. Alemania, 4. Uruguay. Pero aprovecho la oportunidad para reconocer que en este Mundial me he equivocado en muchas predicciones. Como comenté al principio del post, predecir el ganador de un mundial no es fácil antes de que empiece la fase final del mundial. Pero en esta edición hay algo que se me escapa. Así que no me siento seguro en mi predicción ni a 36 horas de la final. Pero espero que disfrutemos de un buen partido y que se nos aclaren las ideas sobre quien es el mejor.

Hay 17 comentarios
  • Marco, todo el comcepto de predicción en sí, en este tipo de eventos es discutible. ¿Qué significa que España tiene un 60% de probabilidades de ganar la Copa del Mundo 2010? Que si repitiéramos la final un número importante de veces, 6 de cada 10 veces, España sale campeón. Ahora bien, que yo sepa, la final se juega una vez, no 10. También pensate esto: nunca España ha jugado una final, entonces ¿ cómo sé como va a hacerlo si nunca la ha jugado?

    Esa es la concepción clásica de predicción y tiene este problema que te dije. Ahora bien, si uno tomara un enfoque bayesiano, la idea pasa por otro lado: asignar priors, o dicho en criollo, dar probabilidades subjetivas y después ver qué es lo que la data nos dice. De ahí, que paga más un par de tíos futboleros que se juntan y dicen quién es el campeón, que un montón de nerds que se pasan todo el día en la oficina, haciendo regresiones.

  • "Marco, todo el comcepto de predicción en sí, en este tipo de eventos es discutible. ¿Qué significa que España tiene un 60% de probabilidades de ganar la Copa del Mundo 2010? Que si repitiéramos la final un número importante de veces, 6 de cada 10 veces"

    Esta es una cuestión muy difícil y no solo en los campeonatos de fútbol. Esto es algo que ha sido discutido hasta el infinito por los físicos porque la base fundamental de la física moderna, la mecánica cuántica, incluye un misterioso componente probabilístico a pesar de que todas las ecuaciones y leyes de la mecánica cuántica son completamente deterministas y "unitarias".

    Solo se ha encontrado una solución matemáticamente consistente, que suele llamarse "interpretación de los muchos mundos" o "interpretación de Everett" (Hugh Everett III). En esta interpretación, el universo físico se desdobla constantemente en (infinitos) universos paralelos que siguen evoluciones independientes. En la interpretación de Everett, el que España tenga un 60% de probabilidad de ganar significa que de los infinitos "universos paralelos" que surgirán como desdoblamiento de nuestro universo, cuando se juegue el partido, en el 60% de ellos habrá ganado España y en el resto habrá perdido.

  • Luisito, creo que terminamos discutiendo la inmortalidad del cangrejo, por asì decirlo en cierta forma. La multiplicidad de universos, ¿no es en definitiva una hipótesis? Si es el caso, si suscribinos a la “interpretación de Everett”, entonces una interpretación clásica de la predicción es válida. Ahora bien, si ese fue el caso, y asumiendo que suscribimos esa interpretación, ¿de dónde sale esa probabilidad? El equipo no ha jugado y sólo jugará una vez, o mejor dicho, sólo podremos verla a España jugar una vez, no las infinitas veces de cada universo, por lo que en definitiva, un enfoque bayesiano en donde uno actualiza sus priors es más eficiente, y por eso, vemos que los "quants" a los que Marco hace referencia no han logrado predicciones tan acertadas como las que se podría salir de un consenso.

  • Marco,

    Menos mal que no acertaste el resultado del partido por el 3er y 4º puesto (aunque no anduviste muy lejos de hacerlo). Me habría dado un mal fario terrible para la final...

  • Marco, un post muy interesante. Espero que razón suerte en tus predicciones (quizás más fundamentadas que la de un pulpo) y España logre el mundial; aunque eso suponga introducir dummies en futuras regresiones para recoger el cambio estructural "España ganó el mundial".

    Estoy de acuerdo con Martin en que el enfoque Bayesiano es el más adecuado para interpretar este tipo de cuestiones. En cualquier caso, creo que Marco solo habla de cómo se puede interpretar un ratio de apuestas (1:5), en probabilidades de ganar el torneo (es decir, no se trata de repetir el mundial 100 veces sino que el ratio 1:5 determina las "priors" sobre los ganadores).

    Sólo tengo una duda. De la encuesta realizada por Reuters a los economistas, sería interesante saber la nacionalidades de los mismos. Creo que hay mucho sesgo en estos casos. En el artículo, no queda claro si corrigen para este tipo de cuestiones. Además, creo que hay problemas para revelar quién crees que ganará. A fin de cuentas, solo puedes anunciar un ganador (no una función de distribución). En estos casos, creo que lo menos "arriesgado" es apostar por Brasil.

  • A menos de una hora de la final no voy a dar predicción porque sería disparatado dada mi ignorancia. Pero hay una manera de verificar el acierto de un predictor. Los estadísticos lo llaman calibración. Para esto es preciso que este predictor se arriesgue suficientes veces. Entonces agarremos las que hace predicciones del 60% y las comparamos con el porcentaje de veces en que el evento sucede. No es "foolproof" pero da una pista de si nos podemos fiar del individuo.

  • Martín:

    Sobre la probabilidad: Decir que España tiene un 60% de probabilidad de ganar la final significa que a los eventos E=España gana la final y H=Holanda gana la final se asocian respectivamente los numeros 0.6 y 0.4.

    Me parece que hay dos cuestiones (que en realidad están relacionadas entre si):

    1) De donde procede esta distribución de probabilidad;
    2) Que uso podemos hacer de ella.

    Sobre la cuestion 1: Por un lado tu indicas que al no haber España jugado una final nunca no tenemos forma de estimar esta probabilidad. En esto no estoy de acuerdo contigo, por dos razones:

    a) Las finales son eventos raros y por lo tanto alejados en el tiempo. No creo que mirar a finales pasada sirva para mucho. ¿Qué importancia puede tener para estimar la probabilidad que Italia gane una final saber que Italia ganó una en 1934?

    b) Si es cierto que una final es un evento especial, también es cierto que el resultado de una final no es independiente de mucho otros eventos y datos que sì conocemos, como son el ranking FIFA, los resultados de los equipos nacionales, la población de los paises, la sensación que pueden haber causado los equipos en los partidos previos a los expertos (tu mismo sugieres la utilidad de preguntar a unos cuantos futboleros). Esto quiere decir que tenemos muchos datos que nos pueden ayudar a estimar la probabilidad.

    Sobre la cuestión 2: Supongamos que

    I) Alguien nos ofrece una apuesta sobre la extracción de una bola de una urna que contiene 10 bolas numeradas del 1 al 10. La apuesta cuesta X € y paga Y € si la bola extraida es del 1 al 6 y 0 € si la bola es del 7 al 10.
    II) De alguna forma llegamos a estimar que las probabilidades de los eventos E y H son 0.6 y 0.4.
    III) Alguien nos ofrece una apuesta sobre la final del mundial. La apuesta cuesta X € y paga Y € si gana España y 0 € si gana Holanda.

    Bajo estos supuesto, el uso que podemos hacer de la distribución de probabilidad en II es el siguiente: Comprar la apuesta en III si y solo si compraríamos la apuesta en I.

    Debería añadir que estoy ignorando dos factores importantes: Apostar y en particular apostar en eventos deportivos tiene un valor propio (por ejemplo porqué ver el evento deportivo resulta mas emocionante); a pesar de que la mayoría de los hinchas suele hacer el contrario, tiene sentido hacer hedging, es decir apostar contra tu propio equipo. Jack Hirshleifer, que fue mi profesor en el doctorado, (http://levine.sscnet.ucla.edu/general/hirshleifer.htm) decía que tendría sentido comprar seguro sobre la vida de los hijos, para tener un consuelo en el caso en el que alguno de ellos fallezca.

    Por otro lado estoy totalmente de acuerdo contigo en que preguntar a los futboleros en el caso de un mundial tiene mucho mas sentido. El objetivo del post en realidad era esto. Hacer ver que en este caso correr regresiones no es tan útil.

  • Luisito:

    Yo creo que la interpretación no es tan importante. Hay estos instrumentos conceptuales que llamamos probabilidades y las llamamos probabilidades para entendernos. Es mucho mas facil decir la probabilidad del evento E es 0.6 que desplegar todo el rollo I-III de mi comentario anterior (la resupuesta a Martin).

    En algunos casos, cuando los eventos son suficientemente numerosos, podemos usar las realizaciones para comprobar si las estimaciones de las probabilidades son acertadas o no. En otros casos, esto no es posible. Pero las probabilidades siguen siendo instrumentos conceptuales útiles tanto para comunicar como para tomar decisiones.

  • Willem:

    Siento haberte asustado.

    Cuando decía "1. España, 2. Holanda, 3. Alemania, 4. Uruguay" no quería decir

    España-Holanda: 1-2
    Alemania-Uruguay: 3-4

    sino que la clasificación final quedaría así:

    1. España
    2. Holanda,
    3. Alemania
    4. Uruguay

    Así que acerté ambas finales.
    no quería decir

  • Ismael:

    "creo que Marco solo habla de cómo se puede interpretar un ratio de apuestas (1:5), en probabilidades de ganar el torneo (es decir, no se trata de repetir el mundial 100 veces sino que el ratio 1:5 determina las “priors” sobre los ganadores)"

    Efectivamente.

    "De la encuesta realizada por Reuters a los economistas, sería interesante saber la nacionalidades de los mismos. Creo que hay mucho sesgo en estos casos. En el artículo, no queda claro si corrigen para este tipo de cuestiones."

    Por lo que entiendo se trata tan solo de una encuesta, informal poco científica y con ninguna correción. Aún así han ido mejor que los "quants".

    "Además, creo que hay problemas para revelar quién crees que ganará. A fin de cuentas, solo puedes anunciar un ganador (no una función de distribución). En estos casos, creo que lo menos “arriesgado” es apostar por Brasil."

    No entiendo por qué. Si crees que es mas probable que gane España a que gane Brasil, ¿por qué debería ser menos arriesgado apostar por Brasil?

  • Carmen:

    Gracias por lo de "nuevo pulpo". Le va a hacer mucha gracia a mis amigos napolitanos, ya que en Napoles un pulpo es una persona muy fea. Por otro lado a mi me gusta tanto el pulpo que me encanta la idea de ser el nuevo pulpo.

    Hablando del pulpo, la verdad es que no sé muy bien como va el tema, pero me pregunto

    1) ¿No será que los experimentos tienen trampa (le ponen gambas mas frescas en la caja con la bandera del país que creen que ganará)?
    2) ¿No será que el pulpo es atraído naturalmente a algunos colores (como el rojo y el amarillo que aparecen tanto en la bandera de Alemania como la de España?

    ¿Alguién tiene mas datos sobre las predicciones del pulpo?

  • Los resultados de kaggle.com:

    http://kaggle.com/blog/2010/07/12/world-cup-modeling-competition-the-results-are-in/

    En “World Cup 2010 – Take on the quants” las posiciones de los banco de inversión han sido las siguientes (sobre 70 participantes):

    JP Morgan: 28
    Goldman Sachs: 33
    UBS 55
    Danske Bank: 64.

    Los mercados lo hacen mejor: La predicción basada en las apuestas en betfair.com ha quedado la 16.

    Hay algunos teams que han ido bastante mejor que los anteriores. Puede que algunos de estos supieran algo que los demás no sabíamos. Pero, como es obvio, existe una tendencia a que las mejores entre 65 predicciones sean mejores que las mejores entre 5 predicciones (quants + betfair.com).

  • Supongamos que creo que España ganará el mundial con 51% y Brasil 49%, de modo que, para mí, España es "ligeramente favorita". Si conozco las encuestas, en que Brasil va a ganar con 80% el mundial, puedo anunciar que para mí también es Brasil la favorita (por seguir la opinión general y no desviarme). En ese sentido, decido tomar la opción "menos arriesgada". Aunque creo que España va a ganar, mi idea es que es "ligeramente favorita". Al anunciar un único ganador, parece que incremento el gap entre mi anuncio y mi segunda opción. A esto me refería, pensando en temas de revelar tu verdadero favorito y sesgo al anunciar quién crees que ganarás. Aún así, puede que tengas razón y quien crea que es España ligeramente favorita, lo anuncie sin tapujos, no sé.

  • Ismael:

    La cuestión es si tus creencias 51-49 incorporan ya la opinion de las encuestas que ven favorita a Brasil 80-20 (como en el Escenario 3 que describo más abajo) o no (como en los Escenarios 1 y 2).

    Escenario 1) Ves unos cuantos partidos y te formas unas opiniones 51-49 (España te parece un pelín mejor). Luego te enteras que unas encuestas dan a Brasil ampliamente favorita. Sin embargo estás convencido de que los que contestaron a la encuesta no entienden nada de fútbol. En este caso no tienes razón para cambias tus creencias. España sigue siendo la favorita para ti y esta será tu predicción.

    Escenario 2) Ves unos cuantos partidos y te formas unas opiniones 51-49 (España te parece un pelín mejor). Luego te enteras que unas encuestas dan a Brasil ampliamente favorita. Crees que el hecho que la mayoría de la gente ve a Brasil como claro favorito significa algo. En este caso modificas tus creencias, mas o menos, dependiendo de la confianza que tengas en ti mismo y en los demás, pero siempre a favor de Brasil. Así que tu 51-49 se puede volver en un 49-51. En este caso, después de conocer la encuesta, cambias de opinión y tu predicción será que Brasil es el ganador.

    Escenario 3) Ves unos cuantos partidos y además te enteras que unas encuestas dan a Brasil ampliamente favorita. Sobre la base de toda esta información (tu impresión individual y las opiniones de los demás) te formas unas opiniones 51-49 (España te parece un pelín mejor). Tu predicción será que España es la ganadora.

    Como comprenderás en todos estos escenario tu predicción es siempre que ganará el equipo que según tu tiene mayor probabilidad de ganar. Cuando la opinion de los demás te hace cambiar y predecir a Brasil como ganadora, no es por que es la opción "menos arriesgada" sino porque, las encuestas han convertido a Brasil en el mas probable ganador para ti.

    Todo lo anterior se basa en razonamientos puramente estadisticos. Pero puede haber otras consideraciones que tienen un impacto sobre las predicciones y pueden hacer que sea menos "arriesgado" elegir Brasil cuando la opinión prevalente es que Brasil sea el favorito y a pesar de creer que España es el mejor equipo. Esto puede ocurrir cuando los "pagos" dependen no solo de tu predicción, sino también de las predicciones de los demás. Imagina por ejemplo que todo el mundo predice que Brasil sea el ganador y tu eres el único en predecir que España sea la ganadora. Si España gana, eres el rey del mambo. Pero si ganas Brasil eres el pringado. Si ser pringado te cuesta más de lo que ganas por ser el rey del mambo, podrias decir tu también que Brasil es el favorito, porque si te equivocas, te equivocas a la vez que todos.

    Esto es lo que normalmente se denomina "herd behavior" (algo como "efecto rebaño" o "comportamiento rebaño"). Aquí tienes la referencia y un link a un artículo muy citado sobre el argumento:

    Scharfstein and Stein (1990) "Herd behavior and investment", American Economic Review, 80(3), pp. 465-479.

    http://ws1.ad.economics.harvard.edu/faculty/stein/files/AER-1990.pdf

Los comentarios están cerrados.