- Nada es Gratis - https://nadaesgratis.es -

Causalidad y control sintético: un ejemplo con el AVE y el turismo

Por Daniel Albalate, Javier Campos y Juan Luis Jiménez

El estudio de las relaciones causa-efecto en economía se remonta al origen mismo de nuestra disciplina. Los trabajos de Adam Smith (An Inquiry into the Nature and Causes of the Wealth of Nations, 1776) o de John Stuart Mill (A System of Logic, Ratiocinative and Inductive, 1843) entre otros, analizan las dificultades para comprender la conducta humana – tanto a nivel individual como agregado – en relación con muchas decisiones económicas. Más de doscientos años después, John Hicks (1979) planteó abiertamente que la Economía debía profundizar en la cuestión de la causalidad si quería ser tomada como una “ciencia” seria. Numerosos trabajos recientes, incluyendo los de varios premios Nobel e incluso obras divulgativas como el popular “The Effect”, de Nick Huntington-Klein, han respondido a esta demanda. Incluso en este blog se ha analizado abundantemente esta cuestión, con más de 50 publicaciones sobre “causas y efectos” (véase por ejemplo, aquí, aquí o aquí) en las que se han desarrollado diferentes variantes sobre el conocido mantra de que correlación no es causalidad.

El método del control sintético

Es indudable, como decimos, que tanto desde el punto de vista teórico como – sobre todo – desde las aportaciones empíricas, los economistas hemos tratado de abordar con seriedad el desafío de Hicks. La relevancia creciente de la economía experimental y del comportamiento, los modelos econométricos de ‘diferencias en diferencias’ (DiD), o el merecido reconocimiento a las aportaciones de Banerjee, Duflo y Kremer en 2019 o Card, Angrist e Imbens en 2021 constituyen buena prueba de ello.

Dentro de estas contribuciones, el método de control sintético es una aportación relativamente reciente (véase Abadie y Gardeazabal, 2003 o Abadie et al., 2010) que se utiliza particularmente para evaluar el efecto de un tratamiento o intervención (por ejemplo, una política económica o un proyecto de infraestructura) comparando grupos de individuos mediante la combinación de técnicas de DiD y de matching. Para identificar factores causantes, este método intenta estimar qué le habría ocurrido al grupo que recibe el tratamiento si no lo hubiera recibido, pero teniendo en cuenta además los efectos que cambian a lo largo del tiempo, ponderándolos en el grupo de control. Esto permite una mejor identificación de las posibles causas y efectos y hacen que este método, como señalan Athey e Imbens (2017), se haya convertido en una de las contribuciones más influyentes en la evaluación empírica de las políticas públicas, especialmente en el estudio de casos prácticos.

Otra vuelta de tuerca sobre los efectos del AVE

Sin negar la indudable contribución que ha supuesto el ferrocarril de alta velocidad para la movilidad de los viajeros en España, en este blog se ha criticado abiertamente el alto coste de esta infraestructura en relación a sus beneficios sociales (aquí, aquí o aquí) o a las desigualdades sociales y territoriales que no soluciona (aquí o aquí). En un reciente trabajo de los autores de este post (Albalate, Campos y Jiménez, 2022) se analiza, con técnicas de control sintético, el argumento de que la llegada del AVE a ciudades pequeñas y medianas del interior peninsular supone un gran revulsivo para el turismo y una posible solución para revertir los efectos de despoblamiento de la llamada ‘España vaciada’.

Nuestras conclusiones obligan a valorar esta posible consecuencia con cierta cautela, ya que muestran que los efectos causales ex-post del AVE sobre el turismo de pernoctación son insignificantes y, cuando los hay, parecen tener incluso una influencia negativa (debido a que aumentan las excursiones de un día, en perjuicio de estancias de mayor duración). Ello no significa que los resultados netos sean totalmente negativos (ya que, como destaca la prensa local, “la alta velocidad dinamiza las ciudades a las que llega”), sino que los beneficios pueden ser muy desiguales por sectores.

Para nuestro análisis, a partir de la Encuesta de Ocupación Hotelera y otras fuentes oficiales, hemos elaborado un panel mensual con datos turísticos, demográficos y económicos de los municipios españoles con población inferior a 200.000 habitantes durante quince años (2005-2019). En total, disponemos de más de 13.000 observaciones correspondientes a 77 ciudades, aunque centramos nuestro estudio en tres casos, Albacete, Cuenca y León, capitales de provincias con baja densidad poblacional (< 30 habitantes por km2), alejadas más de 100 Km2 de cualquier otra gran ciudad (sin spillovers) y donde los servicios de alta velocidad comenzaron respectivamente en 2010 (en los dos primeros casos) y 2015.

Aplicando el control

Para evaluar el efecto causal de la llegada del AVE a estas ciudades, el método del control sintético nos permite crear una ciudad “sintética” para cada caso, a partir de la comparación las otras ciudades no afectadas, lo que nos ofrece un contrafactual adecuado. Como puede verse en las figuras siguientes (donde la línea vertical representa el momento de la intervención), nuestro control refleja bien lo sucedido “antes del AVE” y muestra una diferencia sustancial (que es el precisamente el objeto de la medición contrafactual) en el período “después del AVE”: el número de pernoctaciones en cada una de estas ciudades hubiera sido mayor si el AVE no hubiera comenzado a operar en ellas.

Figura 1: Albacete vs. Synthetic Albacete (contrafactual)

 

Figura 2: Cuenca vs. Synthetic Cuenca (contrafactual)

 

Figura 3: León vs. Synthetic León (contrafactual)

 

En términos estadísticos, estas diferencias pueden confirmarse a través de simples test de diferencias de medias para cada periodo, como se refleja en la Tabla 1. Así, obsérvese que el Albacete real tuvo menos pernoctaciones que su contrafactual, algo que se repite en Cuenca y (con menor impacto) en León. Un examen más detallado de la distribución estacional de los resultados sugiere que las divergencias se encuentran principalmente durante la temporada turística, aunque las diferencias siguen siendo estadísticamente significativas incluso en invierno. Diferentes análisis de sensibilidad (como la utilización de placebos o cambios en las fechas de intervención) no alteran la robustez de estas conclusiones.

Tabla 1: Test de diferencia de medias (antes y después de tratamiento)

Turistas totales (pernoctaciones). Tratados Turistas totales (pernoctaciones) Sintético t-test
Albacete (Antes) 13.413 (243,5) 13.386 (334,5) 0,0990
Albacete (Después) 14.821 (310,1) 21.860 (686,9) -13,2696***
León (Antes) 30.775 (756,8) 30.895 (716,5) -0,4886
León (Después) 34.604 (1.187,5) 39.618 (1.407,2) -7,3071***
Cuenca (Antes) 17.137 (455,5) 17.009 (579,4) 0,4071
Cuenca (Después) 16.235 (387,2) 19.354 (618,3) -8,4016***

Errores estándar entre paréntesis. * p < 0,10, ** p < 0,05, *** p < 0,01

 

Conclusiones

En definitiva, en ocasiones se reclama como positiva la llegada del AVE a una ciudad en términos de impacto turístico, pero lo cierto es que no siempre ocurre así y en este caso se demuestra que el cambio de patrones de viaje, sobre todo en ciudades relativamente pequeñas, puede hacer que esta llegada sea contraproducente para los establecimientos hoteleros: Albacete, Cuenca y León tuvieron sistemáticamente menos pernoctaciones de turistas que las que habrían tenido si el AVE no hubiese llegado a estas ciudades.

Sirva esto como un mero ejemplo, ya que el objetivo de este post no ha sido, ni mucho menos, responder al desafío planteado por Hicks ni solucionar definitivamente el problema de la causalidad en Economía. Esa será una cuestión que nos acompañará siempre en nuestro trabajo y a la que deberemos hacer frente con humildad y sin prepotencia, reconociendo que los economistas somos unos simples aprendices de filósofos que trabajan con datos y que, en el fondo y utilizando palabras de Jorge Luis Borges, “lo que llamamos azar, es nuestra ignorancia de la compleja maquinaria de la causalidad”.