- Nada es Gratis - https://nadaesgratis.es -

¿Para qué sirve la Econometría?

imagesEstos días, como cada Septiembre, me encuentro preparando mis clases del próximo trimestre. Este curso enseñaré, como de costumbre, Estadística para estudiantes de primero de grado, y Econometría de máster. Me gusta impartir estas asignaturas, ya que pienso que ambas proporcionan herramientas que pueden ser de gran utilidad para los estudiantes, sea cual sea su trayectoria profesional futura (ver otras entradas sobre la docencia en Econometría aquí, aquí y aquí).

El curso de Estadística proporciona unas herramientas muy básicas, necesarias para la interpretación de datos al nivel más fundamental: qué es una distribución, media y varianza, correlación, etc. Este curso es simplemente de alfabetización básica. Sin embargo, en el de máster, cada año me replanteo qué material es el que debo ofrecer. Se trata de un máster en Economía de tipo profesional, cuyos estudiantes luego siguen distintas trayectorias, no necesariamente la investigación académica. ¿Qué deberían saber de Econometría?

Efectos causales vs. predicción

La Econometría para mí consiste en un conjunto de técnicas estadísticas que nos pueden ayudar a responder preguntas de contenido económico con la ayuda de datos. ¿Qué tipo de preguntas? Desde mi punto de vista, hay dos grandes tipos de preguntas que nos interesan: 1) Efectos causales, y 2) “Forecasting” o predicción. No incluyo las preguntas meramente descriptivas en mi clasificación (por ejemplo, describir la distribución salarial en España en 2015, o medir la tasa de desempleo por regiones), ya que éstas no suelen tener contenido económico propiamente dicho, y por tanto no requieren análisis econométrico alguno, más allá de técnicas estadísticas básicas.

Por formalizar un poco más mi clasificación, una pregunta de tipo causal se puede expresar como: ¿Cuál es el efecto de x sobre y? O, en términos más matemáticos,

E[y(i)|x=1] - E[y(i)|x=0],

donde la E es la esperanza matemática (y se refiere al efecto medio en una población, aunque también nos pueden interesar otras características de la distribución), la y se refiere a la variable que nos interesa, por ejemplo el salario del trabajador i, o la tasa de paro en la región i, y la x representa a la variable cuyo efecto nos interesa estudiar, por ejemplo, una determinada reforma en la legislación laboral (en este ejemplo, x es binaria: sólo puede tomar dos valores: aplicar la reforma (1), o no (0)). Nos interesa conocer el efecto de la reforma x sobre, digamos, la distribución salarial, es decir, cuál sería dicha distribución si se implementara la reforma, comparado con la situación hipotética de que la reforma no se llevara a cabo.

Para responder a este tipo de preguntas, tenemos a nuestra disposición técnicas econométricas del tipo: variables instrumentales, diferencias en diferencias, regresión en discontinuidad, etc. Usamos datos pasados para estimar cuál fue el efecto de “tratamientos” (por ejemplo, políticas públicas) que efectivamente observamos en el mundo real, y para ello necesitamos tanto observar el tratamiento en la práctica, como estimar “lo que habría ocurrido si ese tratamiento no hubiera tenido lugar”. Responder a este tipo de preguntas de manera creíble no es tarea fácil (ver las entradas de Jesús sobre este tema aquí y aquí).

El segundo tipo de preguntas al que me refería (forecasting o predicción) se puede expresar como: E[y(t+1)]. Es decir, queremos conocer el valor de la variable y (por ejemplo, la tasa de desempleo) en un periodo de tiempo futuro, t+1. Este tipo de preguntas las solemos acometer usando técnicas de series temporales, para lo que usamos valores pasados de la variable y, así como de otras variables que creemos “relacionadas”, para “extrapolar” el valor futuro de y, partiendo de datos pasados. Esto tampoco es tarea fácil, como evidencia el hecho de que las previsiones de variables económicas (tasa de paro, tasa de crecimiento futuro del PIB) pueden quedarse muy lejos de la realidad, como ocurrió por ejemplo en los meses anteriores al comienzo de la recesión de 2008.

Un riesgo importante en el análisis de series temporales es confundir la correlación pasada entre dos variables con una relación subyacente de tipo causal entre las mismas (pero, ¿cómo distinguirlas?), lo que puede dar lugar a errores graves de predicción. Además, el comportamiento futuro de la economía se ve afectado por la política económica, que a su vez puede ir reaccionando a las previsiones, con lo que la propia predicción puede afectar a la política, lo que a su vez afectará a la evolución de la economía (para leer más sobre predicción, recomiendo este libro, ver también esta entrada).

En mi opinión, estas dos “ramas” de la econometría están demasiado desconectadas. En la práctica, normalmente lo que querríamos saber es algo que combina los dos tipos de preguntas:

E[y(i,t+1)|x=1] - E[y(i,t+1)|x=0]

Es decir, querríamos conocer la distribución de y (salarios, tasa de desempleo, etc), en un periodo de tiempo futuro (t+1), si se implementara la reforma x, y compararlo con la distribución de y, en el mismo periodo futuro, en caso de que la reforma NO se llevara a cabo. Este tipo de pregunta combina los dos elementos: el efecto causal de x sobre y, pero también la extrapolación hacia el futuro. Ya no es suficiente estudiar datos pasados sobre reformas que ya han ocurrido, como tampoco es suficiente con extrapolar el valor de y hacia el futuro en base al comportamiento pasado de esta y otras variables, sin entender los mecanismos de causalidad.

Por desgracia, en general estamos lejos de poder realizar este tipo de ejercicios de manera creíble. El análisis de preguntas de tipo causal con técnicas de series temporales ha tenido un éxito limitado hasta el momento, y el análisis de efectos causales con datos pasados procedentes de experimentos controlados o naturales, incluso aunque resulte creíble para el caso concreto estudiado, siempre tiene problemas de “validez externa” (¿cómo sabemos que los efectos serían los mismos en otro periodo de tiempo, en otro país, etc?).

¿Conclusiones?

En la práctica, creo que lo mejor que podemos hacer los profesores de econometría, es intentar que los estudiantes entiendan las limitaciones de las herramientas de que disponemos, así como enseñar a pensar sobre qué pregunta es exactamente la que queremos responder. ¿Es de tipo causal, o descriptivo? ¿Queremos saber cuál fue el efecto de x en el pasado, o entender cuál sería el efecto en un contexto para el que no tenemos datos, y por tanto requiere extrapolar? Y quizá lo más importante: la econometría nunca es “apretar un botón” o correr un comando en el ordenador. Ninguna técnica econométrica puede sustituir al sentido común, y tanto las preguntas causales como las de predicción son fundamentalmente muy difíciles de responder, ya que siempre hay un elemento que no podemos observar desde nuestra perspectiva como analistas de datos: lo que habría ocurrido con y (en el pasado) si x hubiera tomado un valor diferente del que efectivamente tomó, o lo que ocurrirá con y en el futuro, que a su vez depende del valor actual y pasado de un número de variables (desconocido).

Tanto predecir la evolución futura de variables económicas, como estimar efectos causales en economía, es importante pero difícil. Sin embargo, la econometría ha hecho avances importantes, y aunque extrapolar hacia el futuro siempre exige un salto en el vacío, pienso que merece la pena seguir intentándolo, y también que los agentes económicos y políticos deberían tener (o seguir teniendo) un ojo puesto (crítico, eso sí) en el análisis económico. Como economistas, nuestro trabajo consiste en, no sólo realizar, sino también difundir nuestro análisis y resultados, pero de manera honesta, comunicando las dificultades metodológicas y la incertidumbre asociada a nuestras predicciones, de modo que el ciudadano pueda interpretar por sí mismo los resultados. Esto ya nos lo recordaba Luis aquí: “Reconoce la incertidumbre, y no la reemplaces por certezas. Desgraciadamente el mundo es muy complejo, y hay muchas cosas que no sabemos y no entendemos. Lo mejor es reconocerlo.