Nada es Gratis » Como Interpretar la Evidencia Empírica I

El viernes pasado, como respuesta a una entrada de Florentino, hubo una discusión sobre cómo las diferencias en desempleo entre comunidades autónomas indicaban sí había o no un efecto importante de la legislación laboral en la tasa de paro.

De la lectura de la discusión me ha venido la idea de escribir unas líneas sobre cómo se puede interpretar la evidencia empírica y qué se aprende de ella. La vida moderna está llena de situaciones en las que hay que emplear métodos estadísticos para dilucidar los efectos de ciertas políticas públicas. Las ideas básicas de cómo se infiere en estadística no son difíciles de entender. Pero dado que no se explican demasiado bien en nuestro sistema educativo, las mismas algunas veces no están claras entre el público general (y tristemente, ni en muchos economistas que han convertido la ignorancia de la econometría en medalla de distinción).

Para ello, voy a emplear un ejemplo distinto del de la tasa de paro, para que nadie se distraiga con temas colaterales, pero que ilustra los diferentes temas en cuestión (y para nuestros lectores econometras, donde voy a tener problemas de selección y endogeneidad a mogollón, por eso lo escojo, a todo llegaremos).

Imaginémonos que quiero entender qué explica la nota que sacan mis estudiantes de macro en su examen final (que pongamos va desde 0 hasta 10). Para ello, obtengo datos de su nota final, de la cantidad de horas que estudian, de su capacidad cognitiva (medida con un test estándar) y similares.

Entonces, postulo que la nota de un estudiante es una función de las horas de estudio (el “esfuerzo”), de su capacidad cognitiva (“lo listo que es”) y de factores que no especifico en detalle (la “suerte” que tuvieron en el examen, lo “bien” que se les da la macro, etc.)

Esta relación la puedo asumir muy general, sin imponer mucha estructura (esto se llama utilizar “métodos no paramétricos”) o mucho mas restrictiva, por ejemplo lineal (la nota es una función lineal de las horas de estudio, de la capacidad cognitiva y de la “suerte” como un error aleatorio). Ambas especificaciones tienen ventajas e inconvenientes. La primera me da más libertad, pues impongo menos cosas y por tanto me equivoco menos, pero al imponer menos también puedo decir menos cosas, al menos con una muestra como la de mis 70 estudiantes. La segunda impone más hipótesis (que pueden estar equivocadas), pero si acierto con ellas, aprendo mucho más deprisa de los datos. Como todo en la vida, nada es gratis, y esto también se aplica en estadística y en econometría.

Bueno, pues ahora voy y “estimo” el modelo, que no quiere decir nada más que busco los valores de la función (los “parámetros”) que satisfacen ciertos criterios (“mejor ajuste”, “máxima verosimilitud”, “moda de la distribución a posteriori”) que tienen sentido pero que no viene a cuenta explicarlos ahora.

Una vez que tengo el modelo estimado, puedo responder preguntas cómo, ¿cuál es el efecto de estudiar una hora más en la nota? ¿Y de tener un punto más en capacidad cognitiva en la nota?

Imaginémonos, por decir algo, que cada hora que se estudia de más, la nota sube 0.1 puntos y por cada punto de capacidad cognitiva, la nota sube 0.2 puntos.

De repente vemos como afirmaciones del estilo “las horas de estudio no importan porque Pepe, que estudió 10 horas, sacó mejor nota que Juan, que estudió 20” o “las horas de estudio no importan porque Juan y Pepe estudiaron los dos 20 horas y sacaron notas muy diferentes” no tienen mucho sentido.

En primer lugar, porque hay un componente aleatorio (que habíamos llamado “suerte” pero que puede ser muchas otras cosas, como la facilidad comparativa de Pepe y Juan por la macro). Uno debería demostrar, antes que nada, que aquellos estudiantes que estudiaron 10 horas, de manera sistemática, sacaron la misma o mejor nota que los que estudiaron 20. Una desviación arriba o debajo de una observación no demuestra nada. Tiene que haber un patrón regular en los datos.

Pero imaginémonos incluso que pudiésemos demostrar que los estudiantes que estudiaron 10 horas sacaron mejor nota de media. Aun nos queda la pregunta ¿Y cuál es su capacidad cognitiva? Si esta es mucho más alta, bien pudiera ser todavía que estudiar sea importante para la nota. Con la "estimación" que supuse antes: si los estudiantes que estudian solo 10 horas tienen seis puntos más de capacidad cognitiva de media, sacaran también de media mejor nota que los que estudiaron 20 horas pero tienen menos capacidad cognitiva (0.2* 6 puntos = 1.2 puntos marginales> 0.1* 10 horas = 1 punto marginal).

O en otras palabras, si los estudiantes que estudiaron 10 horas hubieran estudiado 20, habrían sacado incluso mejor nota (1 punto más de media) y si los que estudiaron 20 hubieran estudiado 10, estos habrían sacado incluso peor nota (1 punto menos de media). Lo que los métodos estadísticos modernos intentan encontrar es el efecto sistemático en la nota de estudiar una hora más una vez que controlamos por la capacidad cognitiva, y al revés, el efecto sistemático de la capacidad cognitiva una ve que controlamos por las horas de estudio.

Uno puede ver, y en general verá, una gran dispersión en notas incluso entre todos aquellos alumnos que estudian las mismas horas. Esto no debe ser empleado, sin más, para concluir que estudiar no importa. Hay que trabajar mucho más duro para demostrar que las horas de estudio no influyen en la nota.

Volvamos ahora a nuestra discusión de la tasa de desempleo. Cuando decimos que la tasa de desempleo de una comunidad autónoma depende de la legislación laboral, nunca negamos que esta tasa también dependa del nivel de demanda agregada (sí, la demanda agregada importa para el desempleo e importa mucho), de la estructura productiva de la misma, de su demografía, del nivel medio de educación de sus habitantes y de más cosas, incluida la suerte (por ejemplo, una comunidad tiene como actividad principal la producción de sardinas y de pronto se descubre que las sardinas producen cáncer y la demanda mundial de sardinas cae a cero, lo que deja en la calle de la noche a la mañana a muchísimos trabajadores).

Mientras que la legislación laboral es (básicamente) la misma entre Navarra y Andalucía (por coger dos comunidades abajo y arriba en la tasa de desempleo), todas las demás variables que mencionábamos anteriormente son diferentes y por tanto debemos esperar tasas de desempleo medias diferentes y respuestas del desempleo a las fluctuaciones cíclicas de la economía también diferentes. Por eso decir que la legislación laboral no importa para el desempleo porque Navarra tiene mucho menos desempleo que Andalucía es lo mismo que decir que estudiar no importa porque Pepe, que estudió menos horas, sacó mejor nota que Juan, que estudió mucho más.

La pregunta es “¿cuál sería la tasa de desempleo en Navarra con otra legislación laboral?” Bien pudiera ser que fuera la misma, que fuera más alta o que fuera más baja. Yo creo que la legislación laboral importa e importa un montón, pero quién sabe, lo mismo estoy equivocado, esto es investigación, no dogma, y no sería ni la primera ni la última vez que he tenido que cambiar de idea en la vida. Pero en realidad esto da lo mismo en este post. Mi mensaje es de pura lógica de lo que podemos o no inferir, no sobre si la legislación laboral importa o no (lo cual, por cierto, es difícil, porque al no haber variación entre comunidades reduce nuestra capacidad de identificación, pero esto es otro tema distinto). Construir un argumento contra el efecto de la legislación laboral sobre las diferencias de desempleo entre Andalucía y Navarra es sencillamente muy endeble.

Y como esto pasa en mil contextos. Uno no puede decir “los impuestos no importan, porque Suecia los tiene más altos que España y va como una moto” (típico ejemplo de lo que uno lee en Publico, por meterme con los de un lado) o “la política fiscal no tiene efecto porque mira en EE.UU. como el estimulo de Obama no ha sacado a la economía del pozo” (típico ejemplo de lo que uno lee en Libertad Digital, por meterme con los del otro). Tanto unos como otro ignoran que la pregunta de verdad es “¿cómo iría Suecia con impuestos más bajos?” o “¿cómo iría la economía americana sin estímulo?” Puede ser que la respuesta sea mejor, igual o peor. No es lo que estamos discutiendo aquí. Lo único que importa es darse cuenta que si un columnista hace estas afirmaciones de manera sistemática sin más cuidado es alguien que no es particularmente serio o, peor, no es honesto (o, si lo hizo solo una o dos veces, que no ha sido cuidadoso, que todos hemos pecado de ello alguna vez).

El lector atento tendrá, sin embargo, mil preguntas. La primera y más clara es: todo esto que has discutido documenta correlación, pero, ¿dónde está la causación? A fin de cuentas, los accidentes de tráfico correlacionan con la presencia de ambulancias pero la presencia de ambulancias no causa los accidentes de tráfico. Esto es particularmente relevante porque mi clase no es un experimento controlado como el que tendríamos en un laboratorio.

Otras preguntas, y sin hacer una lista completa, incluyen:

1) ¿pero son las horas de estudio y la capacidad cognitiva independientes la una de la otra? (en el caso de las comunidades autónomas, ¿es la estructura productiva independiente de la legislación laboral?)

2) ¿cómo puedo realmente controlar por todas las variables?

3) ¿Es la gente que coge macro similar a la que coge otras asignaturas?

4) ¿Es el efecto de estudiar una hora más el mismo cuando coges la clase conmigo que cuando la cogen con otro compañero del departamento que da la macro en el segundo semestre?

5) ¿Es el efecto de estudiar una hora más el mismo en Pepe que en Juan?

6) ¿Podemos medir las horas de estudio o la capacidad cognitiva?

7) ¿Y si nos dejamos alguna variable clave?

Y muchas otras más.

En próximas entregas intentaré explicar algunas de estas cuestiones.