Como quizás sepan, la semana pasada publiqué en este blog una entrada sobre la investigación que estudia si la inmigración causa crimen. El texto resumía un trabajo de Marie y Pinotti sobre la literatura al respecto, una literatura que, basándose en múltiples estudios que utilizan múltiples estrategias empíricas, concluye que no hay evidencia de esa causalidad.
El articulo trajo y todavía trae cola. Como dijo nuestro querido Jose Luis Ferreira, la más de treintena de comentarios recibidos en la entrada se pueden clasificar en cuatro tipos: 1) “¡Si todo el mundo sabe que es lo contrario!” 2) “¡Usa datos agregados!” 3) “¡Pero no estudian causalidad!” y 4) “Pues yo interpreto otra cosa”. En esta entrada me centraré en el número 3.
Muchos de los comentarios en esa categoría citaban porcentajes de delitos cometidos por extranjeros para concluir que la inmigración genera crimen, cuando en realidad esos porcentajes solo muestran sobrerrepresentación en registros administrativos, no causas. También recurrieron a comparaciones de descriptivas simples ignorando la composición demográfica o sesgos institucionales. Otros se apoyaban en casos particulares para extraer conclusiones generales, o en la idea de que basta con mirar “quién delinque” para resolver la cuestión (acompañado de expresiones como “es obvio”, “es innegable”). Incluso se criticó el uso de técnicas econométricas avanzadas porque “los datos brutos ya muestran correlación”, sin reparar en que justamente esos métodos existen para dirimir causalidad. Es decir, todos estos comentarios reflejaban un mismo error: confundir correlación con causalidad.
En NeG creíamos que el mantra correlación no es causalidad estaba ya había calado. En este blog lo hemos mencionado innumerables veces (por ejemplo, Antonio Cabrales ya avisaba en 2013). Pero parece que demasiada gente no lo tiene tan claro. Por eso, hoy me gustaría volver al tema, centrándome en esta ocasión en la importancia de entender bien esta distinción porque, de no hacerlo, nuestras sociedades pueden cometer errores muy costosos. Lamentablemente, ya lo han hecho.
A continuación, repasaremos varios casos.

La desastrosa austeridad
Tras la Gran Recesión de 2008, la Unión Europea adoptó una política de austeridad fiscal severa basada en la idea de que una deuda pública alta ahoga el crecimiento económico. Esta idea se basaba en un estudio muy citado de Reinhart y Rogoff (2010), que mostraba una correlación histórica: países con deuda superior al 90% del PIB tendían a tener crecimiento bajo o negativo. Políticos conservadores y organismos internacionales tomaron esta correlación como evidencia de causalidad, concluyendo que el elevado endeudamiento provocaba estancamiento económico, y que por tanto era urgente recortar gastos y déficits para recuperar la senda de crecimiento. En España se reformó la constitución de forma express tras un debate y votación en Cortes en pleno agosto.
Sin embargo, pronto se descubrió que el estudio de Reinhart y Rogoff contenía errores de cálculo y omisiones de datos. Más importante aún, al reanalizar los datos se vio que no había tal umbral mágico del 90% y que la relación observada no probaba causalidad. De hecho, una revisión de la literatura sugiere que es más probable que la dirección causal probable sea la opuesta: es el bajo crecimiento es el que suele elevar la deuda al caer los ingresos fiscales y aumentar el gasto social en recesiones. Por ejemplo, en España durante la crisis, el PIB se desplomó y eso disparó el déficit y la deuda pública, no al revés. Correlación no implica causalidad, y confundirlas llevó a aplicar austeridad con consecuencias desastrosas para las personas y un severo descredito del sistema democrático que estamos pagando y que continuaremos pagando un buen tiempo.
El caso Reinhart-Rogoff mostró de una forma rotunda que no se pueden hacer recomendaciones de política económica basadas solo en correlaciones: asociar deuda elevada con crecimiento bajo no equivale a demostrar que la deuda cause estancamiento. Asumir una causalidad inexistente puede agravar la misma situación que se pretende resolver.
Obras publicas milmillonarias
Como nos contó hace poco Javier Campos, otro caso que nos muestra lo problemático de confundir correlación con causalidad en política pública es el del AVE y el turismo. Durante años se asumió que llevar la alta velocidad a ciudades del interior generaría un impulso turístico. A simple vista, la correlación parecía lógica: hay menos turismo donde las conexiones son peores. Sin embargo, al aplicar un método de control sintético que construye un escenario contrafactual comparable, se puede ver que en ciudades como Albacete, Cuenca y León hubo menos pernoctas de hotel que las que habrían tenido sin AVE.
Este ejemplo ilustra el riesgo de basar en ideas que parecen “de cajón” decisiones tan costosas como la construcción de líneas de alta velocidad. Si nos quedamos en la correlación, reforzamos narrativas atractivas pero engañosas. Si a quien propone estas políticas, quizá por motivaciones espurias, no le exigimos más que cuatro porcentajes y correlaciones, deterioramos la calidad democrática porque debilitamos la rendición de cuentas. Y corremos el peligro de invertir miles de millones en políticas que no cumplen sus objetivos o que incluso generan efectos contrarios a los esperados.

“Nos quitan el trabajo”
Otro caso similar es el de los discursos de “los inmigrantes nos quitan el trabajo”. La correlación parece clara, ¿no? Menos inmigración, menos oferta de mano de obra, menos (supuesta) competencia desleal y, por lo tanto, mejores salarios y más empleo para “los de casa”.
Esta idea, consecuencia de la falacia de la cantidad fija de trabajo, ha inspirado políticas migratorias restrictivas como la que se aprobó en el estado de Georgia, EEUU, en 2011. Una política de “mano dura” con los inmigrantes indocumentados que esperaba “liberar” empleos agrícolas para trabajadores nacionales desempleados. ¿El resultado? Un desastre. Miles de braceros inmigrantes no acudieron ese año a recoger frutas y verduras. Como no existía un “ejército oculto” de estadounidenses aguardando la oportunidad de sustituir a los inmigrantes en el campo, ni siquiera ofreciéndoles salarios de hasta 200 dólares al día, cultivos enteros terminaron pudriéndose. Es decir, una ley concebida para “proteger” la economía local terminó dañándola porque se basaba en una causalidad ficticia.
La evidencia desmiente que la inmigración sea devastadora para el empleo o los salarios de los trabajadores “nativos”. Los efectos agregados de la inmigración en el mercado laboral suelen ser modestos o incluso positivos. Así lo dice, por ejemplo, un reciente informe de una institución tan poco sospechosa de izquierdismo bolivariano (lo sé, repito el chiste) como FEDEA.
En resumen, confundir correlación con causalidad en materia migratoria ha llevado a políticas restrictivas que perjudican a todos: se parte de una observación correlacional equivocada (“si hay inmigrantes y paro, los inmigrantes causan el paro”) y se soslaya que las verdaderas causas del desempleo o los bajos salarios suelen ser otras (estructurales, tecnológicas, condiciones laborales). Los ejemplos de Georgia o del Reino Unido tras el Brexit demuestran que expulsar inmigrantes o limitar su posibilidad de trabajar no garantiza mejoras para los nativos y puede acarrear efectos económicos indeseados.
Ayuda no es dependencia
Otro ámbito donde se confunde correlación con causalidad es el de las políticas sociales. Se suele afirmar que las ayudas públicas generan vagancia (o algún otro pecado capital similar), apoyándose en que las regiones o segmentos con más paro concentran también más perceptores de subsidios. Pero esa observación no tiene en cuenta que igualmente se podría argumentar que es la falta de empleo la que explica la mayor demanda de ayudas.
Este razonamiento ha inspirado reformas restrictivas, desde la “welfare reform” en EEUU hasta recortes en España durante la eurocrisis. En ambos casos, se partió de la idea de que recortar subsidios incentivaría a la gente a trabajar. La evidencia, sin embargo, matiza mucho esa idea “de sentido común”. Por ejemplo, como nos contaban Gerard Domenech y Silvia Vannutelli en este mismo blog, si bien la reducción de las prestaciones por desempleo puede impulsar a algunos trabajadores a intensificar la búsqueda de empleo a corto plazo, los efectos a largo plazo son ambiguos y pueden perjudicar a los grupos más vulnerables. El principal factor desalentador de la búsqueda de empleo no es la generosidad de las prestaciones, sino su duración y la falta de oportunidades reales de inserción. Al endurecer las condiciones, lo que a menudo se logra no es más empleo, sino más pobreza, como sucedió en España con los mayores de 55 años tras 2012.
Ver a personas en paro cobrando subsidio no significa que el subsidio sea la causa de su desempleo. Retirar las ayudas con esa premisa suele castigar a quienes más las necesitan, sin resolver las causas de fondo: falta de empleo productivo, baja calidad del trabajo o problemas de salud y formación.
Conclusión
Los casos repasados demuestran el peligro de confundir correlación con causalidad en el diseño de políticas públicas. En todos ellos, mediante la mera percepción o una inspección básica de los datos, se identificó una correlación, se asumió una relación causal simple y se utilizó para tomar medidas de calado. Pero en la realidad lo que parece 1+1 = 2 no siempre lo es. Las percepciones, los casos particulares no bastan. Aplicar políticas sobre la base de una causalidad mal inferida no solo no contribuye a solucionar el problema, sino que con frecuencia genera efectos indeseados que empeoran la situación o crean nuevos daños, especialmente para grupos vulnerables, que son siempre los primeros en sufrir recortes o en ser chivos expiatorios de falsas narrativas causales.
Agradezco a Lluis Torrens la sugerencia de escribir este articulo.
Hay 5 comentarios
Hola Santi. Muy didáctico este post. Quería comentar algunas cuestiones al respecto:
Aristóteles distinguía cuatro tipos de causa, la formal, la material, la eficiente y la final. Yo veo la causalidad como unas lentes que nos permiten ordenar el mundo de forma lógica, adaptando nuestro sistema de creencias, generando una perspectiva o “realidad” concreta.
En física (clásica), el gran modelo a imitar por la econometría, o en la balística, podemos establecer causalidad directa entre los fenómenos. Aquí la causa formal y material quedan sustanciadas como principio vertebrador de nuestra cosmovisión.
En lógica la cosa se vuelve más difusa. Cuando trabajamos con argumentos, despegamos de la adecuada correspondencia material para abrazar la ideación de lo abstracto. En ese sentido es forzosa una interpretación y un intérprete, de ahí la causa eficiente, el investigador, que pone a prueba su hipótesis, con el propósito ambicioso de culminar la causa final ampliando las fronteras de nuestro conocimiento. (sigo)
La correspondencia material representa el grado de proximidad entre nuestras interpretaciones y la realidad. Desde un punto de vista experimental, esto es más “fácil” desde dentro del ámbito de las ciencias duras.
La economía pretende cuantificar bajo la máxima de Galileo “mide lo que es mensurable y haz mensurable lo que no lo es” y ahí, en la industrioso afán de recopilar datos, en el diseño y la metodología de las técnicas de investigación, en su pulcritud inmaculada, se otorga un halo o aura de seriedad y rigor infalible. Esto es real, en la mayoría de los casos, además la alternativa a estos procedimientos, es la charlatanería y la propaganda ideológica, lo cual tampoco está exento de realidad, pero representa un reduccionismo o banalización del poder de la mente humana para emitir argumentos en base a simulaciones o aproximaciones que no requieren contar todos los granos de arena para conjeturar que estamos en la playa en agosto. (sigo)
Santi, muchísimas gracias por combatir con generosidad y sabiduría los prejuicios de gente con ideas preconcebidas sin ( o con débil) base científica, aunque sus comentarios sean muy educados. Haces un gran favor a la profesión.
En la economía de la inmigración, la idea del "lump sum" (trabajo fijo) está muy extendida aunque haya evidencia teórica y empírica demostrando que es una falacia en la mayoría de los casos.
Los inmigrantes no se distribuyen aleatoriamente entre las regiones del país de destino sino que lo hacen hacia aquellas zonas donde hay mas trabajo y, sobre todo, mas contratos para buscar empleos. Por ello es crucial, aleatorizar su llegada usando variables instrumentales como la proporción de inmigrantes de una determinada nacionalidad que llegaron en el pasado. Los venezolanos y marroquíes van donde están sus compatriotas. Por eso, es fundamental usarlos como hacen Marie y Pinotti y llevan haciéndolo los economistas serios desde que Bartik (1991) los propusiera. Sin ellos, lo normal es que haya una correlación negativa entre, digamos, desempleo y tasa de inmigración porque los inmigrantes suelen ir a áreas donde hay menos paro, lo que daría lugar a otra de tus fantásticas viñetas. Obviamente Marie y Pinotti son conscientes de este problema y sus métodos de estimación son los correctos. Si no sale un efecto positivo y estadísticamente significativo de inmigración sobre delincuencia es porque no la hay..... hasta que alguien demuestre lo contrario.
Finalmente, asemejamos el consecuente o el efecto que queremos demostrar como un nodo conectado en un grafo. Éste nodo, para poder llegar a él es posible trazar varias rutas desde otros nodos, que digamos lo legitiman, serían pues sus antecedentes o causantes parciales.
Estos son los “factores” que influyen individualmente o de forma global sobre un determinado fenómeno de la realidad. Todos los nodos o rutas que sostienen o por los que se puede llegar a una conclusión. También puede haber distintos pesos entre los nodos, pero todos cumplen una función de comunicación o respaldo.
En esta trama compleja, cuando se tienen en cuenta unos factores, y la posibilidad de negarlos para anular la conclusión, resulta prácticamente inevitable, dejarnos atrás algunos nodos que aún permiten que la conclusión sea válida. Estaríamos pues incurriendo en un error al establecer una causa por correlación, ya que en ese caso, el contexto global contendrá un número de factores mayor con lo que no habíamos contado. Sin embargo,en el caso de que los factores aislados sean en conjunto el total de los estimados, la conclusión puede considerarse plenamente justificada.(fin)
Gracias por el artículo. Lamentablemente el peso que tiene la experiencia sensible en la formación de ideas es enorme. Incluso gente con formación (entiende y conoce el método científico, el contraste de hipótesis, la plausibilidad biológica....) cuestiona la evidencia cuando esta entra en liza con su experiencia sensible. En el mundo sanitario, esto es bastante frecuente. Es muy fácil encontrar profesionales que aseguran que los genéricos y biosimilares no son iguales que los medicamentos de referencia porque según ellos "en sus pacientes han ido mal". Esto se conoce en psicología como sesgo de negatividad. Recuerdan más los eventos negativos. También les dan más credibilidad y más peso en sus decisiones, ya que mejorar es lo esperable y un resultado adverso obliga a tomar más decisiones. Me parece muy interesante lo que expones y me parecía relevante añadir este aspecto de la experiencia sensible ya que hoy en día ni si quiera hace falta tener una mala experiencia tú mismo para automáticamente establecer una casualidad y generalizarla. Basta con que te llegue por redes sociales x caso que le pasó a x persona para automáticamente encender la visceralidad de la experiencia sensible. Es muy complicado abstraerse de ella y no es suficiente con tener formación al respecto. Y es por ello que es muy rentable utilizar esas "correlaciones" y "casos" para distorsionar la realidad, ya que entran como cuchillo en mantequilla. Enhorabuena por el post!