Por Stephane Bonhomme, Universidad de Chicago
Elena Manresa, profesora de economía en la Universidad de Nueva York, es la galardonada este año del premio fundación Banco Sabadell a la investigación económica. Desde el inicio de ese premio hace veinte años, es la primera vez que es destinado a un(a) económetra.
Los métodos importan
Elena desarrolla y analiza métodos para interpretar los datos económicos. En las últimas décadas, ha habido un movimiento en contra de la metodología que se venía utilizando en economía, que se ha extendido a la vez que la economía se volvía cada vez más empírica. Sin embargo, en esta entrada quiero argumentar por qué los trabajos metodológicos de los económetras como Elena son ahora más relevantes que nunca.
Volviendo unas décadas atrás, en un estudio famoso, el economista Robert Lalonde demostró que los métodos basados en modelos econométricos pueden fallar. Esta crítica tuvo un gran impacto en la evolución de la ciencia económica en los últimos años. La reacción de una parte de la profesión fue tratar de desarrollar maneras más simples y transparentes para analizar datos. A modo de ejemplo, el Premio Nobel del año pasado a Joshua Angrist, David Card, y Guido Imbens se puede interpretar como un reconocimiento a esa nueva forma de analizar datos económicos.
Pero si bien la crítica a los métodos complejos y opacos es sana, es preciso recordar que todos nuestros conocimientos sobre la economía empírica dependen de los métodos que utilizamos. Siempre se puede calcular un número. Pero, ¿qué significa ese número? Las técnicas más populares actualmente (incluso las que implican comparaciones entre grupo de tratamiento y grupo de control) son métodos de análisis que se basan en modelos. Dicho de otra manera, nunca es suficiente “dejar que los datos hablen por sí mismos”. Un ejemplo importante de la dependencia de los métodos es el análisis de preguntas causales, como lo ha demostrado recientemente Judea Pearl en su “Book of why” (“El libro del porqué”).
Y por eso los trabajos metodológicos de Elena, y de los económetras, son tan valiosos. Son estos trabajos los que nos permiten construir la base sobre la cual uno puede entender cómo funciona la economía, y de esa manera, contribuir a mejorar las políticas económicas.
Los datos económicos se pueden usar de muchas maneras
Los trabajos de Elena están cambiando la econometría, introduciendo nuevas maneras de mirar y analizar datos. Sus trabajos combinan métodos clásicos de la econometría con nuevas técnicas del aprendizaje automático (o “machine learning”). Me gustaría mencionar dos ejemplos basados en su investigación.
En primer lugar, voy a comentar un análisis que hicimos juntos, tratando de entender la relación entre la riqueza de un país y su régimen político. En un primer momento, miramos la relación estadística entre la riqueza del país y una medida de su nivel democrático, y encontramos una relación positiva clara que sugiere que los países más ricos tienden a ser más democráticos. ¿Pero cómo interpretar esta relación? ¿Se puede concluir que más riqueza implica más democracia?
Elena propuso construir “grupos de control”, es decir grupos de países similares, y comparar la evolución de la riqueza y del sistema político de los países dentro de cada grupo. La innovación clave de su trabajo fue construir esos grupos de manera automática, usando los mismos datos de democracia y riqueza. El algoritmo que introdujo se puede ver como una extensión del algoritmo K-means, que es popular en machine learning. El algoritmo clasifica la evolución de los regímenes políticos en el tiempo, identificando autocracias, democracias, o países en transición como España en la segunda parte del siglo veinte. De hecho, este método de clasificación se puede usar en otros contextos (para clasificar empresas, trabajadores, ocupaciones…), como lo demuestran varios estudios recientes en diversos campos.
En mi segundo ejemplo voy a comentar un artículo reciente que Elena ha escrito con Guillaume Pouliot y Tetsuya Kaji. El punto de partida es una técnica de machine learning que se llama GANs (Generative Adversarial Networks). Se usa por ejemplo para generar por ordenador cuadros que se parezcan a los de nuestro pintor favorito. Es una técnica popular con diversas aplicaciones, incluyendo textos, imágenes y música.
La idea de Elena es simple y brillante. Los economistas usan modelos de comportamiento. ¿No se puede pensar en los datos generados a partir de estos modelos como pensamos en los cuadros producidos por el ordenador? Al fin y al cabo, en ambos casos, esos datos artificiales están generados por algoritmos. Elena usa GANs para estimar modelos económicos. Es decir, para hallar parámetros del modelo tales que los datos artificiales generados por el modelo y los datos de verdad, se parezcan mucho. Este es un objetivo que los economistas siempre queremos alcanzar cuando intentamos que la realidad y nuestros modelos se parezcan, y para el que las modernas técnicas de aprendizaje automático nos permiten adoptar un nuevo y potente enfoque.
Las matemáticas son solo un medio, no un fin
La evolución de la econometría es cada vez más matemática. Solo hace falta consultar las revistas más prestigiosas del campo para ver cantidad de letras griegas y fórmulas matemáticas complicadas. Pero hay una brecha entre esa teoría abstracta y la práctica aplicada. De hecho, se ha dicho que la matematización de la econometría está produciendo un divorcio entre cómo los investigadores aplicados usan sus datos, y lo que los económetras les dicen que tendrían que hacer.
Para Elena, las matemáticas son un medio para entender el mundo. Siempre intenta entender cómo las fórmulas matemáticas se relacionan con la economía real. Para ilustrar este punto, me gustaría mencionar un campo de la estadística relacionado con la selección de variables relevantes que intenta tener en cuenta un número de factores muy grande cuando lleva a cabo sus análisis empíricos. Una idea clave de los últimos 30 años se basa en un supuesto de “sparsity” (que se podría traducir como “dispersión” - en el espacio - en español). Según ese supuesto matemático, solo unos pocos factores importan, aunque no sepamos cuales. Se ha desarrollado una literatura enorme al respecto en estadística, machine learning, y econometría. La popular técnica del “Lasso” se basa en ese supuesto. Pero ¿es sparsity un supuesto plausible empíricamente? Nadie lo sabe realmente.
En uno de sus primeros trabajos, verdaderamente pionero, Elena ha introducido un entorno donde sparsity es plausible. Analiza como la productividad de una empresa depende de los gastos en I+D de esa empresa, y de los gastos en I+D de otras empresas en la economía. En un caso como ese hay un gran número de variables explicativas, porque hay muchas empresas en la economía. Pero ¿cuántas empresas pueden influenciar a una empresa dada? Pensando en colaboraciones entre empresas, imitación, o incluso espionaje industrial, es plausible que solo unas pocas empresas tengan un efecto directo sobre la productividad de la empresa que consideramos. Si el mundo es así, entonces sparsity, tal y como demuestra Elena, es plausible. Y esta sigue siendo para mí la mejor motivación empírica de ese supuesto matemático clave.
El valor de pensar por sí mismo, de nunca creerse nada “porque lo dicen”
La primera vez que conocí a Elena no era profesora de universidad, sino una estudiante en el máster del CEMFI en Madrid. Lo que más distinguía a Elena en la clase era su espíritu crítico. No se daba por convencida. Es una actitud que mucho más tarde volví a encontrar en la Universidad de Chicago, y que admiro mucho. Quizás es lo más importante para un investigador: esa capacidad de siempre cuestionar.
Y es que como estudiante Elena era diferente a los demás porque lo tenía que entender todo. Tenía una profundidad que raramente he visto en la profesión. Además, siempre era increíblemente curiosa. Como investigadora, sigue así: critica, profunda y curiosa. Una investigadora de primer plano que ampliamente se merece este premio.