- Nada es Gratis - http://nadaesgratis.es -

Guía para aprender métodos cuantitativos en economía (II)

Correlation

Fuente de la tira cómica: xkcd bajo una creative commons license 2.5.

Continuo esta semana mi guía para aprender métodos cuantitativos en economía. En la primera entrega, para mi agradable sorpresa muy leída, me centré en los libros de matemáticas. Hoy, pasaré a tratar las materias importantes para saber realizar análisis empírico, uno de los dos fundamentos de la economía (junto con la teoría). Para ello tenemos que discutir probabilidad, estadística y econometría.

Dividiré mi exposición en libros de nivel de grado y de nivel de postgrado. Algunos de los libros de este segundo grupo pueden ser empleados, sin embargo, para cubrir asignaturas más avanzadas y optativas en el grado. Refiero al lector interesado a mi primera entrega para explicar mis criterios de selección, incluidos, por ejemplo, el preferir libros en inglés y evitar las traducciones. La econometría es la misma en Ribadesella, en Palo Alto o en Ciudad del Cabo. Igualmente, en la primera entrega defino con cierta precisión que entiendo en el contexto de esta serie por un semestre.

Insisto, también, que en probabilidad, estadística y econometría existen decenas de libros excelentes y el no citar un texto con el que un lector puede estar familiarizado puede no tener más razón que la necesidad de escribir una entrada en este blog con una longitud razonable.

1. Enseñanza de Grado

A nivel de grado, una buena enseñanza en métodos empíricos debería de organizarse en cuatro semestres obligatorios, uno de probabilidad, uno de estadística (sin que esta cubra regresión lineal, pues es mejor darla en econometría) y dos de econometría más algunos semestres de optativas. Junto con los seis semestres de matemáticas que recomendé en la primera entrada (tres semestres de cálculo, un semestre de algebra lineal, un semestre de ecuaciones diferenciales y en diferencias finitas y un semestre de optimización) más dos semestres de programación/métodos numéricos que recomendaré en la tercera entrega de esta serie, tenemos un bloque de 12 semestres de métodos cuantitativos obligatorios más las posibles optativas. Dado un grado español con 40 asignaturas semestrales (8 semestres con cinco asignaturas cada uno), dedico aproximadamente un tercio de la carga lectiva a los mismos, considerablemente más que en los planes actuales. Tal incremento debe lograrse suprimiendo asignaturas de escaso valor añadido, como Economía Mundial, Organización Económica Internacional o Política Económica.

Probabilidad

La clave para el éxito en estadística y econometría es entender probabilidad. Si uno no puede seguir los argumentos básicos de probabilidad, todo lo demás es imposible. Si uno tiene los conceptos claros de probabilidad, todo lo que viene después es mucho más claro.

Probability

Y en probabilidad hay un texto magnífico, Introduction to Probability de Joseph K. Blitzstein y Jessica Hwang, basado en la famosa clase Stat 110 de Harvard. Los videos de la misma están en Internet

El libro, además, emplea R, que es un lenguaje abierto y gratuito y el que toda vehemencia recomendaría emplear en enseñanza, sobre todo en unión con RStudio.

Estadística

Friedman

Si uno se pasea por la sección de estadística de una librería universitaria o visita Amazon se encontrará con docenas de libros de estadística. La mayoría de los mismos cumplen con soltura su cometido, pero normalmente sin mucha gracia y sin lograr que los estudiantes entiendan de verdad las ideas de la inferencia. Statistics de David Freedman, Robert Pisani y Roger Purves es distinto. En vez de perderse en fórmulas, que ya pueden ser calculadas mucho más rápido que cualquiera con R o cualquier otro lenguaje estadístico, Freedman y sus coautores se centran en los conceptos y en qué significa aprender de los datos.

Wasserman

Algunos lectores pueden, sin embargo, preferir un libro más riguroso y matemático.
All of Statistics: A Concise Course in Statistical Inference de Larry Wasserman es una opción clara. Además, existe código en R para los ejercicios (¿se les ha escapado a alguien que hay que enseñar con R?). El único problema es que repite muchos de los temas de probabilidad que ya se deberían de haber cubierto en el semestre correspondiente.

Statistics

Finalmente, si algún lector quiere un libro completamente centrado en el empleo de R, el texto de Nicole M. Radziwill es muy sencillito y fácil de seguir.

Si yo fuera a dar clase a estudiantes con mejor preparación matemática probablemente emplease el libro de Wasserman antes que el de Freedman o el de Radziwill. Si fuera a dar clase a gente con ganas de ponerse a correr cosas desde el primer momento, emplearía el de Radziwill. Y el de Freedman sería para los casos intermedios (que son casi todos los demás). Y eso si, evitaría los libros con títulos como “Estadística para Economía y Negocios” o similares.

Econometría

Econometrics

Un buen libro de econometría de grado es Introductory Econometrics: A Modern Approach, de James Wooldridge. El texto trata los temas clásicos -regresión, series temporales, datos de panel, variables instrumentales y variables limitadas- de manera precisa y llega a incluir temas relativamente avanzados como instrumentos débiles. Y con más de 100 bases de datos en distintos formatos, los estudiantes pueden correr en R (o en otras alternativas) los distintos ejercicios propuestos.

watson

Una alternativa es Introduction to Econometrics de James Stock y Mark Watson. Este texto enfatiza la intuición sobre los resultados matemáticos y da lugar a reacciones encontradas. Algunos estudiantes lo encuentran interesante y entretenido. Otros se pierden con el mismo.

Particularmente me gusta más el libro de Stock y Watson pero el Wooldridge es un opción menos arriesgada. Como he explicado anteriormente, ambos libros requieren al menos dos semestres para ser cubiertos con un mínimo de garantías.

2. Enseñanza de Postgrado

Después de concluir el grado, los estudiantes necesitan un nivel más avanzado de probabilidad, estadística y econometría. La manera en los que los estudios se pueden organizar depende de los detalles del programa, pero normalmente pasan por un año completo de econometría y al menos un semestre complementario de temas más concretos.

Probabilidad

Billinsgley

Ahora en probabilidad hay que centrarse en teoría de la medida. El texto más usado en economía es Probability and Measure de Patrick Billingsley. En mi casa debe de haber al menos dos copias pues se enseñaba tanto en Minnesota como en Wisconsin (donde estudió la otra economista de mi familia 😉 ). Patrick Billingsley, además de gran matemático, parece ser fue actor de cierto talento.

Convergence
Del mismo autor, un libro que siempre viene muy bien es Convergence of Probability Measures.

Pollard

Una alternativa en teoría de la medida más moderna, más compacta y bien orientada a las necesidades de los economistas es A User's Guide to Measure Theoretic Probability de David Pollard

Williams

Un libro más conciso y que desarrolla la teoría de la probabilidad desde una perspectiva de martingalas es Probability with Martingales de David Williams. Varios de mis compañeros de doctorado en Minnesota hablaban maravillas del libro, pero yo no lo estudié.

Karatzas

Finalmente, si alguien quiere un tratamiento más avanzado (quizás para hacer investigación en tiempo continuo y/o aprender cálculo estocástico), Brownian Motion and Stochastic Calculus de Ioannis Karatzas y Steven Shreve es particularmente apto para economistas. Shreve tiene también dos libros, Stochastic Calculus for Finance I: The Binomial Asset Pricing Model y Stochastic Calculus for Finance II: Continuous-Time Models tremendamente útiles si alguien quiere concentrarse en valoración de activos (o simplemente una introducción rápida a cálculo estocástico). Finalmente, algún libro especializado en procesos estocásticos puede ser un recurso adicional para aquellos con ganas de trabajar en este campo (aquí y aquí).

Estadística

A nivel de postgrado, la clase de estadística puede enseñarse con un enfoque más frecuentista o un enfoque más bayesiano (a nivel de grado es más complejo cubrir mucha estadística bayesiana).

Berger

Desde una perspectiva más frecuentista, un clásico es Statistical Inference, de George Casella y Roger Berger (que eso es una barba y lo demás son tonterías). Otros complementos, un poco más avanzados son el famoso trío de Testing Statistical Hypotheses de Erich L. Lehmann y Joseph P. Romano, Theory of Point Estimation de Lehmann y Casella y Elements of Large-Sample Theory, de nuevo de Lehmann.

Waart

Esta trilogía se puede completar con un buen libro de teoría asintótica más cortita, como Asymptotic Statistics de A. W. van der Vaart o Stochastic Limit Theory de James Davidson. Un complemento a la teoría asintótica es el bootstrap. Un tratamiento actualizado del mismo aparece aquí. De hecho, se puede hasta dar una clase de introducción a la estadística con remuestreo como tema central (aquí).

Bayesian

Desde el punto de vista bayesiano, a mi me gusta mucho Bayesian Data Analysis, Third Edition de Andrew Gelman (cuyo blog de estadística es sencillamente magnífico), John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari y Donald B. Rubin (si alguno sabe de estadística, en este momento se habrá dado cuenta que esto es un verdadero dream team). Una alternativa que yo utilicé en su día dando clase es The Bayesian Choice: From Decision-Theoretic Foundations to Computational Implementation (2nd Edition) de Christian Robert. El libro de Robert se centra más en fundamentos pero es muy poco más antiguo, algo que importa en una area que ha evolucionado tanto en los últimos años.

efron

La estadística moderna se hace con ordenador. Un libro que ya he recomendado y que resume la literatura de estadística computacional es Computer Age Statistical Inference: Algorithms, Evidence, and Data Science de Bradley Efron (el inventor del bootstrap) y Trevor Hastie.

Robert

Cosas más concretas de computación incluyen Monte Carlo Statistical Methods (2nd Edition) de Christian Robert y George Casella, que es clave, por ejemplo para aprender cosas como el Metropolis-Hastings.

Econometría

Curiosamente ahora mismo no existe un texto claro para recomendar para una primera asignatura de econometría de postgrado. Un libro que se empleó mucho en el pasado, Econometric Analysis de William H. Greene, se ha quedado anticuado (y así, en la privacidad de un blog, a mi nunca me gustó). Otras alternativas, como Econometrics de Fumio Hayashi no cubren todos los materiales que yo querría explicar en esa clase. En vistas de la situación, yo emplearía el borrador en la red Econometrics de Bruce Hansen, que además es gratis.

mostly

Podemos entonces pasar a tratar temas más específicos. Empecemos con libros que tratan microeconometría. Un texto muy popular estos días es Mostly Harmless Econometrics: An Empiricist's Companion de by Joshua D. Angrist y Jörn-Steffen Pischke. El libro viene acompañado de un texto complementario más sencillo, Mastering Metrics. Hablamos de la filosofía detrás de estos libros en NeG hace tiempo.

Mostly Harmless... tiene muchas cosas buenas: entiza los problemas de causalidad, explica muy bien qué es un experimento aleatorizado, para qué sirven las variables instrumentales, etc. Yo lo empleo para algunas de mis clases de estrategias de identificación con cierto éxito, creo. A la vez, el libro se mete algunas veces en berenjenales que no vienen a cuento. Como dice Chris Sims en su comentario a un artículo de los dos mismos autores basado en el libro (y que se aplica por tanto igual al mismo): “What the essay says about macroeconomics is mainly nonsense. The fact that the essay is so mistaken about macroeconomics reflects a broader problem. Recent enthusiasm for single-equation, linear, instrumental variables approaches in applied microeconomics has led many in these fields to avoid under taking research that would require them to think formally and carefully about the central issues of nonexperimental inference, what Griliches saw, and I see, as the core of econometrics.” Mi compañero Aviv Nevo tiene otro ensayo en el que expresa ideas similares sobre las limitaciones de Mostly Harmless... en organización industrial. Un segundo compañero mío, Frank Diebold, es bastante más duro. E incluso con los experimento aleatorizados uno ha de entender sus ventajas e inconvenientes, como bien explica este trabajo de Angus Deaton y Nancy Cartwright. Con cautela, pues, Mostly Harmless... es un fantástico libro. Sin cautela, es quite harmless.

Imbens

Una alternativa, más dura y rigurosa, a Mostly Harmless... es Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction de Guido W. Imbens y Donald B. Rubin (que ya es la segunda vez que sale en esta entrada y, ya que estamos hablando de causalidad, el autor más lógico).

Cameron

Otras areas de microeconometría quedan muy bien servidas con Microeconometrics: Methods and Applications de A. Colin Cameron y Pravin K. Trivedi.

Arellano

Para más detalles sobre datos de panel la mejor opción es, claramente, Panel Data Econometrics de Manuel Arellano, que es el que de verdad sabe de esto en el mundo. Como complemento tenemos la tercera edición de Analysis of Panel Data de Cheng Hsiao. Otra opción, que cubre también secciones cruzadas, es Econometric Analysis of Cross Section and Panel Data, de Jeffrey M Wooldridge.

Para más detalles de modelos discretos, tenemos Discrete Choice Methods with Simulation de Kenneth E. Train y de modelos de recuento está Regression Analysis of Count Data (2nd Edition) de A. Colin Cameron y Pravin K. Trivedi.

Hamilton

Pasemos ahora a series temporales. En mi opinión, y a pesar de sus años, Times Series de Jim Hamilton sigue siendo la mejor referencia.

New

Más moderno es New Introduction to Multiple Time Series Analysis de Helmut Lütkepohl. A mi no es un libro que me emocione pero los comentarios en Amazon son muy positivos, así que lo mismo es mi culpa. El mismo autor, con Lutz Killian, tiene un libro a punto de salir de VARs y que se puede encontrar todavía en la red. Y aunque parezca mentira, Time Series Analysis: Forecasting and Control de George E.P. Box, Gwilym M. Jenkins, Gregory C. Reinsel y Greta M. Ljung sigue siendo un sitio donde uno puede aprender muchísimo. Finalmente, en la intersección entre macro y series temporales tenemos otros dos libros de provecho: Structural Macroeconometrics de David N. DeJong y Chetan Davey y Methods for Applied Macroeconomic Research de Fabio Canova.

Elliot

Sobre cosas más específicas de series temporales, tenemos Economic Forecasting de Graham Elliott y Allan Timmermann.

lo

Sobre econometría financiera tenemos, aunque ya con unos añitos, The Econometrics of Financial Markets (2n Edition) de John Y. Campbell, Andrew W. Lo y mi vecino de Wharton A. Craig MacKinlay. Un buen complemento es High-Frequency Financial Econometrics de Yacine Aït-Sahalia y Jean Jacod.

Horowitz

Sobre métodos semi y no paramétricos, el libro de Joel Horowitz es una primera estación de destino. Otras opciones son esta y esta. Yo complementaría estos temas con algo de identificación.

elements

Sobre aprendizaje automático, escribí hace unas semanas una entrada entera, con lo que no hace falta que repita las recomendaciones aquí, excepto recordar el libro principal, y una versión más sencilla también gratis en internet.

Poirier

Finalmente, dado que yo me dedico a la econometría bayesiana, los lectores me perdonarán si le dedico una buena parte de esta entrada a la misma. Dos libros que tiene un porrón de años pero que sigue siendo una preciosidad son An Introduction to Bayesian Inference in Econometrics de Arnold Zellner e Intermediate Statistics and Econometrics: A Comparative Approach de Dale J. Poirier.

Geweke

El mejor libro es de John Geweke (yo usé sus notas de clase cuando tomé su clase en Minnesota hace ya demasiados años), aunque la notación es realmente compleja.

Frank

Y mi compañero y coautor Frank Schorfheide y un antiguo alumno de Penn, Ed Herbst tienen Bayesian Estimation of DSGE Models, recién salido del horno.

Rossi

Y Peter Rossi tiene tanto un libro sobre estadística en marketing (con Greg M. Allenby y Rob McCulloch) como otro sobre métodos no y semi-paramétricos en un contexto bayesiano.

Hidden

Para cerrar, en econometría bayesiana (aunque también en parte en clásica) es importante saber manejar modelos ocultos de Markov . Yo empleo Inference in Hidden Markov Models de Olivier Cappé, Eric Moulines y Tobias Ryden.

Termino aquí para no extenderme en exceso. Si recuerdo algún libro más en estos temas, lo colgaré en los comentarios. En unas semanas completaré esta serie de guías con una tercera entrada sobre programación/métodos numéricos.