Desorden y predicción en series trimestrales

En estos tres últimos años, los modelos usados por los organismos que estiman la contabilidad nacional trimestral (CNTr) han estado sometidos a una prueba de estrés nunca conocida. La famosa trimestralización de las cuentas anuales se compone de modelos matemáticos (econometría de series temporales) que necesitan de una regularidad en las relaciones que se establecen para que funcionen adecuadamente. El problema es que desde marzo de 2020 y por un tiempo significativo dichas regularidades han desaparecido para no pocos sectores productivos y para no menos agregados. Tratar de “realizar con éxito” una estimación de las series trimestrales en un entorno tan hostil es, cuando menos, heroico. El desorden económico afecta, pues, a los errores que se pueden cometer en las estimaciones de agregados trimestrales, amplificando lo que, por la propia naturaleza estocástica del problema, se cometen. Déjenme unos minutos para explicárselo.

Breve introducción a la trimestralización

Cualquier instituto oficial de estadística publica dos explotaciones de contabilidad para el seguimiento de la actividad económica. Por un lado, la anual (CA) que, como su nombre indica, responde a dicha frecuencia. Su cálculo se basa en una combinación de estimaciones a partir de encuestas estructurales o registros administrativos, siendo por ello costosa en tiempo y dinero. Es por ello por lo que su frecuencia es anual. Encuestas tales como las de presupuestos familiares, las financieras de los hogares o registros tributarios, información de aduanas etc, permiten contabilizar estos grandes agregados dibujando un perfil detallado de cómo es y evoluciona una economía.

Por otro lado, está la de frecuencia trimestral (CNTr). Ésta difiere de la anual no solo en la frecuencia sino, además, en la metodología. Aunque aprovecha, cada vez más, registros administrativos que con los avances de la tecnología se obtienen a un menor coste en tiempo y dinero, su estimación sigue basándose primordialmente en el uso de indicadores coyunturales, es decir, explotaciones estadísticas sobre eventos concretos, como pueden ser la producción industrial, las ventas en grandes superficies o el número de visitantes extranjeros en la encuesta de EGATUR.

Y aquí está el reto de esta explotación estadística. La CNTr busca elevar la frecuencia de los agregados anuales usando estos indicadores de frecuencia mensual o trimestral como instrumentos para ello. Por ejemplo, para el consumo privado anual, calculado cada año gracias a la EPF, podría aprovechar la información contenida en indicadores como el índice de comercio minorista o las matriculaciones, de frecuencia mensual. Asumiendo que indicadores y agregado son expresiones de la misma realidad, podemos suponer que lo que es verdad para el indicador debe serlo para el agregado. A partir de aquí ya solo queda “inocular” la estructura temporal del indicador de mayor frecuencia en la serie anual de baja frecuencia mediante el uso de modelos de trimestralización. Estos métodos buscan que el perfil dentro de cada año (trimestres) siga el dibujado por el indicador, pero con la restricción de que la suma de los cuatro trimestres estimados coincida con el dato anual.

Para llevar a cabo esta “inoculación” existen varios métodos, cada uno con sus supuestos, de uso recomendados en casos específicos. Entre los más usuales destacan Denton, Fernández o Chow-Lin (aquí, aquí y aquí). También el FMI ha desarrollado algunas propuestas que buscan el modo más eficiente y óptimo para transformar series anuales en trimestrales (aquí).

Pero una cosa es trimestralizar un año y otra diferente estimar el dato del trimestre para el que no hay agregado anual, como sería, por ejemplo, el segundo trimestre de 2023. Para estos casos, los modelos mencionados proponen métodos de extrapolación de las series trimestrales desde el último trimestre del año para los que sí disponemos de serie anual hacia el corriente.

Tipos de errores: las obligadas revisiones.

Obviamente hablamos de estimaciones, por lo que siempre habrá errores a cometer. Dos son los principales tipos de errores cometidos al trimestralizar y que, con las sucesivas re-estimaciones, tienen como resultado la publicación de las (ahora) famosas revisiones de la Contabilidad Nacional Trimestral (CNTr).

En primer lugar, cuando se publica la primera estimación para un trimestre (a 30 días de finalizado el trimestre) no todos los indicadores están disponibles para el conjunto de los meses de dicho trimestre. Para rellenar los huecos, se usan predicciones de series temporales (típicamente a partir de modelos ARIMA), que en su momento serán sustituidas por el valor real una vez se dispone de él. Esto es lo que hace el INE dos meses después de publicada la primera estimación (90 días de finalizado el trimestre). En segundo lugar, en septiembre se dispone del primer cálculo en Contabilidad Anual (CA) del dato del año anterior, por lo que se sustituye el estimado a partir de la CNTr por el calculado por la CA. Esto implica una nueva revisión de todos los trimestres empezando por el primero del año para el que obtenemos el nuevo dato anual hasta el último estimado.

A estas revisiones sumen los ajustes en los parámetros de la desestacionalización o el tratamiento de valores extremos. Todo ello implica las revisiones de las series de las que somos testigos en cada ocasión.

Pero hay más: La Trimestral ante el desorden

La capacidad de la CNTr para ofrecer buenas estimaciones depende de la calidad de las relaciones econométricas con las que se proyecta la estructura temporal de indicadores de alta frecuencia (mensual o menos) sobre los agregados de baja frecuencia (trimestrales y anuales). Pero ¿qué pasaría si estos indicadores, de repente, cambian de tal modo que no hay modelo que permita ni predecir ni ajustar su comportamiento? Pues que no pocos agregados se quedarían huérfanos de datos y modelo. Imaginen cuando, además, se confunden efectos, como estacionalidad con eventos no esperados (innovaciones a las series temporales) contaminando incluso hasta los procesos de desestacionalización.

Pero hay más. Podemos afirmar que desde hace un tiempo tanto los agregados como los indicadores son cada vez menos predecibles. ¿Y cómo lo sabemos? Gracias a la Teoría de la Información.

Información y desorden

La entropía puede considerarse como una medida de la incertidumbre. En la intersección de la Teoría de la Información y la necesidad de analizar la estructura temporal de una serie de tiempo para las que el orden en el suceso de eventos y su dinamismo es importante (información causal) surge una idea interesante.

Como sabemos, las series de tiempo muestran patrones de comportamiento que las hacen más o menos predecibles, pero sin que sea posible hacerlo a la perfección. Así, cada nueva realización de una serie aporta dos piezas de información. Una primera, que es predecible, reproduce un patrón. No acumulamos conocimiento. Solo lo reproducimos. Es la que, si es la pieza que domina, nos ayuda a predecir casi a la perfección. Otra es nueva, ofrece información fresca. Cuanto mayor peso tiene esta componente, más difícil es predecir, pero más información nueva acumulamos.

A un técnico que quiere predecir comportamientos de series temporales en economía le ayuda la primera situación: minimizar la información innovadora (el error en la predicción), e identificar tanto el dato como el patrón que tenga una alta probabilidad de suceder: si un valor de la serie es mayor que su anterior y lo normal es que esperemos que el siguiente sea así, la predicción es más fácil. Pero si los patrones se desordenan, cambian a otros patrones con poca frecuencia en la historia previa de la serie, todo se complica.

Existen medidas que nos ayudan a analizar si los patrones en las series temporales cambian, además de si la información “nueva” aumenta en peso o disminuye. En la Teoría de la Información puede usarse la “Permutation Entropy”, que básicamente supone medir la frecuencia de los patrones ordinales de la evolución de los indicadores en un conjunto de meses o trimestres. Así, si elegimos cuatro trimestres de intervalo y para una serie vemos que lo normal es que, a lo largo de toda ella, lo más frecuente sea que un trimestre de mayor crecimiento suceda a otro de menor (ciclo expansivo) o lo contrario (contracción) y solo en momentos de cambio de ciclo observaremos patrones en V o V invertida, entonces la predicción se simplifica. La serie será predicha con mayor facilidad. Y es que una serie de comportamiento ordenado concentrará mucha frecuencia en pocos patrones muy identificados. Sin embargo, una serie caótica o desordenada (no es lo mismo) sería aquella que, dadas otras condiciones, no somos igualmente capaces de prever un patrón dado, puesto que entre los ya observados no será igualmente posible discriminar suficientemente por frecuencias.

Figura: Frecuencia media de los patrones observados por cada mes para 55 indicadores coyunturales españoles.

Fuente: elaboración propia a partir de una batería de indicadores de coyuntura.

Pues bien, desde hace unos años, y para una batería de indicadores coyunturales desestacionalizados (55) y en tasa interanual, observamos una tendencia hacia patrones menos frecuentes. En la siguiente figura se observa la media (con su intervalo de confianza al 90 % sombreado) de la frecuencia de los patrones a cuatro trimestres de series de indicadores españoles. Observamos que cada vez, de manera muy sutil pero evidente, esta frecuencia va bajando, aunque lo hace más intensamente a partir de 2019. Esta figura nos indica que patrones antes infrecuentes comienzan a aparecer con cada vez mayor frecuencia. Esto hace el arte de la predicción más difícil, aunque más sugerente. Las consecuencias evidentes para la estimación de, por ejemplo, series de CNTr, lo que añade, por lo tanto, mayor amplitud a los errores a cometer.

Conclusión

En definitiva, el arte de la estimación de series trimestrales aúna matemáticas, olfato para el uso de indicadores y el arte de leer los resultados. Todo ello en un contexto de predictibilidad dado por unas relaciones que se mantienen en el tiempo. Sin embargo, vivimos tiempos extraños y para la CNTr lo son y mucho. Al final del día, esta menor predictibilidad implica mayores errores en la estimación de los agregados trimestrales y, por ello, mayores revisiones.