Estacionalidad post-Covid

Jesús Ruiz (@icae_ucm), Luis Puch (@lpuchg), Manu García (@manugar), y J. Ignacio Conde-Ruiz (@conderuiz)

A grandes males, grandes remedios, dice el refrán. El pasado 11 de marzo la serie diaria de afiliación a la Seguridad Social sufrió un desplome del 5% en 15 días (casi un millón de afiliados menos). Este shock registrado en los datos diarios, y resultado del estado de alarma y el confinamiento, tuvo su reflejo correspondiente en la serie mensual de afiliación en marzo y abril. Concretamente, desde los 19.250.229 afiliados en febrero a los 18.458.667 en abril en media mensual (791.562 afiliados menos). Tal escalón, que en realidad se mantiene cinco meses después, requiere un tratamiento a la altura de la perturbación que representa. A la altura que también ha de estar el tratamiento estadístico de los datos y su interpretación.

El pasado miércoles 2 de Septiembre, el Ministerio de Inclusión, Seguridad Social y Migraciones nos sorprendía con un dato de afiliación media mensual ajustado de estacionalidad que situaba la afiliación en agosto en 18.796.954 de afiliados, frente a los 18.564.290 del mes anterior (ambas, cifras para la serie desestacionalizada). Es decir, un incremento en un mes en ¡232.664 cotizantes! (frente a los 6.822 del dato observado).

Si alguien tiene la curiosidad de averiguar cómo se calcula dicho número, en la página web del Ministerio se indica:

“PARA EVITAR LA CONTINUA REVISIÓN DE LOS DATOS YA PUBLICADOS AQUÍ SE OPTARÁ POR LA APLICACIÓN A LOS NUEVOS DATOS DEL AÑO EN CURSO DE LOS FACTORES DE DESESTACIONALIZACIÓN CORRESPONDIENTES AL AÑO PREVIO, es decir, estos no se re-estimarán con cada nuevo dato. AL FINAL DE CADA AÑO SE REALIZARÁ LA DESESTACIONALIZACIÓN DE LA SERIE COMPLETA, SUSTITUYENDO A PARTIR DE ESE MOMENTO LOS DATOS PUBLICADOS, en caso de que éstos varíen, y estimando los factores que se emplearán para desestacionalizar el año entrante.”

Es decir, nada especialmente informativo. Decimos “nada” porque reestimar, en particular, los factores estacionales, no es lo importante aquí. La serie de afiliados básicamente se repite, mes a mes, año a año: ningún misterio en términos de estacionalidad. Sin embargo, lo que sí es importante en este momento es “tratar el escalón” descrito arriba. En nuestro post de seguimiento de la afiliación en agosto (ese y los anteriores de seguimiento se ocupan de los datos diarios; hoy se trata de las medias mensuales), preguntábamos si el párrafo anterior podía ser satisfactorio para describir la metodología empleada tras el shock asociado a la pandemia, o si por el contrario, se deberían dar más detalles de la metodología utilizada. La respuesta a estas preguntas podría dar un poco igual si todos los opinadores fueran conscientes de que “en estos tiempos, es mejor no hacer mucho caso al dato ajustado de estacionalidad”, como ya habíamos explicado en dicho post. Pero no parece que la situación sea esa. Algunos analistas incluso llegaron a destacar positivamente el dato (“232.664 cotizantes más en agosto”), y esto sí que nos parece que no puede ser. No estamos para sacar pecho (tampoco para ser catastrofistas, ojo). Por eso este post.

Así que el otro día decidimos comprobar el cálculo realizado por los estadísticos del Ministerio. Todo parece indicar que el ajuste de estacionalidad del Ministerio se ha obtenido especificando seis variables dummy, una para cada uno de los seis meses desde marzo, en un modelo univariante con una diferencia regular y una diferencia estacional (y algunos detalles más). El efecto de las dummies: la intervención, que para cada mes se concreta en un impulso en primeras diferencias (un escalón en el nivel de la variable), se descuenta de la serie diferenciada para a partir de esta nueva serie recuperar la serie en niveles neta del efecto de la Covid-19. Es a esta serie neta del efecto Covid a la que se aplica la desestacionalización (TRAMO/SEATS).

Una vez obtenida la desestacionalización se agrega el efecto de las dummies (el efecto Covid), puesto siempre en las unidades correctas. Todo muy estándar en realidad. Por eso con este procedimiento obtenemos prácticamente la misma serie desestacionalizada que ha publicado el Ministerio, como muestran el Gráfico 1a en niveles, y el Gráfico 1b en variaciones absolutas.

Los gráficos muestran, además de la serie observada (azul), y desde luego, la serie desestacionalizada publicada por el Ministerio (naranja), las otras tres series que hemos calculado: la serie sin Covid-19 (negro discontinuo), la serie sin Covid-19 desestacionalizada (mostaza), y la serie completa ajustada de estacionalidad (gris discontinuo): la serie desestacionalizada Nada es Gratis.

Gráfico 1a. Número de afiliados a la Seguridad Social, mensual desde enero 2018. Datos observados y desestacionalizados.
Gráfico 1b. Variación mensual en el número de afiliados a la Seguridad Social. Datos observados y desestacionalizados.

Lo que ocurre es que en estos tiempos difíciles para el análisis de la coyuntura conviene preguntarse: ¿es esta una buena práctica estadística? La verdad es que no (aunque sea estándar). No, porque al eliminar de la serie temporal el efecto de la Covid-19 mediante un modelo determinista (con las variables dummy antes descritas), se está obviando que la incertidumbre asociada a la serie temporal en estos meses de pandemia ha sido radicalmente distinta a la que podía estimarse antes de marzo 2020. De este modo, la parte determinista estimada bajo el supuesto de varianza constante del término de error estará sobredimensionada: es decir, se “comerá”, de la serie temporal, esa mayor incertidumbre. La consecuencia es que cuando se agrega dicho efecto estimado a la serie desestacionalizada sin Covid-19, la serie resultante sobre-estimará la variabilidad implicada para la serie, como sugiere el Gráfico 1b. La serie desestacionalizada del Ministerio (y la nuestra) muestra por tanto excesivas variaciones absolutas, negativas en marzo y abril, y positivas en julio y agosto.

El problema que hemos descrito es bien conocido en la literatura. Para resolver dicho problema es necesario modelar los cambios en la incertidumbre que producen shocks extraordinarios (ver aquí, o más en relación a la extracción de señales, aquí o aquí). Shocks extraordinarios como lo es éste, asociado a la pandemia. Varios autores ya están proponiendo modelos que nos permitan tratar la secuencia de observaciones extremas que vienen asociadas a la Covid-19, especialmente en contextos multivariantes (más complejos que el univariante que destacamos en este post). Por tanto, el procedimiento naive que está utilizando el Ministerio (y nuestro post) no puede sino servir para animar una investigación más activa en el área. Por el momento, el procedimiento estándar juega con cierta ventaja puesto que el escalón (de caída en afiliación) aún se mantiene: en cinco meses desde abril, tradicionalmente los mejores para la afiliación, la serie ha recuperado menos de un 40% respecto al máximo de afiliación media mensual de 2020. Cabe esperar, sin embargo, que en los próximos meses, cuando tengamos más información sobre cómo se completa el efecto de la Covid-19, la serie desestacionalizada se ajuste de forma diferente a como se está presentando ahora. Será en ese momento cuando la sobre-estimación de la caída en abril y de la subida de agosto se pongan de manifiesto. Ni la caída de la serie desestacionalizada en abril era para esconderla, ni el aumento de agosto debería haber sido ahora para sacar pecho.

En definitiva, como dijimos en nuestro post del otro día (en realidad, dijimos varias cosas al respecto), “los ajustes de estacionalidad han de tomarse con cautela”, particularmente en los extremos de la muestra, e incluso para series temporales con comportamiento estable. Este es el principal mensaje, además de reconocer que realizar ajuste estacional es complicado. Por tanto, si lo que de verdad se quiere es “evaluar la evolución reciente del empleo, condicionada por la fuerte estacionalidad”, lo mejor sería poder ofrecer los resultados que se obtienen con procedimientos de ajuste estacional alternativos, y en la medida de lo posible, los resultados de aquellos procedimientos que incorporen al modelo estadístico la incertidumbre cambiante a lo largo de esta crisis. Sólo la disponibilidad de los datos, y el análisis riguroso por parte de los investigadores y analistas interesados, permitirán evaluar adecuadamente la evolución de la economía en la salida de la crisis.

Aclarado este punto, ¿conviene insistir en algo más? Creemos que sí. Lo primero, de nuevo, que no sólo conviene tomar los resultados con cautela, sino que, además, en medio de esta crisis, en general, mejor ser pesimista. En segundo lugar, que llamar al optimismo cuando el empleo en algún mes durante la fase de recuperación se comporte mejor que históricamente, como ocurrió el pasado agosto o parece estar ocurriendo estos primeros días de septiembre, puede resultar completamente infundado. La dinámica asociada a los ERTE supone irremediablemente una distorsión importante de los mecanismos tradicionales de creación y destrucción de empleo en España. Malo sería si en un mes en el que se han activado más de 300.000 trabajadores que estaban en ERTE como ocurrió en el mes de agosto, no se hubiera generado un efecto de arrastre desde los trabajadores indefinidos que se reincorporan habiendo permanecido afiliados, a los trabajadores temporales que deberían serles complementarios en la tecnología y que representan la mayor parte de las nuevas afiliaciones. Efecto arrastre que, por cierto, en agosto pasado, generó tan sólo un incremento en 6.822 cotizantes en media mensual. ¿Es eso mucho o poco? Lamentablemente aun no podemos contribuir a contestar esta pregunta porque de momento no tenemos acceso a los datos de la evolución diaria de los ERTE.