Por Ricardo Estrada, Daniela Goyheix y María Lombardi
Para los investigadores, los errores de medición en los datos son un poco como las cucarachas en las cocinas de los restaurantes: una amenaza que puede aparecer en el peor momento. Sin embargo, y a diferencia de las cucarachas en las cocinas, es probable que la mejor manera de lidiar con los errores de medición no sea un programa de exterminación total. El diseño de cualquier encuesta presenta una tensión entre el objetivo de lograr medidas más precisas y el de minimizar el coste de la encuesta (Bound et al, 2021; De Weerdt et al, 2020). Una decisión clave en esta tensión es qué hacer si algunas de las personas seleccionadas para participar en la encuesta no se encuentran en su hogar. Una práctica común entre los institutos de estadística es recurrir a un proxy, es decir a otro miembro del hogar que responde en el nombre de la persona ausente. Este es el caso de la Encuesta de Población Activa de España y de la Current Population Survey de Estados Unidos. En la segunda, la mitad de las entrevistas son realizadas por un proxy (U.S. Census Bureau, 2019).
Si bien el uso de informantes proxy ayuda a reducir costes y aumentar la tasa de respuesta de las encuestas, también puede introducir errores en la medición de variables importantes como los ingresos laborales. Estos errores pueden disminuir la precisión de la información recolectada y, de manera más preocupante, producir sesgos en las mediciones de interés. Sobre este segundo tipo de errores, en un estudio reciente, investigamos el efecto de usar informantes proxy en la medición de los ingresos laborales en México. Como adelanto, encontramos que el uso de informantes proxy lleva a la subestimación del ingreso laboral de los trabajadores, pero no de las trabajadoras, debido en parte a que es más probable que los trabajadores oculten parte de sus ingresos al resto de los integrantes del hogar. Además, documentamos que esta brecha en el ingreso reportado lleva a una subestimación significativa de la brecha salarial de género.
El desafío de medir el impacto de usar informantes proxy
A pesar de su importancia, hay poca evidencia sobre cómo el uso de informantes proxy afecta los ingresos reportados, y los mecanismos detrás de esto. Esta brecha de investigación se debe probablemente a un desafío metodológico: para un trabajador determinado, generalmente observamos ingresos reportados por él mismo o por un proxy, pero no ambos. Esto es problemático, ya que los trabajadores que reportan sus propios ingresos y los que usan un proxy probablemente difieran en características no observables correlacionadas con el ingreso, lo que compromete una interpretación causal de una comparación simple entre ambos grupos. En nuestro estudio, superamos esta dificultad utilizando la estructura de panel de la encuesta laboral de México, donde algunos individuos (aproximadamente la mitad de nuestra muestra) responden sus propios cuestionarios en algunas olas de la encuesta, pero no en otras. Esta variación nos permite comparar los ingresos de un mismo trabajador cuando él/ella mismo/a los reporta frente a cuando otro miembro del hogar lo hace.
Para nuestro análisis, usamos microdatos de la Encuesta Nacional de Ocupación y Empleo (ENOE), la principal fuente de estadísticas laborales en México. Esta encuesta es representativa a nivel nacional, y tiene una estructura de panel rotativo tal que cada hogar es entrevistado en 5 trimestres seguidos. Todos los miembros del hogar mayores a 15 años completan el cuestionario laboral, y si alguno de ellos no está presente al momento de la encuesta, otro miembro del hogar actúa como proxy. Un aspecto clave de la ENOE es que se reporta quién es el informante.
Nuestra muestra usa datos del período 2005-2019 (60 olas). Para evitar posibles fluctuaciones de ingresos que podrían correlacionar con la presencia en el hogar al momento de la encuesta, restringimos nuestra muestra a trabajadores asalariados o trabajadores por cuenta propia de entre 25-64 años que se encontraban empleados en todas las olas en las cuales fueron encuestados.
¿Cuál es el impacto de usar informantes proxys sobre la medición de ingresos laborales?
Nuestro primer resultado es que los informantes proxys tienen una menor probabilidad de reportar el ingreso del trabajador que el trabajador mismo. Para hombres esta caída es de 12.4 puntos porcentuales, y para mujeres de 16.9, en comparación a una tasa de respuesta del 90% en casos de autoreporte.
En segundo lugar, para aquellos trabajadores para los cuales se reporta un ingreso, encontramos diferencias sustanciales en el ingreso reportado según el tipo de informante, pero sólo para trabajadores hombres. En particular, el salario mensual de los hombres es 6.1% menor cuando lo reporta un proxy, mientras que para las mujeres esta diferencia es minúscula (0.4% mayor en el caso de autoreporte).
Es importante mencionar que nuestros resultados son robustos a limitar nuestra muestra a trabajadores que tienen una menor probabilidad de experimentar fluctuaciones en sus ingresos a lo largo de las distintas encuestas (trabajadores asalariados que no reciben bonos, aquellos que permanecen en la misma empresa, los que trabajan horas regulares, etc.). Esto indica que la brecha entre ingresos auto reportados y reportados por un proxy se debe a diferencias de reporte y no a cambios en el ingreso del trabajador.
Asimetrías de información dentro del hogar: la raíz del problema
Hay dos posibles mecanismos detrás de esta discrepancia en ingresos reportados para trabajadores hombres. Una posibilidad es que, por cuestiones de asimetría de información dentro del hogar, los informantes de los trabajadores hombres subestimen el ingreso de estos (Deschênes et al., 2020). Para evaluar si los trabajadores ocultan intencionalmente sus ingresos a sus familiares, analizamos si los ingresos autodeclarados varían con la presencia de otros miembros del hogar durante la encuesta. Encontramos que los ingresos autodeclarados por trabajadores son 3% menores si su pareja está presente en el hogar durante la encuesta (en comparación a los ingresos autodeclarados cuando la pareja no se encuentra en el hogar). Este comportamiento sugiere que, en algunos casos, los hombres prefieren no compartir la totalidad de sus ingresos con otros miembros del hogar, lo que genera una discrepancia cuando estos últimos actúan como informantes.
Otra alternativa es que los hombres autoreportan un ingreso mayor a su verdadero ingreso para cumplir con las normas sociales sobre quién es el sostén principal del hogar (Bertrand et al., 2015; Slotwinski y Roth, 2020), o tratar de aparentar un ingreso más cercano al ingreso medio de la población (Bound y Krueger, 1991; Bound et al., 1994; Angel et al., 2019; Flachaire et al., 2023).
La Figura 1 muestra que, para la submuestra de hombres casados, la brecha de ingresos reportados para trabajadores hombres es levemente mayor en casos donde la pareja del hombre no trabaja. Esto va en contra de la hipótesis de que los hombres sobrereportan su ingreso por normas de género, dado que uno esperaría que esto ocurra principalmente en casos donde la pareja del hombre trabaja. Más aún, como muestra la Figura 2, encontramos que la diferencia entre ingresos autoreportados y reportados por un proxy es mayor para hombres de mayores ingresos. Estos resultados son consistentes con la idea de que la asimetría de información aumenta con los ingresos, dado que hay mayor margen para gastos discrecionales que son difíciles de observar para otros miembros del hogar.
Figura 1: Diferencias en los ingresos reportados según el tipo de encuestado: efectos heterogéneos según la situación laboral del cónyuge del trabajador
Figura 2: Diferencias en los ingresos reportados según el tipo de encuestado: efectos heterogéneos según el quintil de ingreso del trabajador
¿Qué implicancias tiene esto para la medición de la brecha salarial de género?
Nuestros hallazgos sobre la brecha en ingresos reportados para hombres implican que el uso generalizado de informantes proxy podría llevar a una medición incorrecta de medidas tales como la brecha de ingresos por género.
Enfocándonos en la muestra de trabajadores para los cuales tenemos ingreso autodeclarado e informado por un proxy, estimamos la brecha de género en el ingreso por hora, con y sin la inclusión de observaciones informadas por proxys. Como se observa en la tabla a continuación, la brecha salarial de género es 60% más grande si se excluyen los ingresos declarados por un proxy. Es decir que el uso de informantes proxy lleva a una subestimación considerable de la brecha salarial de género, que es el indicador más utilizado para medir la igualdad de oportunidades entre mujeres y hombres en el mercado laboral (Blau and Kahn, 2017; Goldin, 2024).
Tabla 1: Brecha salarial de género según el tipo de encuestado
Consecuencias para la investigación y el diseño de encuestas
Estos hallazgos tienen implicaciones importantes tanto para el diseño y uso de datos de encuestas laborales. Es fundamental que las oficinas de estadística incluyan información en sus bases de datos sobre la identidad del informante. Esto permitiría a los investigadores ajustar sus análisis de acuerdo con si los datos provienen directamente del trabajador o de un miembro del hogar actuando como proxy. Revisando 10 encuestas nacionales realizadas por oficinas de estadística de países de América Latina, encontramos que sólo en cinco de las encuestas (Ecuador, México, Paraguay, Perú y Uruguay) se puede determinar si la entrevista fue realizada por un tercero, mientras que en Argentina, Bolivia, Brasil, Chile y Costa Rica, al igual que en la Encuesta de Población Activa de España, esta información no está disponible.