Estimación de ideología y polarización en los países de la UE usando datos de Facebook

Por Francisco Caravaca Crespo, José González Cabañas, Rubén Cuevas y Ángel Cuevas.

Las redes sociales se han convertido en un elemento esencial en nuestro día a día y han cambiado la forma de comunicación social en el siglo XXI. Por supuesto, la comunicación política no se ha quedado al margen y actualmente los partidos políticos y representantes públicos hacen un uso intensivo de redes sociales para comunicar sus mensajes. Creemos que hubo un punto de inflexión que puso en el imaginario colectivo la importancia de estas plataformas en el discurso político: el episodio de Cambridge Analítica. En este evento, datos de 50 millones de usuarios de Facebook fueron procesados para crear perfiles que permitieran optimizar el impacto de las campañas publicitarias en Facebook. Donald Trump hizo uso de esta funcionalidad en la campaña de las elecciones presidenciales de 2016 donde ganó a Hilary Clinton. Existen algunos estudios que han intentado cuantificar el impacto que el uso de Facebook por parte de Trump tuvo en dichas elecciones.

Simplificando mucho, los partidos políticos persiguen dos objetivos con sus publicaciones en redes sociales. En primer lugar, conseguir la atención de los usuarios en las publicaciones (posts) que publican, y que interactúen con estas mediante el uso de acciones como “me gustas (likes)”, “comentarios” o “reenvíos”. A modo ilustrativo, la Figura 1 muestra el número medio de reacciones (p.ej., likes) obtenidas por cinco partidos españoles por post en Facebook durante cada semana de 2022. Se observa claramente que el nivel de reacción de los usuarios a los posts de los distintos partidos difiere notablemente.

Figura 1. Número medio de reacciones por post cada semana

En segundo lugar, los partidos persiguen que su post se haga viral de tal forma que los algoritmos de las plataformas que deciden qué mensaje se muestra a qué usuario decidan mostrarlo muchas veces a una gran cantidad de usuarios.

En la literatura existen múltiples intentos (véase aquí o aquí) de utilizar las redes sociales en la predicción de elecciones. Sin embargo, hasta donde nosotros sabemos, no existe ninguna propuesta que haya conseguido resultados satisfactorios de manera general para ser aplicados en cualquier elección. Esto implica que, hasta el momento, no se puede establecer una correlación directa entre la actividad y atención de la comunicación política en redes sociales y los resultados electorales.

Sin embargo, nosotros creíamos que se puede usar la comunicación política en redes sociales para predecir y cuantificar otros elementos interesantes y relevantes como son la ideología y la polarización política, lo que analizamos en el artículo Estimating ideology and polarization in European countries using Facebook data. En este blog podemos encontrar ejemplos previos de la importancia de la ideología en diferentes contextos como el salario mínimo o la gestión de la pandemia.

Las principales ventajas que ofrece el uso de datos de redes sociales son: (i) La escalabilidad. Nos permite acceder a mucha información con un coste bajo si lo comparamos con otros métodos tradicionales tales como la realización de encuestas. (ii) La homogeneidad. Ofrece una fuente de información y formato de datos homogéneo en países diferentes, lo que permite poder realizar estudios comparativos. (iii) La resolución temporal. La facilidad y escalabilidad de acceso a los datos permite obtener una mayor granularidad temporal comparada con los métodos tradicionales de obtención de datos.

En resumen, la pregunta que nos hicimos es si es posible estimar la ideología y polarización política en todos los países de la Unión Europea, incluyendo a Reino Unido (que al comienzo de nuestro trabajo aún formaba parte de la misma), usando los posts que los partidos políticos publican en sus cuentas de Facebook.

Ideología y Polarización Política

Es importante dejar claro que nosotros somos ingenieros y nuestra formación y conocimiento dista mucho de las ciencias políticas. Por tanto, desde un primer momento tuvimos claro que nosotros no debíamos definir qué significa ideología ni polarización. En su lugar, debíamos usar definiciones procedentes de la literatura y proponer una metodología que permitiese cambiar las definiciones utilizadas por otras en caso de que algún experto en el área considerase oportuno usar otras fuentes de información.

En el caso de la ideología categorizamos a los partidos políticos en un eje ideológico izquierda-derecha que varía entre 0 (extrema izquierda) y 10 (extrema derecha). Para ello, usamos el valor ideológico que la base de datos ParlGov asigna a cientos de partidos políticos en la Unión Europea y Reino Unido. Con esa información, se puede calcular el centro ideológico de un país.

En el caso de la polarización usamos un índice que se construye a partir de la varianza en la ideología de los partidos políticos de un país. Se trata del índice de polarización de Dalton.

Con estas dos variables: ideología y polarización, podemos categorizar de manera cuantitativa a un país, además de compararlo con otros. Dichos parámetros no son estáticos, sino que varían a lo largo del tiempo. Por tanto, nos parecía muy interesante poder monitorizar la evolución temporal de dichas métricas en cada país.

Estimación de ideología y polarización con datos de Facebook

La idea básica de nuestro trabajo es asignar la ideología de los partidos a los posts que publican y utilizar métricas de actividad, popularidad y engagement para construir modelos simples que permitan estimar la ideología y polarización de un país. La actividad se mide con la frecuencia de publicación de un partido político. La popularidad la obtenemos mediante el número de seguidores de la página del partido político. El engagement lo extraemos del número de reacciones, comentarios y reenvíos de los usuarios en los posts de los partidos políticos. Por tanto, nuestra intuición es que la ideología y polarización de un país se pueden estimar mediante un modelo simple que combine la actividad, la popularidad y el engagement asociado a los diferentes partidos políticos de un país.

Localizamos las páginas de Facebook de 234 partidos políticos entre los 27 países de la Unión Europea más el Reino Unido. Para cada una de estas obtenemos la información de seguidores y recogimos todos los posts que han publicado desde principios de 2019. El objetivo era tener datos anteriores a las elecciones Europeas de mediados de 2019 que han servido para poder entrenar nuestros modelos en los 28 países que hemos analizado.

Los modelos resultantes indican que el mejor estimador para ambas métricas es una combinación de la actividad y el engagement. Aunque nuestra investigación no llevó a cabo ningún análisis de causalidad, sí queremos compartir nuestra intuición sobre a qué se debe esa combinación. Para tener influencia debes ser activo en redes sociales y propagar tus mensajes. Esto podría llevar a la falsa impresión de que cuanto más activo sea un partido mayor influencia tendrá en la ideología de un país. Sin embargo, nuestro análisis muestra que una actividad muy alta lleva un engagement menor de tus posts. Por tanto, nuestro modelo parece indicar que para tener influencia en la cuantificación de la ideología de un país un partido político tiene que ser activo en Facebook, pero sin pasarse, y al mismo tiempo ser capaz de publicar contenido que atraiga la atención de los usuarios.

Conclusiones

Entendemos que el lector hubiese encontrado interesante que hiciésemos un análisis informal sobre lo que nuestros resultados muestran en la evolución de la ideología y polarización en los diferentes países. Sin embargo, como ya hemos dicho somos ingenieros y creemos que nuestro análisis tiene poco valor académico en el contexto de la ciencia política. Eso sí, hemos hecho algo que sí sabemos hacer: creado un sitio web denominado EU Political Barometer que permitirá al lector explorar los resultados entre Enero de 2019 y el presente y sacar sus propias conclusiones. Además de mostrar la evolución de la ideología y polaraización de los 27 países  de la UE y Reino Unido, permite explorar muchos otros elementos: actividad por país, cantidad de posts para miles de keywords (p.ej., COVID, Ukraine, Brexit, etc.) emulando a la funcionalidad que Google ofrece en Google Trends, etc.

La principal conclusión que derivamos de nuestro trabajo, desde nuestro punto de vista de ingenieros, es que la información que vierten distintas entidades en sus cuentas de redes sociales unido a metodologías estándar de predicción y estimación representa una herramienta muy útil para complementar técnicas tradicionales (p.ej., encuestas) en el análisis de parámetros socio-económicos relevantes.