La imposibilidad de eliminar la discriminación estadística

Esta entrada está basada en una sección de mi libro Ética para una sociedad abierta.

En 1927 el fotógrafo Benjamin Coupre tomó una de las fotos más famosas de la historia de la ciencia. En ella posaban, tras un congreso de física, veintinueve de los científicos más brillantes de la época. La foto ofrece dos detalles de interés. El primero es que Marie Curie es la única mujer. El segundo, más sutil, es que la media de premios Nobel entre los hombres es de 0,55, mientras que la media entre las mujeres es de 2. Puede ser una coincidencia, pero también que se deba a una situación discriminatoria: para que una mujer sea reconocida como una gran científica debe mostrar un talento superior a la media de hombres que así se reconocen. La discriminación puede tener varias causas, algunas de las cuales tienen su origen en las preferencias por discriminar; pero otras, y este es el tema de este artículo, no necesitan esas preferencias.

Para entender cómo puede suceder una cosa así, comencemos por un ejemplo inocuo. Queremos determinar si una persona está embarazada y, para ello, realizamos una prueba. Como ninguna prueba es perfecta, siempre habrá falsos positivos y falsos negativos. Si la aplicamos indiscriminadamente a todas las mujeres, dado que la gran mayoría no están embarazadas, obtendremos muchos falsos positivos. Así los verdaderos positivos quedarán diluidos entre ellos y un resultado positivo será poco informativo. En cambio, si la prueba se realiza solo cuando existe una sospecha razonable de embarazo, un resultado positivo será mucho más fiable. Y si se aplica a mujeres en menopausia o a hombres biológicos, un resultado positivo no aportará información alguna: sabremos con certeza que se trata de un falso positivo. En suma, la información sobre el grupo al que pertenece la persona sometida a la prueba es relevante para evaluar la probabilidad de embarazo tras un resultado positivo.

Si, en lugar de una prueba de embarazo, consideramos un examen destinado a evaluar si una persona posee los conocimientos necesarios para desempeñar un trabajo, la lógica es la misma. Si el examen no es perfectamente fiable, generará también falsos positivos y falsos negativos (aquí hablé de algunas consecuencias de estos errores a la hora de debatir sobre distintas medidas políticas). De nuevo, la información grupal resulta valiosa. Un buen resultado obtenido por una persona perteneciente a un grupo que, en promedio, presenta una menor preparación para el puesto será evaluado con mayor cautela que el mismo resultado obtenido por alguien de un grupo con mejor preparación media. Como consecuencia, las personas capaces del primer grupo verán sus méritos reconocidos en menor medida que las del segundo. A este fenómeno lo llamamos discriminación estadística.

Una forma de reducir la discriminación estadística es mejorar la fiabilidad de las pruebas, de modo que la decisión dependa más del resultado individual y menos de la media del grupo. Pero las buenas pruebas suelen ser costosas. Por ejemplo, pueden requerir mantener al candidato durante un periodo de prueba. A primera vista, prohibir el uso de información grupal y exigir que las decisiones se basen únicamente en los resultados de las pruebas parecería eliminar la discriminación. Digo «a primera vista» por dos razones. La primera es práctica: resulta muy difícil hacer cumplir esa prohibición. Las pruebas ciegas pueden funcionar en ciertos contextos, pero no en otros muchos, como cuando hay entrevistas personales o cuando la decisión no es de contratación, sino de promoción. La segunda razón es más sutil. Incluso si se lograse eliminar por completo el uso explícito de información grupal, la discriminación estadística reaparecería por otro camino. En los ejemplos anteriores, la discriminación surge porque las tasas de falsos positivos y falsos negativos difieren entre grupos. Tratar a todos los individuos como si pertenecieran a un único grupo resuelve ese problema… al precio de crear otro: la estimación de la probabilidad de tener la característica adecuada en cada grupo no se corresponderá con la realidad, por lo que necesariamente la imagen de algún grupo quedará distorsionada para mal. Este sesgo es también una fuente de discriminación.

De este razonamiento se sigue el siguiente teorema de imposibilidad:

Teorema. No existe ningún método para estimar la probabilidad de poseer la característica buscada que satisfaga simultáneamente las tres siguientes propiedades:

  1. La proporción real de quienes tienen la característica buscada entre quienes pasan la prueba se corresponde con la probabilidad calculada por el método.
  2. La proporción de falsos positivos es la misma en cada grupo.
  3. La proporción de falsos negativos es la misma en cada grupo.

 

El teorema es, en realidad, un corolario de un teorema de imposibilidad más general, demostrado por Kleinberg, Mullainathan y Raghavan, que es válido para todo tipo de decisiones (por ejemplo, la asignación de empleados a distintas tareas) y para cualquier procedimiento de actualización de probabilidades a partir de nueva información, no solo para la actualización bayesiana de nuestros ejemplos.

Sobre la responsabilidad moral

¿Existe responsabilidad moral en el uso de información grupal? Solo en la medida en que, siendo conscientes de la imperfección de nuestra información, no busquemos activamente mejorarla. No obstante, tanto el esfuerzo requerido como el beneficio esperado varían entre individuos, de modo que inevitablemente coexistirán distintos grados de empeño por evitar la discriminación estadística. Cuando una empleadora decide obtener mejor información sobre un candidato, en su cálculo entran los costes y beneficios que ella misma anticipa. Sin embargo, una información más precisa no solo la beneficia a ella, sino también al conjunto de la sociedad, a las personas discriminadas y a quienes quisieran usar esa información más precisa. La decisión individual sobre cuánto informarse no será socialmente óptima, pues no internaliza todos los beneficios. Este fallo de mercado puede mitigarse mediante políticas públicas que faciliten el acceso a información de calidad. Aun así, mientras la información sea imperfecta, este tipo de discriminación persistirá inevitablemente, y llegará un punto en el que deba eximirse al decisor de responsabilidad moral.

El derecho a ser tratado como un individuo

La discriminación estadística plantea un problema ético de primer orden: el derecho a ser tratado como individuo y no en función de los rasgos estadísticos del grupo al que se pertenece. En una sociedad en la que las mujeres tengan, en promedio, menos años de educación que los hombres, tratar a una mujer como individuo implica atender a su nivel educativo concreto, no al promedio de su grupo. Pero si utilizamos la información de que posee un título universitario, estaremos tratándola según los rasgos estadísticos también de un grupo, el de personas con educación universitaria. El problema ético se desplaza entonces a la cuestión de con qué grupo identificamos al individuo.

Las distinciones basadas en sexo, raza, religión o nacionalidad están fuertemente asociadas a prácticas discriminatorias; las basadas en educación lo están mucho menos. Tratar a una persona según los rasgos estadísticos asociados a «mujer pobre gitana» es más problemático que hacerlo según los rasgos de «persona que ha trabajado para pagarse estudios universitarios y colabora como voluntaria en una ONG». Obsérvese, además, que un énfasis excesivo en políticas de identidad puede incrementar el uso de la información grupal que precisamente querríamos minimizar. Toda discusión sobre qué significa no ser discriminado estadísticamente es, en el fondo, una discusión sobre qué formas de discriminación estadística son moralmente permisibles (aquí puede encontrarse una discusión más extensa sobre esto).

De hecho, puede sostenerse que, en un mundo de incertidumbre, la única manera de tratar a una persona como individuo es utilizar toda la información estadística disponible sobre ella, refinándola progresivamente hasta definirla mediante grupos cada vez más pequeños y específicos. Solo cuando alguno de los datos sea lo suficientemente preciso como para eliminar por completo la incertidumbre podremos escapar al teorema de la imposibilidad de la discriminación estadística. Hasta entonces, podremos minimizar su alcance.

Hay 13 comentarios
  • "A este fenómeno lo llamamos discriminación estadística"

    Ustedes los economistas no razonan como el resto de los humanos y violan los postulados de la lógica aristotélica de manera sistemática.

    Me pregunto si no serán extraterrestres que se hacen pasar por humanos para invadir el planeta.

    ¿Pero por qué hacerse pasar por economistas y no por ingenieros o por políticos?

    Seguramente para destruir la economía humana antes de la invasión definitiva del planeta.

    Me gustaría preguntarle a Ferreira si es o no es un extraterrestre y si he acertado en mi sospecha.

  • Pedro:

    Es difícil dar un sentido a tu comentario. No sé si es peyorativo o laudatorio, si apunta a una ironía sutil o a una burla, si es una declaración de desconocimiento o el intento de revelar una sabiduría.

    Hablas de violar la lógica aristotélica, pero, en lugar de mostrar el silogismo errado, señalas una definición. ¿Debo entender que no te gusta la definición?, ¿que no es suficientemente precisa?, ¿que la confundo con otra forma de discriminación?, ¿que saco consecuencias indebidas de esa definición al aplicarla a algunos ejemplos? Hypotheses non fingo. Solo puedo decirte que es una definición bien establecida y que permite aclarar algunas tipos de discriminación establecidos en filosofía, derecho y otras ciencias sociales. Se ha usado para encontrar el origen de algunas discriminaciones y, con ello, poder diagnosticar mejor un problema, primer paso para encontrar una solución.

    Las demás cuestiones son algo más fáciles de resolver. Extraterrestres no somos, razonamos como todo el mundo que razona, pero tenemos unos instrumentos que nos permiten razonamientos que, sin ellos, es difícil hacer. Igual que otras áreas tienen otros instrumentos. No se me ocurre achacar de razonar mal a un ingeniero cuando usa sus herramientas, sus modelos, allá donde las tiene y sabe usarlas porque no sean las mías. Al parecer, sientes que a un Rojas (no sé qué modelos sean los que tengas para pensar sobre aquello sobre lo que estés formado) le está permitido ese achaque a los economistas.

    Tu comentario es, en sí mismo, un ejemplo de discriminación estadística. Tienes una sospecha sobre mí, crees que pertenezco un grupo con formas raras de pensar (extraterrestres, sobre los que pareces saber cosas) y, en lugar de buscar información sobre a qué otros grupos puede ser que pertenezca o sobre qué cosas pienso, te aferras al estereotipo y tiras p'alante con él. Y mira que es fácil encontrar información sobre mí sobre ello en las redes.

    • Excelente entrada y absolutamente magistral respuesta a la pregunta de si eres un extraterrestre.

      Como sugerencia cambiaría el ejemplo de las pruebas de embarazo. Los falsos positivos son altamente improbables (la prueba detecta prostaglandina)

      • Gracias por tus amables palabras. Dudé entre ese ejemplo y algún otro por esa razón que aludes, pero lo mantuve porque es uno de los que más fácilmente ilustran la diferencia entre falsos positivos, falsos negativos y la importancia de la población sobre la que se administra para interpretar correctamente el resultado. Pero sí, tal vez convenga buscar otro más realista.

  • Excelente entrada, José Luis.

    Una cosa, a ver si lo he captado. Me asalta la duda si existe alguna vía alternativa de reducir la incertidumbre sin discriminar o analizar por negación. Me explico, cada afirmación sobre algo, implica negar (o discriminar) una parte de la realidad. Es como quitar capas, hasta que finalmente nos quedamos con la sustancia, con algo definido, o el conjunto de datos que informan sobre ese algo.

    En ese sentido, no se me ocurre como deslindar sesgar de discriminar. Y aquí entroncamos con el nivel de honestidad y rigurosidad del investigador, preocupado de no proyectar sus propias preferencias, para obtener un resultado ajustado desde múltiples puntos de aproximación.

    Mi pregunta sería... tiene alguna conexión la discriminación estadística con la Teoría de la Información de Claude Shannon, en el sentido de que la ausencia de información es sinónimo de incertidumbre. Y hasta que punto, puede una visión unívoca zafarse de cualquier discriminación como método común para reducir dicha incertidumbre.

    Un saludo.

    • Gracias, Jordi.

      Dices: «cada afirmación sobre algo, implica negar (o discriminar) una parte de la realidad»
      No sé qué significa eso. Como muchas otras veces te he dicho, hablar en metáforas o con sentidos figurados es una buena manera de no entendernos.

      No veo ninguna relación entre la discriminación estadística y la teoría de la información de Shannon más allá de que esta última habla de señal y ruido. El ruido inherente a la transmisión de información es una razón por la cual la información no es 100 % precisa, pero no es la única.

      • Discúlpame José Luis.

        "Cada afirmación sobre algo, implica negar (o discriminar) una parte de la realidad"

        Quiero decir, que cuando afirmamos mediante una expresión del lenguaje natural, o del lenguaje algebraico, de forma lógica estamos acotando-definiendo el dominio del problema.

        Si afirmo, mi economista favorito es Keynes, por contraposición se sobrentiende que Hayek o Mises, no entran dentro del dominio que demarco como mis preferencias.

        Esto se puede ver fácil con Teoría de Conjuntos, al afirmar usamos un conjunto de datos concretos, en contraposición a la totalidad (por ejemplo diez primeros números naturales frente al conjunto de los números naturales). Es como la muestra y la población, en estadística. Y en Teoría de la Información, el ruido o la entropía son elevadas, hasta que definimos o demarcamos el contexto.

        Por eso la discriminación estadística, por analogía, podría definirse como una "técnica" falible pero necesaria para emitir "juicios" al ritmo que impone la realidad. Porque tal vez, de lo contrario no podríamos hablar de prácticamente nada con certeza absoluta si esta exigencia fuera la regla común para todos los casos.

        Por cierto, no se si tu libro está en castellano, y si se puede conseguir por Kindle.

        Un saludo.

        • No veo la relevancia de la analogía. En cuanto a esa nueva definición, en todo caso sería una manera de interpretar la definición, que ya existe y es bien precisa. La que tú das, no lo es. En los términos literales de la definición, sería algo así como que la actualización de la información a priori a través de las probabilidades condicionales de los nuevos sucesos nunca es completa a no ser en los casos extremos (probabilidades uno o cero).

          • Te resumo mi punto, José Luis.

            Cuando afirmamos A, elegimos afirmar A implica negar ¬A. Claro, aquí la madre del cordero pasa por determinar a ciencia cierta cuál es el criterio de elección y en qué argumentos o datos fiables se apoya dicha elección.

            ¬A es lo que discriminamos. Lo que quiero dilucidar es que salvo entidades axiomáticas, cualquier argumento que trate de sustentar la discriminación de ¬A caerá de forma necesaria en una nueva afirmación con su correspondiente discriminación ¬A'. Siendo esta contingencia recursiva un obstáculo para fijar la neutralidad o la objetividad, convirtiendo toda suerte de relación cualitativa en el fruto necesario de un sesgo cognitivo.

            Esto desde una perspectiva descriptiva no supone un problema, pero cuando queremos ampliar conocimiento es muy fácil ejercitar el auto-engaño o el auto-convencimiento de que lo hacemos desde el ideal de la objetividad.

            • Demasiadas palabras para decir que, cuando afirmamos algo, normalmente no estamos seguros de ello al 100 %.

              Pero eso no es la discriminación estadística, que debe partir de una probabilidad a priori distinta para distintos grupos y luego de una información imperfecta.

              Observa, además, que el decisor sabe de todas estas imperfecciones y usa probabilidades. La discriminación estadística surge sin sesgos cognitivos y sin dejarse engañar a la hora de hacer afirmaciones. Si eso sucediera, podría dar lugar a otras fuentes de discriminación, pero sería otro mecanismo, otro diagnóstico, otros problemas y otras soluciones.

            • Creo que no ves la relevancia de la analogía porque confundes la precisión del mecanismo con la neutralidad del input.

              Dices que el decisor opera sin sesgos porque 'sabe que usa probabilidades', pero el sesgo reside antes del cálculo: en la elección arbitraria de qué variable (género, raza) se eleva a categoría relevante y cuál se ignora. Esa 'probabilidad a priori' no es un dato neutro caído del cielo; es una construcción subjetiva.

              Al detener la búsqueda de la verdad individual ¬A alegando 'costes', no estás siendo objetivo; estás racionalizando el prejuicio. Tu definición operativa es precisa, sí, pero epistemológicamente ciega: la herramienta matemática es aséptica, pero la mano que selecciona los datos para alimentarla no lo es.

            • No confundo nada. Solo he ido respondiendo a tus mensajes. Esta es la primera vez que dices que te refieres a la elección de los grupos en cuya información basar la actualización de nuevas informaciones. Tus mensajes previos no decían nada de esto, presentabas analogías nada claras, metías por en medio a Shannon y ofuscabas todo con un lenguaje a menudo incomprensible.

              Una vez aclarado a lo que te refieres, te diré que yo mismo en el artículo he tratado el tema explícitamente. El decisor racional deberá usar toda la información de todos los grupos. Como no somos perfectos y como recabar información es costoso, en el texto digo explícitamente alguno de los cuidados que hay que tener sobre ello.

              Todo ello sin salirme de la discriminación estadística. Si quieres mezclarlo con otros tipos de discriminación, eso da para muchas otras entradas. En lo que concierne a esta, dejémoslo así.

          • Por alusión.

            No era mi intención ofuscar y yo también me he ido adaptando a tus respuestas.

            El problema de la densidad lingüística está motivado en parte por el formato ultra-breve al que me tengo que ceñir en los comentarios. Por ello me veo obligado a sintetizar al máximo conceptos que requerirían un amplio desarrollo.

            Este hecho puede dar la impresión de que me oculto tras el lenguaje, como otro lo podría hacer tras los números. En ese sentido, lamento dar la imagen de ofuscar artificialmente el debate y más en un tema tan apasionante y cardinal como este.

            Pero quedo agradecido de tener un interlocutor de tu talla, del que siempre aprendo algo.

            Un saludo.

            Lo dejo aquí.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.