Esta semana tenemos un invitado especial, Orcar Jordá, que nos cuenta:
Richard J. Ablin, descubridor del test PSA (antigen prostático específico) para detección del cáncer de próstata, defiende la abolición de su test en una editorial del New York Times del pasado 9 de Marzo. Su argumento: la administración del test cuesta 3,000 millones de dólares al año, pero el test es tan eficaz como sacar cara o cruz con una moneda y en todo caso, solo el 3% de la población masculina muere de este tipo de cáncer. Argumentos similares se han utilizado recientemente para modificar la administración de mamografías para la detección del cáncer de mama (por ejemplo ver la historia en NY Times). Mientras los expertos debaten, el populacho se queda aterrorizado y no faltan anecdotarios para defender cada posición. Voy a ver si un poco de economía y estadística nos ayuda a pensar sobre este problema y de paso os digo que tiene todo esto que ver con las recesiones.
La eficacia diagnóstica de un test se determina variando el umbral por encima del cual concluimos que un individuo padece la enfermedad, y por debajo del cual determinamos que no la tiene. El test PSA mide el nivel de antigen prostático en la sangre en ng/ml y para que os hagáis una idea, niveles por debajo de 4ng/ml se consideran normales, por encima de 10ng/ml altos (estos son los barómetros de centro nacional de cáncer), pero entre medias la cosa no está clara. Cuatro desenlaces para un determinado umbral describen el abanico de posibilidades: el test da positivo (el nivel de antigen está por encima del umbral escogido) y el paciente tiene cáncer (verdadero positivo, VP), o no (falso positivo, FP); o el test da negativo y el paciente está sano (verdadero negativo, VN) o no (falso negativo, FN). Obviamente, en una población, las tasas VP + FN = 100% y FP + VN = 100%. Por poner un ejemplo, un estudio reciente en el Journal of the American Medical Association obtiene que con un umbral de 1.1ng/ml la VP = 83.4% pero la FP = 61.1% (es decir se asusta innecesariamente al 61.1% de varones hasta que no se les hace una biopsia). Para un umbral del 4.1ng/ml las tasas son VP = 20.5% y FP = 6.2%.
Supongamos que a uno se le hace un análisis de sangre y el PSA tiene un valor de 7ng/ml ¿Qué deberíamos hacer, mandar el paciente a casa o al quirófano para que le hagan una biopsia? Aquí es donde pensar como un economista, y en concreto utilizando la toma de decisiones bajo incertidumbre, quizá podamos aportar algo. Primero, cada uno de los cuatro desenlaces posibles (VP, FP, FN, VN) tiene beneficios y costes asociados y estos varían con cada individuo. El beneficio de un VP es que se le detecta el cáncer al individuo y se le administra el tratamiento adecuado. El beneficio del VN es que al individuo sano se le manda a casa y santas pascuas. Los costes de un FP, amén de la ansiedad, son los costes de realizar una biopsia innecesaria que puede acarrear sus riesgos, y el coste de un FN es que se manda a casa sin tratamiento a un paciente que tiene cáncer.
Dados estos costes y beneficios, es fácil determinar el umbral óptimo que maximice la utilidad esperada:
max u [BVP VP(u) + BVN (1 – FP(u))] – [CFP FP(u) + CFN (1-VP(u))]
donde notareis que B significa “beneficios”, C “costes” y la expresión la escribo solo en términos de VP y FP, ambas funciones del umbral “u.” Por ejemplo, a un señor de 45 años los beneficios de que le detecten un cáncer a tiempo son mucho mayores que a un señor de 70 años. Por el contrario, habitualmente el señor más joven tolerará una biopsia innecesaria mejor que el señor mayor. A una escala nacional costes y beneficios cambian pero el cálculo es el mismo. Este cálculo depende tambien de la eficacia del test y esto se mide habitualmente con la región descrita por todas las combinaciones posibles de VP(u) y FP(u) para valores de u entre menos infinito y mas infinito (para los que seáis mas masoquistas, consultad wikipedia y la entrada para “curva ROC”). El estadístico tiene un valor máximo de 1 (clasificación perfecta) y un mínimo de 0.5 (clasificación aleatoria de un cara y cruz). Para daros una idea, el test PSA tiene valores del 0.7 o mayores (según que variante del test se use).
Pues bueno, si habéis sobrevivido esta maratón de bioestadística, os cuento de que va todo esto con lo de las recesiones. El mismo tipo de cálculos se pueden hacer con índices de actividad económica (el equivalente al PSA test) y el ciclo económico (recesión = cáncer; expansión = sano). En estas cosas ando metido y hace poco examiné aquí como de útiles son los índices que producen los Bancos de la Reserva Federal de Chicago y Filadelfia para detectar si la economía se encuentra en expansión o recesión tal y como dictamina el NBER en EE. UU. El ejercicio consiste en determinar el umbral óptimo y también determinar la calidad de los índices utilizando el estadístico ROC. No os mareo mucho pero encontré valores del estadístico ROC del 0.94 y 0.95 respectivamente para cada índice – realmente muy buenos ya que el mayor valor posible es de 1. Entonces me dije, ¿Como de bueno es el índice de actividad económica que FEDEA ha comenzado a publicar recientemente? Aquí el problema es que no tenemos un comité de ciclos como en EE. UU. (o como la zona Euro) y por lo tanto no hay un dictamen oficial de las fechas de recesión y expansión españolas. Así que lo que hice es utilizar el filtro de Hamilton (que por algo soy alumno suyo) sobre el PIB español para sacar un calendario de ciclos de andar por casa y luego ver que tal funciona el índice de Fedea. Resultado: el estadístico ROC es del 0.93 – ¡Felicidades Fedea! Ahora bien, que cada cual utilice el índice de acuerdo a sus costes y beneficios…
Hay 5 comentarios
Nota: ng/ml = nanogramos de PSA por cada mililitro de sangre
Me parece una comparación poco afortunada. Me da la impresión que con información perfecta sobre el estado de un paciente los médicos estarían de acuerdo la inmensa mayoría de las veces de si una persona tiene cancer o no. En una minoría de casos el cancer sería tan incipiente que se podría estar en desacuerdo de si merece la pena adjudicarle ese nombre. Una recesión en cambio no es algo que exista, sino que es una pura calificación como se comparan magnitudes agregadas con una noción más o menos explícita de normalidad o tendencia.
Ya sé que es posible interpretar el tener cancer de la misma forma en que yo he interpretado estar en recesión, pero pocos lo harían. Incluso si admitieramos ésta forma de interpretar el tener cancer, el análisis de Jesús (perdón de Oscar), yo no lo aplicaría, ya que está basado en esas nociones populares en algunos ámbitos de que existe una verdad en algún sitio (el proceso estocástico que genera la historia de los humanos, la binomial que a unos da cancer y a otros salud, u otra parecida) y nosotros tenemos la labor de descifrarla basados en muestras finitas.
Ahora bien, no tengo ninguna duda de que tanto el índice de actividad económica de FEDEA, como el ROC ese son muy valiosos. Sólo discrepo respetuosamente de la forma de interpretarlos.
Gracias por enseñarme tanto. Lee este blog como un poseso.
Perdón, en la última linea debería decir ¨Leo¨ y no ¨Lee¨
Jose Victor,
Encantado de corresponder contigo y de "conocerte" por primera vez.
Comparto tu critica respecto a que es una recesion (mi interpretacion de tu comentario). Bob Hall (quien preside el comite que se encarga de fechar las recesiones en EE. UU. en el NBER) me cuenta que tienen dificultad en ponerle el dedo a que significa "actividad economica" y por lo tanto, que significa estar en recesion o en expansion (hay que mirar a produccion solo, a empleo, a ambos y con que combinacion linear...). Mi opinion personal es que, aparte de estar en una zona de crecimiento negativo, el comportamiento dinamico de la economia durante periodos de "recesion" es distinto a cuando estamos en expansion. Por lo tanto, una forma natural de interpretar este comportamiento es imaginando que el comportamiento de la economia en cada fase se caracteriza por un proceso estocastico de mezcla de densidades, una para cada regimen. Bajo este prisma, una observavion tiene cierta probabilidad de pertenecer a la distribucion "expansion" y cierta probabilidad de pertenecer a la distribucion "recesion" y por lo tanto, aunque tuvieras una muestra infinita, a lo sumo podrias refinar estas probabilidades pero no necesariamente atribuir una observacion a una u otra distribucion con certeza. Por lo tanto, puedes interpretar el estadistico ROC como una medida noparametrica de distancia entre estas dos densidades.
Si no te gusta el ejemplo del cancer, quiza sea mas apropiado un ejemplo basado en la presion barometrica (el equivalente a el test PSA o al indice de FEDEA) y el "mal tiempo" donde el mal tiempo puede ser lluvia, aire, bajas temperaturas (el equivalente a padecer cancer o estar en recesion).
Termino por indicar que el estadistico ROC se establecio como norma por la organizacion mundial de la metereologia para evaluar modelos atmosfericos del tipo: manyana llovera o no, o nevara o no, etc. Y quiza ahi este el fondo de la cuestion - el estadistico ROC sirve para evaluar una clasificacion dada, pero no para decir como debes construir esta clasificacion.
No se dice "una editorial",m eso es para libros, se dice "un" editorial cuando es la opinión no firmada de un periódico.
Los comentarios están cerrados.