En julio les contaba algo sobre dos experimentos de largo plazo, el Perry preescolar y el Abecedario (en mayo les hablé de otro menos exitoso). Desde ese momento, media docena de corresponsales me alertaron de que el New York Times se había hecho eco de un estudio de Raj Chetty y varios coautores sobre los efectos de largo plazo de otro de los experimentos más famosos en educación, el STAR de Tennesee.
Pero comencemos por el principio. ¿Qué es el experimento STAR? El acrónimo ya dice algo: Student/Teacher Achievement Ratio. Es decir, logros del ratio (razón o cociente) entre estudiantes y profesores. El número de estudiantes por profesor es una de las medidas más habituales de recursos utilizados en educación. Resulta fácil de medir y aunque su implementación no es trivial, es claramente más sencillo que mejorar la calidad o los incentivos.
Sin embargo, la evidencia sobre su utilidad es, como mínimo, controvertida. Por ejemplo, muchos países han reducido, a veces de forma extrema, el tamaño de las clases a lo largo de las últimas décadas, sin mejoras perceptibles en el rendimiento de los alumnos, medido a través de pruebas estandarizadas (esto es crucial como veremos después). Por ejemplo, Hanushek no encuentra en su revisión de la literatura académica grandes ventajas de políticas basadas simplemente en disminuir el número de niños por clase.
Y, sin embargo, esto no es la última palabra. La evidencia procede de bases de datos longitudinales, donde suele ser difícil cerciorarse de la inclusión de todas las variables relevantes y donde la obtención de relaciones causales firmes puede ser muy compleja. Por esto muchos investigadores han intentado evaluar los efectos de esta política de otras maneras. Por ejemplo, se selecciona de manera aleatoria un grupo de estudiantes para ser tratado con un menor tamaño de clase, para luego comparar su rendimiento con el de un grupo de control. El experimento más famoso en este campo es justamente el STAR.
Alrededor de 11000 niños de 3 años fueron seleccionados para participar en este experimento. Un grupo escogido aleatoriamente se educó en clases con 22 niños y otro en clases con 15 niños. Un primer estudio, de Finn y Achilles encuentran mejoras de entre 0,3 y 0,6 desviaciones típicas en las notas de los alumnos en exámenes estandarizados. Krueger vuelve a analizar los datos con técnicas econométricas más sofisticadas y obtiene unas mejoras algo mayores.
Aunque es una evidencia de por sí muy importante, Krueger y Whitmore, por ejemplo muestran que el efecto de la intervención desaparece con el paso del tiempo. Para el año siguiente al experimento, la diferencia entre los estudiantes tratados y no tratados se reduce entre la mitad y tres cuartas partes de la diferencia inicial. Algo parecido, por cierto, pasó con los experimentos Perry y Abecedarios , como muestra Anderson.
Afortunadamente para todos, esto no es el final de la historia. Los investigadores americanos han tenido acceso a los datos fiscales de una gran mayoría (95%) de los participantes en el experimento (además parece que el hecho de ser tratados no está relacionada con la disponibilidad de sus datos fiscales) y se puede ver su relación con las notas obtenidas cuando tenían tres años.
Los resultados son espectaculares. Por ejemplo, en el gráfico se ven las ganancias en dólares anuales por cada percentil de ganancia en preescolar (KG quiere decir Kindergarten, esto es, prescolar).
En números, se trata de unos 100 dólares anuales de ganancia salarial a los 27 años por punto porcentual de aumento de notas. Dado que las ganancias por el reducir el tamaño de clase de 22 a 17 estaban entre 0.3 y 0.6 desviaciones estándar, estamos hablando de entre 1200 y 2000 dólares de ganancia (el periodista del NY Times es algo más conservador, pero como hemos visto por el análisis de Krueger, el efecto podría ser incluso mayor).
En este otro gráfico se pueden ver también unas ganancias significativas en la probabilidad de ir a la universidad. La presentación también muestra efectos sustanciales en la calidad de la universidad a la que se va, de ser propietario de una casa, de ahorros para la jubilación, de vivir en barrios con más graduados universitarios, de estar casados, y de movilidad entre estados (algo positivo en los EEUU).
(Actualización: algún lector me ha pedido una aclaración porque en los gráficos no se muestran directamente las diferencias de ganancias entre el grupo tratado y de control. Ciertamente, las ganancias salariales o de probabilidad de ir a la universidad han de inferirse del hecho que una clase de tamaño menor mejora la posición relativa de los chicos en las notas de prescolar. Si una clase de tamaño pequeño mejora la nota en 0,3 desviaciones estándar, esto mejora la posición porcentual, lo que hay en el eje horizontal, en 12 puntos, y como cada punto son alrededor de 100 dólares de salario extra, así llegamos a los 1200 dólares de ganancia por una clase más pequeña. En las transparencias de Chetty hay otros graficos que comparan directamente las distribuciones de salarios y de probabilidad de ir a la universidad del grupo tratado y el de control, las figuras 4a, 4b y 4c.)
¿Quiere decir esto que nos debemos embarcar en una política costosísima de reducción generalizada del tamaño de las clases? No lo creo. La evidencia que revisa Hanushek, o los resultados negativos para un experimento con adolescentes de los que informaba Núria Rodríguez-Planas me hacen ser escéptico sobre políticas muy generalizadas con chicos más mayores, aunque estoy dispuesto a ser contradicho si se hace un experimento general. Me inclino más bien a pensar que estos resultados confirman la conveniencia de intervenciones tempranas de alta calidad como ya decíamos en julio. Muchos buenos hábitos se crean muy temprano, y es importante que nos demos cuenta de ello, y actuemos sobre la base de esta evidencia cada vez más abrumadora.