El tamaño de la clase y el experimento STAR a largo plazo

En julio les contaba algo sobre dos experimentos de largo plazo, el Perry preescolar y el Abecedario (en mayo les hablé de otro menos exitoso). Desde ese momento, media docena de corresponsales me alertaron de que el New York Times se había hecho eco de un estudio de Raj Chetty y varios coautores sobre los efectos de largo plazo de otro de los experimentos más famosos en educación, el STAR de Tennesee.

Pero comencemos por el principio. ¿Qué es el experimento STAR? El acrónimo ya dice algo: Student/Teacher Achievement Ratio. Es decir, logros del ratio (razón o cociente) entre estudiantes y profesores. El número de estudiantes por profesor es una de las medidas más habituales de recursos utilizados en educación. Resulta fácil de medir y aunque su implementación no es trivial, es claramente más sencillo que mejorar la calidad o los incentivos.

Sin embargo, la evidencia sobre su utilidad es, como mínimo, controvertida. Por ejemplo, muchos países han reducido, a veces de forma extrema, el tamaño de las clases a lo largo de las últimas décadas, sin mejoras perceptibles en el rendimiento de los alumnos, medido a través de pruebas estandarizadas (esto es crucial como veremos después). Por ejemplo, Hanushek no encuentra en su revisión de la literatura académica grandes ventajas de políticas basadas simplemente en disminuir el número de niños por clase.

Y, sin embargo, esto no es la última palabra. La evidencia procede de bases de datos longitudinales, donde suele ser difícil cerciorarse de la inclusión de todas las variables relevantes y donde la obtención de relaciones causales firmes puede ser muy compleja. Por esto muchos investigadores han intentado evaluar los efectos de esta política de otras maneras. Por ejemplo, se selecciona de manera aleatoria un grupo de estudiantes para ser tratado con un menor tamaño de clase, para luego comparar su rendimiento con el de un grupo de control. El experimento más famoso en este campo es justamente el STAR.

Alrededor de 11000 niños de 3 años fueron seleccionados para participar en este experimento. Un grupo escogido aleatoriamente se educó en clases con 22 niños y otro en clases con 15 niños. Un primer estudio, de Finn y Achilles encuentran mejoras de entre 0,3 y 0,6 desviaciones típicas en las notas de los alumnos en exámenes estandarizados. Krueger vuelve a analizar los datos con técnicas econométricas más sofisticadas y obtiene unas mejoras algo mayores.

Aunque es una evidencia de por sí muy importante, Krueger y Whitmore, por ejemplo muestran que el efecto de la intervención desaparece con el paso del tiempo. Para el año siguiente al experimento, la diferencia entre los estudiantes tratados y no tratados se reduce entre la mitad y tres cuartas partes de la diferencia inicial. Algo parecido, por cierto, pasó con los experimentos Perry y Abecedarios , como muestra Anderson.

Afortunadamente para todos, esto no es el final de la historia. Los investigadores americanos han tenido acceso a los datos fiscales de una gran mayoría (95%) de los participantes en el experimento (además parece que el hecho de ser tratados no está relacionada con la disponibilidad de sus datos fiscales) y se puede ver su relación con las notas obtenidas cuando tenían tres años.

Los resultados son espectaculares. Por ejemplo, en el gráfico se ven las ganancias en dólares anuales por cada percentil de ganancia en preescolar (KG quiere decir Kindergarten, esto es, prescolar).
Percentil de notas y salarios anuales

En números, se trata de unos 100 dólares anuales de ganancia salarial a los 27 años por punto porcentual de aumento de notas. Dado que las ganancias por el reducir el tamaño de clase de 22 a 17 estaban entre 0.3 y 0.6 desviaciones estándar, estamos hablando de entre 1200 y 2000 dólares de ganancia (el periodista del NY Times es algo más conservador, pero como hemos visto por el análisis de Krueger, el efecto podría ser incluso mayor).

En este otro gráfico se pueden ver también unas ganancias significativas en la probabilidad de ir a la universidad. La presentación también muestra efectos sustanciales en la calidad de la universidad a la que se va, de ser propietario de una casa, de ahorros para la jubilación, de vivir en barrios con más graduados universitarios, de estar casados, y de movilidad entre estados (algo positivo en los EEUU).

(Actualización: algún lector me ha pedido una aclaración porque en los gráficos no se muestran directamente las diferencias de ganancias entre el grupo tratado y de control. Ciertamente, las ganancias salariales o de probabilidad de ir a la universidad han de inferirse del hecho que una clase de tamaño menor mejora la posición relativa de los chicos en las notas de prescolar. Si una clase de tamaño pequeño mejora la nota en 0,3 desviaciones estándar, esto mejora la posición porcentual, lo que hay en el eje horizontal, en 12 puntos, y como cada punto son alrededor de 100 dólares de salario extra, así llegamos a los 1200 dólares de ganancia por una clase más pequeña. En las transparencias de Chetty hay otros graficos que comparan directamente las distribuciones de salarios y de probabilidad de ir a la universidad del grupo tratado y el de control, las figuras 4a, 4b y 4c.)

¿Quiere decir esto que nos debemos embarcar en una política costosísima de reducción generalizada del tamaño de las clases? No lo creo. La evidencia que revisa Hanushek, o los resultados negativos para un experimento con adolescentes de los que informaba Núria Rodríguez-Planas me hacen ser escéptico sobre políticas muy generalizadas con chicos más mayores, aunque estoy dispuesto a ser contradicho si se hace un experimento general. Me inclino más bien a pensar que estos resultados confirman la conveniencia de intervenciones tempranas de alta calidad como ya decíamos en julio. Muchos buenos hábitos se crean muy temprano, y es importante que nos demos cuenta de ello, y actuemos sobre la base de esta evidencia cada vez más abrumadora.

Hay 12 comentarios
  • Sobre el tamaño de los grupos: Si de lo que se trata es de que un maestro pueda hacer un seguimiento personalizado de cada uno de los niños a su cargo, yo no esperaría grandes cambios al pasar de 22 a 15 estudiantes. Mi definición de grupo pequeño, al menos a estas edades, es uno que no pasa de los diez niños. Otra cosa es que haya dinero para esto.

    Sobre esas correlaciones: Uno diría que no importa tanto el conocimiento demostrado en esas pruebas como la personalidad del niño que esos resultados reflejan. El propio articulista del New York Times considera como conjetura plausible que una buena educación primaria puede inculcar en los niños actitudes que les acompañarán toda la vida como paciencia, disciplina, buenas maneras o perseverancia.

    Dicho de otro modo: Las pruebas objetivas tienen la ventaja de que son observables pero a lo mejor no deberían ser el objetivo de una política educativa. No es la primera vez que doy la tabarra con esto pero es que me parece importante. Y no, no creo que una escuela Steiner sea tan cara; las escuelas caras lo son por actividades que tienen poco que ver con su actividad principal.

  • Jorge Durán, de acuerdo con tu comentario. La inteligencia/capacidades que se miden en esos tests es sesgada. También són importantes:
    - el tiempo que dedican los niños a relacionarse libremente en grupo SIN actividades dirigidas (muchos, simplemente no saben inventarse juegos, necesitan que les digan a qué tienen que jugar, "who killed proactivity?"),
    - aprender como gestionar sus conflictos/relaciones. De ahí que pocos niños por maestro sean importantes, el maestro debe mediar en ocasiones y para ello debe estar supervisando sus interacciones, con 25 resulta imposible y todo acaba o con 'LA LEY DEL MÁS FUERTE' o 'EL MAESTRO CONTROLA A GRITOS Y MANTENIÉNDOLOS OCUPADOS'. Habéis observado que los maestros en escuelas públicas tienden a gritar mucho? Es necesario?
    - la paciencia
    - la actividad física en cuerpos EN DESARROLLO (con ratios de 1 niño/2 m2 y la mayoria del tiempo en una silla, no es de extrañar que el índice de obesidad augmente alarmantemente).

    Y no, no es dar la tabarra, es el futuro de nuestros pequeños en un mundo globalizado.

  • Al hilo de lo que dice Javier Tabuenca, se puede hablar de otro tamaño de la clase: el tamaño del aula.

    A mí me da la impresión de que la misma cantidad de alumnos rinde más y crea menos conflicto de baja intensidad cuando el aula es más grande.

    Antonio, perdona la digresión pero ¿Sabes si alguien se ha preocupado de esto?

  • Jorge. Efectivamente lo que parece importar son los hábitos, y estos pueden medirse con ruido en el examen estándar que mide solamente conocimientos. Es lo que Heckman lleva tiempo diciendo. El efecto que observan con el experimento STAR está basado en una bajada de 22 a 15 alumnos. Parece que esto basta para tener efecto. No sé si una bajada mayor daría lugar a un efecto más fuerte. Por lo que dices, podría ser.

  • Javier. Ojo con renegar de lo que miden los tests. Puede que la medida tenga ruido, pero también tiene señal. Para aprender la lista de los reyes godos hace falta paciencia y disciplina. El examen es sobre la lista pero evalúa indirectamente otros hábitos. Y esas otras capacidades de innovar y gestionar conflictos también pueden medirse. Para los conflictos existe, por ejemplo, el número de "avisos" que tiene el niño y que pueden reflejarse en su hoja escolar.

  • Habría que añadir la falta de medios del profesorado (tendría que haber unos recursos que fueran instantáneos y gratuitos para educación), un entorno adecuado de temperatura (se da clases con más de 30º y menos de 15º) acústica, comodidad y recursos.
    Realmente lo que se necesita en educación no es prioridad para los políticos (es mejor 4 millones de parados no preparados que 4 millones de sobrecualificados), amen de que con la televisión y otras influencias, la labor del profesorado se ha puesto cuesta arriba.
    Por cierto, en el capítulo de redes, Punset pasa de hablar de los padres. La ciencia ya los da por perdidos, lo que significa que el profesorado además tiene que ejercer de ese sostén familiar que la economía y la neocultura han destrozado.

Los comentarios están cerrados.

Centro de preferencias de privacidad