Detección de buenas prácticas educativas en escuelas de alto valor añadido mediante técnicas de Big Data es un proyecto financiado por la Fundación BBVA en el marco de las Becas Leonardo a Investigadores y Creadores Culturales (convocatoria 2017), que tiene una extensión de 15 meses y el siguiente objetivo general:
Detectar factores asociados al rendimiento en escuelas de alto valor añadido para la elaboración y difusión a la comunidad de un catálogo de buenas prácticas educativas.
Este objetivo general se desglosa en 3 fases, cuyo desarrollo se implementa en orden cronológico.
Esta fase tiene como meta la selección de escuelas de alta y baja eficacia a partir de los resultados de la muestra española de centros educativos y estudiantes del programa de evaluación a gran escala PISA 2015.
En el marco de este proyecto, entenderemos eficacia como la aportación específica que el centro educativo ofrece a la formación del estudiante una vez se aíslan las condiciones contextuales de partida tanto a nivel de centro (recursos, tamaño del centro y aula, nivel socio-económico de la comunidad educativa, multiculturalidad, etc.) como a nivel de estudiante (género, nivel socio-económico familiar, asistencia al primer y segundo ciclo de educación infantil, etc.). Para la cuantificación de esta eficacia, a partir del rendimiento bruto de los estudiantes en las 3 grandes áreas evaluadas por PISA (lectura, Matemáticas y Ciencias), se procede a aislar la parte del rendimiento medio de los centros educativos no atribuible al efecto de estas variables contextuales, obteniendo un residuo medio por centro.
El conjunto de técnicas estadísticas empleado para llevar a cabo estos cálculos se denomina generalmente como modelos jerárquicos lineales o modelos multinivel. Mediante su aplicación, por tanto, logramos eliminar la influencia que factores contextuales tienen sobre el rendimiento de escuelas y estudiantes, obteniendo un índice que informa sobre la parte del rendimiento promedio de las escuelas no explicada por estos factores contextuales. Este rendimiento promedio residual obtenido en los modelos jerárquicos lineales se denomina, de manera general, Valor Añadido en Educación.
Así pues, esta fase finaliza con la detección, selección y caracterización de aquellos centros educativos cuyo rendimiento promedio residual se mantiene de manera sistemática y clara en los niveles superiores (centros de alta eficacia) e inferiores (centros de baja eficacia) a lo largo de las 3 áreas evaluadas en PISA.
Una vez seleccionados aquellos centros educativos cuyo aporte es claramente superior al que cabría esperar dadas sus condiciones contextuales (alta eficacia) y los centros cuyo aporte es inferior (baja eficacia), cabe estudiar qué elementos, acciones y dinámicas educativas concretas les diferencian. Así, esta fase tiene como fin último la detección y análisis de los principales factores no contextuales (también llamados de proceso) atribuibles a los centros educativos que están claramente asociados a la alta eficacia, en relación o contraste con los centros de baja eficacia.Así, para la consecución de esta fase, se prevé la aplicación de técnicas propias del llamado Big Data. Se aplican técnicas de Minería de Datos, en concreto árboles de decisión, para la detección de los factores no contextuales asociados a la alta o baja eficacia, y el comportamiento de sus interacciones. La ventaja de este conjunto de técnicas con respecto a las tradicionales estriba principalmente en que permiten la detección y selección de información valiosa en todo tipo de conjuntos de datos, incluso cuando éstos son de gran tamaño. Tal es el caso de las evaluaciones a gran escala en educación, como las pruebas PISA 2015, que nos ocupan en este proyecto.
Los árboles de decisión generan clasificaciones o agrupaciones de sujetos en función de sus puntuaciones en un conjunto de variables explicativas (en este caso, factores no contextuales) tomando como referencia un criterio dado (en este caso, que los sujetos y/o centros educativos hayan sido considerados de alta o baja eficacia). De este modo, se genera un árbol que, bajo una estructura ramificada y jerarquizada, indica el conjunto de factores no contextuales que mejor es capaz de explicar que los sujetos/centros se hayan considerado de alta o baja eficacia en la fase anterior.
Por lo tanto, como aporte principal de esta fase, se analizará la información obtenida con estos árboles de decisión para llevar a cabo una caracterización y diferenciación de las escuelas de alto y bajo valor añadido con respecto a sus niveles en los factores no contextuales estudiados.
Una vez se han obtenido y analizado pormenorizadamente los datos empíricos, se plantea la última fase del estudio, con la finalidad última de difundir los resultados a distintos colectivos que pueden estar interesados en el proyecto. Se tiene en cuenta, por un lado, la comunidad educativa, y por otro, la comunidad científica:
Comunidad educativa:
En primer lugar, se plantea la difusión de un catálogo de buenas prácticas amplio, destinado a profesores, equipos directivos e instituciones educativas que incluya información exhaustiva sobre los factores clave de eficacia escolar localizados en el proyecto. Como añadido, se plantea la elaboración y difusión de un catálogo resumido, en forma de folleto informativo, destinado principalmente a familias y otros agentes educativos del ámbito no profesional. Finalmente, esta web trata de ser un elemento de comunicación multidireccional, tanto para difundir los resultados del proyecto, como con la intención de recibir feedback sobre el mismo y poder aportar a la mejora educativa.
Comunidad científica:
Se define la publicación tanto en eventos científicos como en publicaciones nacionales e internacionales de impacto, de cara a difundir los resultados principalmente de las 2 primeras fases del proyecto.