La polémica: tests sí, tests no

Creado: 15/11/2012 | Modificado: 30/1/2013 2986 visitas | Ver todas Añadir comentario



La polémica: tests sí, tests no
 
Texto: http://www.psico.uniovi.es/REMA/v4n2/a1/p4.html

El abanico de campos de actuación y de fines cubiertos por los tests es enorme. Sin embargo, a pesar de ser muy utilizados han sido también -o quizás precisamente por eso- muy criticados. Muy pronto empieza a cambiar la consideración social de los tests, enfriándose algo el entusiasmo inicial que éstos habían suscitado; se comienza a escribir entonces el capítulo de críticas a los tests, capítulo todavía sin terminar al día de hoy.

Desde la década de los 20 y hasta la fecha, los tests han sido criticados con más o menos virulencia y ferocidad, según las épocas, pero tanto las críticas como el uso de los tests ha sido una constante. Por tanto, después de un período inicial de uso acrítico y entusiasta de los tests, la tónica dominante ha sido un uso continuado y generalizado pero crítico.

Quizás, si se comparan las primeras décadas del siglo con esta última, el diagnóstico podría ser el siguiente: a las puertas del cambio de milenio, se dispone de más tests y de un mayor corpus teórico, pero se tiene menos confianza en ambos que a comienzos de siglo o, al menos, una confianza menos ciega.

 


Las voces críticas se empiezan a escuchar a finales de la década de los 20; en la década de los 40 la sociedad americana asiste ya a una versión preliminar de la moderna controversia sobre el cociente intelectual, los tests y la evaluación, que se desata con fuerza y alcanza su apogeo a finales de la década de los 60 y durante toda la década siguiente (Cole, 1986; Cronbach, 1975). A partir de los 80, baja un poco la temperatura del debate, pero el fuego todavía no se ha apagado.

Todos los tests estaban en el ojo del huracán pero, especialmente, los tests de cociente intelectual y de inteligencia o aptitudes mentales en general (Jensen, 1980). La realidad es que la evaluación psicológica realizada con tests no ha sido cuestionada cuando ésta se ha efectuado con un objetivo diagnóstico, habitualmente en el campo de la psicología clínica o de la salud; la evaluación psicológica con tests ha sido criticada, sobre todo, cuando los tests son utilizados en procesos de selección y, como no podía ser de otra forma, las voces más airadas proceden -lógicamente- de los que se quedan fuera en el proceso, de los que dejan fuera los tests en situaciones de selección en el ámbito laboral o educativo (Graham y Lilly, 1984).

Una crítica muy general que se les ha hecho a los tests es que no son ni lo suficientemente válidos ni lo suficientemente fiables como para justificar su uso. Los detractores más radicales sostienen que, aun en el mejor de los casos, los tests que realmente evalúan lo que pretenden lo hacen de una forma bastante pobre y, por tanto, no resulta adecuada su utilización en procesos de selección, orientación o distribución de recursos. Se cuestiona a los tests por medir, en ocasiones, habilidades muy específicas, de alcance muy limitado como para ser útiles para hacer predicciones significativas y a largo plazo. Es incuestionable, además, que los tests de inteligencia no miden muchas cosas que son importantes en la actuación posterior del sujeto en el puesto laboral o educativo, lo que limita parcialmente su capacidad predictiva (Wigdor y Garner, 1982).

Junto a estas críticas de carácter general, también se han cuestionado aspectos más puntuales de los tests, como el contenido y formato de sus ítems (especialmente, los de elección múltiple han sido objeto de frecuentes polémicas), las normas utilizadas para la interpretación de sus puntuaciones y la interpretación misma de las puntuaciones de los tests.
 


En ocasiones, los tests han tenido efectos secundarios en el proceso de enseñanza-aprendizaje de los escolares. En efecto, muchos profesores, ante las presiones sufridas dado el carácter obligatorio de la evaluación, se han limitado a enseñar las habilidades que posteriormente iban a ser evaluadas, pero es que, además, las han enseñado tal y como sugerían las especificaciones de los tests utilizados en cada momento y de ningún otro modo (teaching to the test), de manera que la instrucción se ha visto focalizada en exceso y los alumnos con dificultades para generalizar (Popham, 1992).

Los estudiantes pueden dedicar gran parte de su tiempo a aprender cosas solo porque éstas van a ser posteriormente preguntadas en los tests utilizados en la evaluación y no porque tengan un valor intrínseco como objetivos educativos. Los tests estandarizados están siendo cada vez más criticados por fracasar en proporcionar objetivos instruccionales adecuados.

Los efectos no esperados de la evaluación, cuando no son deseables, pueden ser seriamente perniciosos y distorsionar gravemente la esencia misma de la propia evaluación. Por consiguiente, el uso masivo -o, cuando menos, regular- de los tests en el ámbito educativo ha tenido de algún modo un efecto perverso en el sistema educativo ya que, en ocasiones, el curriculum se ha ido reorientando hacia los contenidos y habilidades evaluadas por los tests estandarizados, en lugar de ajustarse éstos a los objetivos curriculares definidos para los distintos cursos y ciclos educativos.

A los tests se les ha acusado también de ser herramientas al servicio del poder, de ser instrumentos de control o represión social al servicio de la clase económica y políticamente dominante, de constituir barreras para la igualdad social y de oportunidades económicas, simplemente porque los tests han servido para revelar diferencias entre grupos, y el tema de las diferencias entre grupos es muy espinoso, levanta muchas ampollas.

Los tests han sido puestos en la picota porque ciertos grupos sociales tienden a puntuar como grupo por debajo de la media de otros grupos socialmente más favorecidos. Por ejemplo, los norteamericanos negros puntúan como grupo una desviación típica por debajo del grupo de norteamericanos blancos en tests de inteligencia, es decir, hay una diferencia de 15 puntos en la escala de cociente intelectual entre la media de blancos y negros. Las mujeres como grupo también tienden a puntuar por debajo de los hombres en algunas pruebas de habilidad espacial y de razonamiento matemático, y por encima de los hombres en pruebas de aptitud verbal.

El problema es que, durante bastante tiempo, las diferencias observadas en los tests entre distintos grupos sociales, étnicos o raciales han sido atribuidas a los tests, es decir, han sido explicadas aduciendo que los tests estaban sesgados contra distintas minorías o grupos, favoreciendo sistemáticamente a unos grupos en perjuicio de otros. Esto tiene una repercusión social muy importante: el uso de los tests en procesos de selección conduce a tasas distintas de selección en los distintos grupos. La preocupación básica es dictaminar si los tests utilizados habitualmente en el ámbito educativo y empresarial -y construidos, normalmente, por la clase y raza económica y políticamente dominante- están sesgados contra grupos minoritarios, es decir, si conducen a una discriminación en el acceso al mercado laboral y educativo de personas pertenecientes a clases y razas ni económica ni políticamente dominantes.

Las denuncias sobre la parcialidad de los tests crecen considerablemente a finales de la década de los 60 y, sobre todo, durante los años 70, en parte, debido al fuerte impulso que experimentó en esa época el movimiento por los derechos humanos, que va a desatar un enorme interés y preocupación por el posible uso y efecto discriminador de los tests.

Los tests pasan a disposición judicial y su adecuación en distintos contextos de aplicación se va a dirimir en los juzgados. De hecho, en algunos estados americanos se prohibió el uso de tests en la toma de decisiones educativas, se fallaron sentencias judiciales importantes por discriminación en la selección de personal y en la admisión a instituciones educativas y se cometieron también no pocas tropelías desde el punto de vista técnico. Una de las más conocidas es el caso Golden Rule. Tras ocho años de litigios, el Educational Testing Service y la compañía de seguros Golden Rule acordaron eliminar de las pruebas que utilizaban con sus agentes de seguros aquellos elementos que eran respondidos correctamente un 15% más en la población blanca que en la afroamericana. Esta decisión, políticamente rentable, era técnicamente un disparate.

Para acabar de complicar las cosas, la polémica sobre los tests se vio metida de lleno en el ya de por sí controvertido debate sobre la herencia y el medio (véase, por ejemplo, Block y Dworkin, 1976; Jensen, 1969, 1980 y Reynolds y Brown, 1984), cargando el acento más en el lado hereditario que en el ambiental. Eran muchos -aunque no todos- los autores que sostenían que las diferencias en las puntuaciones de los tests de distintos grupos reflejaban diferencias hereditarias en habilidad, y que los tests de inteligencia general medían características genéticas.

Así las cosas, es fácil entender porqué los tests eran considerados como instrumentos claramente reaccionarios, ya que podían proporcionar un fundamento a la desigualdad social (Gould, 1981), al estar ésta basada o justificada por las diferencias en aptitud de distintos grupos.

Esta situación resulta, si no paradójica, sí cuando menos curiosa. En efecto, los tests que fueron acogidos con gran entusiasmo por suponer un paso adelante frente a posiciones retrógradas que utilizaban como criterios para medrar la posición social, la familia o la cuna, pocas décadas después son vilipendiados justamente por grupos o minorías socialmente desfavorecidas. Como señala Cronbach (1975), lo llamativo es que los impulsores de los tests pretendían abrir con ellos las puertas a personas competentes pero socialmente más desfavorecidas e, irónicamente, el ataque más feroz procede justamente de los que hablan en nombre de los pobres.

Lo cierto es que la preocupación por el tratamiento igualitario de grupos y minorías, aunque totalmente legítima, condujo a una situación equívoca, llevó a un planteamiento simplista y algo ingenuo conocido como la falacia igualitarista.

Esta falacia arranca del supuesto de que todos los hombres son iguales, sin distinción alguna de raza, color, sexo, religión, origen social o nacional. Este supuesto es totalmente gratuito, ya que a nadie se le escapa la diferencia que existe entre nacer en un país como España y, por ejemplo, en Somalia; la diferencia es enorme no ya en las oportunidades sociales y económicas sino simplemente en términos de mera supervivencia. Pues bien, partiendo de este supuesto -falso- de que todos los hombres son iguales, se plantea que si los tests hacen a los hombres desiguales es porque los tests son injustos, ya que la justicia está obviamente con la igualdad de oportunidades. Así, con esta argumentación, cualquier test en el que se encontrasen diferencias entre grupos étnicos, culturales o socioeconómicos, era considerado injusto y sesgado.

La realidad es que la falacia igualitarista llevó a confundir la legítima igualdad de derechos y oportunidades con la (des)igualdad de los resultados obtenidos. Esto condujo, irremisiblemente, a matar al mensajero -los tests- cuando éstos lo único que hacían era constatar -que no producir- las diferencias en la actuación media de distintos grupos. Los tests eran solo el mensajero, no el enemigo: se confundían las diferencias entre grupos con el sesgo y se trataba ingenuamente de buscar la igualdad en los resultados como forma de remediar la desigualdad de oportunidades. Sin embargo, el papel de los tests no es conjurar los demonios sociales del mundo sino ser un reportero neutral de lo que en el mundo acontece.

Trasladado el problema a la arena política, su solución pasa por encontrar un punto de equilibrio entre el principio de igualdad de oportunidades para cada individuo de la sociedad con la realidad incontestable de una procedencia y una formación desigual de dichos individuos.

Trasladado el problema a la arena técnica, el objetivo de los constructores de tests y de los psicómetras debe centrarse en las diferencias entre grupos que tienen su origen en los ítems del test, y no en el ambiente o la procedencia de los individuos. Esos ítems son los que realmente pueden sesgar o distorsionar la actuación de los sujetos en el test.

En suma, los tests han sido criticados o debatidos tanto dentro como fuera del marco de la psicología, es decir, las críticas han trascendido el ámbito de lo puramente psicométrico y los tests se han convertido en una cuestión de debate público e incluso legal.

En ambos terrenos -público y profesional- las críticas a los tests tienen que ver más con el uso inadecuado que a veces se hace de los tests que con las propias características o propiedades técnicas de los mismos. Para ilustrar este punto, Muñiz (1998) compara los tests con el automóvil, considerado como el mayor homicida de nuestros días. Sin embargo, a pesar del elevado número de muertes que ocasiona, son muy pocos los accidentes atribuibles a fallos mecánicos, es el uso inapropiado que se hace del automóvil lo que genera la elevada tasa de siniestralidad. Algo similar ocurre con los tests: el problema no es tanto sus características técnicas sino el uso que se hace de ellos. Y el mal uso de los tests puede provenir de tres fuentes: la negligencia en su uso, la mala fe, es decir, un intento deliberado de distorsionar la realidad y conocimientos insuficientes, falta de información o información errónea. Esta última fuente es, con diferencia, la causa más frecuente del uso inapropiado de los tests.

Atajar este problema supone necesariamente regular el uso de los tests. La cuestión es cómo y cuánto.

Fuentes de regulación.

Las fuentes de regulación del uso de los tests pueden proceder desde distintos frentes. Por ejemplo, se puede trabajar desde la propia industria de los tests, desde organizaciones o colegios profesionales o desde la misma administración pública (Wigdor y Garner, 1982). En cualquier caso, se trata de maximinar la excelencia técnica de las pruebas y la preparación de los usuarios. No hay recetas mágicas para ello, pero parece que la mejor fórmula consiste en combinar la formación de los usuarios con la restricción en el acceso a los tests de personas no cualificadas aunque, a la larga, los esfuerzos por mejorar la formación son más eficientes que la mera restricción en el uso (Fremer, 1996; Tyler, 1986).

Desde hace tiempo, el Colegio Oficial de Psicólogos viene realizando diversas actividades para mejorar el uso y la práctica de los tests en España.

A nivel nacional, se formó en su día una comisión de tests constituida por universitarios, profesionales y casas editoras que trata de discutir y proponer medidas tendentes a la mejora del uso de los tests en España (véase la página web del colegio http://www.cop.es para obtener información relativa a estas medidas).

A nivel internacional, el Colegio Oficial de Psicólogos participa en la International Test Commission, organismo encargado de potenciar un uso adecuado de los tests a nivel internacional. Este organismo está ultimando unas normas internacionales para el uso de los tests que verán la luz en el 2000. Estas normas se articulan en torno a dos grandes apartados: el uso ético de los tests y la utilización adecuada de los tests.

Existe también una comisión europea para el estudio y mejora de la construcción y uso de los tests en Europa.



Contacto y comentarios
Puedes comentar este texto aquí: Comentarios
También puedes contactar con el administrador en este enlace: Contacto


Síguenos