You are on page 1of 5

VENTAJAS Y DESVENTAJAS DE LA TEORA CLSICA DE LOS TESTS

Recordemos que la teora clsica de los tests (TCT) llamada tambin Modelo Lineal Clsico, propone la teora de
los tests paralelos y la teora de los test referidos al criterio.

- La Teora de los tests paralelos: Se refiere a aquellos tests que miden lo mismo exactamente pero con
distintos tems. Las puntuaciones verdaderas de las personas en los tests paralelos seran las mismas, y
tambin seran iguales los errores de medida.

- La teora de los tests referidos al criterio: Que evalan el estatus absoluto del sujeto respecto a algn
dominio de conductas bien definido.

Ventajas y limitaciones de la TCT.

Como seala Muiz (1992), lo que le ha proporcionado una larga vida a la TCT son su sencillez matemtica y
enjundia psicolgica, el xito de la TCT se debe a que proporciona solucin a una amplia gama de problemas de
medida y a que sus supuestos son mnimos. En definitiva, la sencillez, claridad y flexibilidad de sus conceptos,
junto a la simplicidad de sus supuestos y procedimientos han posibilitado que pueda ser aplicada a muchas
situaciones en las que no tienen cabida modelos con supuestos ms restrictivos.

Es un modelo vlido que permite realizar inferencias sobre el nivel en que los sujetos poseen la caracterstica o
rasgo inobservable que mide el test.

Ahora bien, sus ventajas conllevan muchos problemas y algunos de ellas son ciertamente importantes. Entre los
ms relevantes podemos destacar los siguientes:

- Limitaciones relacionadas con los supuestos del modelo. Los supuestos del modelo no pueden ser
contrastados empricamente; por definicin tienen un carcter tautolgico, es decir no pueden ser
evaluados.

- Limitaciones relacionadas con el concepto de tests paralelos. La equivalencia de las medidas paralelas,
en la prctica, es difcil de conseguir. Este supuesto que es clave en la TCT resulta muy restrictivo y rara
vez se cumple.

- Limitaciones relacionadas con los parmetros del modelo. Los parmetros del modelo no son
invariantes, es decir, las puntuaciones de los sujetos dependen de los tems del test y stos a su vez
dependen de la muestra de sujetos a los que se ha aplicado el test. Como sealan Muiz y Hambleton,
1992, si se aspira a una medicin rigurosa y cientfica, resulta difcil justificar que las mediciones estn
en funcin del instrumento utilizado (p.40).

- Limitaciones relacionadas con el concepto de fiabilidad. La fiabilidad del test es un concepto central en
la TCT, y sin embargo no es posible definirlo ni estimarlo de forma unvoca (Lloret, 1999). La
implementacin de mltiples procedimientos para estimarla ha producido confusin en los conceptos de
consistencia interna, homogeneidad y unidimensionalidad y, en consecuencia, el valor del coeficiente
de fiabilidad depende del mtodo de estimacin usado. Ello, unido a que la fiabilidad del instrumento de
medida depende de la longitud del test y de la variabilidad de las respuestas de los sujetos a los que se
les aplica el test, hace que la consideracin de la fiabilidad como una propiedad caracterstica del
instrumento de medida sea difcil de sostener.

- Limitaciones relacionadas con los errores de medida. La consideracin simplista de las fuentes de los
errores de medida, es otra de las crticas, ms importantes al modelo; el carcter nico e indiferenciado
del error de medida obliga a incluir dentro del mismo todas las posibles fuentes de error (variaciones
individuales, factores situacionales, caractersticas del aplicador, variables instrumentales, ..), es decir ,
el modelo presenta serias dificultados al no poder diferenciar las distintas fuentes de error que afectan a
las puntuaciones.
De acuerdo a Muiz (2010) hay dos cuestiones bsicas que no encontraban buena solucin en la teora clsica y
que hacan que la medicin psicolgica no fuese homologable a la que exhiban otras ciencias empricas. Estas
son:

1 Las mediciones no son comparables respecto al instrumento utilizado; es decir si un psiclogo


evala la inteligencia de tres personas distintas con un test diferente para cada persona, no podemos decir
en sentido estricto qu persona es ms inteligente. Esto es as porque los resultados de los tres tests
no estn en la misma escala, cada test tiene la suya propia. Esto puede sorprender a los psiclogos
usuarios habituales de la teora clsica, acostumbrados en la prctica a comparar la inteligencia de
personas que han sido evaluadas con distintos tests de inteligencia.

Para hacerlo se transforman las puntuaciones directas de los tests en otras baremadas, por ejemplo
en percentiles, con lo que se considera que se pueden ya comparar, y de hecho as se hace. Este
proceder clsico para solventar el problema de la invarianza (sinnimo de equivalencia, es decir la
probabilidad de obtener puntuaciones iguales en los tests) no es que sea incorrecto, pero descansa
sobre un pilar muy frgil, a saber, se asume que los grupos normativos en los que se elaboraron los
baremos de los distintos tests son equiparables, lo cual es difcil de garantizar en la prctica. Si eso
falla la comparacin se viene abajo. No hay duda que lo ms deseable cientficamente sera que los
resultados obtenidos al utilizar distintos instrumentos estuviesen en la misma escala, y todo
quedara resuelto.

2 Ausencia de invarianza de las propiedades de los tests respecto de las personas


utilizadas para estimarlas. En otras palabras, propiedades psicomtricas importantes de los tests,
tales como la dificultad de los tems, o la fiabilidad del test, estaban en funcin del tipo de personas
utilizadas para calcularlas, lo cual resulta inadmisible desde el punto de vista de una medicin
rigurosa. Por ejemplo, la dificultad de los tems, o los coeficientes de fiabilidad dependen en gran
medida del tipo de muestra utilizada para calcularlos.

Aparte de estas dos grandes cuestiones, haba otras menores de carcter ms tcnico a las que la
teora clsica no daba una buena solucin. Por ejemplo, cuando se ofrece un coeficiente de fiabilidad
de un test en el marco clsico, como el coeficiente alfa de Cronbach, se est presuponiendo que ese
test mide con una fiabilidad determinada a todas las personas evaluadas con el test, cuando
tenemos evidencia emprica ms que suficiente de que los tests no miden con la misma precisin a
todas las personas, dependiendo la precisin en gran medida del nivel de la persona en la variable
medida.
TEORA DE RESPUESTA A LOS TEMS (TRI)
Quizs es conveniente resaltar la idea de que tanto la TCT como la TRI persiguen el mismo objetivo:
estimar el error que se comete al intentar medir un fenmeno psicolgico especfico.

Son construcciones tericas (con menor o mayor grado de complejidad y profundidad) respecto de
un mismo hecho. Ambas teoras plantean un modelo y un conjunto de supuestos, que si se cumplen,
garantizan la precisin de la medida. Tambin cabe destacar que la coexistencia de ambas teoras no
implica su incompatibilidad. Lejos de competir, estos modelos se complementan en la prctica
psicomtrica para realizar un anlisis ms profundo y exhaustivo de la calidad y/o del
funcionamiento del test.

Ahora bien, para poder hacerlo tiene que formular modelos ms complejos y menos intuitivos que el
modelo clsico, sin que ello suponga que entraen dificultades especiales. Pero antes de pasar a
exponer los fundamentos de estos modelos, vamos a dar unas breves pinceladas de su nacimiento
histrico, para as ayudar al lector a ubicarlos en la historia de la psicologa.

Resea histrica

En ciencia pocos avances surgen de repente, de la noche a la maana, sin incubacin, lo ms


habitual es que se produzca un proceso gradual que en un momento determinado cuaja en una
nueva lnea de trabajo. Y eso es ms o menos lo que ha pasado con la TRI, sus primeros atisbos
pueden rastrearse en trabajos pioneros de Thurstone all por los aos veinte (Thurstone, 1925), que
se continan en los cuarenta con las aportaciones de autores como Lawley (1943, 1944) o Tucker
(1946). Como se puede ver ya en estos aos de pleno dominio de la Teora Clsica se estn dando
los primeros pasos de los que luego vendra a denominarse TRI. Esos son los orgenes remotos, pero
ser el gran psicmetra Frederic Lord (1952) quien en su tesis doctoral pone los primeros ladrillos
firmes de la TRI.

Birnbaum en los aos cincuenta aporta nuevos avances, pero ser el matemtico dans Rasch
(1960), quien propone su hoy famoso modelo logstico de un parmetro. Bien podemos tomar esa
fecha como el momento de despegue de la TRI, pero el gran impulso lo darn Lord y Novick (1968)
en su famoso libro, en el cual dedican cinco captulos al tema. A partir de su libro las investigaciones
sobre los modelos de TRI dominarn la psicometra, hasta nuestros das. A partir de esa fecha
empiezan a aparecer los programas informticos necesarios para utilizar los modelos de TRI, tales
como BICAL y LOGIST en 1976 entre otros.

En 1980 Lord publicar un influyente libro dedicado a las aplicaciones de la TRI. De esas fechas
hasta hoy los avances han sido notorios, y podemos decir que en nuestros das la TRI domina el
panorama psicomtrico.

La denominacin TRI agrupa lneas de investigacin psicomtricas independientes.

Centran su inters en anlisis de los tems/preguntas

.
La teora de Respuesta al tem (TRI), es un modelo estadstico que relaciona
la probabilidad de respuesta a un reactivo (tem) en funcin de un
parmetro especfico y el nivel de rasgo latente (el constructo que se va a
medir) que presenta un determinado sujeto

Parmetros: es el
nivel de
habilidad
denominado
zeta .

- Discriminacin del tem: medida generalmente por la correlacin entre el puntaje en el tem y
el puntaje total de la prueba.
- Dificultad del tem: medida por el porcentaje de respuestas correctas.
- Acierto al azar

Entonces, la probabilidad de una respuesta correcta depende de la habilidad del examinado y de


las caractersticas propias de las preguntas, tales como

El factor comn de estos desarrollos es que establecen una relacin entre el comportamiento de un
sujeto frente a un tem y el rasgo responsable de esta conducta (rasgo latente). Para ello, recurren a
funciones matemticas que describen la probabilidad de dar una determinada respuesta al tem para
cada nivel del rasgo medido por este.

El objetivo sustancial de la TRI es la construccin de instrumentos de medicin con propiedades


invariantes entre poblaciones. Si dos individuos presentan idntico nivel de rasgo medido ambos
tendrn igual probabilidad de dar la misma respuesta, independientemente de la poblacin de
pertenencia. Esto conlleva un gran beneficio respecto de la TCT en tanto que es posible evitar el uso
de un grupo normativo.

You might also like