Professional Documents
Culture Documents
Recordemos que la teora clsica de los tests (TCT) llamada tambin Modelo Lineal Clsico, propone la teora de
los tests paralelos y la teora de los test referidos al criterio.
- La Teora de los tests paralelos: Se refiere a aquellos tests que miden lo mismo exactamente pero con
distintos tems. Las puntuaciones verdaderas de las personas en los tests paralelos seran las mismas, y
tambin seran iguales los errores de medida.
- La teora de los tests referidos al criterio: Que evalan el estatus absoluto del sujeto respecto a algn
dominio de conductas bien definido.
Como seala Muiz (1992), lo que le ha proporcionado una larga vida a la TCT son su sencillez matemtica y
enjundia psicolgica, el xito de la TCT se debe a que proporciona solucin a una amplia gama de problemas de
medida y a que sus supuestos son mnimos. En definitiva, la sencillez, claridad y flexibilidad de sus conceptos,
junto a la simplicidad de sus supuestos y procedimientos han posibilitado que pueda ser aplicada a muchas
situaciones en las que no tienen cabida modelos con supuestos ms restrictivos.
Es un modelo vlido que permite realizar inferencias sobre el nivel en que los sujetos poseen la caracterstica o
rasgo inobservable que mide el test.
Ahora bien, sus ventajas conllevan muchos problemas y algunos de ellas son ciertamente importantes. Entre los
ms relevantes podemos destacar los siguientes:
- Limitaciones relacionadas con los supuestos del modelo. Los supuestos del modelo no pueden ser
contrastados empricamente; por definicin tienen un carcter tautolgico, es decir no pueden ser
evaluados.
- Limitaciones relacionadas con el concepto de tests paralelos. La equivalencia de las medidas paralelas,
en la prctica, es difcil de conseguir. Este supuesto que es clave en la TCT resulta muy restrictivo y rara
vez se cumple.
- Limitaciones relacionadas con los parmetros del modelo. Los parmetros del modelo no son
invariantes, es decir, las puntuaciones de los sujetos dependen de los tems del test y stos a su vez
dependen de la muestra de sujetos a los que se ha aplicado el test. Como sealan Muiz y Hambleton,
1992, si se aspira a una medicin rigurosa y cientfica, resulta difcil justificar que las mediciones estn
en funcin del instrumento utilizado (p.40).
- Limitaciones relacionadas con el concepto de fiabilidad. La fiabilidad del test es un concepto central en
la TCT, y sin embargo no es posible definirlo ni estimarlo de forma unvoca (Lloret, 1999). La
implementacin de mltiples procedimientos para estimarla ha producido confusin en los conceptos de
consistencia interna, homogeneidad y unidimensionalidad y, en consecuencia, el valor del coeficiente
de fiabilidad depende del mtodo de estimacin usado. Ello, unido a que la fiabilidad del instrumento de
medida depende de la longitud del test y de la variabilidad de las respuestas de los sujetos a los que se
les aplica el test, hace que la consideracin de la fiabilidad como una propiedad caracterstica del
instrumento de medida sea difcil de sostener.
- Limitaciones relacionadas con los errores de medida. La consideracin simplista de las fuentes de los
errores de medida, es otra de las crticas, ms importantes al modelo; el carcter nico e indiferenciado
del error de medida obliga a incluir dentro del mismo todas las posibles fuentes de error (variaciones
individuales, factores situacionales, caractersticas del aplicador, variables instrumentales, ..), es decir ,
el modelo presenta serias dificultados al no poder diferenciar las distintas fuentes de error que afectan a
las puntuaciones.
De acuerdo a Muiz (2010) hay dos cuestiones bsicas que no encontraban buena solucin en la teora clsica y
que hacan que la medicin psicolgica no fuese homologable a la que exhiban otras ciencias empricas. Estas
son:
Para hacerlo se transforman las puntuaciones directas de los tests en otras baremadas, por ejemplo
en percentiles, con lo que se considera que se pueden ya comparar, y de hecho as se hace. Este
proceder clsico para solventar el problema de la invarianza (sinnimo de equivalencia, es decir la
probabilidad de obtener puntuaciones iguales en los tests) no es que sea incorrecto, pero descansa
sobre un pilar muy frgil, a saber, se asume que los grupos normativos en los que se elaboraron los
baremos de los distintos tests son equiparables, lo cual es difcil de garantizar en la prctica. Si eso
falla la comparacin se viene abajo. No hay duda que lo ms deseable cientficamente sera que los
resultados obtenidos al utilizar distintos instrumentos estuviesen en la misma escala, y todo
quedara resuelto.
Aparte de estas dos grandes cuestiones, haba otras menores de carcter ms tcnico a las que la
teora clsica no daba una buena solucin. Por ejemplo, cuando se ofrece un coeficiente de fiabilidad
de un test en el marco clsico, como el coeficiente alfa de Cronbach, se est presuponiendo que ese
test mide con una fiabilidad determinada a todas las personas evaluadas con el test, cuando
tenemos evidencia emprica ms que suficiente de que los tests no miden con la misma precisin a
todas las personas, dependiendo la precisin en gran medida del nivel de la persona en la variable
medida.
TEORA DE RESPUESTA A LOS TEMS (TRI)
Quizs es conveniente resaltar la idea de que tanto la TCT como la TRI persiguen el mismo objetivo:
estimar el error que se comete al intentar medir un fenmeno psicolgico especfico.
Son construcciones tericas (con menor o mayor grado de complejidad y profundidad) respecto de
un mismo hecho. Ambas teoras plantean un modelo y un conjunto de supuestos, que si se cumplen,
garantizan la precisin de la medida. Tambin cabe destacar que la coexistencia de ambas teoras no
implica su incompatibilidad. Lejos de competir, estos modelos se complementan en la prctica
psicomtrica para realizar un anlisis ms profundo y exhaustivo de la calidad y/o del
funcionamiento del test.
Ahora bien, para poder hacerlo tiene que formular modelos ms complejos y menos intuitivos que el
modelo clsico, sin que ello suponga que entraen dificultades especiales. Pero antes de pasar a
exponer los fundamentos de estos modelos, vamos a dar unas breves pinceladas de su nacimiento
histrico, para as ayudar al lector a ubicarlos en la historia de la psicologa.
Resea histrica
Birnbaum en los aos cincuenta aporta nuevos avances, pero ser el matemtico dans Rasch
(1960), quien propone su hoy famoso modelo logstico de un parmetro. Bien podemos tomar esa
fecha como el momento de despegue de la TRI, pero el gran impulso lo darn Lord y Novick (1968)
en su famoso libro, en el cual dedican cinco captulos al tema. A partir de su libro las investigaciones
sobre los modelos de TRI dominarn la psicometra, hasta nuestros das. A partir de esa fecha
empiezan a aparecer los programas informticos necesarios para utilizar los modelos de TRI, tales
como BICAL y LOGIST en 1976 entre otros.
En 1980 Lord publicar un influyente libro dedicado a las aplicaciones de la TRI. De esas fechas
hasta hoy los avances han sido notorios, y podemos decir que en nuestros das la TRI domina el
panorama psicomtrico.
.
La teora de Respuesta al tem (TRI), es un modelo estadstico que relaciona
la probabilidad de respuesta a un reactivo (tem) en funcin de un
parmetro especfico y el nivel de rasgo latente (el constructo que se va a
medir) que presenta un determinado sujeto
Parmetros: es el
nivel de
habilidad
denominado
zeta .
- Discriminacin del tem: medida generalmente por la correlacin entre el puntaje en el tem y
el puntaje total de la prueba.
- Dificultad del tem: medida por el porcentaje de respuestas correctas.
- Acierto al azar
El factor comn de estos desarrollos es que establecen una relacin entre el comportamiento de un
sujeto frente a un tem y el rasgo responsable de esta conducta (rasgo latente). Para ello, recurren a
funciones matemticas que describen la probabilidad de dar una determinada respuesta al tem para
cada nivel del rasgo medido por este.