Professional Documents
Culture Documents
" Para una descripcin fascinante de los primeros avances de los principales conceptos estadsticos y de las personas responsables, vase
Cowles (1989).
CATTELL Y LOS PRIMEROS TESTS MENTALES
El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente en el
adelanto de las pruebas psicolgicas. En su trabajo se combinan la recin establecida ciencia
de la psicologa experimental y el todava ms reciente movimiento psicomtrico. Para
obtener su doctorado en Leipzig redact una tesis sobre el tiempo de reaccin bajo la
direccin de Wundt; y en 1888, mientras enseaba en Cambridge, su trato con Galton
fortaleci su inters por la medicin de las diferencias individuales. A su regreso a los
Estados Unidos, Cattell particip activamente en el establecimiento de laboratorios de
psicologa experimental y en la difusin del movimiento psicomtrico.
El trmino "test mental" apareci por primera vez en la bibliografa psicolgica en un
artculo escrito por Cattell en 1890, que describe una serie de pruebas que cada ao se
aplicaban a los estudiantes universitarios para determinar su nivel intelectual. Las pruebas,
cuya aplicacin era individual, incluan mediciones de la fuerza muscular, velocidad de
movimiento, sensibilidad al dolor, agudeza visual y auditiva, discriminacin de pesos,
tiempo de reaccin, memoria y cosas similares. En su eleccin de las pruebas, Cattell
comparta la opinin de Galton respecto a la posibilidad de obtener una medida de las
funciones intelectuales con el uso de instrumentos de discriminacin sensorial y de tiempo
de reaccin. La preferencia de Cattell por dichas herramientas tambin se sustent en el
hecho de que le permitan medir con precisin y exactitud las funciones simples, mientras
que la obtencin de mediciones objetivas de funciones ms complejas en ese tiempo pareca
una tarea inalcanzable.
Las pruebas de Cattell son caractersticas de los instrumentos desarrollados en la ltima
dcada del siglo XIX, que se aplicaban a escolares, universitarios y adultos. En la Exposicin
de Columbia realizada en Chicago durante 1893, Jastrow mont una exhibicin en la que a
los visitantes se los invitaba a realizar pruebas de procesos per-ceptuales, sensoriales y
motores simples y a comparar su habilidad con las nomias (J. Peterson, 1926, Philippe, 1894).
Los pocos intentos por evaluar estas primeras pruebas arrojaron resultados desalentadores.
El desempeo de cada individuo mostraba poca correspondencia de una prueba a otra
(Sharp, 1898-1899; Wissler, 1901) y su relacin con estimaciones independientes del nivel
intelectual basadas en las calificaciones de los maestros (T. L. Bolton, 1891-1892; J. A. Gilbert,
1894) o con. las calificaciones acadmicas (Wissler, 1901) era poca o nula.
Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir
funciones algo ms complejas. Kraepelin (1895), que estaba interesado sobre todo en la
evaluacin clnica de pacientes psiquitricos, prepar una larga serie de pruebas para medir
lo que consideraba factores bsicos en la caracterizacin del individuo. Las pruebas, que
empleaban principalmente operaciones aritmticas simples, estaban destinadas a medir los
efectos de la prctica, la memoria y la susceptibilidad a la fatiga y la distraccin. Otro
psiclogo alemn, Ebbinghaus (1897), aplic a escolares pruebas de clculo aritmtico,
memoria y completacin de oraciones; esta ltima, que era la ms compleja, fue la nica que
mostr una clara correspondencia con el desempeo escolar.
En un artculo publicado en Francia en 1895, Binet y Henri criticaron el hecho de que
casi todas las pruebas disponibles eran sensoriales y se concentraban indebidamente en
habilidades especializadas simples. Adems, argumentaban que en la medicin de las
funciones ms complejas no se requiere de gran precisin, ya que, en tales funciones, las
diferencias individuales son mayores. Propusieron una amplia y variada lista de tests que
cubran funciones como la memoria, la imaginacin, la atencin, la comprensin, la
susceptibilidad a la sugestin, la apreciacin esttica y muchos otros, en los que podemos
reconocer las tendencias que a la postre condujeron al desarrollo de las famosas escalas de
inteligencia de Binet.
PRUEBAS COLECTIVAS
Los tests de Binet, as como todas sus revisiones, son escalas individuales en el sentido de
que slo pueden aplicarse a una persona y luego a otra. Muchos de los tests de esas escalas
requieren respuestas orales del examinado o la manipulacin de materiales. Algunos
exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras razones, las
pruebas no pueden adaptarse a la aplicacin colectiva. Otra caracterstica de los tests de
Binet es que requieren de un examinador muy capacitado, pues se trata de instrumentos
esencialmente clnicos adecuados para el estudio intensivo de casos individuales.
Las pruebas de grupo similares a la primera escala de Binet fueron elaboradas para
satisfacer Lina necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en la
Primera Guerra Mundial, la Asociacin Estadounidense de Psicologa form una comisin
para considerar cmo poda contribuir la psicologa a la conduccin de la
guerra. La comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpida
clasificacin del nivel intelectual general del milln y medio de reclutas. Esta in-
formacin era importante para tomar muchas decisiones administrativas, incluyendo el
rechazo o la dispensa del servicio militar, la asignacin a diferentes servicios o la ad-
misin a campos de entrenamiento de oficiales. En este ambiente se formul el primer
test colectivo de inteligencia. Para realizar la tarea, los psiclogos acudieron a todos los
materiales disponibles, especialmente a un test colectivo de inteligencia no publicado,
preparado por Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este
instrumento, elaborado por Otis cuando era estudiante en uno de los cursos de grado de
Terman, fue la introduccin de preguntas de opcin mltiple y otros reactivos
"objetivos".
Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a
grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas Alfa y Beta).
La primera se ocupaba de las pruebas generales de rutina, mientras que la segunda era una
escala no lingstica utilizada con reclutas iletrados o procedentes de pases cuyo idioma no
era el ingls.
Poco despus de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron
liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las pruebas
Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos de inteligencia,
lo que contribuy al notable crecimiento del movimiento psicomtri-co. Muy pronto se
prepararon tests colectivos de inteligencia para todas las edades y personas, desde
preescolares hasta universitarios. Los programas de evaluacin a gran escala, otrora
imposibles, se emprendieron con gran entusiasmo. Como las pruebas colectivas fueron
diseadas como instrumentos de evaluacin masiva, no slo permitieron la medicin
simultnea de grandes grupos, sino que tambin simplificaron las instrucciones y los
procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del aplicador.
Los maestros empezaron a aplicar en sus grupos los tests de inteligencia y los estudiantes
universitarios eran evaluados de rutina antes de su ingreso; se iniciaron amplios estudios de
grupos especiales de adultos, como los prisioneros, y muy pronto el pblico general cobr
conciencia del CI.
La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por
obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se olvidaba
que las pruebas an eran tcnicamente imperfectas, de modo que cuando no lograban
cumplir las injustificadas expectativas, se generaba escepticismo y hostilidad hacia todas las
pruebas. De este modo, el auge psicomtrico de los aos veinte, basado en el uso
indiscriminado de los instrumentos, puede haber demorado el progreso de las pruebas
psicolgicas.
TESTS DE APTITUD
Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia
variedad de funciones que permitieran estimar el nivel general de inteligencia del individuo,
pronto se hizo evidente que su alcance era muy limitado. No todas las funciones importantes
estaban representadas. De hecho, la mayor parte de los tests de inteligencia eran
principalmente mediciones de la habilidad verbal y, en menor grado, de la
habilidad para manejar relaciones numricas y otras relaciones abstractas y simblicas.
Gradualmente, los psiclogos reconocieron que el trmino "test de inteligencia" era un
nombre inadecuado, ya que slo medan ciertos aspectos de sta.
Para que resultaran seguros, los instrumentos tocaban habilidades que son de gran
importancia en la cultura para la que fueron diseados, pero pronto se reconoci la
conveniencia de contar con designaciones ms precisas en trminos de la informacin que
podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algunos
instrumentos que en los veinte habran sido llamados de inteligencia. Este cambio en la
terminologa procede del hecho de que muchos de los llamados tests de inteligencia miden
la combinacin de habilidades requeridas y fomentadas por el trabajo universitario.
Incluso antes de la Primera Guerra Mundial, los psiclogos empezaban a admitir la
necesidad de contar con tests de aptitudes especiales que complementaran los de inte-
ligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso en la
orientacin vocacional y en la seleccin y clasificacin de personal industrial y militar.
Entre las ms empleadas estn los tests de aptitud mecnica, profesional, musical y
artstica.
La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado
durante los veinte tambin revel el hecho notable de que el desempeo del individuo a
menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result en
especial evidente en las pruebas colectivas, en las que los reactivos suelen separarse en
subpruebas de contenido relativamente homogneo; por ejemplo, una persona poda
obtener una puntuacin ms bien alta en la subprueba verbal y un pobre resultado en la
numrica o viceversa. Dicha variabilidad interna es hasta cierto grado discemible en un
test como el Stanford-Binet en el que, por ejemplo, todos los reactivos que incluyen
palabras pueden resultar difciles para cierto individuo, mientras que los que emplean
imgenes o diagramas geomtricos pueden resultarle ventajosos.
Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones
internas para obtener un conocimiento ms profundo de la estructura psicolgica del
individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o algn
otro resultado global, sino tambin el desempeo en grupos de reactivos o sub-tests; sin
embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no
fueron diseados con el propsito de realizar un anlisis diferencial de las aptitudes. Con
frecuencia, los subtests comparados contienen muy pocos reactivos para producir una
estimacin estable o confiable de determinada habilidad. Entonces, la diferencia de las
puntuaciones de los subtests se puede revertir si vuelve a examinarse al individuo otro da
o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo
sujeto, es necesario disear las pruebas con el objeto de que revelen diferencias de
ejecucin en diversas funciones.
Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con
mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los
rasgos iba proporcionando los medios para elaborarlos. Los estudios estadsticos sobre la
naturaleza de la inteligencia haban explorado las relaciones entre las puntuaciones
obtenidas por muchas personas en una gran variedad de pruebas. El psiclogo ingls
Charles Spearman (1904, 1927) inici estas investigaciones durante la primera dcada del
siglo XX. Los desarrollos metodolgicos subsecuentes, basados en el trabajo de estudiosos
ingleses y estadounidenses, como T. L. Kelley (1928) y L. L. Thurstone (1938, 1947b),
llegaron a conocerse como anlisis factorial.
En el captulo 11 examinaremos de manera exhaustiva las contribuciones de los mtodos
del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los datos
obtenidos con estos procedimientos sealaron la presencia de diversos factores o rasgos
relativamente independientes, algunos representados en diversas proporciones en los tests
tradicionales de inteligencia, como, por ejemplo, la comprensin verbal y el razonamiento
numrico; otros, como la aptitud espacial, percep-tual y mecnica, se encuentran ms a
menudo en los instrumentos para la medicin de aptitudes especiales que en los de
inteligencia.
Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de las
bateras de aptitudes mltiples, diseadas para proporcionar una medida de la posicin del
individuo en una serie de rasgos. En lugar de una puntuacin total, o CI, estos instrumentos
obtienen una puntuacin aparte para rasgos como la comprensin verbal, la aptitud
numrica, la visualizacin espacial, el razonamiento aritmtico y la rapidez perceptual, lo que
permite realizar el anlisis intrasujeto o diagnstico diferencial en el mismo sujeto que los
usuarios trataron de obtener por muchos aos con los resultados crudos y a menudo errneos
de los tests de inteligencia. Adems, dado que cubren algunos de los rasgos que
generalmente no se incluan en ese tipo de instrumentos tambin incorporaron en un
programa amplio y sistemtico de evaluacin gran parte de la informacin que antes se
obtena de las pruebas de aptitud especial.
Las bateras de aptitudes mltiples representan un desarrollo relativamente tardo en el
campo de las pruebas, ya que casi todas aparecieron a partir de 1945. A este respecto es de
destacar el trabajo de los psiclogos militares durante la Segunda Guerra Mundial. Gran
parte de la investigacin conducida en las fuerzas armadas se bas en el anlisis de factores y
se orient a la preparacin de bateras de aptitudes mltiples; por ejemplo, en la fuerza area
se construyeron bateras especiales para pilotos, bombarderos, operadores de radio,
rastreadores y muchos otros especialistas. El informe de las bateras que elabor la fuerza
area ocupa al menos nueve de los 19 volmenes dedicados al programa psicolgico de la
aviacin durante la Segunda Guerra Mundial (Arniy Air Forces, 1947-1948). La investigacin
en esas lneas an sigue en progreso con el patrocinio de varias ramas de las fuerzas armadas.
Tambin se han realizado bateras para uso civil y se aplican lo mismo en la orientacin
vocacional y educativa que en la seleccin y clasificacin de personal. En los captulos 10 y 17
presentaremos algunos ejemplos.
Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa,
permite la integracin de dos mtodos al principio contradictorios de medicin mental
representados por los tests tradicionales de inteligencia y las bateras de aptitudes mltiples
(Anastasi, 1994). En la actualidad, se reconoce que la habilidad del ser humano puede ser
evaluada de manera adecuada a diferentes niveles de profundidad, desde las aptitudes muy
definidas de las pruebas especficas (o incluso de reactivos), pasando por el nivel de los
rasgos hasta una puntuacin global como el tradicional CI. Para cada propsito de evaluacin
hay un nivel apropiado de profundidad. En
correspondencia, los tests de inteligencia que se han desarrollado recienremente, como las
Escalas de Habilidad Diferencial o las revisiones recientes de tests anteriores, como la
cuarta edicin del Stanford-Binet (que explicaremos en el captulo 8), combinan la amplia
cobertura de diversas aptitudes con calificaciones flexibles de niveles mltiples para
propsitos concretos de evaluacin. Aunque se trata de dos ejemplos de tests de
inteligencia de aplicacin individual, el mismo mtodo amplio y flexible de preparacin y
uso de los instrumentos ha tenido un impacto en las bateras de aplicacin colectiva, como
las que veremos en el captulo 10. En el captulo 1 1 estudiaremos la base terica y las
implicaciones prcticas de esta combinacin de tests de habilidad en relacin con los
adelantos recientes, relativos a la naturaleza de la inteligencia.