Psicometría

Antecedentes histricos
de las pruebas actuales

principales acontecimientos que forman la base de las pruebas contemporneas, y a ellos
dirigimos ahora nuestra atencin.
INTERS INICIAL EN LA CLASIFICACIN

Y LA CAPACITACIN DE LAS PERSONAS
CON RETARDO MENTAL
El siglo XIX atestigu el surgimiento del inters por el tratamiento humano de las personas
"insanas" y las que sufran de retardo mental. Hasta ese momento, el destino comn de tales
individuos era el descuido, el ridculo e incluso la tortura. Con la nueva preocupacin por el
cuidado adecuado de la gente con problemas mentales, se hizo evidente la necesidad de contar
con criterios uniformes para su identificacin y clasificacin, necesidad que se volvi
verdaderamente urgente con la proliferacin de instituciones sociales dedicadas a estas
personas en todo el mundo. Primero era necesario distinguir entre los individuos insanos y los
que sufran de retardo mental. Los primeros manifestaban trastornos emocionales que podran
o no estar acompaados por un deterioro intelectual a partir de un nivel normal; los segundos
se caracterizaban principalmente por una deficiencia intelectual que estaba presente desde el
nacimiento o la primera infancia. El primer informe explcito de esta distincin se encuentra
quiz en un trabajo publicado en 1838 por el mdico francs Esquirol. Se trata de dos
volmenes en los que dedica ms de 100 pginas a lo que ahora se conoce como "retardo
mental". Esquirol tambin seala que existen muchos grados de retardo, que varan desde la
normalidad hasta la "idiotez profunda". En su esfuerzo por elaborar un sistema para clasificar
los diversos grados y variedades de retardo, Esquirol prob varios procedimientos y lleg a la
conclusin de que el habla proporciona el criterio ms confiable del nivel intelectual del
individuo. Es importante decir que los criterios actuales para determinar el retardo mental
tambin son principalmente lingsticos y que los tests actuales de inteligencia tienen una
fuerte carga de contenido verbal. En los captulos siguientes mostraremos la importante
funcin que cumple la habilidad verbal en nuestro concepto de inteligencia.
De especial significado son las contribuciones de otro mdico francs, Seguin, quien fue
pionero en la capacitacin de los retardados. Luego de rechazar la idea dominante de que el
retardo mental era incurable, Seguin (1866/1907) experiment durante muchos aos con lo
que llam el mtodo fisiolgico de capacitacin, y en 1837 estableci la primera escuela
dedicada a la educacin de los nios retardados. En 1848 emigr a los Estados Unidos, en
donde sus ideas obtuvieron un amplio reconocimiento. Seguin fue el creador de muchas de las
tcnicas de entrenamiento sensorial y muscular que despus fueron adoptadas por las
instituciones de asistencia a los retrasados. Con esos mtodos, los nios con retardo profundo
reciben ejercicio intensivo en discriminacin sensorial y para el desarrollo del control motor.
Algunos de los procedimientos que estableci Seguin con este propsito fueron luego
incorporados a los tests de inteligencia no verbal o de ejecucin. Un ejemplo de lo anterior es el
Tablero de Formas* de Seguin (Seguin Forra Board), en el que el individuo debe insertar
bloques de distinta apariencia en los huecos correspondientes tan rpidamente como
pueda.
Ms de medio siglo despus del trabajo de Esquirol y Seguin, el psiclogo francs
Alfred Binet recomendaba que los nios que no lograran responder a la educacin normal
fueran evaluados antes de expulsarlos y que, de ser considerados educables, fueran
asignados a cursos de educacin especial (T H. Wolf, 1973). Con sus compaeros de la
Sociedad para el Estudio Psicolgico del Nio, Binet exhort al ministro de Instruccin
Pblica a emprender acciones para mejorar las condiciones de los nios retardados. Un
resultado especial fue el establecimiento de una comisin ministerial a cargo de Binet para
el estudio de estos infantes. Tal designacin fue un acontecimiento trascendental en la
historia de las pruebas psicolgicas.
LOS PRIMEROS PSICLOGOS EXPERIMENTALES

En general, los primeros psiclogos experimentales del siglo XIX no estaban interesados en
la medicin de las diferencias individuales. Su objetivo principal era la formulacin de
descripciones generalizadas de la conducta humana, lo que supone que su atencin se
concentraba en las uniformidades ms que en las diferencias conductua-les, y que, por lo
tanto, las diferencias individuales eran ignoradas o aceptadas como un mal necesario que
limitaba la aplicabilidad de las generalizaciones. As, el hecho de que un individuo
reaccionara de manera diferente a otro en las mismas condiciones era considerado como
un error, o variabilidad individual, que disminua la exactitud de las generalizaciones.
sta era la actitud hacia las diferencias individuales que prevaleca en laboratorios como
el fundado por Wundt en Leipzig en 1879, donde se formaron muchos de los primeros
psiclogos experimentales.
Al elegir sus reas de estudio, como en muchas otras fases de su trabajo, los funda-
dores de la psicologa experimental evidenciaban la influencia de sus antecedentes en la
fisiologa y la fsica. Los problemas que estudiaban en sus laboratorios tenan que ver
principalmente con el tiempo de reaccin y con la sensibilidad a estmulos sensoriales
como los visuales y los auditivos. Como veremos en otros captulos, este acento en los
fenmenos sensoriales refleja tambin la naturaleza de las primeras pruebas psicolgicas.
Otra influencia que la psicologa experimental del siglo XIX ejerci en el curso del
movimiento psicomtrico se manifiesta en su insistencia por ejercer un control riguroso
de las condiciones en las que se realizan las observaciones; por ejemplo, la forma de dar
las instrucciones en un experimento de tiempo de reaccin puede aumentar o disminuir
de modo notable la velocidad de la respuesta, y el brillo o el color del fondo pueden
alterar marcadamente la apariencia de un estmulo visual, lo que demuestra la
importancia de que todos los participantes del experimento sean observados en condi-
ciones estandarizadas. Esta estandarizacin del procedimiento lleg a convertirse en una
de las seales distintivas de las pruebas psicolgicas.
Tambin conocido como Tablero de encajamientos. (N. del T.)

CONTRIBUCIONES DE FRANCIS GALTON
El bilogo ingls Francis Galton fue el principal responsable del inicio del movimiento
psicomtrico. Un factor comn en las numerosas y variadas actividades de investi-
gacin de Galton fue su inters por la herencia humana. En el curso de sus
investigaciones sobre esta materia, Galton se dio cuenta de la necesidad de medir las
caractersticas de personas que estaban y no emparentadas, ya que slo de esta manera
poda descubrir, por ejemplo, el grado exacto de parecido entre padres e hijos, herma-
nos y hermanas, primos o gemelos. Con este propsito, Galton convenci a diversas
instituciones educativas de que llevaran registros antropomtricos sistemticos de sus
estudiantes. Tambin estableci un laboratorio antropomtrico en la Exposicin Inter-
nacional de 1884 donde, mediante el pago de tres peniques, se medan ciertos rasgos f-
sicos de los visitantes y se los someta a pruebas de agudeza visual y auditiva, fuerza
muscular, tiempo de reaccin y otras funciones sensoriomotoras simples. Cuando la
exposicin cerr, Galton transfiri el laboratorio al Museo de South Kensington, en
Londres, donde trabaj durante seis aos. Con estos mtodos se acumul
gradualmente el primer cuerpo sistemtico de datos sobre diferencias individuales en
los procesos psicolgicos simples.
El propio Galton elabor varias de las pruebas aplicadas en su laboratorio, muchas de las
cuales siguen siendo conocidas, sea en su forma original o modificada. Entre los ejemplos se
encuentran la barra de Galton para la discriminacin visual de la longitud, el silbato que lleva
tambin su nombre para determinar el mayor tono audible y una serie graduada de pesos para
medir la discriminacin anestsica. Galton crea que las pruebas de discriminacin sensorial
podan servir para estimar el intelecto. A este respecto, haba sido tambin la influencia de las
teoras de Locke. As, Galton escribi: "La nica informacin concerniente a los
acontecimientos externos que nos alcanza parece pasar por la avenida de los sentidos, y entre
ms perceptivos sean los sentidos de las diferencias, mayor ser el campo sobre el que pueden
actuar nuestro juicio y nuestra inteligencia" (Galton, 1883, p. 27). Galton tambin se percat de
que las personas con retardo mental extremo tienden a mostrar defectos en su capacidad para
discriminar entre calor, fro y dolor, una observacin que posteriormente fortaleci su
conviccin de que la capacidad de discriminacin sensorial, "en conjunto, sera ms elevada
entre los intelectualmente aptos" (Galton, 1883, p. 29).
Galton tambin fue pionero en la aplicacin de escalas de calificacin y cuestionarios, as
como en el uso de la tcnica de asociacin libre que posteriormente fue utilizada con diversos
propsitos. Otra de sus muchas contribuciones se encuentra en la formulacin de mtodos
estadsticos para el anlisis de datos sobre las diferencias individuales. Galton tom y adapt
algunas tcnicas matemticas de forma que pudieran ser utilizadas por investigadores sin
conocimientos en la materia que desearan tratar en forma cuantitativa los resultados de sus
pruebas. De esta manera extendi considerablemente la aplicacin de los procedimientos
estadsticos al anlisis de datos de las pruebas. Esta fase del trabajo de Galton fue llevada
adelante por muchos de sus estudiantes, de los cuales Karl Pearson2 fue el ms eminente.
" Para una descripcin fascinante de los primeros avances de los principales conceptos estadsticos y de las personas responsables, vase
Cowles (1989).
CATTELL Y LOS PRIMEROS TESTS MENTALES
El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente en el
adelanto de las pruebas psicolgicas. En su trabajo se combinan la recin establecida ciencia
de la psicologa experimental y el todava ms reciente movimiento psicomtrico. Para
obtener su doctorado en Leipzig redact una tesis sobre el tiempo de reaccin bajo la
direccin de Wundt; y en 1888, mientras enseaba en Cambridge, su trato con Galton
fortaleci su inters por la medicin de las diferencias individuales. A su regreso a los
Estados Unidos, Cattell particip activamente en el establecimiento de laboratorios de
psicologa experimental y en la difusin del movimiento psicomtrico.
El trmino "test mental" apareci por primera vez en la bibliografa psicolgica en un
artculo escrito por Cattell en 1890, que describe una serie de pruebas que cada ao se
aplicaban a los estudiantes universitarios para determinar su nivel intelectual. Las pruebas,
cuya aplicacin era individual, incluan mediciones de la fuerza muscular, velocidad de
movimiento, sensibilidad al dolor, agudeza visual y auditiva, discriminacin de pesos,
tiempo de reaccin, memoria y cosas similares. En su eleccin de las pruebas, Cattell
comparta la opinin de Galton respecto a la posibilidad de obtener una medida de las
funciones intelectuales con el uso de instrumentos de discriminacin sensorial y de tiempo
de reaccin. La preferencia de Cattell por dichas herramientas tambin se sustent en el
hecho de que le permitan medir con precisin y exactitud las funciones simples, mientras
que la obtencin de mediciones objetivas de funciones ms complejas en ese tiempo pareca
una tarea inalcanzable.
Las pruebas de Cattell son caractersticas de los instrumentos desarrollados en la ltima
dcada del siglo XIX, que se aplicaban a escolares, universitarios y adultos. En la Exposicin
de Columbia realizada en Chicago durante 1893, Jastrow mont una exhibicin en la que a
los visitantes se los invitaba a realizar pruebas de procesos per-ceptuales, sensoriales y
motores simples y a comparar su habilidad con las nomias (J. Peterson, 1926, Philippe, 1894).
Los pocos intentos por evaluar estas primeras pruebas arrojaron resultados desalentadores.
El desempeo de cada individuo mostraba poca correspondencia de una prueba a otra
(Sharp, 1898-1899; Wissler, 1901) y su relacin con estimaciones independientes del nivel
intelectual basadas en las calificaciones de los maestros (T. L. Bolton, 1891-1892; J. A. Gilbert,
1894) o con. las calificaciones acadmicas (Wissler, 1901) era poca o nula.
Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir
funciones algo ms complejas. Kraepelin (1895), que estaba interesado sobre todo en la
evaluacin clnica de pacientes psiquitricos, prepar una larga serie de pruebas para medir
lo que consideraba factores bsicos en la caracterizacin del individuo. Las pruebas, que
empleaban principalmente operaciones aritmticas simples, estaban destinadas a medir los
efectos de la prctica, la memoria y la susceptibilidad a la fatiga y la distraccin. Otro
psiclogo alemn, Ebbinghaus (1897), aplic a escolares pruebas de clculo aritmtico,
memoria y completacin de oraciones; esta ltima, que era la ms compleja, fue la nica que
mostr una clara correspondencia con el desempeo escolar.
En un artculo publicado en Francia en 1895, Binet y Henri criticaron el hecho de que
casi todas las pruebas disponibles eran sensoriales y se concentraban indebidamente en
habilidades especializadas simples. Adems, argumentaban que en la medicin de las
funciones ms complejas no se requiere de gran precisin, ya que, en tales funciones, las
diferencias individuales son mayores. Propusieron una amplia y variada lista de tests que
cubran funciones como la memoria, la imaginacin, la atencin, la comprensin, la
susceptibilidad a la sugestin, la apreciacin esttica y muchos otros, en los que podemos
reconocer las tendencias que a la postre condujeron al desarrollo de las famosas escalas de
inteligencia de Binet.
BINET Y EL SURGIMIENTO DE LOS

TESTS DE INTELIGENCIA
Binet y sus colaboradores dedicaron muchos aos a la investigacin activa e ingeniosa de las
formas de medir la inteligencia. Probaron muchos mtodos, incluyendo la medicin de la
forma del crneo, la cara y la mano, as como el anlisis de la escritura; sin embargo, los
resultados los llevaron a la conviccin de que la medicin directa, aunque tosca, de las
funciones intelectuales complejas era la ms promisoria. Entonces una situacin en particular
hizo fructificar los esfuerzos de Binet. En 1904, el Ministerio de Educacin lo comision para
que estudiara procedimientos para la educacin de nios retardados. Fue en relacin con los
objetivos de esta comisin que Binet prepar, en colaboracin con Simn, la primera escala de
Binet-Simon (Binet y Simn, 1905).
Esta escala, conocida como la escala de 1905, constaba de 30 problemas o tests arreglados
en orden de dificultad creciente. El nivel de dificultad se estableci empricamente
aplicndolos a 50 nios normales de tres a 11 aos y a algunos nios y adultos retardados.
Las pruebas fueron diseadas para cubrir una amplia variedad de funciones, con nfasis
especial en el juicio, la comprensin y el razonamiento, que Binet consideraba los
componentes principales de la inteligencia. Aunque incluyeron pruebas sensoriales y
perceptuales, en esta escala se encuentra una proporcin de contenido verbal mayor que en la
generalidad de las pruebas de la poca. Como la escala de 1905 fue presentada como un
instrumento preliminar y tentativo, no se formul un mtodo objetivo preciso para obtener
una puntuacin total.
En la segunda escala, la de 1908, aument el nmero de tests, se eliminaron algunos de la
primera que resultaron insatisfactorios y todos fueron agrupados en niveles de edad sobre la
base del desempeo de alrededor de 300 nios normales de entre tres y 13 aos. De este
modo, en el nivel de tres aos se ubicaron todos los tests que pasaban del 80 al 90 por ciento
de los nios normales de tres aos; en el nivel de cuatro aos, los que aprob el mismo
porcentaje de nios normales de esa edad; y as sucesivamente hasta los 13. La calificacin del
nio en toda la prueba poda entonces expresarse como el nivel mental correspondiente a la
edad de los nios normales cuya ejecucin haba igualado. En las diversas traducciones y
adaptaciones de las escalas de Binet el trmino de "nivel mental" fue sustituido por el de
"edad mental", cuya fcil comprensin indudablemente contribuy a popularizar los tests de
inteligencia;3 sin embargo, el propio Binet evitaba el uso del trmino por sus implicaciones no
verificadas de desarrollo y prefera el ms neutral de "nivel mental" (T. H. Wolf, 1973).
En 1911, ao en que Binet muri intempestivamente, apareci la tercera revisin de la
Escala de Binet-Simon, que no presenta mayores modificaciones, salvo revisiones menores,
cambios en la localizacin de algunos tests, la adicin de otros en varios niveles de edad y la
extensin de la escala al nivel adulto.
Incluso antes de la revisin de 1908, los tests de Binet-Simon atrajeron la atencin de los
psiclogos de todo el mundo. En muchos pases, aparecieron traducciones y adaptaciones,
pero la primera fue la de H. H. Goddard, en ese entonces psiclogo investigador en la Escuela
de Capacitacin de Vineland para nios con retardo mental. La revisin de Goddard result
clave para que la profesin mdica aceptara los tests de inteligencia (Zenderland, 1987).
Apareci en un momento propicio para satisfacer la urgente necesidad de un instrumento
estandarizado para diagnosticar y clasificar a las personas con retardo mental. No obstante,
como herramienta de evaluacin pronto fue dejada atrs por el Stanford-Binet, un
instrumento ms extenso y psicomtrica-mente refinado, elaborado por L. M. Terman y sus
colaboradores en la Universidad de Stanford (Terman, 1916). Este instrumento utiliz por
primera vez el cociente de inteligencia (CI) o razn entre la edad mental y la cronolgica. La
ltima revisin se emplea extensamente y la estudiaremos de manera ms completa en el
captulo 8. Tambin resulta de especial inters la primera revisin Kuhlmann-Binet, que
ampli la escala hasta la edad de tres meses (Kuhlmann, 1912) y representa uno de los
primeros esfuerzos por elaborar tests de inteligencia para preescolares e infantes.
PRUEBAS COLECTIVAS
Los tests de Binet, as como todas sus revisiones, son escalas individuales en el sentido de
que slo pueden aplicarse a una persona y luego a otra. Muchos de los tests de esas escalas
requieren respuestas orales del examinado o la manipulacin de materiales. Algunos
exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras razones, las
pruebas no pueden adaptarse a la aplicacin colectiva. Otra caracterstica de los tests de
Binet es que requieren de un examinador muy capacitado, pues se trata de instrumentos
esencialmente clnicos adecuados para el estudio intensivo de casos individuales.
Las pruebas de grupo similares a la primera escala de Binet fueron elaboradas para
satisfacer Lina necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en la
Primera Guerra Mundial, la Asociacin Estadounidense de Psicologa form una comisin
para considerar cmo poda contribuir la psicologa a la conduccin de la
guerra. La comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpida
clasificacin del nivel intelectual general del milln y medio de reclutas. Esta in-
formacin era importante para tomar muchas decisiones administrativas, incluyendo el
rechazo o la dispensa del servicio militar, la asignacin a diferentes servicios o la ad-
misin a campos de entrenamiento de oficiales. En este ambiente se formul el primer
test colectivo de inteligencia. Para realizar la tarea, los psiclogos acudieron a todos los
materiales disponibles, especialmente a un test colectivo de inteligencia no publicado,
preparado por Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este
instrumento, elaborado por Otis cuando era estudiante en uno de los cursos de grado de
Terman, fue la introduccin de preguntas de opcin mltiple y otros reactivos
"objetivos".
Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a
grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas Alfa y Beta).
La primera se ocupaba de las pruebas generales de rutina, mientras que la segunda era una
escala no lingstica utilizada con reclutas iletrados o procedentes de pases cuyo idioma no
era el ingls.
Poco despus de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron
liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las pruebas
Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos de inteligencia,
lo que contribuy al notable crecimiento del movimiento psicomtri-co. Muy pronto se
prepararon tests colectivos de inteligencia para todas las edades y personas, desde
preescolares hasta universitarios. Los programas de evaluacin a gran escala, otrora
imposibles, se emprendieron con gran entusiasmo. Como las pruebas colectivas fueron
diseadas como instrumentos de evaluacin masiva, no slo permitieron la medicin
simultnea de grandes grupos, sino que tambin simplificaron las instrucciones y los
procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del aplicador.
Los maestros empezaron a aplicar en sus grupos los tests de inteligencia y los estudiantes
universitarios eran evaluados de rutina antes de su ingreso; se iniciaron amplios estudios de
grupos especiales de adultos, como los prisioneros, y muy pronto el pblico general cobr
conciencia del CI.
La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por
obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se olvidaba
que las pruebas an eran tcnicamente imperfectas, de modo que cuando no lograban
cumplir las injustificadas expectativas, se generaba escepticismo y hostilidad hacia todas las
pruebas. De este modo, el auge psicomtrico de los aos veinte, basado en el uso
indiscriminado de los instrumentos, puede haber demorado el progreso de las pruebas
psicolgicas.
TESTS DE APTITUD
Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia
variedad de funciones que permitieran estimar el nivel general de inteligencia del individuo,
pronto se hizo evidente que su alcance era muy limitado. No todas las funciones importantes
estaban representadas. De hecho, la mayor parte de los tests de inteligencia eran
principalmente mediciones de la habilidad verbal y, en menor grado, de la
habilidad para manejar relaciones numricas y otras relaciones abstractas y simblicas.
Gradualmente, los psiclogos reconocieron que el trmino "test de inteligencia" era un
nombre inadecuado, ya que slo medan ciertos aspectos de sta.
Para que resultaran seguros, los instrumentos tocaban habilidades que son de gran
importancia en la cultura para la que fueron diseados, pero pronto se reconoci la
conveniencia de contar con designaciones ms precisas en trminos de la informacin que
podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algunos
instrumentos que en los veinte habran sido llamados de inteligencia. Este cambio en la
terminologa procede del hecho de que muchos de los llamados tests de inteligencia miden
la combinacin de habilidades requeridas y fomentadas por el trabajo universitario.
Incluso antes de la Primera Guerra Mundial, los psiclogos empezaban a admitir la
necesidad de contar con tests de aptitudes especiales que complementaran los de inte-
ligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso en la
orientacin vocacional y en la seleccin y clasificacin de personal industrial y militar.
Entre las ms empleadas estn los tests de aptitud mecnica, profesional, musical y
artstica.
La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado
durante los veinte tambin revel el hecho notable de que el desempeo del individuo a
menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result en
especial evidente en las pruebas colectivas, en las que los reactivos suelen separarse en
subpruebas de contenido relativamente homogneo; por ejemplo, una persona poda
obtener una puntuacin ms bien alta en la subprueba verbal y un pobre resultado en la
numrica o viceversa. Dicha variabilidad interna es hasta cierto grado discemible en un
test como el Stanford-Binet en el que, por ejemplo, todos los reactivos que incluyen
palabras pueden resultar difciles para cierto individuo, mientras que los que emplean
imgenes o diagramas geomtricos pueden resultarle ventajosos.
Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones
internas para obtener un conocimiento ms profundo de la estructura psicolgica del
individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o algn
otro resultado global, sino tambin el desempeo en grupos de reactivos o sub-tests; sin
embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no
fueron diseados con el propsito de realizar un anlisis diferencial de las aptitudes. Con
frecuencia, los subtests comparados contienen muy pocos reactivos para producir una
estimacin estable o confiable de determinada habilidad. Entonces, la diferencia de las
puntuaciones de los subtests se puede revertir si vuelve a examinarse al individuo otro da
o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo
sujeto, es necesario disear las pruebas con el objeto de que revelen diferencias de
ejecucin en diversas funciones.
Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con
mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los
rasgos iba proporcionando los medios para elaborarlos. Los estudios estadsticos sobre la
naturaleza de la inteligencia haban explorado las relaciones entre las puntuaciones
obtenidas por muchas personas en una gran variedad de pruebas. El psiclogo ingls
Charles Spearman (1904, 1927) inici estas investigaciones durante la primera dcada del
siglo XX. Los desarrollos metodolgicos subsecuentes, basados en el trabajo de estudiosos
ingleses y estadounidenses, como T. L. Kelley (1928) y L. L. Thurstone (1938, 1947b),
llegaron a conocerse como anlisis factorial.
En el captulo 11 examinaremos de manera exhaustiva las contribuciones de los mtodos
del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los datos
obtenidos con estos procedimientos sealaron la presencia de diversos factores o rasgos
relativamente independientes, algunos representados en diversas proporciones en los tests
tradicionales de inteligencia, como, por ejemplo, la comprensin verbal y el razonamiento
numrico; otros, como la aptitud espacial, percep-tual y mecnica, se encuentran ms a
menudo en los instrumentos para la medicin de aptitudes especiales que en los de
inteligencia.
Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de las
bateras de aptitudes mltiples, diseadas para proporcionar una medida de la posicin del
individuo en una serie de rasgos. En lugar de una puntuacin total, o CI, estos instrumentos
obtienen una puntuacin aparte para rasgos como la comprensin verbal, la aptitud
numrica, la visualizacin espacial, el razonamiento aritmtico y la rapidez perceptual, lo que
permite realizar el anlisis intrasujeto o diagnstico diferencial en el mismo sujeto que los
usuarios trataron de obtener por muchos aos con los resultados crudos y a menudo errneos
de los tests de inteligencia. Adems, dado que cubren algunos de los rasgos que
generalmente no se incluan en ese tipo de instrumentos tambin incorporaron en un
programa amplio y sistemtico de evaluacin gran parte de la informacin que antes se
obtena de las pruebas de aptitud especial.
Las bateras de aptitudes mltiples representan un desarrollo relativamente tardo en el
campo de las pruebas, ya que casi todas aparecieron a partir de 1945. A este respecto es de
destacar el trabajo de los psiclogos militares durante la Segunda Guerra Mundial. Gran
parte de la investigacin conducida en las fuerzas armadas se bas en el anlisis de factores y
se orient a la preparacin de bateras de aptitudes mltiples; por ejemplo, en la fuerza area
se construyeron bateras especiales para pilotos, bombarderos, operadores de radio,
rastreadores y muchos otros especialistas. El informe de las bateras que elabor la fuerza
area ocupa al menos nueve de los 19 volmenes dedicados al programa psicolgico de la
aviacin durante la Segunda Guerra Mundial (Arniy Air Forces, 1947-1948). La investigacin
en esas lneas an sigue en progreso con el patrocinio de varias ramas de las fuerzas armadas.
Tambin se han realizado bateras para uso civil y se aplican lo mismo en la orientacin
vocacional y educativa que en la seleccin y clasificacin de personal. En los captulos 10 y 17
presentaremos algunos ejemplos.
Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa,
permite la integracin de dos mtodos al principio contradictorios de medicin mental
representados por los tests tradicionales de inteligencia y las bateras de aptitudes mltiples
(Anastasi, 1994). En la actualidad, se reconoce que la habilidad del ser humano puede ser
evaluada de manera adecuada a diferentes niveles de profundidad, desde las aptitudes muy
definidas de las pruebas especficas (o incluso de reactivos), pasando por el nivel de los
rasgos hasta una puntuacin global como el tradicional CI. Para cada propsito de evaluacin
hay un nivel apropiado de profundidad. En
correspondencia, los tests de inteligencia que se han desarrollado recienremente, como las
Escalas de Habilidad Diferencial o las revisiones recientes de tests anteriores, como la
cuarta edicin del Stanford-Binet (que explicaremos en el captulo 8), combinan la amplia
cobertura de diversas aptitudes con calificaciones flexibles de niveles mltiples para
propsitos concretos de evaluacin. Aunque se trata de dos ejemplos de tests de
inteligencia de aplicacin individual, el mismo mtodo amplio y flexible de preparacin y
uso de los instrumentos ha tenido un impacto en las bateras de aplicacin colectiva, como
las que veremos en el captulo 10. En el captulo 1 1 estudiaremos la base terica y las
implicaciones prcticas de esta combinacin de tests de habilidad en relacin con los
adelantos recientes, relativos a la naturaleza de la inteligencia.
PRUEBAS ESTANDARIZADAS DE APROVECHAMIENTO

Mientras los psiclogos se ocupaban de los tests de inteligencia y de aptitud, los ex-
menes escolares tradicionales experimentaban avances tcnicos (O. W. Caldwell y Courtis,
1923; Ebel y Damrin, 1960). Un paso importante en esta direccin lo dieron las escuelas
pblicas de Boston en 1845 cuando los exmenes escritos sustituyeron al interrogatorio
oral de los estudiantes por examinadores visitantes. Entre los argumentos ofrecidos en
apoyo de esta innovacin estaba que los exmenes escritos ponan a los estudiantes en
una situacin uniforme, permitan una cobertura ms amplia del contenido, reducan el
elemento azaroso en la eleccin de reactivos y eliminaban la posibilidad de favoritismo
por parte del examinador. Todos estos argumentos tienen un sonido familiar: fueron
utilizados mucho despus para justificar la sustitucin de los reactivos de ensayo por los
reactivos objetivos de opcin mltiple.
A la vuelta del siglo empezaron a aparecer las primeras pruebas estandarizadas para
medir los resultados de la instruccin escolar. Encabezadas por el trabajo de E. L.
Thorndike, las pruebas empleaban principios de medicin tomados del laboratorio
psicolgico. Entre los ejemplos se incluyen escalas para calificar la calidad de la escritura
y la redaccin, as como pruebas de ortografa, aritmtica, clculo y razonamiento
aritmtico. Despus llegaron las bateras de aprovechamiento, iniciadas con la publi-
cacin de la primera edicin de la Prueba de Aprovechamiento de Stanford (Stanford
Achievement Test) en 1923. Sus autores fueron tres lderes en la elaboracin de pruebas:
Truman L. Kelley, Giles M. Ruch y Lewis M. Teman. Presagiando muchas caractersticas
de la psicometra moderna, esta batera proporcion medidas comparables de ejecucin
en diferentes materias escolares, evaluadas en trminos de un solo grupo normativo.
Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los maestros
al calificar las pruebas de ensayo. Para 1930 era ampliamente reconocido que las pruebas
de ensayo no slo requeran ms tiempo para los examinadores y examinados, sino que
tambin arrojaban resultados menos confiables que el "nuevo tipo" de reactivos
objetivos.4 En la medida en que estos ltimos llevaron al uso creciente de las pruebas
estandarizadas de aprovechamiento, hubo un nfasis mayor en el diseo

Psicometría

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Psicometría

Uploaded by

Copyright:

Available Formats

Antecedentes histricos

de las pruebas actuales

INTERS INICIAL EN LA CLASIFICACIN

LOS PRIMEROS PSICLOGOS EXPERIMENTALES

Tambin conocido como Tablero de encajamientos. (N. del T.)

BINET Y EL SURGIMIENTO DE LOS

PRUEBAS ESTANDARIZADAS DE APROVECHAMIENTO

You might also like