You are on page 1of 191

ESTADSTICAS

APLICADAS EN
PSICOLOGA
Ciencias sociales y Educacin

PSIC. GERARDO A. VALDERRAMA M .

DICIEMBRE 2011

ESTADSTICAS APLICADAS EN
PSICOLOGA
Ciencias Sociales y Educacin

Psic. Gerardo A. Valderrama M.

Diciembre, 2011

TABLA DE CONTENIDO
DEDICATORIA
AGRADECIMIENTO
PRLOGO
INTRODUCCIN
CAPTULO 1 ESTADSTICAS Y PSICOLOGA ........................................................................................ 1
ESTADSTICAS E INVESTIGACIN ......................................................................................................... 2
Etapa 1 ....................................................................................................................................................... 3
Etapa 2 ....................................................................................................................................................... 3
Etapa 3 ....................................................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPTULO 2 LA NATURALEZA DE LAS ESTADSTICAS .................................................................... 2
LAS POBLACIONES .................................................................................................................................... 4
MEDICIN DE LAS VARIABLES PSICOLGICAS ................................................................................. 5
ESCALAS DE MEDICIN ........................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPTULO 3 ORGANIZACIN DE DATOS DISTRIBUCIONES DE FRECUENCIAS ..................... 8
CONCEPTOS IMPORTANTES .................................................................................................................. 13
EJERCICIOS PRCTICOS ......................................................................................................................... 14
Problema 1 ............................................................................................................................................... 14
Problema 2 ............................................................................................................................................... 14
Problema 3 ............................................................................................................................................... 14
CAPTULO 4 REPRESENTACIONES GRFICAS .................................................................................. 15
GRFICO DE BARRAS.............................................................................................................................. 16
HISTOGRAMA ........................................................................................................................................... 17
POLGONO DE FRECUENCIAS ............................................................................................................... 19
GRFICO DE FRECUENCIAS ACUMULADAS U OJIVA ...................................................................... 21
DIAGRAMA DE TALLO Y HOJAS ........................................................................................................... 22
LOS ORDENADORES Y LAS GRFICAS................................................................................................ 23
CONCEPTOS IMPORTANTES .................................................................................................................. 24
EJERCICIOS PRCTICOS ......................................................................................................................... 25
Problema 1 ............................................................................................................................................... 25
Problema 2 ............................................................................................................................................... 25
CAPTULO 5 MEDIDAS DE TENDENCIA CENTRAL ........................................................................... 26
LA MEDIA ARITMTICA ......................................................................................................................... 26
La media aritmtica para distribuciones de frecuencias ......................................................................... 27
La media aritmtica y los mtodos abreviados ........................................................................................ 28
LOS PROMEDIOS DE POSICIN ............................................................................................................. 29
La mediana (mdn) .................................................................................................................................... 29
La moda (
) .......................................................................................................................................... 32
COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA ............................................................. 34

CONCEPTOS IMPORTANTES .................................................................................................................. 35


EJERCICIOS PRCTICOS ......................................................................................................................... 36
Problema 1 ............................................................................................................................................... 36
CAPTULO 6 MEDIDAS DE VARIABILIDAD ......................................................................................... 37
MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA MEDIA ARITMTICA .................. 37
La Fluctuacin (Amplitud) ....................................................................................................................... 37
Los Percentiles ......................................................................................................................................... 38
MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA ARITMTICA ......................... 40
La Desviacin Media ............................................................................................................................... 40
Desviacin Estndar O Tpica ................................................................................................................. 41
La Asimetra ............................................................................................................................................. 43
La Curtosis ............................................................................................................................................... 44
CONCEPTOS IMPORTANTES .................................................................................................................. 45
EJERCICIOS PRCTICOS ......................................................................................................................... 46
Problema 1 ............................................................................................................................................... 46
CAPTULO 7 MODELOS POBLACIONALES PROBABILSTICO ...................................................... 47
VARIABLES DISCRETAS ......................................................................................................................... 48
La Distribucin Binomial ......................................................................................................................... 48
VARIABLES CONTNUAS ........................................................................................................................ 49
Puntuaciones estndar ............................................................................................................................. 49
La Distribucin Normal ........................................................................................................................... 51
Aproximacin Normal De La Distribucin Binomial .............................................................................. 56
CONCEPTOS IMPORTANTES .................................................................................................................. 58
EJERCICIOS PRCTICOS ......................................................................................................................... 59
Problema 1 ............................................................................................................................................... 59
Binomial ................................................................................................................................................... 59
Aproximacin Normal A La Binomial ...................................................................................................... 60
CAPTULO 8 CORRELACIN Y REGRESIN ...................................................................................... 61
CORRELACIN MLTIPLE ..................................................................................................................... 71
Como Interpretar El Coeficiente De Correlacin. ................................................................................... 72
REGRESIN LINEAL SIMPLE. ................................................................................................................ 73
Error Tpico De La Estimacin ................................................................................................................ 75
CONCEPTOS IMPORTANTES .................................................................................................................. 77
EJERCICIOS PRCTICOS ......................................................................................................................... 78
Problema 1 ............................................................................................................................................... 78
CAPTULO 9 ESTADSTICA INFERENCIAL Y PROBABILIDADES ................................................. 79
TEORA DE LA PROBABILIDAD (TP)..................................................................................................... 80
El Experimento Aleatorio ......................................................................................................................... 81
Probabilidad ............................................................................................................................................ 83
Axiomas De Probabilidad ........................................................................................................................ 84
ASPECTOS BSICOS EN ELCLCULO DE PROBABILIDADES ......................................................... 85
CONCEPTOS IMPORTANTES .................................................................................................................. 89
EJERCICIOS PRCTICOS ......................................................................................................................... 90
CAPTULO 10 DE LA POBLACIN A LA MUESTRA ........................................................................... 92

QU ES UNA VARIABLE ALEATORIA? ........................................................................................................... 92


QU ES UNA DISTRIBUCIN MUESTRAL DE PROBABILIDADES? ................................................................... 94
ESTIMACIN ESTADSTICA ................................................................................................................... 97
Estimacin Puntual: ................................................................................................................................. 97
Estimacin Por Intervalos: ...................................................................................................................... 97
MTODOS DE MUESTREO ...................................................................................................................... 99
Muestreo No Aleatorio:.......................................................................................................................... 100
Muestreo Aleatorio: ............................................................................................................................... 100
DETERMINACIN DEL TAMAO DE LA MUESTRA: N .................................................................... 103
Tamao De Poblacin Desconocido ...................................................................................................... 104
Tamao De Poblacin Conocido ........................................................................................................... 104
CONCEPTOS IMPORTANTES ................................................................................................................ 105
EJERCICIOS PRCTICOS ....................................................................................................................... 106
CAPTULO 11 INTRODUCCIN A LA PRUEBA DE HIPTESIS ..................................................... 109
LA PRUEBA DE HIPTESIS ................................................................................................................... 110
PASO 1: Hiptesis Estadstica ............................................................................................................... 111
PASO II: Nivel De Significacin ............................................................................................................ 112
PASO III: Estadstico De Prueba........................................................................................................... 116
PASO IV: Regla De Decisin ................................................................................................................. 117
PASO V: Aplicacin de la Prueba Estadstica ....................................................................................... 117
PASO VI: Decisin................................................................................................................................. 118
CONCEPTOS IMPORTANTES ................................................................................................................ 118
CAPTULO 12 PRINCIPALES TIPOS DE PRUEBA DE HIPTESIS ................................................. 119
PRUEBAS DE HIPTESIS PARA POBLACIONES O DATOS DISTRIBUIDOS NORMALMENTE. . 119
El Caso De Una Media Poblacional ...................................................................................................... 119
El Caso De Dos Medias Poblacionales ................................................................................................. 121
PRUEBA DE HIPTESIS PARA MUESTRAS PEQUEAS................................................................... 123
Grados De Libertad ............................................................................................................................... 123
La Prueba t de Student ...................................................................................................................... 125
Prueba t para el caso de una media poblacional .............................................................................. 126
Prueba t para el caso de dos medias independientes ........................................................................ 127
Prueba t para dos muestras correlacionadas .................................................................................... 129
Prueba t para correlaciones .............................................................................................................. 131
CONCEPTOS IMPORTANTES ................................................................................................................ 132
EJERCICIOS PRCTICOS ....................................................................................................................... 133
Muestras grandes: pruebas de hiptesis para medias ........................................................................... 133
Muestras pequeas: pruebas de hiptesis para medias y correlaciones ............................................... 134
CAPTULO 13 ANLISIS DE LA VARIANZA ....................................................................................... 136
LA DISTRIBUCIN F ............................................................................................................................... 136
Principios del ANOVA ........................................................................................................................... 138
Anova Simple o en un solo sentido ......................................................................................................... 139
La Prueba de comparacin de dos medias de Tukey. ............................................................................ 143
Anova Factorial (dos o ms variables independientes) ......................................................................... 145
CONCEPTOS IMPORTANTES ................................................................................................................ 152
EJERCICIOS PRCTICOS ....................................................................................................................... 153
Anlisis de la Varianza Simple o de Un Solo factor .............................................................................. 153

APNDICE 1 DISTRIBUCIN NORMAL ............................................................................................... 157


APNDICE 2 VALORES CRTICOS DE LA DISTRIBUCIN T DE STUDENT .............................. 158
APNDICE 3 VALORES CRTICOS DE LA DE DISTRIBUCIN F DE FISHER ............................ 159
APNDICE 4 PROBABILIDADES BINOMIALES ................................................................................. 163
APNDICE 5 DISTRIBUCIN T DE STUDENT: SIGNIFICANCIA DE CORRELACIONES DE
PEARSON ..................................................................................................................................................... 168
APNDICE 6 VALORES CRTICOS DEL ESTADSTICO DE Q ........................................................ 169
APNDICE 7 TABLA DE NMEROS AL AZAR ................................................................................... 170
BIBLIOGRAFA .......................................................................................................................................... 174

DEDICATORIA

Quiero dedicar esta obra, a mi querida esposa


Bedsy Anais, a mis hijas e hijos: Lisbet, Marta,
Gerardo y Juan Carlos, smbolos permanentes
de mi existencia, mis principios y mi amor por
la vida.

AGRADECIMIENTO
Esta obra no se hubiera podido haber completado, sin la colaboracin permanente de la Psicloga
Elsa I. Fajardo, Magister en Estadsticas Aplicadas, quien colabor desde un principio con el
desarrollo de este trabajo a travs de sus observaciones, crticas y evaluaciones tcnicas, de manera
desinteresada, honrada y motivadora.
Es necesario extender este agradecimiento al Psiclogo Rubn Daz, quien aport en el desarrollo
de esta obra, adems de sus conocimientos en el rea, una dimensin tcnica de presentacin de
grficos, cuadros y frmulas, que me ayudaron a enriquecer el objetivo principal de esta obra:
llegar a mis estudiantes con la mayor claridad y objetividad posible.
Tambin deseo expresar mi gratitud, a mis estudiantes de las Escuelas de Psicologa de la
Universidad de Panam y la Universidad Catlica Santa Mara La Antigua, quienes han sido a lo
largo de estos aos de docencia, mi fuente de inspiracin para transmitir, de la manera ms
eficiente, la importancia que tiene una especialidad, considerada por la mayora como difcil, pero
insustituible en el desarrollo de la investigacin del comportamiento: las estadsticas.

Gerardo A. Valderrama M.

PRLOGO
La presente obra es un texto de estadsticas descriptivas e inferenciales dirigida especialmente a los
futuros psiclogos, estudiantes de licenciatura en Psicologa. La finalidad principal es ofrecer a los
estudiantes un libro que integre las herramientas de anlisis estadsticos y sus aplicaciones a su
quehacer profesional.
Su autor ha dedicado ms de 30 aos de su vida a la docencia en materia de Estadsticas,
Investigacin y Medicin Psicolgica as como una invaluable experiencia en numerosas
investigaciones a nivel nacional e internacional. Su amplia experiencia y estudios garantizan que la
presente obra cuente con el rigor estadstico y aplicacin psicolgica necesarias tanto para el
pblico objetivo de la misma, como para cualquier otro profesional de las Ciencias Sociales que
requiera este nivel de conocimientos.
Este libro permite adentrarse en el mbito de la ciencia, la psicologa, la investigacin del
comportamiento humano y a la vez aplicar los modelos y anlisis estadsticos pertinentes.
El texto va desde un nivel introductorio sobre la relacin inherente de la ciencia, la psicologa, la
medicin del comportamiento y la naturaleza estadstica de los datos hasta llegar a los distintos
anlisis estadsticos que aplican desde los ms bsicos (resumen de datos en tablas, grficas,
medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos
poblaciones de probabilidades y pruebas de hiptesis).
El texto es de fcil manejo y con suficientes definiciones, demostraciones y prcticas para que el
estudiante logre aprehender su contenido. Por su amigable lenguaje y ejemplos aplicados, requiere
una preparacin matemtica bsica.
Esta obra logra abordar temas extremadamente densos y complejos como las pruebas de hiptesis y
el anlisis de varianza pero tomando de cada uno lo medular: concepto, aplicacin, clculo e
interpretacin de manera inusualmente prctica y manejable. Sin perder, el rigor estadstico
requerido.
En resumen, esta obra acadmica constituye una alternativa de aproximacin para la integracin de
la teora psicolgica, la prctica y la investigacin.

Elsa Isabel Fajardo


Lcda. en Psicologa
Mgtra. en Estadsticas Aplicadas

INTRODUCCIN
Al iniciar un curso de estadsticas aplicadas en psicologa, es frecuente que algunos estudiantes se
me aproximen y cuestionen sobre la pertinencia de las matemticas, especficamente, de las
estadsticas, en los estudios relacionados con las ciencias del comportamiento. Es evidente que an,
algunos estudiantes conciben a la psicologa como una especialidad terico-prctica, cuyo objetivo
principal es la atencin de los problemas de los sujetos, ya sean de carcter individual y/o grupal,
exenta de aspectos cuantitativos que impliquen cuantificacin y manipulacin matemtica.
Adems, por lo general los estudiantes que ingresan a psicologa no son fanticos de las
matemticas y mantienen una actitud poco favorable para el estudio sistemtico de la misma. Sin
embargo, no puedo negar que hay un cambio de actitud en lo referente a la importancia que se le da
a las estadsticas en la formacin profesional del psiclogo; no hay alternativa, si queremos ser
competentes y competitivos.
En la dcada de los 80, cuando la Escuela de Psicologa de la Universidad de Panam formaba parte
de la Facultad de Filosofa, Letras y Educacin, confeccionamos un folleto que denominamos:
Estadstica Descriptivas Aplicadas en Psicologa,, con el cual intentamos aproximarnos
acadmicamente, a nuestros estudiantes, transmitindole nuestros conocimientos, inquietudes y
actitudes hacia esta asignatura, en un lenguaje ms amistoso, y ms propio de nuestra cultura y de
mi perspectiva personal de la materia. El folleto fue exitoso desde el momento en que muchos
estudiantes lo obtuvieron y lo utilizaron, ya sea como texto o como apoyo bibliogrfico para
reforzar su proceso de aprendizaje.
Es importante destacar que siempre han existido excelentes textos de estadsticas al alcance de
nuestros estudiantes, inclusive haciendo nfasis en su aplicabilidad en las ciencias del
comportamiento. Ms sin embargo, desde mi punto de vista, los mismos por lo general estaban
polarizados: por un lado, encontramos los cargados en matemticas que eran un verdadero dolor de
cabeza para los estudiantes; y por otro, aquellos que consideraban a los estudiosos de la psicologa,
sujetos incapaces de aproximarse exitosamente a los procesos de razonamiento numrico, y se
caracterizaban por su exagerada simplicidad, convirtindolos en textos con muy poco nivel
cuantitativo. El detalle estaba en lograr concebir un texto que, sin caer en exigencias matemticas
innecesarias, pero respetando su pertinencia, tanto terica como prctica, favoreciera el estudio
sistemtico de las estadsticas y permitiera al estudiante su aplicacin, con validez, sistematizacin
y sustento cientfico.
A continuacin presentamos de manera experimental, nuestra concepcin de las estadsticas
bsicas que deben ser dominadas por un profesional de la psicologa. Est escrito con nuestras
propias palabras, actitudes, sentimientos y emociones; tal y como me dirijo al estudiante en el aula
de clases. Espero que esta forma de comunicacin mejore el inters de los estudiantes hacia la
asignatura, reduzca un poco la brecha que hay en trminos de razonamiento cuantitativo y
modifique las actitudes hacia esta importante asignatura, cuyo conocimiento es inevitable para todo
aquel profesional de las ciencias del comportamiento, respetuoso de sus obligaciones hacia sus
pacientes y la sociedad. Pero no olvide esta premisa: mientras ms conocimientos tenga en el rea
de las matemticas, y mejor actitud manifieste hacia la utilizacin de las mismas en la profesin,
indudablemente que ser un mejor psiclogono le quepa la menor duda.

El presente texto, que hemos denominado: Estadsticas Aplicadas en PsicologaCiencias


Sociales y Educacin, consta de 13 captulos de estadsticas aplicadas formales y un captulo de
problemas y ejercicios. Los 13 captulos estn organizados de tal manera, que permiten dividir los
contenidos en las dos grandes reas de conocimientos y estudio de las estadsticas: la descriptiva y
la inferencial. Adems, antes de adentrarnos en el procesamiento y anlisis de datos, intentamos
una importante aproximacin a la investigacin aplicada en psicologa, que en mi opinin
representa el ms alto nivel de desarrollo profesional en esta especialidad (junto con la
investigacin bsica o pura). La estadstica es una herramienta fundamental en el desarrollo de la
actividad cientfica para los psiclogos. Dos aspectos ineludibles de la esta profesin estn
fundamentados en las estadsticas: la medicin del comportamiento, desde sus perspectivas tericas
y prcticas, y la investigacin cientfica.
El rea de la estadstica descriptiva la comprenden los captulos que se refieren a la naturaleza de
las estadsticas (2), la organizacin de datos (3), las representaciones grficas (4), las medidas de
tendencia central (5), las medidas de variabilidad (6), los modelos poblacionales (7) y la correlacin
y regresin (8). En estos captulos presentamos, analizamos, discutimos y desarrollamos ejercicios,
con el objetivo de que el estudiante comprenda de qu manera se le hace frente a la informacin
cuantitativa que se utiliza en los diversos estudios comportamentales; todo proceso de anlisis
estadstico requiere de la descripcin de los datos, esto es ineludible.
La estadstica inferencial est desarrollada en los captulos de estadstica inferencial y
probabilidades (9), de la poblacin a la muestra (10), introduccin a la prueba de hiptesis (11),
principales tipos de pruebas de hiptesis (12) y
anlisis de la varianza (13). En esos captulos compartimos nuestras experiencias y conocimientos
en lo referente al estudio de las poblaciones a travs de muestras, que es el procedimiento ms
efectivo para investigar los grandes conjuntos de datos. Esta situacin obliga al psiclogo a
comprender que entre la poblacin y la muestra hay diferencias, y que si est verdaderamente
interesado en interpretar correctamente los resultados, debe saber comprender e interpretar estas
diferencias, a travs de la comprensin del papel que juega en las decisiones de la psicologa, la
teora de la probabilidad; esto es en el fondo, el objetivo que tratamos de alcanzar con estos
captulos de introduccin a la inferencia estadstica
Este libro es muy sencillo en comparacin con otros, es menos matemtico en comparacin con
otros, respeta la cuantificacin y la importancia de las matemticas en la actividad del psiclogo en
comparacin con otros. Sin embargo est hecho con amor y respeto hacia los estudiantes y hacia
los conocimientos que intento representar. Pedimos disculpas por los errores que encuentren a lo
largo de la lectura y estamos totalmente anuentes a las observaciones que tengan a bien
hacernos..Y no olviden: ms conocimientos y mejor actitud hacia la investigacin cuantitativa,
mayores probabilidades de xito profesional, especialmente en las reas referentes al
comportamiento humano.

Gerardo Abraham Valderrama Morales.

CAPTULO 1
ESTADSTICAS Y PSICOLOGA
Al iniciar un curso de estadsticas para estudiantes de psicologa, es frecuente que algunos de ellos,
intrigados, pregunten la razn por la cual en esta especialidad es necesario estudiar una asignatura
con un contenido cuantitativo importante. La concepcin generalizada es que la psicologa es una
especialidad terico-prctica, cuyo objetivo principal es atender problemas de conducta, tanto
individuales como grupales, sin la participacin de elementos cuantitativos; seamos ms objetivos,
sin matemticas.
Esta actitud de duda, y en algunas ocasiones de rechazo, est relacionada con la experiencia y
formacin previa de muchos estudiantes en al rea de las matemticas, la cual con mucha frecuencia
ha sido dolorosa y de aporte limitado, en cuanto al desarrollo del conocimiento. Es comn en los
estudiantes una actitud de temor y poco inters hacia esta rea cientfica. La situacin anteriormente
descrita no es exclusiva de los estudiantes, al observarse la misma en algunos profesionales del rea
del comportamiento en cualquiera de sus especialidades, haciendo ms difcil la transmisin del
conocimiento de los temas que involucran la cuantificacin al momento de estudiarse el
comportamiento humano.
Sin embargo, a pesar de lo anteriormente sealado, la mayora de los especialistas en el
comportamiento coinciden en que la psicologa dio sus primeros pasos como una ciencia, a partir
del momento en que logr aplicar el mtodo cientfico. En mi opinin, esto sucedi especficamente
en el momento en que se logr definir los conceptos tericos presentes en las teoras de manera
operacional, lo cual trajo como consecuencia inevitable: la medicin del comportamiento. A partir
de esta situacin, la psicologa cont con una nueva herramienta que favoreci la transicin de la
especulacin a la observacin ms directa y natural de los fenmenos comportamentales, y su
posterior anlisis objetivo y preciso. Haba nacido la psicologa cientfica.
La medicin psicolgica, a travs de las definiciones operacionales, permiti adscribirle valores
numricos, no solamente a algunos fenmenos de observacin directa asociados con el
comportamiento tales como la estatura, el peso corporal, la presin sangunea, etc., sino a otros que
no se pueden observar directamente con tanta facilidad, tal y como sucede con factores
comportamentales tales como la inteligencia, las actitudes, las aptitudes, y otros. De esta manera,
las matemticas se convirtieron en colaboradoras permanentes de la investigacin psicolgica en la
solucin de sus problemas: la comprobacin cientfica, era una realidad.
Las estadsticas aplicadas han resultado ser el conjunto de tcnicas matemticas de mayor eficiencia
en la investigacin psicolgica. Ya Lun Chou (1972) present una definicin del trmino
estadstica muy importante para los investigadores en general y en especial, para los psiclogos:
la estadstica es un mtodo empleado en la toma de decisiones frente a la
incertidumbre, partiendo de datos numricos y calculando los riesgos

2
Esta definicin cuenta con cuatro elementos fundamentales, a travs de los cuales se justifica
plenamente la pertinencia de las estadsticas en la investigacin psicolgica: toma de decisiones,
incertidumbre, datos numricos y riesgos; veamos su relacin con la psicologa.
La psicologa es una ciencia muy especial. No cuenta con un cuerpo nico y universal de teoras e
hiptesis; por el contrario, cuenta con un nmero plural de stas, a travs de los cuales se intenta
describir, explicar, analizar e interpretar la conducta del hombre; la psicologa cuenta con muchas
corrientes o escuelas. Lo importante de esta situacin es que todas funcionan a niveles tericos y
que requieren, constantemente de comprobacin y evaluacin de sus postulados tericos y
epistemolgicos. En otras palabras, el psiclogo se enfrenta constantemente a la toma de
decisiones sin importar a que corriente psicolgica pertenezca o en qu rea de la psicologa est
laborando. Todo problema del comportamiento, ya sea individual o grupal, requiere de una toma de
decisin, y muchos de ellos necesitan la cuantificacin de sus variables y el anlisis estadstico
requerido para lograr una solucin cientficamente acertada.
Los problemas asociados con el comportamiento no son estticos, muy por el contrario, son muy
dinmicos. Son universales pero pueden diferir de sujeto a sujeto, de sociedad a sociedad, de
poblacin a poblacin, de muestra a muestra; lo que es vlido para un grupo no lo es para otros, lo
que se logr demostrar hoy, no se repite en las mismas condiciones maana, y as sucesivamente. El
psiclogo se enfrenta a la incertidumbre propia de los fenmenos conductuales, la cual ha
encontrado en la teora de la probabilidad un modelo de explicacin, evaluacin e investigacin; la
conducta no es exacta en su medicin y evaluacin, sino aproximada. La conducta es
probabilstica.
La psicologa, a travs de las escalas de medicin, ha logrado asignarle valores numricos a sus
constructos tericos cuando stos se han definido operacionalmente, favoreciendo de esta manera la
evaluacin del comportamiento con niveles de objetividad muy satisfactorios. Partiendo de la
premisa de que la medicin del comportamiento no es exacta sino aproximada, las estadsticas
aplicadas a la investigacin del comportamiento han logrado incorporar el concepto de
probabilidad a la medicin y evaluacin comportamental. El anlisis estadstico ha permitido
calcular los riesgos propios de esta actividad, favoreciendo la minimizacin de los errores y la
disminucin de la incertidumbre al momento de la toma de decisiones.
Las estadsticas estn estrechamente ligadas con la psicologa, en la medida en que los estudiantes,
profesores y especialistas del comportamiento, en cualquiera de sus reas e independientes de su
formacin, le den relevancia a la investigacin cientfica y consideren esta actividad, el mtodo ms
adecuado para conocer y comprender el comportamiento humano. En tal caso, las estadsticas sern
la mejor herramienta para la evaluacin comportamental precisa., vlida y confiable.
ESTADSTICAS E INVESTIGACIN
Partiendo de la premisa de que la investigacin cientfica es una actividad fundamental en el
desarrollo de la psicologa, y de que las estadsticas son herramientas bsicas en la investigacin del
comportamiento, a continuacin presentamos un resumen de los principales pasos a seguir en el
proceso de investigacin. Adems, intentaremos ir sealando los momentos en que el investigador

3
debe ir tomando en consideracin los procedimientos estadsticos requeridos para la ejecucin
exitosa de una investigacin.
Etapa 1
1. Planteamiento del problema
Toda investigacin nace a partir del planteamiento de un problema que requiere una solucin. En el
caso de los estudiantes, y principalmente por falta de experiencia, el problema nace de la intuicin,
de sus intereses personales o sencillamente porque se le ocurri. Con mucha frecuencia, cuando los
problemas a investigar nacen de alguna de las formas anteriormente sealadas, se presentan
problemas de orden metodolgico que dificultan el desarrollo del estudio.
Los problemas a investigar no se inventan, ellos existen; el detalle est en tener la habilidad para
detectarlo y definirlo con claridad y objetividad, evitando confusiones y tratando de hacerlo lo ms
sencillo posible: el principio de la parsimonia. La observacin, la lectura especializada, el estudio
constante y sistemtico y la discusin cientfica objetiva y desapasionada, son fuentes inagotables
de ideas que pueden cristalizar en problemas de investigacin genuinos.
2. Revisin Bibliogrfica
Una vez planteado el problema, es necesaria una revisin exhaustiva de la informacin cientfica
recabada sobre el problema planteado: investigaciones previas, teoras, ensayos, conferencias,
entrevistas personales, y toda fuente de informacin que brinde informacin objetiva y cientfica. El
objetivo principal de esta revisin, es el de encontrar (descubrir) posibles soluciones, variables y sus
relaciones, explicaciones tericas (modelos), que permitan al investigador desarrollar una
explicacin coherente y cientfica de los factores que inciden en el problema planteado y que a la
vez favorezcan el desarrollo de un modelo terico aplicable a dicho problema; a esta estructura se le
llama con frecuencia Fundamentacin Terica del Problema. A travs de esta figura, el
investigador crea un modelo terico que debe explicar de manera organizada la estructura dinmica
del problema (variables y relaciones) y debe plantear una posible solucin al mismo. De aqu se
desprenden las hiptesis de investigacin.
En la actualidad, gracias al desarrollo de la tecnologa, el conocimiento es ms fcil de obtener que
en dcadas pasadas, en las cuales los investigadores slo dependan de las bibliotecas, libreras,
congresos, etc., para la consecucin de los ltimos conocimientos cientficos. Con el desarrollo de
los ordenadores y el advenimiento del Internet, el conocimiento est a la vuelta de un click, que
permite accesar fuentes inagotables de informacin al servicio de la investigacin cientfica.
Etapa 2
Metodologa
Luego de planteado el problema, fundamentado tericamente tras una revisin bibliogrfica
efectiva, y planteadas las correspondientes hiptesis, la siguiente etapa consiste en establecer
sistemticamente los procedimientos, las tcnicas, la logstica y los controles requeridos para llevar
adelante el estudio, preferiblemente en una muestra de sujetos seleccionados de la poblacin

4
pertinente al problema de investigacin. Esta fase se conoce como metodologa y a continuacin
presentamos algunas caractersticas de la misma.
1. Tipo de Investi gacin
Las investigaciones deben definirse dentro de ciertos parmetros que permitan identificar con
claridad los elementos propios del problema y las condiciones requeridas para la solucin del
mismo. Las investigaciones pueden clasificarse como bsicas cuando tienen como objetivo crear o
alimentar las teoras ya existentes; tambin se les conoce como puras. Las investigaciones tambin
pueden ser definidas como aplicadas, cuando su objetivo es la solucin de un problema dentro de
un contexto social. Atendiendo a las dos definiciones sealadas anteriormente, las investigaciones
que se desarrollan en nuestro contexto cientfico pueden ser bsicas o aplicadas, siendo las ms
frecuentes, stas ltimas.
Las investigaciones tambin se pueden clasificar como de campo cuando se desarrollan en un
contexto social especfico, y de laboratorio cuando las condiciones de control son muy rigurosas y
por lo general las variables no se manifiestan naturalmente.
2. Diseo de Investigacin
La tarea de disear corresponde a la definicin y delimitacin de las condiciones de control a travs
de las cuales se va a investigar un problema especfico. El objetivo fundamental del diseo es el de
aislar la variable independiente a tal punto que los resultados obtenidos se deban, presumiblemente,
a la accin de dicha variable y no de otras variables rivales. Los diseos pueden ser experimentales,
cuasiexperimentales, no experimentales, correlacionales, etc., atendiendo a las situaciones de
manipulacin de las variables involucradas.
3. Variables
Las variables corresponden a ciertas propiedades que se dan en los sujetos, tomando en
consideracin, las diferencias individuales. Estas son susceptibles de ser manipuladas por el
investigador. Las tres variables identificadas como las ms importantes en todo proceso de
investigacin son: la independiente, la dependiente y las extraas. De acuerdo a Aroldo
Rodrguez (1977), estas variables se pueden definir de la siguiente manera:

Variable Independiente: es la propiedad manipulada por el experimentador y que se supone


ser responsable de las modificaciones de la propiedad observada mediante la investigacin
experimental.

Variable dependiente es la propiedad afectada por la variable independiente; es la que se


supone debe modificarse y esta modificacin debe ser susceptible de ser medida y evaluada por
el investigador.

Variables extraas son aquellas que pueden influir en los resultados del experimento sin que
en el modelo su efecto est considerado. Las variables extraas compiten con la variable
independiente y por lo general son las que el investigador intenta controlar en su diseo.

5
4. Muestras
Se refieren a conjuntos o grupos de sujetos seleccionados de las poblaciones en las cuales se
desarrollan las investigaciones. Las muestras pueden ser representativas o no representativas de una
poblacin, y estas condiciones son importantes al momento de analizar estadsticamente los
resultados, en vista de que la eleccin del modelo estadstico est determinada por la
representatividad o no de la muestra con respecto de una determinada poblacin.
5. Tcnicas de Medicin
En psicologa, los resultados obtenidos en una investigacin son recabados a travs de instrumentos
de medicin especiales denominados, por lo general, test psicolgicos. Los psiclogos cuentan con
una pluralidad de organizaciones internacionales que se responsabilizan por la construccin de tests,
aplicables en casi todas las situaciones de medicin y evaluacin del comportamiento. Estos tests
son construidos siguiendo teoras y mtodos muy especializados, lo que permite que dichos
instrumentos sean objetivos, vlidos y confiables. Sin embargo, los psiclogos deben estar
preparados para hacerle frente a situaciones en las cuales los instrumentos utilizados no satisfacen
plenamente los criterios cientficos de construccin de pruebas pero sus resultados deben ser
utilizados a pesar de estas deficiencias. En otras ocasiones, los psiclogos deben construir los
instrumentos de medicin requeridos para sus estudios.
En cualquiera de estos casos, los psiclogos deben estar en capacidad de construir los instrumentos
de evaluacin psicolgica que requieran para sus estudios e investigaciones. Es una obligacin del
psiclogo conocer con rigurosidad las teoras y tcnicas propias de la medicin psicolgica, ya sea
para interpretar resultados provenientes de pruebas de calidad indiscutible, como para construir los
test que necesite en situaciones especficas. En el caso de la medicin psicolgica, la estadstica es
una herramienta crucial en la elaboracin de test.
6. Modelo Estadstico
Se refiere a los procedimientos de procesamiento y anlisis estadstico de los datos que provienen
de las investigaciones. Incluye los supuestos, modelos, metodologa y pruebas estadsticas
requeridas en la investigacin. Los modelos estadsticos pueden ser paramtricos o no paramtricos
y los mismos estn apoyados por supuestos de carcter probabilsticos.
Los modelos estadsticos que se utilizan en las investigaciones estn previamente determinados por
el problema planteado, las hiptesis de investigacin, el tipo y diseo de investigacin, el tipo de
medicin de las variables involucradas y los instrumentos o test psicolgicos aplicados en el estudio
Etapa 3
1. Anlisis Estadstico
Una vez recogida la data proveniente de las mediciones psicolgicas, el paso siguiente sera la
organizacin y anlisis estadstico de los resultados obtenidos, utilizando los modelos, metodologa
y procedimientos estadsticos previamente sealados. Bsicamente se desarrollan dos tipos de
anlisis: descriptivos y/o inferenciales.

6
2. Discusin
Concluido los anlisis estadsticos, los resultados deben ser discutidos y analizados a la luz de los
objetivos del estudio y/o las hiptesis planteadas. En esta seccin, el investigador no se circunscribe
nicamente a verificar sus objetivos y/o hiptesis, sino que observa el comportamiento de los datos
y analiza elementos adicionales y complementarios, que permiten enriquecer y profundizar en la
informacin obtenida, en muchas ocasiones, ms all de sus objetivos e hiptesis originales.
3. Conclusiones y recomendaciones
Finalmente, atendiendo a los resultados obtenidos en el anlisis estadstico, el investigador est en
condiciones de concluir si los objetivos del estudio se alcanzaron plenamente, medianamente o no
se alcanzaron, y si las hiptesis planteadas fueron verificadas o no.
Las tres Etapas presentadas anteriormente, son un esbozo general de los principales pasos que se
siguen en el desarrollo de una investigacin. El objetivo principal de la presentacin de las mismas
ha sido el de establecer, con la mayor claridad posible, en qu momento de la investigacin las
estadsticas son pertinentes. Como se observ, el modelo estadstico es el ltimo punto de la Etapa 2
y el anlisis estadstico es el primero de la Etapa 3. Esto debe ser as, porque las estadsticas estn
condicionadas a los fundamentos tericos del problema y a los aspectos metodolgicos inherentes al
mismo. Para ser ms especfico, en una investigacin, las estadsticas estn determinadas por las
siguientes condiciones:
1.
2.
3.
4.
5.

Los objetivos de la investigacin


Las hiptesis de la investigacin
El tipo de investigacin y el diseo de investigacin a desarrollar
El nivel de manipulacin de las variables independientes
Los sujetos participantes del estudio: puede tratarse de una poblacin o una muestra. Si se trata
de una muestra es determinante si la misma es aleatoria o no, si es una muestra grande o
pequea, si se trata de una sola muestra o de varias muestras.
6. Las tcnicas de medicin que se utilizaron para recabar la informacin. Esto incluye las
caractersticas psicomtricas de los instrumentos de medicin, la escala de medicin de las
variables, etc.
Las estadsticas aplicadas en una investigacin no deben ser una improvisacin de ltima hora,
como se observa frecuentemente en algunos trabajos de graduacin. El modelo estadstico debe ser
planificado al momento de disearse la investigacin. Es comn observar a estudiantes e inclusive a
profesionales de la psicologa solicitar asesora estadstica despus de haber desarrollado la
investigacin (recogido la data) casi en su totalidad. Cuando esto sucede, se corre el riesgo de que la
estructura metodolgica del estudio no coincida con los objetivos e inclusive, las hiptesis del
estudio. En muchos casos, las investigaciones no se pueden concluir tal y como fueron diseadas y
los investigadores deben hacer profundas modificaciones a las mismas o, inclusive, desistir del
estudio.

7
CONCEPTOS IMPORTANTES
Desarrolle cada uno de los conceptos presentados en la columna anterior. Intente establecer el
significado tcnico de cada uno de ellos e interrelacionarlos en la actividad de la investigacin
psicolgica. Es importante que trate de alcanzar un nivel de comprensin importante para cada uno
de ellos. Como ver posteriormente, son bsicos para el diseo de investigaciones psicolgicas.

Estadstica
Incertidumbre
Riesgos
Parsimonia
Metodologa
Diseo
Variables

Poblacin
Muestra
Test psicolgico
Medicin psicolgica
Modelo estadstico
Estadstica descriptiva
Estadstica inferencial

CAPTULO 2
LA NATURALEZA DE LAS ESTADSTICAS
La estadstica se puede definir como el conjunto de mtodos que se emplean para la toma de
decisiones. Los problemas psicolgicos que se tratan de resolver a travs de la investigacin
cientfica, en especial aquellos en los que el anlisis estadstico es pertinente, estn afectados por la
incertidumbre, la cual proviene de la capacidad que tienen los datos numricos de reflejar, con
cierta precisin, los fenmenos comportamentales que se analizan para determinada poblacin.

POBLACIN

DECISIN

MUESTRA

RIESGO

ERROR

FIGURA 21

Los fenmenos psicolgicos se dan en poblaciones de sujetos. En algunas ocasiones estos


problemas se pueden investigar directamente sobre la poblacin (censo), pero en la mayora de las
situaciones, es imposible analizar la totalidad de la poblacin, y el estudio se desarrolla entonces
con una parte de la misma a la que se denomina muestra. Las muestras, que son sub conjuntos de
las poblaciones mayores, estn constituidas por un nmero mucho menor de sujetos, situacin que
determina que los resultados numricos o estadsticos de stas no sean iguales a los de la poblacin;
por lo que se produce, lo que en estadsticas se denomina error de muestreo.
Como el inters est centrado en tomar una decisin sobre una poblacin a partir de una muestra
que est afectada de errores, los investigadores estn en la obligacin de analizar los errores de las
muestras para tomar una decisin con relacin a la poblacin partiendo de los datos de la muestra
(ver Figura 21).
Para que las decisiones estadsticas sean lo ms acertadas posibles, los errores cometidos se
analizan a travs de teoras y mtodos estadsticos que permiten establecer hasta qu punto los
errores son significativos o no; en otras palabras, lo que se trata de establecer es si la muestra, a
pesar de los errores que presenta en comparacin con la poblacin, es lo suficientemente
representativa de la misma como para considerarse que sus resultados son semejantes a los que se
hubieran obtenido en la poblacin de haberse analizado estadsticamente esta ltima.
Para llegar a este nivel de precisin estadstica, se debe hacer uso de la Teora de la Probabilidad,
que analiza y evala las diferencias entre muestras y poblaciones en trminos de probabilidad (ver
Figura 22)

ERRORES
TEORAS Y
MTODOS
ESTADSTICOS

DECISIONES
ACERTADAS
Riesgos
calculados
Probabilidad

FIGURA 22

Es importante destacar la trascendencia que tiene el concepto de incertidumbre en el anlisis


estadstico. Hay una fuente de incertidumbre que corresponde a aquellas situaciones en las que el
estado natural del fenmeno se puede conocer; este es el caso de la incertidumbre que se genera en
los juegos de azar; lotera, dados, cartas, etc. En estas situaciones se conoce de antemano cules son
los eventos que se pueden dar en cualquier experimento e inclusive cules son las probabilidades
correspondientes a cada uno de ellos; veamos un ejemplo:
TABLA 2-1:
Experimento denominado lanzamiento de un dado de seis caras

Eventos

Probabilidad

1/6

1/6

1/6

1/6

1/6

1/6

Al lanzarse un dado comn, sabemos de antemano qu eventos se pueden producir e inclusive


conocemos las probabilidades de cada uno de ellos; la incertidumbre nace del desconocimiento de
cul ser el evento que se presentar en un acto especfico, dado que todos tienen las mismas
probabilidades. Nosotros conocemos el estado natural del dado y por lo tanto podemos hipotetizar
sobre los posibles resultados a obtener. Veamos otro ejemplo.
TABLA 2-2:
Experimento denominado lanzamiento de dos dados de seis caras

Evento

10

11

12

Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Al lanzarse los dos dados, independientemente de las veces que sean lanzados, la suma de los
puntos de las caras superiores dara resultados entre 2 y 12. Se observa, adems, que las
probabilidades varan para cada uno de estos posibles resultados: el 2 tiene 1/36 de ocurrir, el 5
tiene 4/36, el 7 tiene 6/36, etc. Esto significa que al arrojarse los dos dados, potencialmente
conocemos los eventos que pueden suceder, e inclusive, las probabilidades para cada uno de ellos.

4
En este caso, la incertidumbre nace de las distintas probabilidades asignadas a cada evento: hay
eventos con ms probabilidades y otros con menos.
En los dos experimentos anteriormente analizados, se conoce el estado natural de cada fenmeno y
sus probabilidades, siendo esto ltimo la fuente de la incertidumbre.
El problema para los psiclogos radica en que no se conoce, con tanta facilidad, el estado natural de
los fenmenos comportamentales, ni tampoco las probabilidades asignadas a cada uno de ellos. Este
desconocimiento a priori de los hechos y sus probabilidades, es la fuente de incertidumbre para el
investigador del comportamiento.
Veamos un ejemplo. Supongamos que estamos interesados en investigar las actitudes de los
estudiantes universitarios hacia la apertura del denominado Tapn del Darin. Supongamos adems,
que esta actitud va a ser evaluada en una escala de 1 a 5, en la que 1 significa totalmente en
desacuerdo y 5 significa totalmente de acuerdo. Al aplicarse el instrumento de medicin, sabemos
de antemano que los resultados numricos para cada encuestado puede ser numricamente entre 1 y
5, pero no sabemos a priori, el estado natural de cada uno de estos eventos en la poblacin de
estudiantes; no sabemos cules son sus probabilidades, tal y como sucede con los dados. Esto
significa que en psicologa, la fuente principal de incertidumbre es el desconocimiento del estado
natural de los fenmenos conductuales en las poblaciones. Solamente se logra disminuir esta
condicin de incertidumbre, desarrollando observaciones empricas en las poblaciones
(investigaciones), analizando los resultados obtenidos y estableciendo de manera a posteriori, cuales
son los eventos que se dan y las probabilidades de cada uno de ellos.
LAS POBLACIONES
Una poblacin se puede definir como un conjunto completo de elementos individuales, definidos
dentro de un problema especfico. Por lo general, las poblaciones se definen como un conjunto de
cosas o sujetos, que se manifiestan, por lo general, en grandes cantidades. La cantidad no es lo
importante en este momento, porque hay poblaciones constituidas por pequeas cantidades de
unidades individuales como tambin las hay constituidas por grandes cantidades. Lo importante es
tener claro que para la investigacin, una poblacin existe a la luz de un problema especfico y que
contiene la totalidad de unidades que se desean investigar.
Sobre cada una de estas unidades individuales se hacen observaciones directas que son las que en
ltima instancia ofrecen la informacin cuantitativa referente al problema psicolgico a investigar.
Por ejemplo, si estamos interesados en investigar las aptitudes numricas de los aspirantes a
ingresar a Psicologa, las puntuaciones obtenidas por cada uno de ellos en la prueba de aptitud es
considerada como una observacin, y todas las observaciones (puntuaciones) obtenidas de la
totalidad de aspirantes constituye la poblacin.
El nmero de sujetos que conforman una poblacin tambin permite definir a las mismas como:
infinitas si el nmero de sujetos es muy grande y finitas si el nmero es pequeo. En la
investigacin psicolgica, por lo general las poblaciones a investigar se consideran finitas.

5
MEDICIN DE LAS VARIABLES PSICOLGICAS
Los atributos, caractersticas o propiedades psicolgicas susceptibles de ser definidas
numricamente se denominan variables. La caracterstica principal de una variable es que puede
adquirir distintos valores atendiendo a las diferencias individuales. Algunos ejemplos de variables
psicolgicas son: la inteligencia, el autoritarismo, la ansiedad, el liderazgo, el aprovechamiento, los
intereses, las aptitudes, la tolerancia, etc. Supuestamente, cada una de estas variables es susceptible
de ser medida y esto debe reflejar las diferencias que se pueden dar de sujeto a sujeto atendiendo a
las individualidades.
Al respecto de definir una variable, Kerlinger (1979) dice:
Los cientficos designan de manera un tanto vaga con el trmino de variable a las
construcciones hipotticas o propiedades que estudian. Podemos afirmar que una
variable es una propiedad que adquiere distintos valores; diremos que una variable es
algo que vara
Las variables pueden ser continuas o discretas. Una variable continua es aquella que puede asumir
cualquier valor dentro de un intervalo; puede asumir valores fraccionales. Una variable discreta es
aquella en la que las mediciones no pueden asumir valores fraccionales tales como el sexo, nmero
de hijos, correcto-incorrecto, etc. Chou (1972) hace algunos sealamientos al respecto de variables
continuas y discretas:
Una serie continua es una variable que puede asumir cualquier valor numrico dentro
de un recorrido especfico. Por otro lado, la naturaleza de cierto tipo de datos es tal que
la unidad de medida se puede definir solamente en trminos enteros; una serie en la que
las medidas no pueden darse entre las unidades de escala se llama serie discreta
ESCALAS DE MEDICIN
Hasta este punto de la lectura se puede observar que hay un aspecto importante en lo referente a la
aplicacin de las estadsticas en la investigacin cientfica: la medicin de los fenmenos
naturales, en nuestro caso, de los fenmenos comportamentales. Por esta razn, es necesario
discutir cules son las alternativas con las que se enfrenta un investigador al momento de definir o
decidirse por una escala de medicin para sus observaciones.
Las mediciones se pueden dar en uno de cuatro niveles y cada uno de ellos corresponde a una escala
de medicin determinada: nominal, ordinal, de intervalos y de razones. Adems, es necesario
destacar que cada escala satisface ciertas condiciones que favorecen la realizacin de ciertas
operaciones matemticas. Estas condiciones estn satisfechas por una serie de postulados bsicos de
la medicin, los cuales presentamos a continuacin.

) (
)
Postulado #1: (
. Este postulado es bsico para establecer
clasificaciones y sealar si los objetos son iguales o diferentes de acuerdo a una caracterstica
especial.

) (
)
(
). Este postulado, de tipo transitivo, es
Postulado #2: (
importante para determinar la igualdad de dos o ms eventos atendiendo a una o ms
caractersticas comunes.

(
) (
)
(
). Este postulado tambin es de
Postulado #3:
transitividad, e incorpora un concepto de mucha importancia en la medicin psicolgica como
lo es mayor que y menor que, en el que se basan la mayora de las mediciones que se
hacen en psicologa.

Al respecto Kerlinger seala:


en dicho postulado se fundan la mayora de las mediciones psicolgicas y pedaggicas.
Hemos de estar en condiciones de hacer enunciados de tipo ordinal o de ordenacin por
rangos
1. Escala Nominal
Corresponde al nivel ms bajo de medicin y con la misma se alcanza nicamente la
identificacin de sujetos u objetos, ya sea por el nombre o por un nmero. Por ejemplo: los
nmeros con los que identifican a los jugadores de un equipo de baloncesto, las clasificaciones
por categoras tales como altos o bajos, masculinos o femeninos, etc.
2. Escala Ordinal
Representa un avance en comparacin con la nominal, porque requiere de la ordenacin de los
objetos o sujetos por rangos, atendiendo a cierta condicin o caracterstica en particular; los
operadores mayor que (>) y menor que (< ) son fundamentales. Esta escala demuestra quin es
mayor o menor, quin est por encima o quin por debajo, qu es ms duro o ms blando, etc. A
pesar de que brinda informacin sobre quin posee ms o menos del atributo, no brinda
informacin sobre la cantidad de atributo de cada sujeto u objeto.
3. Escala de Inter valos:
Tiene sus propias caractersticas, pero adems posee las de la escala nominal y la ordinal. Su
caracterstica principal es que las unidades de medicin son iguales, situacin sta que le permite
una manipulacin algebraica mucho ms amplia que los casos anteriores. Las escalas de
temperatura, el tiempo, las escalas de medicin psicolgicas, etc., son ejemplos de esta situacin.
Presentamos un ejemplo:
a
1

b
2

c
3

d
4

e
5

La escala que se presenta con anterioridad, supuestamente mide una propiedad (X) en cinco
posibles alternativas. Se supone que las unidades de medicin entre cada alternativa son iguales
y por lo tanto tambin representan distancias iguales con respecto a la propiedad investigada. La
diferencia entre e d, o sea, 5 4 = 1, es la misma diferencia que hay entre b a, 2 1 =1.

7
Ambas representan las mismas distancias con respecto a la propiedad evaluada. Otra ventaja es
que se pueden combinar procesos matemticos diferentes, como por ejemplo:
, lo cual se puede representar tambin as:

( )

), donde,

), donde,

( )

4. Escala de Razones o Proporciones:


Corresponde al ms alto nivel de medicin; posee todas las caractersticas de las escalas
discutidas anteriormente, pero a diferencia de ellas, es la nica que posee un cero natural. El cero
representa ausencia absoluta de la propiedad en mencin y esto permite aplicar operaciones
matemticas que no se podan aplicar en las escalas anteriores (multiplicacin y divisin). Se
considera que en esta escala, una medicin que representa numricamente el doble que otra,
tambin representa el doble de la propiedad medida.
La utilizacin de las escalas de medicin en la investigacin aplicada en psicologa, es muy
importante porque determina el tipo de estadsticas que se deben utilizar para el anlisis de los
resultados. Cuando la medicin se da en una escala nominal u ordinal, el procesamiento
estadstico es diferente a los casos en que la medicin se hace en escala de intervalos o de razn.
Por ejemplo, las investigaciones en escala nominal u ordinal, por lo general se procesan con
estadsticos no paramtricos, mientras que si se utilizan escalas de intervalos o razn, las
estadsticas a utilizar son de tipo paramtricas.
CONCEPTOS IMPORTANTES

Incertidumbre
Variable continua
Probabilidad
Acto o Prueba
Experimento
Variable discreta
Escala de medicin
Nominal
Ordinal
Intervalos
De razn o proporcin

CAPTULO 3
ORGANIZACIN DE DATOS
DISTRIBUCIONES DE FRECUENCIAS
Los anlisis estadsticos comienzan, por lo general, en el momento en que se recogen los datos.
Estos datos son los resultados de mediciones y/o evaluaciones realizadas con instrumentos
psicolgicos muy especficos y que por lo general dan informacin cuantitativa (o cualitativa) sobre
ciertos aspectos del comportamiento que son objeto de investigacin en momentos determinados. A
continuacin presentamos un ejemplo:
TABLA 3-1:
Resultados de la medicin de las aptitudes en una muestra de
70 estudiantes de los cursos de capacitacin en una universidad.
95

101

92

67

118

105

76

104

84

122

86

87

97

87

94

94

79

94

89

90

103

101

81

94

91

77

107

94

100

102

93

94

105

68

82

117

94

119

117

89

106

111

107

92

91

89

83

73

97

99

91

120

103

90

89

112

93

100

117

78

99

111

91

83

84

81

88

84

81

110

Los puntajes resumidos en la tabla anterior no presentan ninguna informacin sistematizada, ni


organizada sobre la variable aptitudes: el investigador no podra, a partir de dichos puntajes, ofrecer
ningn tipo de informacin sobre el fenmeno psicolgico en mencin y su incidencia en la muestra
de estudiantes. Los puntajes deben ser organizados de tal manera que faciliten su posterior
utilizacin en los anlisis estadsticos necesarios para la interpretacin de los resultados.
Un primer mtodo de organizacin de los datos es el denominado: distribucin en una tabla de
frecuencias simples. Esta tabla se caracteriza porque los datos se ordenan, preferiblemente de menor
a mayor, indicndose para cada uno de los puntajes la frecuencia correspondiente; o sea, el nmero
de sujetos que obtuvo dicho puntaje. A continuacin se presenta la tabla correspondiente.

9
TABLA 3-2:
Distribucin de frecuencias simples de los promedios de las aptitudes de
70 estudiantes de los cursos de capacitacin
X

67

81

95

109

68

82

96

110

69

83

97

111

70

84

98

112

71

85

99

113

72

86

100

114

73

87

101

115

74

88

102

116

75

89

103

117

76

90

104

118

77

91

105

119

78

92

106

120

79

93

107

121

80

94

108

122

La tabla anterior representa un gran adelanto en comparacin con la Tabla 3-1, en vista que presenta
la informacin mejor organizada y sistematizada: los puntajes se ordenaron de menor a mayor
(podra haber sido a la inversa), cada puntaje tiene asignada una frecuencia, o sea, el nmero de
sujetos que obtuvieron dicha puntuacin. Se observa un primer indicio de agrupamiento hacia los
puntajes centrales en comparacin con los valores extremos.
La organizacin de los datos en distribuciones de frecuencias simples, a pesar de la ventaja que
presenta, tampoco es el procedimiento ms adecuado, especialmente si el tamao de la muestra es
muy grande al igual que su amplitud. En tales casos, la informacin tiende a verse muy disgregada
y no se dramatizan las caractersticas particulares de la muestra, que pueden resultar muy
importantes para el anlisis de los resultados. En el caso de muestras pequeas, este tipo de
organizacin es bastante efectiva.
Una segunda forma de organizar los resultados, especialmente si la muestra es grande, es la Tabla
de Frecuencia por intervalos. Bajo este mtodo, se logra que los puntajes se presenten de manera
ms compacta en la distribucin, lo cual facilita la observacin clara de las principales
caractersticas estadsticas de los puntajes de la muestra. Este mtodo se caracteriza por la creacin
de intervalos, distancias entre puntajes, que facilita la distribucin de todos los puntajes de la
muestra en dichos intervalos. Para el uso de este tipo de distribucin, el investigador debe tener
claro algunos aspectos que pasamos a discutir:
1.

El agrupamiento de los puntajes en algunas ocasiones puede favorecer la prdida de


informacin.
2. El tamao del intervalo y el nmero de los mismos se darn a criterio del investigador.

10
3. Se acepta, generalmente, que el nmero de intervalos debe oscilar entre 10 y 20.
4. El tamao del intervalo puede ser par o impar, aunque se sugiere un tamao impar porque de
esta manera se reduce la probabilidad de trabajar con datos fraccionales.
Los pasos para construir una distribucin de frecuencias por intervalos son los siguientes:
1.

Se calcula el rango o amplitud de la distribucin, lo que corresponde a la diferencia entre


el puntaje ms alto y el ms bajo de la muestra ms uno:

,
En donde, es amplitud,
es puntaje mayor y
es puntaje menor. La amplitud
identifica los valores que estn dentro de este intervalo, lo cual facilita la
identificacin de los puntajes particulares dentro del mismo. Para el caso de la
Tabla 3-1,

2. Divida la amplitud entre el nmero de intervalos que se han considerado adecuados, recordando
que preferiblemente deben ser entre 10 y 20. Se recomienda que se utilice un nmero de
intervalos tal, que al dividir la amplitud entre el nmero de intervalos, el nmero resultante sea
un valor impar, el cual va a representar el tamao de cada uno de los intervalos; este tamao es
constante para todos. Para nuestro ejemplo, hemos decidido que sean 12 intervalos; para
calcular el tamao del intervalo se lleva a cabo la siguiente operacin:
Amplitud = 56
No. de intervalos estimado (No.i) = 12; con esta informacin se calcula el
tamao del intervalo (Ti):

, que redondeado al entero ms prximo corresponde


a 5.

3. A partir de estos datos, se construye la Tabla de frecuencias por intervalos que para este caso
ser de menor a mayor. En el primer intervalo debe quedar incluido el valor ms pequeo de la
distribucin y en el ltimo se incluir el valor ms grande. La estructura de cada intervalo se
caracteriza por las siguientes condiciones:
Los intervalos tendrn un puntaje inferior que se denominar lmite inferior, y
un puntaje superior que se denominar lmite superior; el recorrido entre ambos
extremos debe ser igual al Ti, incluidos estos dos valores. Por ejemplo:
65 ----------------------- 69
Lmite inferior Lmite superior

Para escoger el lmite inferior del primer intervalo, debe utilizarse la siguiente
regla: debe corresponder al nmero ms cercano al puntaje ms pequeo
de la distribucin, y que a su vez sea un mltiplo del tamao del
intervalo. Para efectos de este ejemplo, el lmite inferior del primer intervalo
corresponde a 65 y el mayor a 69.

11
4. A partir de esta informacin, construya la Tabla de frecuencias partiendo del intervalo 65 69,
en el cual est incluido el puntaje ms bajo que es 67, hasta llegar al ltimo intervalo que debe
incluir el puntaje ms alto: 122. Todos los intervalos deben ser de tamao 5 para efectos de este
problema.
5. Una vez confeccionada la columna de intervalos, se determina el nmero de casos de la muestra
que caen dentro de cada uno de ellos. Para facilitar esta informacin, se crea una columna
adyacente a la de los intervalos y se van asignando marcas a cada valor encontrado en la
muestra, tal y como lo presenta el siguiente ejemplo:
Intervalo Tabulacin Frecuencia
65 69

//

6. Se procede de esta manera con todos los intervalos hasta obtener toda la informacin
correspondiente a las frecuencias simples. Se completa la tabla con el resto de las columnas que
contendrn la informacin requerida para adelantar los primeros anlisis estadsticos. Las otras
columnas ms frecuentes son: tabulacin (tab), frecuencias (f), frecuencias acumuladas (fa),
puntos medios (Pm), proporciones (p), y porcentajes (%).
A continuacin se presenta la Tabla de Frecuencias por intervalos correspondiente a los datos
presentados en la Tabla 3-1.
TABLA 3-3:
Distribucin de frecuencias por intervalos
correspondientes a las aptitudes de una muestra de 70 estudiantes
i

fa

Pm

65-69

67

0.03

2.86

70-74

72

0.01

1.43

75-79

77

0.06

5.71

80-84

16

82

0.13

12.86

85-89

24

87

0.11

11.43

90-94

17

41

92

0.24

24.29

95-99

46

97

0.07

7.14

100-104

54

102

0.11

11.43

105-109

59

107

0.07

7.14

110-114

63

112

0.06

5.71

115-119

68

117

0.07

7.14

120-124

70

122

0.03

2.86

La sumatoria de p es <1.00 por efectos de redondeo

0.99a

00.00

12
La Tabla anteriormente presentada, no toma en consideracin los denominados lmites
verdaderos o reales de cada intervalo. Por ejemplo, los lmites verdaderos de 65 seran: 64.5 y
65.5; de igual manera, los lmites verdaderos de 69 seran 68.5 y 69.5. Si se construye la Tabla de
frecuencias utilizando este concepto, en el caso del primer intervalo, el intervalo real sera: 64.5
69.5, y el resto de los intervalos se construiran de la misma manera. Este concepto de los lmites
verdaderos, es importante para el clculo de ciertos estadsticos tales como la mediana, los
percentiles y otros.
El resto de los elementos de la Tabla de Frecuencias por intervalos se determinaran de la siguiente
manera:

Frecuencias acumuladas (fa): a partir de la frecuencia del intervalo ms pequeo, se van


sumando de manera acumulativa las frecuencias de los intervalos posteriores y se van indicando
en la Tabla. Para verificar, debe observarse que en el primer intervalo est acumulada la
frecuencia de este intervalo y que en el ltimo intervalo debe estar acumulada la totalidad de las
frecuencias de la muestra. Ejemplo: (ver Tabla 3-3)
Primer intervalo =
65 69
Frecuencia = 2
ltimo intervalo =
120 124
Frecuencia = 70

Punto medio (Pm): se refiere al puntaje que se ubica en la mitad de cada intervalo y se calcula
a travs de la siguiente operacin:
o

, en donde, Li representa al lmite inferior del intervalo y Ls, al lmite

superior.
o

Para efectos del primer intervalo, el Pm sera igual a:

, tal y como se

puede verificar en la Tabla 3-3.


o

Esta operacin se debe desarrollar para todos los intervalos de la distribucin y sealar
el resultado en su correspondiente columna.

Otro procedimiento para construir una Tabla de Frecuencias es La Regla de Sturges. En el mismo
se aplica una regla (frmula) especial, a travs de la cual se puede determinar (K), que representa el
(
), en donde:
nmero aproximado de intervalos en la distribucin:
K: nmero aproximado de intervalos
n: nmero de sujetos de la muestra
log: logaritmo ordinario de base 10.
Si aplicamos dicha regla a los datos de nuestra muestra, los resultados seran los siguientes:
(

)(

Tamao de intervalos (

0)

13
Como se puede observar el nmero de intervalos es menor que en el procedimiento anterior;
adems, el tamao del intervalo tiende a ser mayor. A continuacin se presenta la Tabla
desarrollada con la Regla de Sturges.
TABLA 3-4:
Distribucin de frecuencias por intervalos correspondientes
a las aptitudes de una muestra de 70 estudiantes.

fa

Pm

63 - 69

67

0.03

2.86

70 - 76

72

0.03

2.86

77 - 83

13

77

0.13

12.86

84 - 90

13

26

82

0.19

18.57

91 - 97

18

44

87

0.26

25.71

98- 104

10

54

92

0.14

14.29

105 - 111

62

97

0.11

11.43

112 - 118

67

102

0.07

7.14

119 - 125

70

107

0.04

4.29

a La

.00

00.01a

sumatoria de % es >100.00 por efectos de redondeo

Como se puede observar, la distribucin de frecuencias por intervalos generada a travs de la Regla
de Sturges, tiende a producir distribuciones ms compactas que en el primer caso, por el hecho de
que genera menor nmero de intervalos pero con un tamao mayor, lo cual hace que dentro de los
mismos haya un mayor nmero de sujetos. Ahora, no existe ninguna regla que seale que Sturges
produce resultados superiores que el primer mtodo estudiado. Nada supera el buen juicio del
investigador para determinar cul es la distribucin ms conveniente.
CONCEPTOS IMPORTANTES

Distribucin de frecuencias
Simples
Por Intervalos
Intervalos
Amplitud o Rango
Lmites de intervalos
Frecuencias simples
Frecuencias acumuladas
Proporciones
Porcentajes

14
EJERCICIOS PRCTICOS
Problema 1
110
133
116
128
85
100
105
150
118
97
154

113
119
103
93
108
100
111
130
104
135
131

111
115
103
93
108
100
122
130
104
135
113

108
117
121
105
136
123
100
89
94
139
82

113
110
109
118
115
126
114
108
115
133
106

134
104
147
119
117
119
91
137
112
107
101

124
125
103
89
110
113
123
121
125
115
122

80
85
113
143
128
102
132
142
129
83
96

112
120
107
108
145
100
97
111
131
109
145

106
135
98
142
127
93
110
123
110
116
101

Los datos anteriores corresponden a los puntajes obtenidos en una prueba de admisin universitaria,
por una muestra de estudiantes graduados de escuela secundaria. Organice los datos en una Tabla de
Frecuencias por intervalos, satisfaciendo los siguientes requisitos:
1.
2.
3.
4.

Calcule la amplitud de la distribucin de datos.


La tabla debe ser construida de menos a ms.
El tamao del intervalo debe ser de 5.
La Tabla debe incluir las siguientes columnas: intervalos, puntos medios, frecuencias simples,
frecuencias acumuladas, proporciones y porcentajes.

Problema 2
Con los mismos datos, del problema construya una Tabla de Frecuencias utilizando un tamao de
intervalo igual a 4. Repita el mismo procedimiento que en el problema anterior. Observe, analice y
discuta las diferencias entre una distribucin y la otra.
Problema 3
Elimine de forma aleatoria (por azar) un dato de cada columna del problema 1; esto crear una
nueva distribucin de datos. Para la misma, construya dos Tablas de frecuencias utilizando las
recomendaciones brindadas en este Texto. Una de las tablas debe tener un tamao de intervalo
impar y la otra, un tamao par. Complete ambas tablas con los elementos solicitados anteriormente;
analice y discuta los resultados obtenidos.
Si desea practicar ms, puede eliminar columnas de la distribucin de datos y desarrollar sus
correspondientes tablas. Tambin puede revisar los textos sealados en la bibliografa y hacer otros
problemas.

15

CAPTULO 4
REPRESENTACIONES GRFICAS
En el captulo anterior se inici un proceso de organizacin de los datos tendiente a sistematizarlos,
lo cual facilitara el posterior anlisis de los mismos. Se observa que dicho proceso de organizacin
se caracteriza por una cuidadosa reorganizacin de la data (Tabla 3-1), a travs de las denominadas
Tablas de Frecuencias, especialmente la de intervalos (Tabla 3-3 y Tabla 3-4).
Otro aspecto importante en la organizacin de datos lo constituyen las representaciones grficas,
las cuales se caracterizan por lo siguiente:
1. Facilitan la observacin de hechos esenciales en las distribuciones.
2. Permiten la comparacin de diferentes distribuciones al mismo tiempo.
3. Son de fcil comprensin para el lector porque facilita la percepcin de los hechos.
Existen diferentes tipos de representaciones grficas utilizadas para diferentes objetivos. Para
efectos de este captulo, se analizarn tres tipos de grficas, las cuales son bsicas para el anlisis
cientfico de la data proveniente de la medicin comportamental: el grfico de barra (histogramas),
el polgono de frecuencias y la ojiva. Pero antes de iniciar este estudio formalmente, es necesario
sealar algunos detalles importantes en la construccin de las mismas y que son comunes en todas
ellas. Los grficos sern construidos en el cuadrante cartesiano en que los ejes X e Y son positivos.
Al eje X se le denominar abscisa y al Y ordenada.
Y

X e Y son positivos

FIGURA 41

En el eje de las ordenadas (Y) se colocan las frecuencias, porcentajes, etc, mientras que en el
eje de las abscisas (X) se colocarn los puntajes, los cuales pueden estar representados por los
valores correspondientes a los puntos medios, los lmites de los intervalos ya sean los superiores
o los inferiores; no se deben combinar estos en un mismo grfico. Tambin se considera que en
el eje de X se coloca la variable independiente y en el de la Y la variable dependiente.
Cuando los grficos se construyen manualmente, se sugiere la regla de los tres cuartos, la
cual se caracteriza por lo siguiente: en la representacin grfica de las frecuencias,
el eje vertical debe hacerse de tal forma que la altura del punto mximo (que
representa el resultado asociado con la frecuencia ms alta) debe ser
aproximadamente igual a tres cuartos de la longitud del eje horizontal.

16
En la prctica, esta es una condicin difcil de cumplir, por lo cual se sugiere que tanto
X como Y sean ms o menos proporcionales. Este problema ha sido superado con la
utilizacin de ordenadores para la construccin de los grficos.
GRFICO DE BARRAS
Se refiere a un grfico diseado para variables medidas en escalas nominales y ordinales; o sea, que
los datos no estn relacionados numricamente entre ellos. Cada categora o intervalo se representa
por una barra y la frecuencia determina la altura de la misma; adems, las barras son independientes
una de otras. Para la construccin de un grfico de este tipo, se sugieren los siguientes pasos:
1. En el eje de Y se representan las frecuencias dentro de cada categora; esto determina
la altura de la barra. En el eje de las X se ubican las categoras o estratos. A
continuacin presentamos un ejemplo.
TABLA 4-1:
Frecuencias De Las Carreras A Las Que Aplican 70 Aspirantes A La Universidad
Facultad

Admn de Empresas

Arquitectura

Ciencias Agropecuarias

Ciencias de la Educacin

Ciencias Exactas y Tecnologa

Comunicacin Social

Derecho y Ciencias Polticas

Economa

Enfermera

Humanidades

Medicina

Odontologa

Psicologa

17
GRFICO 4-1

Frecuencia

Facultad a la que aplican 70 aspirantes universitarios


10
9
8
7
6
5
4
3
2
1
0

Como se puede observar, el grfico representa cada intervalo con su correspondiente altura
(frecuencia), la cual est identificada por la barra. Este tipo de grfico tambin puede representarse
de manera horizontal, tal y como se demuestra a continuacin.
GRFICO 4-2

Facultad a la que aplican 70 aspirantes universitarios


Psicologa
Odontologa
Medicina
Humanidades
Enfermera
Economa
Derecho y Ciencias Polticas
Comunicacin Social
Ciencias Exactas y Tecnologa
Ciencias de la Educacin
Ciencias Agropecuarias
Arquitectura
Admn de Empresas

5
6
Frecuencia

10

HISTOGRAMA
El histograma tambin es un grfico de barras, pero a diferencia del anterior, se utiliza en el caso en
que las distribuciones de frecuencias corresponden, por lo menos a una escala de intervalos. Desde
el punto de vista estadstico, las barras comparten informacin en vista de que se construyen con los

18
lmites reales de cada una de ellas. El lmite superior de cada barra se convierte en el lmite inferior
de la siguiente, apoyados en el concepto de continuidad de la variable. A continuacin se presenta
un ejemplo.
TABLA 4-2:
Distribucin De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i

65-69

70-74

75-79

80-84

85-89

90-94

17

95-99

100-104

105-109

110-114

115-119

120-124

GRFICO 4-3

Aptitudes de n=70 aspirantes universitarios


18
16

Frecuencia

14
12

10
8
6
4
2
0

Aptitudes

19
POLGONO DE FRECUENCIAS
El Polgono de Frecuencias es otra alternativa de representacin grfica de las distribuciones de
frecuencias. Al igual que los grficos de barras, se construye sobre un eje de coordenadas (X,Y),
con la diferencia que no se utilizan los intervalos completos, sino que stos estn representados por:
los lmites superiores, los lmites inferiores, o, los puntos medios de cada intervalo. Se genera un
grfico lineal que se traza sobre cada uno de los puntos que representan a los intervalos. A
continuacin presentamos un ejemplo.
TABLA 4-3:
Distribucin De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i

65-69

70-74

75-79

80-84

85-89

90-94

17

95-99

100-104

105-109

110-114

115-119

120-124

GRFICO 4-4

Frecuencias

Polgono de frecuencias de las aptitudes en una muestra de n=70


aspirantes universitarios
18
16
14
12
10
8
6
4
2
0

20
El polgono anterior utiliza como representativo de los datos, cada uno de los intervalos. Sin
embargo, por lo general, se utilizan los puntos medios de los intervalos, lo cual facilita la
descripcin de los datos. A continuacin presentamos un ejemplo.
TABLA 4-4:
Distribucin De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
pm
f
67
72
77
82
87
92
97
102
107
112
117
122

2
1
4
9
8
17
5
8
5
4
5
2

GRFICO 4-5

Frecuencias

Polgono de frecuencias de las aptitudes en una muestra de n=70


aspirantes universitarios
18
16
14
12
10
8
6
4
2
0
67

72

77

82

87

92
97
102
Puntos medios

107

Para construir un Polgono de Frecuencias sugerimos los siguientes pasos:

112

117

122

21
1.

Represente el eje de coordenadas (X, Y) en el cual se va a construir el grfico; recuerde que


estamos utilizando el cuadrante de valores positivos. En X deben estar identificados los valores
de los sujetos, representados por los puntos medios de los intervalos (o por los lmites
superiores o los inferiores). En Y deben estar identificadas las frecuencias de cada intervalo.

2. Seale en el cuadrante los pares ordenados para cada X e Y con un punto. En otras palabras, la
interseccin de cada valor X con su correspondiente Y, se marca con un punto. Repita esta
accin para cada intervalo y una vez terminado, una los puntos con rectas hasta que se dibuje la
figura del polgono.
3. Los extremos del polgono quedan suspendidos (no se unen con el eje de X). En tal caso, nalos
con segmentos de recta que deben estar ubicados a medio intervalo por debajo y por encima de
los dos valores extremos (Grfico 4-4 y Grfico 4-5).
4. La utilizacin de los puntos medios est plenamente justificado tericamente, en vista de que
los mismos representan cada uno de los intervalos, lo cual quedar demostrado al momento de
calcularse ciertos estadsticos bsicos para los anlisis.
GRFICO DE FRECUENCIAS ACUMULADAS U OJIVA
Hay ocasiones en las que el investigador necesita que los datos se ordenen acumulativamente. Ya
observamos en la Tabla 3-4 que es posible resumir las frecuencias de los intervalos de manera
acumulada. Para tales casos, los datos acumulados pueden representarse grficamente a travs de
una ojiva o curva acumulativa de frecuencias; a continuacin se presenta un ejemplo.
TABLA 4-5:
Distribucin De Frecuencias Por Intervalos Correspondientes
A Las Aptitudes De Una Muestra De 70 Estudiantes.
i

fa

Pm

63 - 69

67

70 - 76

72

77 - 83

13

77

84 - 90

13

26

82

91 - 97

18

44

87

98- 104

10

54

92

105 - 111

62

97

112 - 118

67

102

119 - 125

70

107

22
GRFICO 4-6

Ojiva correspondiente a las aptitudes de n=70 aspirantes


universitarios
80

Frecuencias acumuladas

70
60
50
40
30
20
10
0
67

72

77

82

87

92

97

102

107

Los pasos a seguir para confeccionar una grfica de frecuencias acumuladas (OJIVA) son los
siguientes:
1. Confeccione el cuadrante de coordenadas
2. En el eje Y se colocan las frecuencias acumuladas de la distribucin y en el eje X se colocan los
puntos medios de cada intervalo.
3. Localice, en el cuadrante, el punto en que coinciden el intervalo (punto medio) y la frecuencia
acumulada de dicho intervalo: mrquelo con un punto. Repita esta accin con todos los
intervalos y con sus correspondientes frecuencias acumuladas.
4. Una todos los puntos a travs de lneas rectas obtenindose finalmente el grfico denominado
Ojiva.
A travs de ste grfico se puede calcular algunas medidas de posicin importantes tales como los
percentiles, los rangos percentiles, la mediana, etc.
DIAGRAMA DE TALLO Y HOJAS
Es una alternativa muy sencilla de describir los datos de una muestra, especialmente cuando la
misma no es muy grande (n 100). Cada dato se va a dividir en dos partes: el primer dgito (y el
segundo, en algunas ocasiones), corresponde al tallo y el segundo a la hoja. Veamos un ejemplo con
el dato X = 46. Para este caso:
Tallo = 4, Hoja = 6.
Este procedimiento se seguira con todos los puntajes de la distribucin, pero el diagrama tiene una
estructura especial, la cual pasamos a presentar a continuacin. Para tal efecto utilizaremos los datos
resumidos en la Tabla 3-2.

23
GRFICO 4-7

TALLO

HOJA

7 8

3 6 7 8 9

1 1 1 2 3 3 4 4 4 4 6 7 7 8 9 9 9 9

0 0 1 1 1 1 2 2 3 3 4 4 4 4 4 4 4 5 7 7 9 9

10

0 0 1 1 2 3 3 4 5 5 6 7 7

11

0 1 1 2 7 7 7 8 9

12

0 2

En el ejemplo anterior se observa que el puntaje ms bajo corresponde al nmero 67, por esta razn
el diagrama se inicia en el tallo 6. Las hojas correspondientes a este tallo son el 7 y el 8 porque
nicamente en esta decena estn el nmero 67 y 68. A continuacin vendra la decena del 70, cuyo
tallo sera el 7; las hojas en este tallo seran 3, 6, 7, 8 y 9, porque corresponderan a los nmeros 73,
76, 77, 78 y 79. De esta manera se desarrollaran los restantes tallos con sus correspondientes hojas.
LOS ORDENADORES Y LAS GRFICAS
El desarrollo y crecimiento de la informtica, tanto en lo que respecta a los ordenadores como a los
programas, han facilitado la presentacin de grficos y han enriquecido este aspecto tan importante
de las estadsticas. A continuacin presentamos algunos ejemplos de presentaciones grficas que se
pueden desarrollar gracias al avance de la tecnologa.

24

f
18
16
14
12
10
8
6
4
2
0
6569

7579

8589

9599

105109

115
-119

CONCEPTOS IMPORTANTES

Grfico
Cuadrante cartesiano
Ordenada
Grfico de barras
Histograma
Polgono de frecuencias
Pares ordenados
Ojiva
Diagrama Tallo Hoja

25
EJERCICIOS PRCTICOS
Problema 1
110
133
116
128
85
100
105
150
118
97
154

113
119
103
93
108
100
111
130
104
135
131

111
115
103
93
108
100
122
130
104
135
113

108
117
121
105
136
123
100
89
94
139
82

113
110
109
118
115
126
114
108
115
133
106

134
104
147
119
117
119
91
137
112
107
101

124
125
103
89
110
113
123
121
125
115
122

80
85
113
143
128
102
132
142
129
83
96

112
120
107
108
145
100
97
111
131
109
145

106
135
98
142
127
93
110
123
110
116
101

Los datos presentados son los mismos que se dieron para el ejercicio del Captulo III, para los
cuales usted ya ha generado varias tablas de frecuencias por intervalos. Utilizando la Tabla de
intervalos de tamao 5, construya los siguientes grficos:
1. Polgono de frecuencias usando los puntos medios. Tambin lo debe hacer utilizando uno de los
lmites del intervalo.
2. Grfico de barras
3. Histograma
4. Ojiva
5. Diagrama de tallo y hojas

Problema 2
Construya estos grficos, utilizando las diferentes distribuciones de frecuencias que construy en el
Captulo III. Observe, analice y discuta las diferencias encontradas entre los grficos construidos.

26

CAPTULO 5
MEDIDAS DE TENDENCIA CENTRAL
Hasta este momento, el proceso de sistematizacin y organizacin de los datos que hemos seguido,
ha permitido reducir la informacin inicial (datos originales) correspondientes a las aptitudes de 70
aspirantes a ingresar a la Universidad, a partir de tablas y grficos descriptivos. A pesar de esta
reduccin, la calidad de la informacin mejor tanto cuantitativa como cualitativamente, en vista de
que se logr identificar caractersticas especiales de la muestra que no resaltaban en su forma
original de presentacin: datos brutos.
Estas caractersticas particulares de las muestras, favorecen un anlisis ms profundo y dinmico de
la informacin cuantitativa resumida en las tablas y grficos, a tal punto, que logran resumir, en
muy pocos valores cuantitativos, las caractersticas de las variables analizadas y como consecuencia
directa, las caractersticas de las muestras que estn siendo objeto de anlisis. Esta nueva
informacin se identifica como medidas estadsticas y se pueden definir desde dos perspectivas
particulares pero complementarias: las medidas de tendencia central y las medidas de
variabilidad. A continuacin pasaremos a analizar y discutir lo que significan las medidas de
tendencia central y su importancia en el anlisis descriptivo de los datos.
Las muestras de datos, con mucha frecuencia, tienden a comportarse de manera muy particular, lo
cual tiende a dramatizarse con mucho detalle en las tablas y los grficos correspondientes. Por lo
general, hay uno o varios puntajes que al analizarlos en las tablas y grficos, presentan una mayor
frecuencia de ocurrencia que los otros; en muchas ocasiones, es un solo valor de la distribucin el
que se destaca por esta cualidad.
Si observamos los resultados resumidos en la Tabla 3-3 y en la Tabla 3-4, la mayor frecuencia de
datos se observa en el intervalo 90-94 (frecuencia 17) y en el intervalo 91-97 (frecuencia 18),
respectivamente. Es evidente que un nmero importante de datos tiende a agruparse alrededor de
ciertos valores centrales (intervalos), y consecuentemente, el resto se distribuye por encima y por
debajo de estos intervalos de mayor frecuencia. A partir de este comportamiento, se determina que
en las distribuciones muestrales hay un valor que es el ms frecuente y alrededor del cual se agrupa
el resto de los valores; este puntaje se considera representativo de toda la distribucin. A estos
valores, que representan la tendencia de una distribucin se les denomina: medidas de tendencia
central. A continuacin pasaremos a analizar las ms importantes en el anlisis estadstico de los
resultados obtenidos en una investigacin del comportamiento.
LA MEDIA ARITMTICA
Es la medida de tendencia central ms conocida y la ms importante. Su utilizacin no es una
experiencia tan novedosa cuando se inician los estudios de estadstica, en vista de que se le conoce
ampliamente como el promedio. Todos recordamos en el colegio cuando el profesor nos peda que
calculramos el promedio de la materia en el bimestre, lo cual era equivalente a sumar todas
nuestras notas, dividir la suma entre la totalidad de stas y alcanzar un puntaje que era el
representativo de nuestro rendimiento.

27
Una definicin simple y adecuada de la media aritmtica es: la suma de todos los datos
correspondientes a una muestra, dividida entre el total de los datos. Definida de manera estadstica
sera:

Para el caso de una muestra

Se refiere a la sumatoria de todos los datos de la muestra, dividida entre la totalidad de


sujetos de la misma.

Para el caso de una poblacin:

Se refiere a la sumatoria de todos los datos de la poblacin, dividida entre la totalidad


de sujetos de la misma.
La frmula anterior se conoce como la frmula general de la media aritmtica y se aplica cuando
se utiliza la totalidad de las observaciones, tanto de las muestras como las poblaciones. Es el
procedimiento que usan los programas estadsticos tanto de las calculadoras manuales como los
ordenadores.
Las principales caractersticas de la media aritmtica son las siguientes:
1.

Por ser el promedio de todas las observaciones est afectada por todos los valores, lo cual
determina que la media sea muy sensible a las puntuaciones extremas de las distribuciones.

2. A partir de la frmula general,

si dos de los componentes son conocidos, se puede

conocer el tercero.
3. La suma de las desviaciones de cada puntaje con relacin a la media es igual a cero:
0.
4. La media representa un punto de equilibrio o centro de gravedad de la distribucin, a partir de
los puntajes extremos de la misma.

La media aritmtica para distribuciones de frecuencias


Cuando las muestras estn organizadas en Tablas de Frecuencias, la media aritmtica se calcula a
partir de algunos de los componentes de la misma, tal y como se demuestra a continuacin. Es
importante que la tabla resumen contenga la informacin necesaria para que se puedan aplicar las
frmulas requeridas para el clculo de la media aritmtica siguiendo este procedimiento.

28
TABLA 5-1:
Clculo de la media aritmtica para datos agrupados
i

Pm

f * Pm

65-69

67

134

70-74

72

72

75-79

77

308

80-84

82

738

85-89

87

696

90-94

17

92

1564

95-99

97

485

100-104

102

816

105-109

107

535

110-114

112

448

115-119

117

585

120-124

122

244

A partir de los datos de la Tabla anterior, se aplica la siguiente frmula:


(

0
El resultado obtenido indica que la media aritmtica de las aptitudes de los 70 aspirantes a ingresar
a la Universidad fue igual a 94.64. Si se observa la Tabla 5-1, se puede verificar la cercana de este
resultado con el intervalo de mayor frecuencia. Es evidente que la correcta construccin de la Tabla
y de sus componentes, son una garanta para la obtencin de resultados precisos en el clculo de
estadsticos como la media aritmtica.
La media aritmtica y los mtodos abreviados
La media aritmtica puede ser calculada a travs de los denominados mtodos abreviados.
Aprovechando la propiedad de que la
0, se han desarrollado dos mtodos alternativos para el
clculo de este estadstico. En ambos se determina una media supuesta, que puede corresponder a
cualquier puntaje de la distribucin, ya sea que est por encima o por debajo de la media real. A
partir de este valor se calcula un corrector, que se va a agregar algebraicamente a la media
supuesta:

Si la media supuesta es mayor que la media verdadera, el corrector ser restado de la primera,
corrigiendo el exceso. De esta manera, el resultado final corresponde a la media real.

Si la media supuesta es menor que la media verdadera, el corrector ser sumado a la primera
corrigiendo el defecto; el resultado corresponder a la media verdadera.

Las frmulas correspondientes a los mtodos abreviados son:

29

1.

, en donde:

A corresponde a la media supuesta


es igual a la sumatoria de las diferencias alrededor de la media supuesta

es el factor de correccin, cuyo signo ser positivo o negativo atendiendo a las


caractersticas de la media supuesta (por encima o debajo de la media real)

2.

, en donde:

A es la media supuesta
(
) corresponde a la sumatoria del producto de las frecuencias de cada intervalo
con su correspondiente diferencia
(

es el factor de correccin

i es el tamao del intervalo


Cualquiera de los dos mtodos abreviados tendr como resultado la misma media: la verdadera.
Con el desarrollo de la tecnologa y la informtica, en la actualidad la utilizacin de los mtodos
abreviados se ha reducido de manera significativa. Sin embargo, son un ejemplo claro de la
posibilidad de calcular la media real, a partir de cualquier valor de la distribucin.
LOS PROMEDIOS DE POSICIN
Otros promedios, diferentes que la media aritmtica, permiten estimar el valor representativo de la
distribucin. A estos promedios se les denomina promedios de posicin, en vista de que los mismos
corresponden a un lugar en la distribucin. Para calcularlos, se deben satisfacer las siguientes
condiciones:
1. La distribucin debe estar ordenada de menor a mayor
2. Hay que determinar el lugar o posicin de la distribucin, en que debe caer el promedio.
3. A diferencia de la media aritmtica, no estn afectados por las puntuaciones extremas de la
distribucin en vista de que no se calculan a partir de los datos individuales de las muestras.
Los promedios de posicin ms importantes son: la mediana y la moda, los cuales pasaremos a
analizar a continuacin.
La mediana (mdn)
Se considera la medida de tendencia central que divide la distribucin de datos en dos partes
iguales, dejando por encima y por debajo de ella igual cantidad de observaciones. Para el clculo de
la mediana, es necesario que los datos estn ordenados de menor a mayor atendiendo a sus
magnitudes. A continuacin presentamos un ejemplo para datos no organizados en tablas de
frecuencias:

30
Puntuacin (ficticios)
1
2
3
4
5
6
7
8
9

mediana

La mediana de los datos anteriores es 5, porque es el valor que en la distribucin ordenada deja por
encima y por debajo igual nmero de puntajes. Cuando el nmero de observaciones es impar, la
mediana coincide con uno de los valores de la distribucin; cuando el nmero es par, la mediana
ser una fraccin y estar ubicada entre los dos valores centrales de la distribucin, y habr
necesidad de promediar los mismos, tal y como se presenta a continuacin:
X
1
2
3
4

mediana:

5
6
7
8

Como se puede observar, la mediana slo se puede calcular en una distribucin ordenada
previamente y no est afectada por los dos valores ms extremos (1 y 8).
Cuando los datos estn agrupados en tablas de frecuencias, la mediana se calcula utilizando un
procedimiento de interpolacin, siendo su frmula de clculo la siguiente:
(

: lmite inferior real del intervalo en que debe caer la mediana


: lugar(intervalo) en la columna de frecuencias acumuladas en que debe caer la
mediana
fa : frecuencia acumulada hasta el intervalo anterior al de la mediana
: frecuencias simples dentro del intervalo en donde debe caer la mediana
i : tamao del intervalo

31
TABLA 5-2:
Clculo de la mediana en una distribucin de frecuencias
i

fa

65-69

70-74

75-79

80-84

16

85-89

24

90-94

17

41

95-99

46

100-104

54

105-109

59

110-114

63

115-119

68

120-124

70

Para el clculo de la mediana se requiere de las columnas intervalos, frecuencias y frecuencias


acumuladas de la tabla de intervalos (ver Tabla 5-2). Como se puede observar, la tabla est
organizada de menor a mayor. A continuacin se detalla el procedimiento para el clculo de dicho
estadstico:
1.

Se calcula

2. 35 se ubica en las frecuencias acumuladas en el intervalo 90 94. A este intervalo se le


denomina la clase mediana.
3. Se determina fa que corresponde a la frecuencia acumulada anterior a la clase mediana; en este
caso es igual a 24
4. De igual manera se seala el valor de fmdn , o sea, la frecuencia simple dentro de la clase
mediana, que result ser igual a 17
5. El tamao del intervalo, i, para este problema es de (5)
6. Finalmente se sustituye en la frmula de la mediana:
(

El valor de la mediana para estos datos es de 92.73 y se considera que deja por encima y por debajo
de l al 50% de los datos de la distribucin. Como se puede observar, el valor de la mediana es
ligeramente inferior al de la media aritmtica, situacin que se presentar siempre que se analicen
datos muestrales. Sin embargo, siempre aspiraremos a que la diferencia entre estos dos estadsticos
sea la menor posible, lo cual indicara lo que se denominar posteriormente asimetra.

32
La moda (

La definicin ms simple y frecuente de la moda es: el valor o puntaje que ms se repite en una
distribucin. A continuacin se presenta un ejemplo, cuando las puntuaciones no estn afectadas
por intervalos:
Puntajes (ficticios)
1
2
3
4
moda
4
5
6
7
8

Para el ejemplo anterior, la moda es 4 porque es el puntaje que ms se repite. El clculo de este
estadstico en distribuciones simples es sencillo, presentndose dificultades si en la distribucin hay
ms de un puntaje con la mayor frecuencia; en estas condiciones, estamos ante la presencia de
varias modas en una sola distribucin, situacin que no es la ms adecuada para el anlisis de la
tendencia central de las observaciones.

1. La moda para datos agrupados en inter valos


Existen varios procedimientos para el clculo de la moda en datos agrupados en distribuciones por
intervalos: el mtodo de interpolacin algebraica y el mtodo emprico. A continuacin
analizaremos cada uno de ellos.

33

Moda por el mtodo de interpolacin algebraica


TABLA 5-3:
Clculo de la moda por interpolacin algebraica
i

65-69

70-74

75-79

80-84

85-89

90-94

17

95-99

100-104

105-109

110-114

115-119

120-124

La frmula general para el clculo de la moda por el mtodo de interpolacin algebraica es la


siguiente:
(

: lmite inferior real del intervalo donde cae la moda (clase modal), o sea, el que tiene
mayor frecuencia
: Delta 1, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase pre modal (desprciense los signos).
: Delta 2, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la post modal (desprciense los signos).
i : tamao del intervalo.
Al igual que en la mediana, los datos estn organizados de menor a mayor y se requiere determinar
previamente el lugar (intervalo) en que debe caer el valor de la moda. A continuacin se presenta un
ejemplo a partir de los datos de la Tabla 5-3.
(

El valor de la moda calculada a travs del mtodo de interpolacin algebraica es de 91.64, que es un
valor ligeramente diferente al de la media y la mediana, calculadas para el mismo conjunto de datos.

34
Moda por el mtodo emprico
Otro mtodo a travs del cual tambin se puede calcular la moda es el mtodo emprico, el cual se
utiliza preferiblemente cuando la distribucin es moderadamente asimtrica, o sea, cuando la media
y la mediana difieren ligeramente. En este caso se requiere que la media y mediana hayan sido
calculadas previamente y la frmula general es la siguiente:
(

Como ya se tienen los valores de la media y la mediana calculados, 94.64 y 92.73 respectivamente,
se hacen las correspondientes sustituciones en la frmula:
(

En este caso, la moda alcanz un valor de 88.91, menor que el obtenido en el mtodo de
interpolacin algebraica. La diferencia entre ambos valores calculados no debe inquietar al
estudiante si los procedimientos han sido correctamente ejecutados; estos procedimientos no llevan
a resultados iguales. Sin embargo, el buen juicio del investigador debe prevalecer en situaciones
como sta antes de escoger el mtodo ms conveniente. Para este caso, sera prudente evaluar el
coeficiente de asimetra para verificar que la diferencia entre la media y la mediana es
estadsticamente aceptable.
COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA
Es importante destacar que de las tres medidas de tendencia central, la media presenta
caractersticas estadsticas que la hacen poseer un mayor nivel de utilidad; es la ms importante. Sus
propiedades favorecen su utilizacin en clculos estadstico ms avanzados, especialmente en las
estadsticas inferenciales y el muestreo. Se le considera la ms estable y confiable entre las medidas
de tendencia central, lo cual significa que si tomramos varias muestras, la media aritmtica
presentara menor fluctuacin que la mediana y la moda.
Hay ocasiones en que se prefiere utilizar la mediana, especialmente cuando queremos hacer ciertas
descripciones.
Finalmente, la moda es la medida de tendencia central con menos aplicaciones en la investigacin
psicolgica. Fundamentalmente, es una medida muy inestable, no es susceptible de manipulacin
algebraica y su verdadero valor es difcil de establecer.
La media, mediana y moda pueden relacionarse a travs de ciertas condiciones que pasaremos a
sealar:

Para una distribucin simtrica y unimodal, la media mediana moda

Para una distribucin positivamente asimtrica, la media es la mayor, la mediana se ubica en el


centro y la moda es la menor.

35

Para una distribucin negativamente asimtrica, la media es la menor, la moda la mayor y la


mediana se ubica entre las dos.

CONCEPTOS IMPORTANTES

Datos originales o brutos


Media aritmtica
Promedios de posicin
Mediana
Moda
Medidas estadsticas
Tendencia Central
Variabilidad

36
EJERCICIOS PRCTICOS

Problema 1
110
133
116
128
85
100
105
150
118
97
154

113
119
103
93
108
100
111
130
104
135
131

111
115
103
93
108
100
122
130
104
135
113

108
117
121
105
136
123
100
89
94
139
82

113
110
109
118
115
126
114
108
115
133
106

134
104
147
119
117
119
91
137
112
107
101

124
125
103
89
110
113
123
121
125
115
122

80
85
113
143
128
102
132
142
129
83
96

112
120
107
108
145
100
97
111
131
109
145

106
135
98
142
127
93
110
123
110
116
101

Los datos anteriores son los mismos para los cuales ha creado distribuciones de frecuencias y
grficos. En esta ocasin, utilizando la tabla de Frecuencias con intervalos de tamao 5, determine:
1. La media aritmtica
2. La mediana
3. La moda (por el mtodo de interpolacin u por el mtodo emprico)
Como usted ha construido para estos datos, distintos tipos de tablas de frecuencias, calcule las
medidas de tendencia central identificadas anteriormente. Trate de desarrollar estas prcticas que
sern de gran beneficio para su proceso de aprendizaje.

37

CAPTULO 6
MEDIDAS DE VARIABILIDAD
En el captulo anterior analizamos las denominadas Medidas de Tendencia Central ms
importantes en las estadsticas aplicadas en psicologa. La importancia de la tendencia central es
incuestionable, pero es importante destacar que las mismas no son totalmente exhaustivas para
describir todas las caractersticas de una muestra de puntajes.
Adems de la tendencia central o el agrupamiento de los puntajes alrededor de ciertos valores
centrales, se observan manifiestas diferencias entre los valores obtenidos por cada sujeto. Algunos
sujetos obtienen puntajes que sobrepasan las medidas de tendencia central, mientras que otros
corresponden a valores inferiores a la tendencia central. Esto se debe, principalmente, a las
diferencias individuales, que se reflejan en los resultados obtenidos en las mediciones
psicolgicas, las cuales determinan una evidente variabilidad de las puntuaciones individuales.
En la misma forma en que la tendencia central fue analizada a travs de varios estadsticos
denominados medidas de tendencia central, las variaciones observadas entre los puntajes pueden ser
descritas a travs de estadsticos denominados medidas de variabilidad o dispersin, las cuales
permiten analizar las condiciones de variacin que se dan entre los puntajes de la muestra y las
medidas de tendencia central.
Las medidas de variabilidad que se analizarn a lo largo de este captulo son: la fluctuacin, los
percentiles, la varianza y la desviacin estndar. Las dos primeras, la fluctuacin y los
percentiles, son medidas de variabilidad que no estn asociadas con ninguna medida de tendencia
central, mientras que la desviacin media, la varianza y la desviacin estndar, son medidas de
variabilidad asociadas con la media aritmtica.
Las medidas de variabilidad anteriormente presentadas no son las nicas medidas de de este tipo
existentes, pero para efectos de nuestros estudios y posteriores aplicaciones, se considerarn las ms
importantes.
MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA
MEDIA ARITMTICA
La Fluctuacin (Amplitud)
La fluctuacin es la medida de variabilidad ms sencilla, tanto en su forma de calcularse como de
interpretarse. Tambin se le reconoce como rango o amplitud, y se refiere a la diferencia que hay
entre la puntuacin mayor de la distribucin, menos la puntuacin menor de la distribucin, ms
uno:
= fluctuacin
= puntuacin mayor
= puntuacin menor
1 : corrector por continuidad

38
Si nos referimos a los datos de la muestra No.1, Captulo 3 (ver Tabla 3-1), el puntaje mayor fue
122 y el menor 67, lo que implica que su fluctuacin es de:

Para datos agrupados en tablas de distribuciones de frecuencias, la fluctuacin es la diferencia entre


el lmite de clase superior del intervalo ms alto, menos el lmite de clase inferior del intervalo ms
bajo.
Como puede observarse, la fluctuacin est afectada por los puntajes extremos de la distribucin, y
esta situacin establece la probabilidad de que valores inusuales pueden estar afectndola. Adems,
la fluctuacin no est relacionada con ninguna medida de tendencia central, lo cual le resta poder en
los anlisis estadsticos.
Es importante destacar, que la fluctuacin es muy sensible al tamao de la muestra, lo que significa
que est muy afectada por las modificaciones en el tamao de las mismas. Ante este conjunto de
condiciones desfavorables, es claro que la utilidad de la fluctuacin es bastante limitada en
comparacin con otras medidas de variabilidad que analizaremos posteriormente. Sin embargo, ya
vimos que la misma es importante para la construccin de las tablas de frecuencias por intervalos.
A continuacin vamos a introducir una medida de variabilidad de mucha importancia para la
psicometra y el diseo de normas: los percentiles.
Los Percentiles
Se conoce como percentil, al puntaje de una distribucin que deja por debajo de l un cierto
porcentaje de los casos de dicha distribucin. Por ejemplo, el percentil 50, o sea, P50 en notacin
estadstica, es aquel que deja por debajo de s al 50% de la totalidad de los casos; el percentil 32,
P32, es aquel que deja por debajo de s al 32%, y as sucesivamente. Para el clculo de los
percentiles, es necesario que los datos estn organizados en una Tabla de Frecuencias ordenada de
menor a mayor. El procedimiento de clculo de un percentil es idntico al de la mediana y se le
considera un estadstico de posicin. Para el clculo de los percentiles en una tabla de frecuencias se
recurre a la siguiente frmula:
(

), donde:

Li = lmite inferior real del intervalo en que cae el percentil.


%n= nmero de casos correspondientes al percentil y se encuentra en la columna de las
frecuencias acumuladas.
= frecuencias acumuladas hasta el intervalo anterior al del percentil.
= frecuencias simples dentro del intervalo donde cae el percentil.
i = tamao del intervalo.
A continuacin se presenta un ejemplo:

39
TABLA 6-1:
Clculo del P40 en una muestra de 78 sujetos
I

Fa

5-9

10-14

11

15-19

16

27

20-24

17

44

25-29

12

56

30-34

63

35-39

68

40-44

72

45-49

74

50-54

76

55-59

77

60-64

78

Intervalo en que cae 31.2

Supongamos que se desea calcular el P40 en los datos de la Tabla anterior:


Paso 1: se calcula el %/n, o sea, el 40% de 78 = (0 0)( )
Paso 2: se ubica 31.2 en el intervalo 20 24 que tiene una fa = 44, porque es en ese
intervalo en el que se encuentra dicho valor.
Paso 3: a partir de este intervalo se desarrolla la frmula:
(

De acuerdo con el resultado obtenido, el puntaje 20.74 deja por debajo de l al 40% de la
distribucin. Es necesario destacar que los percentiles tambin pueden ser identificados con otras
denominaciones, la cuales estn asociadas con los porcentajes de puntajes que dejen por debajo de
si:

Deciles (D): se refieren al 10%. En este caso, se les denominara: decil 1 al primer 10% (D 1),
decil 2 al 20% (D2), decil 3 al 30% (D3) y as sucesivamente hasta el decil 10 que dejara por
debajo de s al 100%.

Quartil (Q) : se refieren a intervalos de 25%. El cuartil 1 (Q1) deja por debajo al 25%, el Q2 se
refiere al que deja por debajo al 50% (observe que este caso es igual a la mediana), el Q3 que
deja por debajo el 75% y el Q4 que corresponde al 100%.

40

Observe que el D5, el Q2 y la mediana, corresponden al mismo dato: el que deja por debajo de si
al 50% de la distribucin.

Todas estas denominaciones corresponden a percentiles y son calculados de acuerdo con la


frmula ya presentada.

MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA


ARITMTICA
La Desviacin Media
A partir de la desviacin media, nuestro inters se centra en las medidas de variabilidad que
parten de algn tipo de promedio, ya sea la mediana o en especial la media. La desviacin media se
define como el promedio de las desviaciones absolutas alrededor de la media. La frmula para el
clculo de dicho estadstico para datos no organizados por intervalos es:
|

| |

A continuacin se presenta un ejemplo:

|d|

3.5

2.5

1.5

0.5

0.5

1.5

2.5

9__

3.5__

Diferencia
entre el
puntaje y la
media
aritmtica,
sin
considerar
el signo

16.0

Como se puede observar, cada puntaje se resta de la media (d) pero no se toma en consideracin el
signo (diferencias absolutas), se suman y dividen entre n, obtenindose una estimacin de la
variabilidad la cual tiene la restriccin de que no da informacin sobre la ubicacin del puntaje con
relacin a la media.

41
Para datos organizados en tablas de frecuencias, los puntos medios de cada intervalo se restan de la
media aritmtica, sin tomar en consideracin los signos (| |). Luego se multiplican las frecuencias
de cada intervalo por sus respectivas desviaciones, f(d), se suman los resultados de esta columna y
se dividen entre la n muestral. La frmula para calcular de DM en datos agrupados es la siguiente:
( |

|)

( | |)

Considerando los datos de la Tabla 6-2, la

TABLA 6-2:
Clculo de la DM para una muestra de 70 estudiantes aspirantes a ingresar a la universidad.
I
F
Pm
|d|
f(|d|)
65-69

67

27.64

55.28

70-74

72

22.64

22.64

75-79

77

17.64

70.56

80-84

82

12.64

113.76

85-89

87

7.64

61.12

90-94

17

92

2.64

44.88

95-99

97

2.36

11.8

100-104

102

7.36

58.88

105-109

107

12.36

61.8

110-114

112

17.36

69.44

115-119

117

22.36

111.8

120-124

122

27.36

54.72

= 70

= 736.68

La DM representa una modificacin del clculo e interpretacin de las medidas de variabilidad.


Esto se debe a que en este caso existe un punto o criterio a partir del cual se determinan las
desviaciones: la media aritmtica. En otras palabras, desviacin significa diferencia entre el puntaje
y la media aritmtica. La DM no es aconsejable en muestras grandes, aunque puede utilizarse en
muestras pequeas; adems, no toma en consideracin los signos positivos o negativos de las
diferencias, atendiendo a la posicin del puntaje con relacin a su media.; esto no favorece la
utilizacin de esta medida en el anlisis de la Distribucin Normal.
Desviacin Estndar O Tpica
Es la ms importante de las medidas de variabilidad. Est afectada por todos los valores de la
distribucin y mide la dispersin de los puntajes a partir de la media aritmtica, con la caracterstica
fundamental de que considera los signos + y de cada diferencia. Esta situacin la coloca en una
posicin superior, matemticamente, con respecto de las otras medidas de variabilidad

42
anteriormente discutidas. Para el caso de poblaciones, la desviacin estndar se representa por el
2

smbolo ; y al cuadrado de la desviacin estndar , se le denomina varianza. Cuando nos


referimos a muestras, la desviacin estndar est representada por s y el cuadrado de esta desviacin
s2 se denomina varianza muestral.
En distribuciones de frecuencias simples (no afectadas por intervalos), la frmula para calcular la
desviacin estndar es a siguiente:
(

Para el clculo de la S, se requieren los siguientes pasos:


1. Calcular la media aritmtica de la distribucin
2. Calcular la diferencia algebraica entre cada puntaje (x) y la media:
); a esta diferencia se le denomina desviacin (d).
3. (
) y sumar
4. Elevar al cuadrado las desviaciones de cada puntaje con respecto a la media (
el total de las desviaciones cuadrticas
5. Dividir la suma de las desviaciones cuadrticas en la muestra entre el nmero total de casos (n).
Este valor se denomina la varianza muestral, la cual ser muy til al momento de analizar las
estadsticas inferenciales.
6. Finalmente le extrae la raz cuadrada a la varianza y se obtiene la desviacin estndar (s).
Para datos agrupados en tablas de intervalos, la frmula para el clculo de la s es la siguiente:

A continuacin se presenta un ejemplo del clculo de la varianza y la desviacin estndar, para


datos agrupados en tablas de intervalos.
A partir de los datos organizados en la Tabla 6-3, se sustituye en la frmula, y se obtiene el valor de
la s:

168.20 representa la varianza


Al extrarsele la raz cuadrada a la varianza, se calcula la s (desviacin estndar de la
muestra).

43
TABLA 6-3:
Clculo de la desviacin estndar para una muestra de 70 aspirantes a ingresar a la universidad
I

Pm

fpm

fpm2

65-69

67

134

8978

70-74

72

72

5184

75-79

77

308

23716

80-84

82

738

60516

85-89

87

696

60552

90-94

17

92

1564

143888

95-99

97

485

47045

100-104

102

816

83232

105-109

107

535

57245

110-114

112

448

50176

115-119

117

585

68445

120-124

122

244

29768

6625

638745

Total

La s es la medida de variabilidad ms confiable y se puede definir como la raz cuadrada del


promedio de las desviaciones cuadrticas alrededor de la media, siendo sta su propiedad
matemtica ms importante. A partir de estas propiedades, la s es de gran utilidad en anlisis
estadstico ms avanzados tales como: muestreo, prueba de hiptesis, Anlisis de la Varianza, teora
de regresin y correlacin, etc.
La Asimetra
Se entiende por simetra el grado de equilibrio que presentan las observaciones a ambos lados de su
tendencia central. Por lo tanto, la asimetra es la ausencia de equilibrio entre dichas puntuaciones.
Estadsticamente, la simetra se refiere a que las tres medidas de tendencia central son iguales; como
esta situacin es poco probable que suceda en las muestras, las mismas son asimtricas en vista de
que dichas medidas tienden a ser diferentes por efecto de los errores de muestreo. En el fondo, los
investigadores aspiramos a obtener muestras con bajos niveles de asimetra y tratamos de verificar
esta situacin calculando el ndice de asimetra.
La condicin de asimetra de una muestra se puede verificar, inicialmente, a travs del polgono de
frecuencias, en el cual se puede observar las distintas formas de asimetra o sesgo, como tambin se
le denomina. Veamos algunos ejemplos.

44

FIGURA 61

Si la cola izquierda del polgono es ms alargada que la derecha, estamos ante un caso de asimetra
negativa. Esto significa que por debajo de la media se encuentran los puntajes ms extremos y la
media aritmtica ha tenido que correrse en esta direccin, para mantener los pesos positivos y
negativos equilibrados. Si la cola de la derecha est ms alargada, significa que estamos ante un
caso de asimetra positiva. Es decir, los puntajes ms extremos estn por encima de la media
aritmtica y ella ha tenido que correrse en dicha direccin. En la distribucin ubicada en el centro
de la Figura 61, ambos lados de la curva estn equilibrados y esto indica que sus medidas de
tendencia central tienden a ser ms o menos iguales.
Existen diversas frmulas para calcular el Coeficiente de Asimetra o CA.; a continuacin
presentamos dos de ellas.

Primer Coeficiente de Asimetra de Pearson:

Segundo Coeficiente de Asimetra de Pearson:


(

Cuando el coeficiente de asimetra es 1, se considera que el mismo est dentro de los lmites
aceptables de sesgo; mucho mejor a medida que tiende a cero (0).

La Curtosis
Se define como el grado de apuntalamiento (alargamiento vertical) que tiene una distribucin y que
se refleja con claridad en los grficos estudiados anteriormente. Cuando el apuntalamiento es poco
marcado (bajo), se considera que la distribucin es platicrtica. Cuando el apuntalamiento es muy
marcado, la distribucin se considera leptocrtica. Y cuando el apuntalamiento es mesurado, se
considera mesocrtica, siendo esta ltima la que mejor nos aproxima al modelo de la curva normal.

45

FIGURA 62

Al igual que en la asimetra, hay diversos mtodos para calcular la curtosis. A continuacin
presentamos uno de ellos: K = coeficiente de curtosis percentlico, cuya frmula es la siguiente:

K = coeficiente de curtsis percentlico


Q = desviacin intercuartil =
P90 : percentil 90
P10 : percentil 10

CONCEPTOS IMPORTANTES

Variabilidad o dispersion
Fluctuacin
Percentil
Variable
Varianza
Desviacin estndar (tpica)
Decil
Quartil
Desviacin media
Asimetra
Curtsis

46
EJERCICIOS PRCTICOS

Problema 1
110
133
116
128
85
100
105
150
118
97
154

113
119
103
93
108
100
111
130
104
135
131

111
115
103
93
108
100
122
130
104
135
113

108
117
121
105
136
123
100
89
94
139
82

113
110
109
118
115
126
114
108
115
133
106

134
104
147
119
117
119
91
137
112
107
101

124
125
103
89
110
113
123
121
125
115
122

80
85
113
143
128
102
132
142
129
83
96

112
120
107
108
145
100
97
111
131
109
145

106
135
98
142
127
93
110
123
110
116
101

Para los datos presentados, los cuales estn debidamente organizados en Tablas y grficos, y para
los cuales se han calculado las principales medidas de tendencia central, determine, utilizando la
tabla con intervalos de tamao 5:
1.
2.
3.
4.
5.

Los percentiles 25, 50, 75 y 95


La desviacin media
La Varianza y la desviacin estndar
La asimetra primero, y segundo, coeficiente de asimetra
La Curtosis

Calcule los estadsticos de variabilidad anteriormente sealados, para todas las tablas de prctica
que ha desarrollado utilizando los datos presentados.

47

CAPTULO 7
MODELOS POBLACIONALES PROBABILSTICO
A lo largo de los captulos anteriores, se ha hecho nfasis en la relacin existente entre las medidas
de tendencia central y las de variabilidad, especialmente entre la media aritmtica y la desviacin
estndar. Es incuestionable que una medida pierde mucha significatividad si no va acompaada de
la otra, dado que ambas conjugan las dos caractersticas ms importantes que se pueden observar en
una distribucin de puntajes.
La media y la desviacin estndar son las dos medidas descriptivas ms poderosas y ms
importantes en los anlisis estadsticos aplicados en la investigacin del comportamiento. Bajo
ciertos supuestos tericos, las muestras analizadas estadsticamente se aproximan a un modelo
poblacional terico denominado curva normal; esto es posible a partir de la informacin
proporcionada por la media y la desviacin estndar.
Para comprender mejor lo anteriormente sealado, es necesario tener claro el significado del
concepto modelo poblacional o probabilstico. Un modelo poblacional (o probabilstico) es una
expresin matemtica deducida de un conjunto de supuestos con el propsito de:
1. Estudiar los resultados de un experimento aleatorio y
2. Pronosticar resultados futuros del experimento o investigacin, cuando se realizan un nmero
repetido de veces.

Algunos modelos poblacionales se utilizan para aproximar un gran conjunto de distribuciones de


datos obtenidos de grandes poblaciones, las cuales se hacen representar por subconjuntos menores
denominados muestras. En vista de que las variables se han definido como discretas y continuas, se
han creado modelos poblacionales para cada uno de estos tipos de variables. Lo anteriormente
sealado nos permite hacer las siguientes observaciones:

En los casos en que la(s) variable(s) de estudio se considere discreta, o sea, que est
representada por categoras, las cuales reflejan la cantidad de sujetos, objetos o fenmenos que
comparten dicha categora, hay un conjunto de modelos poblacionales probabilsticos que
permitirn llevar adelante estudios e investigaciones con dichas variables, independientemente
del rea cientfica en la que se desarrolla el estudio. Lo importante es que la variable, adems de
ser discreta y no poseer valores fraccionales, satisfaga las restricciones que el modelo
probabilstico exige. Algunos ejemplos de estos modelos seran: Bernoulli, Binomial,
Multinomial, Hipergeomtrico, Poisson, y otros. Para el caso de este libro, analizaremos el
modelo Binomial, en vista de que el mismo se aplica a diversas experiencias, situaciones e
investigaciones propias de los estudios del comportamiento, en especial en el rea de la
psicometra y construccin de pruebas.

48

En los casos en que la(s) variable(s) de estudio se considere continua, o sea, que puede asumir
valores fraccionales dentro de intervalos y que por lo tanto indica la cantidad que cada sujeto
posee del atributo, los resultados sern aproximados a modelos de probabilidad continuos, tales
como la Distribucin Normal para muestras grandes (>) de 30 sujetos, la t de student y la F
de Fisher para muestras de 30sujetos.

VARIABLES DISCRETAS
La Distribucin Binomial
La Distribucin Binomial es til en aquellos casos en los cuales la variable de estudio es discreta en
el sentido de que puede asumir nicamente dos posibles valores y se satisfacen las siguientes
restricciones:
1.
2.
3.
4.
5.
6.

El experimento o investigacin est compuesto por n casos, para cada uno de los cuales hay n
cantidad de pruebas o actos, con dos posibles alternativas cada una.
Cada una de las pruebas se debe desarrollar en las mismas condiciones
Los resultados obtenidos en cada prueba se clasifican en una de dos posibles categoras que son
mutuamente excluyentes denominadas xitos o fracasos.
La probabilidad de xito se identifica por p y la de fracaso por q, las cuales son
mutuamente excluyentes.
En cada acto, la probabilidad de xito no vara, y por lo tanto, la probabilidad de q sera igual
a1p
El objetivo del experimento es determinar para cada acto o prueba, si el evento venturoso o
esperado, se present o no.

Cuando se desarrollan investigaciones de esta ndole, las mismas se consideran de carcter binomial
y tienen n + 1 resultados posibles. El 1 representa la posibilidad de que el evento esperado no se
d. Veamos algunas situaciones relacionadas con este tipo de estudio.

Se lanza una moneda 5 veces. El evento de inters es la aparicin de caras y por lo tanto la
misma podra aparecer: 1, 2, 3, 4 y 5 veces, pero tambin puede suceder que no aparezca
ninguna vez. Por lo tanto, cara tiene 5 + 1 formas diferentes de aparecer (n + 1), lo cual incluye
que no aparezca. Su representacin correcta sera: 0, 1, 2, 3, 4, 5.

Se aplica un examen de 25 preguntas y el evento de inters es el nmero de preguntas


respondidas correctamente. Esto significa que el estudiante puede obtener desde 1 hasta 25
preguntas correctas, pero hay que incluirle que no responda correctamente ninguna de las 25 lo
que significa que obtuvo 0 xitos. Bajo estas condiciones, el experimento tiene 25 + 1 posibles
resultados, o sea, 26. Desde 0, 1, 2, 3, 4 hasta 25.

El modelo binomial es til en casos en los cuales estamos interesados en determinar la probabilidad
de ocurrencia de un nmero X de xitos, cuando se han desarrollado n pruebas o actos, y la
probabilidad p de xitos se ha mantenido constante a lo largo de las n pruebas. Por ejemplo:

Cul es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?

49

Cul es la probabilidad de responder satisfactoriamente 10 preguntas de un examen de 30


preguntas, si cada pregunta es de seleccin mltiple con cuatro alternativas?

Para responder a estas preguntas, se debe aplicar la frmula de la funcin probabilstica binomial, la
cual detallamos a continuacin:
(

Esta expresin se leera de la siguiente manera: cul es la probabilidad de obtener exactamente X


xitos, en un experimento de n pruebas, siendo p la probabilidad de xito en cada prueba? Los
elementos que componen la ecuacin son los siguientes:
b : funcin binomial o probabilidad binomial
X: nmero de xitos
p: probabilidad de cada xito (es una constante, que ser explicada en el captulo 9)
nCx: combinacin

( )

de x xitos en n pruebas.

A continuacin se desarrollarn los dos problemas presentados como ejemplos:

Ejemplo 1
Cul es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?
(

0 0)

)(0 0 )(0 0

( 0)(0

)(0

Ejemplo 2
Cul es la probabilidad de responder satisfactoriamente 4 preguntas de un examen de 10
preguntas, si cada pregunta es de seleccin mltiple con cuatro alternativas?
(

00

)(0

)(0 0

0)(0 00 )(0

VARIABLES CONTNUAS
Puntuaciones estndar
Daremos inicio a nuestro estudio de los modelos poblacionales continuos, a travs de la
Distribucin Normal, considerada la ms importante de todas las distribuciones por las propiedades
estadsticas que la definen.
Si tomramos en consideracin todos los puntajes de la muestra resumida en la Tabla 5-1,
podramos llegar a la conclusin que la media aritmtica de dichos datos fue de 94.64. A partir de
este dato podemos observar que las puntuaciones de dicha muestra se desvan por encima y por
debajo de su media muestral, tal y como lo presentamos en los ejemplos a continuacin:

50
TABLA 7-1:
Desviaciones con respecto a la media
Dato

Lmite real

Media

(d)
Desviacin

75

74.5

94.64

-20.14

90

89.5

94.64

-5.14

99

99.5

94.64

+4.86

112

112.5

94.64

+17.86

Los ejemplos anteriores demuestran que los puntajes de las distribuciones se desvan por encima y
por debajo de su media aritmtica; si recordamos una propiedad de la media sabemos que
0.
Otro aspecto a destacar en el cuadro anterior es que para calcular la desviacin (d), se utilizan los
lmites reales de cada dato, atendiendo a la posicin que ocupe con relacin a la media: si es menor
que la media, la desviacin se hara desde el lmite inferior real del dato (75 y 90); si es mayor que
la media, se utilizara el lmite superior real del dato (99 y 112). Estos ejemplos permiten aclarar el
concepto de desviacin con respecto a la media, desde el punto de vista de que las desviaciones
alrededor de la media pueden ser negativas (-) para los casos de X menores que la media, y
positivas (+) para los casos de X mayores que la media.
Para la muestra de datos de la Tabla 5-1, la desviacin estndar (s) fue de 12.97, lo cual representa
el promedio de las desviaciones alrededor de la media. Si cada desviacin de los puntajes
observados en la Tabla 7-1, fuera dividida entre la desviacin estndar (12.97), se obtendran las
desviaciones de los puntajes expresados en unidades de desviacin estndar, tal y como se presenta
en la siguiente Tabla.
TABLA 7-2:
Desviacin estandarizada de los puntajes originales a partir de la relacin d/s
d
x
Desviacin
(Desviacin

(Puntajes)
estandarizada
original)

-1.55

-5.14

-0.40

99

+4.86

+0.37

112

+17.86

+1.38

75

-20.14

90

Si observamos la Tabla anterior, las d han sido transformadas a unidades de desviacin estndar.
Esta nueva situacin se interpreta de la siguiente manera:
1. El puntaje 75 se desva de la media aritmtica en -1.55 unidades de desviacin estndar.
2. El puntaje 90 se desva de la media aritmtica en -0.40 unidades de desviacin estndar.
3. El puntaje 99 se desva de la media aritmtica en 0.37 unidades de desviacin estndar.
4. El puntaje 112 se desva de la media aritmtica en 1.38 unidades de desviacin estndar

51
Como se puede observar, las d con la media aritmtica son relativas en funcin de la desviacin
estndar; la interpretacin ahora es la siguiente: cuntas unidades de desviacin estndar se
desva cada puntaje de su media aritmtica.
Una puntuacin estndar, identificada a partir de este momento por z, se refiere a la
transformacin de la diferencia de un puntaje con respecto a su media aritmtica en unidades de
desviacin estndar. La regla (frmula) para calcular esta medida es la siguiente:

En trminos de puntuaciones estandarizadas Z, una distribucin de puntajes est definida dentro de


los siguientes intervalos:

|
-3s
-3z

|
-2s
-2z

|
-1s
-1z

|
1s
1z

|
2s
2z

|
3s
3z

FIGURA 71

De acuerdo con el diagrama anterior, podemos hacer las siguientes deducciones:

Cada desviacin estndar (s) corresponde a una z

En una distribucin de puntajes, los mismos estarn definidos entre -3z y +3z.

Esto significa que el puntaje menor de la distribucin estar muy cerca de -3z pero nunca ms
all de este valor

De igual manera, el puntaje mayor de la distribucin estar muy cerca de +3z, pero nunca ser
mayor a ste.

La media de las puntuaciones z ser igual a cero y la desviacin estndar ser igual a uno.

La Distribucin Normal
La Distribucin Normal es un modelo poblacional, terico, que permite analizar las observaciones
correspondientes a ciertas muestras en trminos de probabilidades. La Distribucin normal se
identifica por una curva perfecta en forma de campana, que satisface las siguientes propiedades:
1. Es una distribucin terica de los datos de una poblacin
2. Tiene forma de campana
3. Es asinttica, o sea, que las colas de la curva nunca se unen con el eje de X
4. Tiene como parmetros a (media) y a (desviacin estndar). Esto significa que el rea bajo
la curva est definida por y un valor determinado de .
5. El valor de es de 0, mientras que el valor de es de 1.

52
6. Est definida totalmente a partir de la media, por 3 desviaciones a la derecha (por encima de )
y 3 desviaciones a la izquierda (por debajo de ), lo que significa que la totalidad de los casos
de la muestra estn definidos dentro de este intervalo. (Ver la Figura 72)

34.13%

34.13%

13.59%

13.59%

2.15%

-3

2.15%

-2

-1

FIGURA 72

Otra caracterstica de la Distribucin Normal es su perfecta simetra; la media aritmtica = a la


mediana = a la moda, lo que determina que una mitad de la curva sea igual a la otra mitad. Esto
implica que las caractersticas estadsticas de una mitad, sean igual a las de la otra.
Entre cada desviacin estndar se describe la probabilidad de los datos bajo la curva, tal y como se
observa en la Figura 72. Esta probabilidad tambin se expresa en % para facilitar su
interpretacin. A continuacin se detalla la distribucin de probabilidades bajo la curva:

Entre la media y una desviacin estndar positiva se encuentra el 0.3413 de probabilidad que
corresponde al 34.13%. Por identidad, se dan los mismos valores a una desviacin negativa.

Entre una desviacin y dos desviaciones positivas, se da el 0.1359 de probabilidad que


corresponde al 13.59%; lo mismo sucede el lado izquierdo.

Entre dos desviaciones y tres desviaciones positivas se observa el 0.0215; de igual manera
sucede en el lado izquierdo. Esto corresponde al 2.15% de la probabilidad total.

Desde la media hasta tres desviaciones positivas se da un total de 0.4987 de probabilidad; de


igual manera sucede en el lado izquierdo.

La probabilidad total bajo la curva, o sea, entre -3z y + 3z es igual a 0.9974, que corresponde a
un 99.74% de la totalidad del rea bajo la curva. La Curva Normal no tiene un 100% de
probabilidades bajo ella, por su condicin asinttica; la curva normal va al infinito tanto en la
cola derecha como en la izquierda.

53

As como las probabilidades bajo la curva son infinitas, de igual manera lo son las puntuaciones
z. Sin embargo, cuando se aproximan muestras a la curva normal, las probabilidades se
determinan entre +3z y 3z.

Para cada valor z hay una probabilidad asignada, la cual se determina a travs de una Tabla
especialmente confeccionada para estos fines (Ver Apndice)

Aplicacin
Una de las aplicaciones al trabajar con la distribucin normal mediante las puntuaciones z es el
clculo de la probabilidad de ocurrencia de una determinada puntuacin.
El procedimiento para este clculo conlleva los siguientes pasos:
1. Determinar el puntaje z correspondiente a la puntuacin cuya probabilidad se quiere calcular.
2. Se determina el rea correspondiente entre la media y el valor z (Utilizar la tabla de reas bajo
la curva normal en el Apndice 1)
3. Realizar la operacin de acuerdo con el rea que se solicita
Si Z es positiva y se solicita rea por encima de x, entonces resta
0 000

P de Z

Si Z es positiva y se solicita rea por debajo de x, entonces suma


0 000

P de Z
0.5000

Si Z es negativa y se solicita rea por encima de, entonces suma


0 000

54

P de Z
0.5000

Si Z es negativa y se solicita rea por debajo de, entonces resta


0 000

P de Z

Si Z1 y Z2 tienen signos iguales y se solicita el rea entre ellas, entonces se resta

P de Z2
P de Z1

Si Z1 y Z2 tienen signos distintos y se solicita el rea entre ellas, entonces se


suma

P de Z1

Ej emplos

P de Z2

55
1.

Se aplic una prueba de aptitudes generales a una muestra de 250 estudiantes de primer ingreso
a la universidad. La media fue de 65 y la desviacin estndar de 8.25. Determine la p de
obtener una puntuacin mayor de 68 puntos
Se calcula el valor z correspondiente al puntaje 68. En vista de que ese
puntaje es mayor que la media aritmtica, se utiliza el lmite superior real del
mismo.
0

Se determina el rea o probabilidad bajo la Tabla de la curva normal


correspondiente al valor de z, lo cual equivale a 0.1628
Como la probabilidad pedida es mayor que 68, se resta a la mitad de la curva
(0.5000) la probabilidad correspondiente a X = 68, tal y como se demuestra a
continuacin:
0 000 0
0
, lo cual corresponde a la
respuesta correcta.

2. Con los mismos datos del problema, determine la probabilidad de obtener una puntuacin
menor o igual a 71 puntos.
Se calcula el valor z correspondiente al puntaje 71; por ser el mismo mayor
que la media aritmtica, se utiliza el lmite superior real.
0

Se determina el rea o probabilidad de z = 0.79, que corresponde a 0.2852


En vista de que la probabilidad solicitada es que 71, a la probabilidad
correspondiente a 71 que va desde la media hasta este puntaje, se le suma la
mitad inferior de la curva, tal y como se presenta a continuacin:
0
0 000 0
, que representa la respuesta correcta

3. Con los mismos datos, indique la probabilidad de obtener una puntuacin entre 60 y 71.
Por el problema anterior ya se conoce la probabilidad del puntaje 71, que fue
igual a 0.2852
Se determina el valor Z del puntaje 60, que por ser inferior a la media
aritmtica, requerir que se utilice el lmite inferior real de dicho puntaje.
0

Como se pudo observar, este valor es negativo por ser 60 inferior a la media de
65.
Se determina el rea o probabilidad de Z = -0.67 utilizando la Tabla; el
resultado fue de 0.2486
Finalmente se suman las dos reas y se determina la probabilidad de obtener un
puntaje ente 60 y 71, tal y como se presenta a continuacin:
0
0
0
, que representa la respuesta correcta.

56

Hay ocasiones en que el problema se debe desarrollar ntegramente en una mitad de la curva. Por
ejemplo, si se busca un rea en la mitad superior de la media o en la mitad inferior de la media
aritmtica.
Tomando como referencia el problema planteado, suponga que se requiere determinar la
probabilidad que hay entre los puntajes 53 y 62. Como se puede observar, ambos puntajes estn
por debajo de la media aritmtica, lo cual afecta la definicin de los lmites reales. Para estos
casos, se procedera de la siguiente manera.
1.

Ubique el puntaje ms alejado de la media aritmtica, el cual sera, en este caso 53, y
determine su valor Z, utilizando su lmite real inferior.

2. Determine el rea correspondiente a este valor Z, que es igual a 0.4357


3. Ubique el puntaje ms cercano a la media, el cual corresponde a 62. Como usted est buscando
la probabilidad entre 53 y 62, en realidad est buscando la probabilidad entre 52.5 y 62.5, por lo
tanto, necesita determinar la probabilidad entre la media y el lmite superior de 62, que es 62.5.
Se determina la Z de 62.5.
0 0
4. Determine el rea o probabilidad correspondiente a esta Z, que es 0.1179
5. Teniendo el rea del lmite inferior del puntaje ms lejano (53) y el rea del lmite superior del
puntaje ms cercano (62), se restan ambas probabilidades, tal y como se presenta a
continuacin:
0
0
0
, que es la respuesta correcta al problema.

El manejo correcto de la Distribucin Normal es una obligacin de los especialistas del


comportamiento, en vista de que un nmero importante de investigaciones se refieren a muestras
provenientes de grandes poblaciones. Adems, un nmero importante de pruebas de hiptesis se
fundamentan en los principios de la Distribucin Normal, tanto en el caso de muestras grandes
como pequeas. Finalmente, la medicin del comportamiento requiere del dominio de la curva
normal en los aspectos de muestreo, anlisis de reactivos y diseo de normas.

Aproximacin Normal De La Distribucin Binomial

En algunas ocasiones, los investigadores se encuentran con la necesidad de analizar un problema


utilizando una distribucin de probabilidad diferente a la que corresponde a la(s) variable(s) de
estudio. Uno de los casos ms frecuente en psicologa es el evaluar a travs de la normal, datos que
originalmente corresponden a la binomial. A esta situacin se le conoce como la aproximacin
normal de la binomial.

57
Su aplicacin es muy til en investigacin general del comportamiento, pero en mi opinin, su
aporte ms importante se da en la medicin psicolgica, especialmente en los casos en que
deseamos analizar probabilsticamente los resultados de pruebas, cuyas respuestas se pueden
brindar en dos posibles alternativas: xitos y fracasos, y en las cuales, el nmero de reactivos que la
conforman es grande.

Para utilizar esta aproximacin es necesario que se cumplan algunas condiciones:

N debe ser grande. Para efectos prcticos estadsticos, np debe ser > 5.

p y q no deben estar prximos a cero; mientras ms se aproximen a su lmite, 0.50, mejor.

La aproximacin se realiza transformando los puntajes binomiales a normales, o sea, a puntuaciones


z. La frmula para alcanzar ste objetivo es:

z : puntuaciones normales estandarizadas


np : media de la distribucin binomial
: desviacin estndar de la distribucin binomial

x : puntaje.

A continuacin se presenta un ejemplo:

Se aplic una prueba de conocimientos generales constituida por 60 reactivos; la prueba es de


cierto-falso, o sea, dos alternativas. Estamos interesados en determinar la probabilidad de
obtener hasta 38 preguntas correctas.
( 0)(0 0)

( 0)(0 0)(0 0)

Area (p) de Z = 2.20 = 0.4861


Probabilidad solicitada: mitad inferior de la curva = 0.5000 + 0.4861 = 0.9861
A partir del clculo de Z, el resto del procedimiento se hace tal y como se estudi en el captulo de
la Distribucin Normal.

58
CONCEPTOS IMPORTANTES

Curva Normal
rea o probabilidad
Desviacin
Distribucin binomial
Modelo poblacional
Lmites reales
Puntuacin estndar
Puntuacin Z

59
EJERCICIOS PRCTICOS

Problema 1
110
133
116
128
85
100
105
150
118
97
154

113
119
103
93
108
100
111
130
104
135
131

111
115
103
93
108
100
122
130
104
135
113

108
117
121
105
136
123
100
89
94
139
82

113
110
109
118
115
126
114
108
115
133
106

134
104
147
119
117
119
91
137
112
107
101

124
125
103
89
110
113
123
121
125
115
122

80
85
113
143
128
102
132
142
129
83
96

112
120
107
108
145
100
97
111
131
109
145

106
135
98
142
127
93
110
123
110
116
101

Para los datos presentados, usted ya ha desarrollado en los captulos anteriores, todo un modelo de
anlisis descriptivo que incluye: tablas de frecuencias, grficos, medidas de tendencia central y de
variabilidad. En estas dos ltimas, ha calculado la media aritmtica y la desviacin estndar. Como
ya es de su conocimiento, estos dos estadsticos se consideran los estimadores requeridos para
ajustar los datos a la distribucin normal o curva normal. Desarrolle los problemas que le
presentamos, a continuacin:
1.
2.
3.
4.
5.
6.
7.
8.
9.

Cul es el rea o p por encima del puntaje (X) = 103?


Cul es el rea o p por debajo de X = 90?
Cul es el rea o p por encima de X = 79?
Cul es el rea o p por debajo de X = 112?
Cul es el rea o p entre X = 77 y X = 94?
Cul es el rea o p entre X = 99 y X = 112?
Cul es el rea o p por debajo de X = 80 y por encima de X = 107?
Cul es el rea o p exactamente = a X=103?
Para cada uno de los 8 ejercicios anteriores, determine el nmero de sujetos (n) incluidos dentro
de cada uno de los intervalos presentados.

Binomial
10. Se ha presentado un examen de cierto-falso con 20 preguntas. Determine la p de obtener:
0 preguntas correctas
4 preguntas correctas
Entre 3 y 6 preguntas correctas
11. La probabilidad de que nazca una nia mujer es de 0.51. Si en cierta fecha se producen tres
nacimientos, cul es la p de: que nacieran:
tres mujeres?
Por lo menos una mujer?
Ninguna mujer?

60
12. En un test psicolgico de relaciones espaciales, se tiene una probabilidad de 0.40 de acertar
en cada una de las pruebas. Si un sujeto realiza 5 pruebas, cul es la probabilidad de obtener:
un xito?
tres xitos?
hasta cuatro xitos?
Ningn xito?
13. El 30% de los hogares de cierta ciudad, tiene por lo menos una persona desempleada. Un
investigador visita 6 hogares. Cul es la probabilidad de que encuentre:
Un hogar en estas condiciones?
Entre 0 y 3 hogares en estas condiciones?
Todos los hogares en estas condiciones?
No menos de 2 hogares en estas condiciones?
14. La probabilidad de que un nio tenga Dficit de Atencin (DA) en una escuela elemental es de
0.20. Se seleccionan 7 nios de dicha escuela. Cul es la probabilidad de que:
por lo menos 4 nios sufran de DA?
2 nios sufran de DA?
A lo mximo 3 nios sufran de DA?
Entre uno y 4 nios sufran de DA?
Aproximacin Normal A La Binomial
15. Una prueba de aptitudes cuyas preguntas son de 4 alternativas cada una, consta de 50 reactivos.
Cul es la probabilidad de obtener:
entre 20 y 38 respuestas correctas
entre 30 y 42 correctas
ms de 26 correctas
menos de 20 correctas
16. En un centro de rehabilitacin de menores el 40% ingres por consumo de drogas. Se
selecciona una muestra de 60 menores. Cul es la probabilidad de obtener:
entre 20 y 29 menores consumidores?
menos de 30 menores consumidores?
15 o ms menores consumidores?
Entre 12 y 22 menores consumidores?

61

CAPTULO 8
CORRELACIN Y REGRESIN

En los captulos anteriores nos hemos dedicado a analizar los resultados correspondientes a la
medicin de una sola variable. Pero en muchas ocasiones, los psiclogos se interesan por las
relaciones que existen entre dos o ms variables, asumiendo que las mismas no funcionan
independientemente, sino que una afecta o se relaciona con la otra.
Por lo general, las teoras psicolgicas que tratan de explicar la conducta del hombre, analizan la
misma a travs de modelos tericos multivariantes, que exploran el comportamiento desde dos
perspectivas: la terica y la operacional; en ambos casos, el enfoque principal se centra en
considerar el comportamiento como el efecto combinado de dos o ms variables. El anlisis
operacional de las relaciones entre variables se lleva a cabo utilizando una herramienta de las
estadsticas denominada correlacin. El anlisis de las correlaciones permite explicar, en trminos
estadsticos, el tipo de relacin entre las variables y la magnitud (cantidad) de la relacin entre las
mismas.
Las correlaciones favorecen la interpretacin del comportamiento desde diferentes puntos de vista:

La prediccin: no es otra cosa que la posibilidad que tienen los especialistas de la conducta de
pronosticar, dentro de ciertos mrgenes de error, el comportamiento de una o ms variables, a
travs del anlisis del comportamiento de otras variables diferentes. Suponga que yo considero
que dos variables comportamentales X y Y se relacionan de alguna manera. Si logro comprobar
dicha relacin, desde una perspectiva estadstica, puedo estar en capacidad de pronosticar que
suceder en el futuro con una de ellas, a partir del conocimiento del comportamiento de la otra.
Por ejemplo:
o

Se ha logrado establecer estadsticamente, que la aptitud numrica (X) se relaciona


con el rendimiento acadmico en ingeniera (Y).

Por lo tanto es posible, probabilsticamente, que se pueda pronosticar qu resultados se


pueden obtener en el futuro en la variable Y, si tengo informacin previa de los
resultados obtenidos de un atributo en la variable X.

Relacin causa-efecto: a partir de la correlacin, se puede establecer si entre dos o ms


variables se da una relacin de causa y efecto; o sea, que el comportamiento de una(s), es(son)
la(s) responsable(s) del comportamiento de la otra(s).

La Confiabilidad: es una de las dos caractersticas imprescindibles en toda prueba psicolgica;


la otra es la validez. Se entiende por confiabilidad, la capacidad que tiene una prueba de
mantener resultados ms o menos parecidos en dos o ms mediciones de una variable, siempre
y cuando entre dichas mediciones, el sujeto no sufra cambios significativos (cognitivos,
cognoscitivos, emocionales, etc.). La correlacin es un mtodo que favorece la determinacin
de la confiabilidad de una prueba.

62

La Regresin: es un procedimiento estadstico a partir del cual se puede establecer una


prediccin y requiere que previamente se establezca que entre las variables involucradas exista
correlacin.

Despus de haber presentado algunas caractersticas propias de la correlacin, es prudente brindar


una definicin de este concepto: se entiende por correlacin, el grado de relacin que existe entre
dos o ms variables. La correlacin nos brinda informacin sobre la magnitud o cantidad de
relacin y la direccin de dicha relacin. Ms adelante aclararemos estos dos conceptos, porque
consideramos prudente aclarar el concepto de relacin, antes de continuar avanzando en este tema.
Adems, para facilitar la presentacin del mdulo, nos referiremos especficamente a la relacin
que hay entre dos variables; a esta situacin la llamaremos relacin bivariante. Las relaciones de
ms de tres variables las presentaremos al finalizar del captulo.
La relacin entre dos variables puede ser de dos tipos:
1.

Relacin lineal, que se refiere al caso en que dicha relacin puede ser representada con mayor
precisin, a travs de una lnea recta.
2. Relacin no lineal, que se refiere al caso en que la misma no se aproxima a una lnea recta.
Para el desarrollo de nuestro tema nos referiremos, tanto en teora como en la prctica, al modelo de
relacin lineal.
A continuacin presentamos un ejemplo de relacin lineal. Supongamos que un investigador en
psicologa escolar est interesado en determinar si las variables Habilidad General y Habilidad
Verbal estn relacionadas. Para tal efecto, toma una muestra de 10 estudiantes preuniversitarios y
les aplica pruebas que miden ambos factores. Los resultados son los siguientes:
TABLA 8-1
Puntajes obtenidos en habilidad general y en habilidad verbal por 10 estudiantes preuniversitarios
H. General
H. Verbal
Sujetos
X
Y
1

10

10

12

15

20

17

25

25

27

32

35

37

43

40

40

38

32

30

10

47

49

Los puntajes resumidos en la Tabla 8-1 indican, de forma descriptiva, los resultados que obtuvieron
cada uno de los diez sujetos de la investigacin, en la medicin de las variables contempladas en el
estudio. Para determinar la correlacin se sugiere que, como primer paso, se determine el

63
Diagrama de Dispersin correspondiente a dichos datos, el cual nos brindar informacin grfica
de la relacin entre ambas variables.
GRFICO 8-1

Grfico de dispersin de los datos


60

Y (Habilidad verbal)

50
40
30
20
10
0
0

10

15

20
25
30
X (Habilidad general)

35

40

45

50

El Diagrama de Dispersin consiste en localizar cada par de puntos (X, Y) en un sistema de


coordenadas rectangulares, el cual se construye en el cuadrante cartesiano en el cual tanto X (eje
horizontal) como Y (eje vertical) son positivos. Como se puede observar en el diagrama, hay diez
puntos que corresponden a la interseccin de las X y las Y para cada sujeto. La variable Habilidad
General est ubicada en el eje X y la variable Habilidad Verbal en el eje Y; la totalidad de los
puntos localizados en el diagrama se denomina nube de puntos.
Los puntos localizados en el Diagrama permiten identificar ciertas caractersticas de la relacin de
las variables X y Y, las cuales se deben generalizar para cualquier Diagrama de Dispersin que se
construya:
1. Si la nube de puntos tiende a una lnea recta, estamos ante una relacin lineal.
2. Si la nube de puntos tiende a algn tipo de curva, la relacin es no lineal.
Para nuestro ejemplo, la nube de puntos tiende a una lnea recta, lo cual es indicativo que estamos
ante una relacin lineal.
La nube de puntos adems de aproximar los datos a una lnea recta, puede presentar una de dos
direcciones dentro del diagrama:

64

1.

Una direccin positiva, que es aquella en que la nube de puntos va de izquierda a derecha del
diagrama de dispersin.

X
2. Una direccin negativa, cuando la nube de puntos va de derecha a izquierda del diagrama de
dispersin.

Si analizamos con detenimiento la informacin presentada con relacin al Diagrama de Dispersin,


podemos hacer las siguientes observaciones:

El Diagrama nos permite establecer si la relacin ser lineal o no lineal.

Adems, el Diagrama permite pronosticar que la relacin ser positiva (+) o negativa (-)
atendiendo a la direccin de la nube de puntos.

Otro aspecto importante que se puede deducir de la inspeccin del Diagrama de Dispersin es la
estimacin de la magnitud (cantidad) de la relacin entre ambas variables, lo cual se podr
determinar observando si los puntos tienen poca variabilidad o mucha variabilidad; en otras
palabras, si los puntos al trazarse una lnea recta tienden a caer sobre la misma, o si los puntos
tienden a caer fuera de la lnea, ya sea por encima o por debajo de ella. La siguiente figura presenta
las principales alternativas.

65

FIGURA 81

En la Figura 81 se presenta con mucha claridad la informacin que se puede extraer de un


Diagrama de Dispersin.

Los tres primeros diagramas horizontales nos indican que corresponden a relaciones positivas,
por la direccin de la nube de puntos. Adems se observa que la magnitud de las correlaciones
(informacin que est sobre recta de regresin) vara en cada uno de los Diagramas. En el
primero de observa que r = 1.00; en el segundo r = 0.91; en el tercero r = 0.56. Si observamos
con detalle cada diagrama resalta el hecho de que en cada uno de ellos, los puntos que
constituyen la nube se dispersan de manera diferente en cada ejemplo: en el primero, todos los
puntos caen sobre la lnea recta; en el segundo, los puntos no caen en su totalidad sobre la lnea
y se dispersan por arriba y por debajo de la misma, pero no estn muy alejados de ella; en el
tercero, los puntos no caen sobre la lnea y se dispersan de la misma en un mayor grado que en
los dos ejemplos anteriores. De esto podemos extraer como conclusin de que a menor
dispersin, mayor magnitud de la correlacin. De los tres ejemplos se desprende que, la mayor
relacin corresponde al primero (r=1.00), en segundo lugar est el ejemplo nmero dos (r =
0.91) y finalmente, el ejemplo nmero tres (r=0.56). Se ha introducido un elemento nuevo a
nuestra discusin: r, que se lee coeficiente de correlacin y es el indicador matemtico de la
cantidad de relacin entre las variables. Ms adelante, vamos a discutir ampliamente este
concepto.

66

Los tres diagramas que estn en la segunda lnea de la Figura No.1 indican que, por la direccin
de la nube de puntos, o no hay relacin (primer diagrama) o la relacin es negativa (segundo y
tercer diagrama), lo cual se observa en los valores de r para cada uno de ellos: para el primero
r = 0 y los puntajes no se aproximan a una lnea recta; en el segundo caso, la nube si se
aproxima a una lnea recta pero a la inversa, adems de que los mismos no caen exactamente
sobre la recta (r = - 0.66); y en el tercer caso, la nube se ajusta totalmente a una recta y el valor
de r = - 1.00.

El Diagrama de Dispersin es una herramienta que permite hacer una estimacin cualitativa de
la relacin entre dos variables. Esta relacin se debe establecer cuantitativamente a travs del
denominado coeficiente de correlacin, el cual se representa por r. Los valores de r
presentados para cada uno de los seis ejemplos anteriores, no se calculan a travs del diagrama
de dispersin; han sido presentados en los mismos con la intencin de hacer ms clara la
explicacin de la importancia de dicha figura en el establecimiento de la relacin entre dos
variables. El clculo de r se presentar a continuacin.

Si los incrementos en X van acompaados de incrementos en Y, se produce una correlacin


positiva, lo cual se refleja en la direccin de la nube de puntos. Si al incrementarse X se observa
que Y tiende a disminuir, estamos ante una correlacin negativa y esto se reflejar en la
direccin de la nube de puntos. Si no se observa en la nube de puntos, tendencia a aproximarse
a una lnea recta, entonces estamos ante una evidente situacin de ausencia de correlacin.

Vamos a continuacin a referirnos al coeficiente de correlacin como indicador de la magnitud o


cantidad de relacin que se presenta entre las variables involucradas.
Un coeficiente de correlacin es una estimacin matemtica de la relacin entre dos o ms
variables. El valor del coeficiente de correlacin estar comprendido entre + 1 y -1, pasando por
cero. El mximo valor que puede alcanzar un coeficiente de correlacin positivo es +1; esto indica
que la relacin es perfecta entre los valores de X y Y. Por lo tanto, decimos que estamos ante una
relacin de este tipo, cuando la posicin que ocupa el sujeto en la variable X es exactamente la
misma que ocupa en la variable Y. En el momento en que esta situacin no se d sistemticamente,
el valor de r ser menor a 1.00, y se aproximar a cero (0) a medida que las diferencias de posicin
(rango) sean mayores.
Por otro lado, cuando el valor de r es igual a -1, estamos ante una correlacin perfecta negativa y
corresponde al valor de r ms alto con este signo. Esto nos indica que el sujeto ms alto en X es el
ms bajo en Y, el segundo sujeto ms alto en X es, a su vez, el segundo sujeto ms bajo en Y, y as
sucesivamente. Si esta relacin inversamente proporcional no se cumple sistemticamente, el valor
de r va a disminuir y se aproximar a cero en la medida que las diferencias de posicin en ambas
variables sean mayores.

/
r = -1.00

/
r=0

/
r = 1.00

67
La correlacin se centra en dos aspectos de la relacin: la direccin que puede ser positiva o
negativa, y el grado, fuerza o magnitud, que se refiere al valor cuantitativo de la relacin. Cuando la
relacin es perfecta (+1 -1), la prediccin de una variable hacia la otra es exacta; cuando la
correlacin es imperfecta (< 1 > -1), la prediccin es aproximada y se debe establecer el margen
de error, siendo sta la situacin ms comn cuando se trabaja con muestras. Cuando no hay
correlacin (r = 0), no se puede hacer prediccin.
El coeficiente de correlacin, que a partir de este momento representaremos por rxy se denomina
Coeficiente de Correlacin de Pearson, y el mismo es aplicable al clculo de relaciones lineales.
Para determinar el rxy, es necesario que ambas variables estn medidas en la misma escala y se
pueden utilizar dos mtodos para calcular el mismo:
1.

El mtodo normalizado, en el cual se aproximan los datos a la curva normal, y cuya frmula
es:
(
)

2. El mtodo de los puntajes originales, cuya frmula es:

( )( )
( )

] [

( )

A continuacin se presenta el clculo de rxy para los datos de la Tabla 8-1, utilizando ambos
mtodos: el normalizado y el de datos originales. Con ambos mtodos los resultados deben ser
iguales aunque, en la situacin de laboratorios o talleres, puede suceder que se observen diferencias
de +/- 0.01; en estos casos, por la situacin del redondeo, las diferencias pueden ser aceptadas.
TABLA 8-2:
Clculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General
H. Verbal
Sujetos
Z de X
Z de Y
(ZxZy)
X
Y
1
10
10
-1.51
-1.55
2,34
2
12
15
-1.35
-1.15
1,55
3
20
17
-0.72
-0.99
0.71
4
25
25
-0.32
-0.35
0.11
5
27
32
-0.17
0.22
-0.04
6
35
37
0.47
0.62
0.29
7
43
40
1.10
0.86
0.95
8
40
38
0.86
0.70
0.60
9
32
30
0.23
0.06
0.01
10
47
49
1.42
1.58
2.24

68
La Tabla 8-2 presenta el resumen del procedimiento para calcular el coeficiente de correlacin r xy
para dos variables, utilizando el procedimiento de los datos normalizados z. A continuacin
presentamos los pasos requeridos. En primera instancia, organice los datos en una matriz o Tabla
que contenga las siguientes columnas: Sujetos, X, Y, Zx, Zy, ZxZy
1. Calcule la media y la desviacin estndar tanto para la variable X como para la Y.
2. Transforme todos los valores X en puntuaciones Z (columna Zx) al igual que los valores Y
(columna Zy)
3. Multiplique cada valor de Zx por su correspondiente valor de Zy y coloque cada resultado en la
columna (ZxZy) y sume esta columna.
4. Sustituya en la frmula los datos calculados en el ejemplo:
(

)
0

El resultado obtenido de 0.97 indica, que entre las variables Habilidad General y Habilidad
Numrica se observa una relacin positiva y alta. Esto implica que, en general, los sujetos con
puntuaciones altas en X, tambin obtuvieron puntuaciones alta en la variable Y; los que obtuvieron
puntuaciones medias en X, tambin las obtuvieron en Y, y de igual manera sucedi con los de
puntajes bajos.
El mtodo de las puntuaciones originales es una forma alternativa para calcular el coeficiente de
correlacin lineal de Pearson. Tal y como su nombre lo indica, se utilizan las puntuaciones
originales para calcular la rxy. A continuacin se desarrolla el procedimiento, utilizando los datos de
la Tabla anterior
TABLA 8-3:
Clculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General
H. Verbal
Sujetos
X2
Y2
XY
X
Y
10
10
100
100
100
1
12
15
144
225
180
2
20
17
400
289
340
3
25
25
625
625
625
4
27
32
729
1024
864
5
35
37
1225
1369
1295
6
43
40
1849
1600
1720
7
40
38
1600
1444
1520
8
32
30
1024
900
960
9
47
49
2209
2401
2303
10

291

293

9905

9977

9907

69
( )( )

( )

0
[

( )

] [
)(
0

0 ]

0 00

0
0][

0 0
(

0 ][
0

0)(

0]
0

Los pasos a seguir para calcular rxy utilizando el mtodo de las puntuaciones originales son los
siguientes:
1.

Cree una tabla en la que deben aparecer las columnas de X y Y. Sume las puntuaciones de cada
columna.
2. Incorpore a la Tabla las columnas de X2 y Y2; sume las puntuaciones de dichas columnas.
3. Incluya en la Tabla la columna de XY, o sea, que para cada sujeto se multiplica el puntaje X por
el puntaje Y; sume los puntajes de la misma.
4. Sustituya en la frmula los datos obtenidos en la Tabla y obtendr el coeficiente de correlacin
para datos originales.
Los mtodos analizados anteriormente estn dirigidos a variables que han sido medidas por lo
menos en una escala de intervalos. Para estos casos, el Coeficiente de Correlacin de Pearson, ya
sea en su forma normal (Z) o en la de puntuaciones originales, es el adecuado para establecer la
magnitud y el sentido de la relacin entre las dos variables.
Sin embargo, hay ocasiones en las cuales las variables no satisfacen la condicin de medicin
intervalar, sino que ambas o una de ellas est medida en una escala ordinal. En estos casos, el
Coeficiente de Correlacin de Rangos de Spearman (rho) es el mtodo ms eficiente para
determinar la relacin entre estas variables; es una aplicacin del coeficiente lineal de Pearson para
datos medidos en escala ordinal. Es importante destacar que los datos originales no necesariamente
deben estar medidos en escala ordinal, pero si el investigador considera que los daos no satisfacen
los requisitos exigidos para la aplicacin del mtodo de Pearson, puede transformarlos a una escala
ordinal y aplicar el coeficiente Rho. La frmula para el clculo de rho es la siguiente:

D: diferencia entre los rangos de ambas variables


n: nmero de pares de rangos (X y Y)
A continuacin presentamos un ejemplo:

70
TABLA 8-4:
Clculo del coeficiente de correlacin rho de Spearman para una muestra de 5 sujetos
D
D
Sujetos
X
Y
R(X) R(y)
(Rx(Rx-Ry)
Ry)2
1

-1

-3

11

4
18

0 0

El coeficiente rho del problema anterior es de 0.10, el cual es positivo y bajo, en vista de que se
aproxima a cero. Como se puede observar, la interpretacin del Coeficiente rho es exactamente
igual a la de Pearson. Los pasos para calcular el Coeficiente rho son los siguientes:
1. Organice los datos X y Y en una matriz, tal y como se presenta en la Tabla 8-4:
2. Se crea la columna R(X), rangos de X, para la cual se asigna a cada puntaje X un rango de
menor a mayor. Para nuestro ejemplo X = 5 es el de menor valor, se le asigna el rango 1, a
continuacin sigue el puntaje 6 al que corresponde el rango 2, y as sucesivamente.
3. Se crea la columna R(Y), rangos de Y, para la cual se asigna a cada puntaje Y un rango de
menor a mayor. Para nuestro ejemplo, Y = 4 es el de menor valor y se le asigna el rango 1,
luego sigue el puntaje 6 al que corresponde el rango 2, y as sucesivamente.
4. Se crea la columna D, que corresponde a la diferencia de cada par de rangos X y Y, tomando en
consideracin los signos.
5. Se desarrolla la columna D2 que corresponde a elevar al cuadrado cada diferencia entre los
pares de rangos. Estas diferencias al cuadrado se suman.
6. Se desarrolla la frmula correspondiente a Rho y se obtiene el coeficiente de correlacin.
Hay ocasionas en que en una variable se repite el mismo valor varias veces. A esta situacin se le
denomina ligas, y las mismas son resueltas promediando los rangos que se le hubieran adjudicado
originalmente. A continuacin se presenta un ejemplo.

71
TABLA 8-5:
Clculo del coeficiente de correlacin de spearman para una muestra de 10 sujetos (mtodo de ligas)
Sujetos
1
2
3
4
5
6
7
8
9
10

H. General
X
10
12
12
25
27
35
40
40
32
47

H. Verbal
Y
10
15
17
25
25
37
40
38
30
49

(
0

R(X)

R(Y)

1
2.5
2.5
4
5
7
8.5
8.5
6
10

1
2
3
4.5
4.5
7
9
8
6
10

0
0.5
-0.5
-0.5
0.5
0.0
-0.5
0.5
0.0
0.0

)
0

D2
0
0.25
0.25
0.25
0.25
0.00
0.25
0.25
0.00
0.00

00

Como puede observarse, el coeficiente de correlacin Rho es muy alto (0.99), casi perfecto y
positivo. En este ejemplo se observa cmo se tratan las ligas. En la variable X, el puntaje menor es
10 y se le asign el rango 1, a continuacin los siguientes puntajes son 12 y 12, como son iguales, al
primero se le asigna el rango 2 y al segundo el rango 3, se promedia la suma de estos dos rangos
que es 2.5, y se les asigna a los dos valores 12, el rango 2.5. Esto se repite en cada ocasin en que
aparezcan ligas. Las ligas pueden corresponder a 2, 3 ms sujetos a quienes se les asigna el mismo
puntaje; en cada caso, se promedian los rangos que originalmente se les asignara.
CORRELACIN MLTIPLE
Hasta este momento, los anlisis de correlaciones discutidos en esta obra se han referido a la
relacin lineal entre dos variables. Sin embargo, se dan circunstancias en las cuales estamos
interesados en la relacin que hay entre tres o ms variables, o especficamente, en la relacin de
una variable con una combinacin lineal de otras variables. A este anlisis de correlaciones se le
denomina correlacin mltiple, la cual vamos a presentar en su forma ms simple: la relacin entre
una variable y la combinacin lineal de otras dos variables.
Suponga que una muestra de estudiantes ha sido evaluada en tres factores psicoeducativos que se
consideran relacionados:
1. Factor 1: Rendimiento acadmico
2. Factor 2: Aptitud general
3. Factor 3: Aptitud verbal
Estamos interesados en analizar la relacin que hay entre el rendimiento acadmico (F1) y los
efectos combinados de la aptitud general (F2) y la aptitud verbal (F3): F1 VS F2+F3. La regla
general (frmula) para el clculo de dicha relacin es la siguiente:

72
(

Los pasos para calcular r1.23 son los siguientes:


1.

Calcule las relaciones simples entre las combinaciones de pares de variables r 12, r13 y r23. Para
efecto de nuestro ejemplo, dichas correlaciones fueron las siguientes:
r12 = 0.52
r13 = 0.45
r23 = 0.60
2. Sustituya estos valores en la frmula de correlacin mltiple, tal y como se presenta a
continuacin:
[( )(0 )(0 )(0 0)]
0 0
(0 0)
A partir de esta regla, se puede generalizar para cuatro o ms variables, situaciones stas que
escapan de los objetivos de este texto. Para analizarlas, recomendamos revisar la bibliografa que
acompaa esta obra.
(0

(0

Como Interpretar El Coeficiente De Correlacin.


La interpretacin del coeficiente de correlacin, debe hacerse cuidadosamente, atendiendo
principalmente a las caractersticas de las variables involucradas y al tipo de problema que se est
tratando de solucionar. Es evidente que a medida que r se aproxima a 1.00, la correlacin se
considera ms alta, siendo este valor el ms extremo, tanto en el lado positivo como en el negativo
(-1.00). O sea, que la correlacin tiende a aumentar tanto positiva como negativamente, a medida
que se aleja de 0 y se aproxima a sus valores extremos (+1.00 -1.00).
Sin embargo, hay ocasiones en que los coeficiente de correlacin que son bajos se consideran lo
suficientemente saludables como para utilizarlos de manera efectiva. Por ejemplo, en la
construccin de pruebas es muy frecuente que los coeficientes de correlacin no alcanzan valores
altos, y observamos en estos casos coeficientes efectivos desde 0.35 hasta 0.60, en el mejor de los
casos.
A pesar de los casos especiales citados anteriormente, algunos autores sugieren que para facilitar la
interpretacin de los coeficientes de correlacin, se tome en consideracin la siguiente escala:
r.0.00 hasta 0.20.correlaciones bajas
r.0.21 hasta 0.40.correlaciones inferiores al trmino medio
r.0.41 hasta 0.60.correlaciones promedio
r.0.61 hasta 0.80.correlaciones superiores al trmino medio
r.0.81 hasta 1.00.correlaciones altas
Esto se puede aplicar tanto en el caso de las correlaciones positivas, > 0, como en las negativas, - 0.
Sin embargo no olvide que el buen juicio del psiclogo investigador, es la principal herramienta

73
para el anlisis de los coeficientes de correlacin, porque tambin se dan casos de coeficientes de
correlacin relativamente altos, pero ineficaces.
REGRESIN LINEAL SIMPLE.
A travs del estudio de la correlaciones se logr analizar la asociacin que existe entre dos o ms
variables. Se logr establecer que la magnitud de estas relaciones se podan determinar
cuantitativamente a travs del coeficiente de correlacin, adems de establecerse el sentido de las
mismas: positivo, negativo o ausencia de correlacin.
Pero, la relacin de variables nos permite obtener informacin que va mas all de lo anteriormente
sealado. Tambin permite alcanzar uno de los objetivos ms apreciados en la investigacin del
comportamiento: la prediccin.
Para comprender en qu forma el anlisis de la asociacin de variables nos permite hacer
predicciones, es necesario recordar algunos aspectos bsicos de la teora de la correlacin.
Como se observ anteriormente, la primera aproximacin al anlisis estadstico de la correlacin, es
el diagrama de dispersin. En el mismo, se analiza la nube de puntos generada por la combinacin
de cada X con su respectiva Y, sobre un sistema de coordenadas rectangulares. Se explic, adems,
que la nube tomaba diferentes formas y que una de ellas, la que se aproxima a una lnea recta, era de
gran importancia para el anlisis de las correlaciones. En realidad, lo que sucede es que la nube de
puntos se puede aproximar a travs de diferentes curvas entre las cuales tenemos: parbolas,
hiprbolas, etc, y la lnea recta.
Haremos nfasis en los diagramas de dispersin cuya nube de puntos est aproximada por una lnea
recta, dado que ste es el tipo de dispersin ms comn al estudiarse las relaciones de variables
psicolgicas. Por lo tanto, vamos a considerar a la lnea recta como la que mejor aproxima los datos
de la nube de puntos. A esta lnea recta se le denomina Recta de Mnimos Cuadrados, en vista de
que tiene la propiedad de que la suma de las diferencias cuadrticas de los puntos del diagrama con
relacin a su valor terico sobre la curva, es mnimo. O sea: D2 es mnimo, tal y como se presenta
en el siguiente grfico:

74
GRFICO 8-2

En el Grfico 8-2 se presenta el diagrama de dispersin correspondiente a dos variables X y Y. Se


puede observar con claridad que los puntos oscuros corresponden a los pares ordenados (XY), los
cuales generan una nube de puntos. Adicionalmente se presenta un conjunto de puntos ms claros,
ordenados de tal manera que, si los uniera, generaran una lnea recta; esta es la recta de mnimos
cuadrados porque las distancias entre cada punto del diagrama y su correspondiente valor en la
recta, al elevarse al cuadrado y sumarse, daran el valor ms pequeo que se podra alcanzar.
La figura incluye otra lnea recta, de color oscuro que tambin cruza el diagrama pero en otro
sentido. En este caso, que no corresponde a la recta de mnimos cuadrados, la D2 no sera la
mnima, como si lo es para el otro caso (lnea clara).
La recta de mnimos cuadrados se construye a partir de la siguiente ecuacin:
( )
La cual corresponde a la ecuacin de la lnea recta. Esta ecuacin se utiliza para pronosticar Y a
partir de un valor conocido de X. En dicha ecuacin se identifican dos constantes:
a0 : corresponde a la interseccin de la recta de regresin con el eje Y.
a1: corresponde a la pendiente (inclinacin) de la recta de regresin.
X : corresponde al valor de X para el cual se va a pronosticar el valor de Y.
Las constantes se calculan a travs de las siguientes frmulas:
( )( )

( )(
( )

( )( )
( )

En los casos en que se requiera estimar X a partir de Y, las ecuaciones seran las siguientes:

75
( )
Para la cual:
( )( )

( )(
( )

( )( )
( )

Error Tpico De La Estimacin


La recta de regresin representa el centro de gravedad de la nube de puntos, siendo evidente que
alrededor de la misma se dispersan los puntos del diagrama. En tales circunstancias, se puede
calcular una medida de la dispersin de los valores a travs de las siguientes expresiones:
(

Que se denomina error tpico de la estima de Y a partir de X.


En los casos que se refieren a la recta de regresin de X a partir de Y, el error tpico de la
estimacin viene dado por la expresin:

A partir del error tpico de la estimacin, se puede estimar (pronosticar), para cualquiera de los
valores X, su correspondiente valor esperado Y, al igual que para cualquier valor de Y, se puede
estimar su correspondiente valor esperado X. A continuacin presentamos un ejemplo de
estimacin estadstica.

Sujetos
1
2
3
4
5
6
7
8
9
10

H. General
X
10
12
20
25
27
35
43
40
32
47
291

TABLA 8-6
H. Verbal
X2
Y
10
100
15
144
17
400
25
625
32
729
37
1225
40
1849
38
1600
30
1024
49
2209
293
9905

Y2

XY

100
225
289
625
1024
1369
1600
1444
900
2401
9977

100
180
340
625
864
1295
1720
1520
960
2303
9907

76
Ya se demostr que entre ambas variables existe una correlacin importante:
r = 0.98. Por lo tanto es factible desarrollar un modelo de estimacin estadstica que permita el
pronstico de Y a partir de X o viceversa.
En primera instancia se calculan las dos constantes que requiere el modelo:

)( 0 ) (
)( 0 )
( 0)( 0 ) (
)
)(
)
0( 0 ) (
)
0( 0 ) (

Una vez determinadas las constantes de regresin, se desarrolla la ecuacin de mnimos cuadrados,
tal y como se presenta a continuacin:
( ) : ecuacin de mnimos cuadrados
0 ( )
Cada valor de X obtenido por el sujeto se sustituye en la ecuacin, obtenindose el valor Y
estimado o pronosticado para cada persona que, perteneciendo a la misma poblacin, obtenga dicho
valor X. A continuacin se presenta la Tabla resumen correspondiente a los datos analizados.

Sujetos

H. General
X

TABLA 8-7
H. Verbal
Y

10

(Y-Y)2

10

10.94

0.88

12

15

12.86

4.58

20

17

20.54

12.53

25

25

25.34

0.12

27

32

27.26

22.47

35

37

34.94

4.24

43

40

42.62

6.86

40

38

39.74

3.03

32

30

32.06

4.24

10

47

49

46.46

6.45
65.40

Como se puede observar, para cada valor de X se estim un posible valor de Y, el cual corresponde
al punto en que cae dicha estimacin sobre la recta de regresin; en el fondo, la recta de regresin es
el conjunto de todos los valores estimados para cada uno de los valores de X. Adems, la Y
estimada es el promedio de todos los posibles valores esperados para cada una de las X. Esto
significa que para cada valor de X, la Y estimada sera el pronstico promedio, aunque algunos
valores de Y estarn por encima y otros por debajo de dicha estimacin.

77
Tal y como sealamos anteriormente, de todas las estimaciones de Y se puede determinar una
desviacin estndar de las mismas, la que se denomina error tpico de la estimacin. Los datos
requeridos para este clculo estn descritos en la ltima columna de la Tabla anterior (Y Y)2 y
con los mismos resolvemos la ecuacin del error tpico:

0
0

Esto significa que, en promedio, las Y estimadas varan en 2.56 unidades, informacin que favorece
el anlisis de la estimacin a la luz de la Distribucin Normal, siempre y cuando los datos se ajusten
a dicha distribucin. Este mismo procedimiento se puede desarrollar para estimar X a partir de Y,
siempre y cuando se utilice la ecuacin de estimacin correspondiente.
CONCEPTOS IMPORTANTES

Relacin lineal
Correlacin simple
Correlacin mltiple
Prediccin
Relacin causa-efecto
Confiabilidad
Diagrama de dispersin
Nube de Puntos
Ecuacin de mnimos cuadrados
Regresin lineal simple
Constantes de regresin
Error tpico de estimacin
Y estimada
X estimada

78
EJERCICIOS PRCTICOS
Problema 1
Un investigador del comportamiento seleccion una muestra aleatoria de 20 estudiantes de primer
ingreso a la Universidad y obtuvo las puntuaciones en las pruebas de Conocimientos Generales (X)
y de Comprensin Verbal (Y). A continuacin, se presentan los puntajes:
E
X
Y

1
52
49

2
49
49

3
26
17

4
28
34

5
63
52

6
44
41

7
70
45

8
32
32

9
49
29

10
51
49

11
64
53

12
28
17

13
49
40

14
43
41

15
30
15

16
65
50

17
35
28

18
60
55

19
49
37

20
66
50

A partir de los datos anteriores determine:


1. Las medias de X y de Y.
2. Las desviaciones estndar de X y de Y
3. Confeccione el Diagrama de Dispersin correspondiente
4. Calcule el coeficiente de correlacin Producto Momento de Pearson (rxy) a partir del:
Mtodo de puntuaciones estandarizadas; analice y discuta el resultado
Mtodo de puntuaciones originales: analice y discuta el resultado
5. Calcule el coeficiente de determinacin r2 para ambos casos. Analice y discuta los resultados.
6. Calcule los valores de las constantes a0 y a1 y presente la ecuacin de regresin (prediccin) de
Y a partir de X.
7. Escoja cinco pares de valores de la tabla de datos originales y construya la recta de regresin
sobre el diagrama de dispersin. Analice y discuta los resultados.
8. Calcule el error estndar de la estimacin de Y a partir de X.
9. Desarrolle los pasos 6, 7 y 8, para la estimacin de X a partir de Y.
10. Con los datos de la Tabla, determine el Coeficiente de Correlacin por Rangos (Rho). Analice y
discuta los mismos; compare los resultados con los obtenidos por el mtodo de Producto
Momento de Pearson.
11. Suponga que est interesado(a) en determinar la correlacin entre el rendimiento acadmico (1)
y las variables aptitud verbal (2) y razonamiento lgico (3). Las intercorrelaciones obtenidas
entre estas tres variables fueron: r12 = 0.64, r13 = 0.50 y r23 = 0.41. Calcule el coeficiente de
correlacin mltiple entre el rendimiento acadmico y las variables aptitud verbal y
razonamiento lgico. Analice y discuta los resultados.

79

CAPTULO 9
ESTADSTICA INFERENCIAL Y PROBABILIDADES
Ya hemos analizado los principios de la estadstica descriptiva, los cuales hacen nfasis en la
organizacin, presentacin y descripcin de los datos obtenidos en las investigaciones
comportamentales, de una manera, objetiva, coherente y eficiente. Para tal efecto, se discutieron
conceptos tales como: organizacin de datos, medidas de tendencia central y variabilidad, la curva
normal y los principios de la correlacin y regresin simple.
La estadstica inferencial se preocupa, principalmente, por analizar cuantitativamente los datos
provenientes de las muestras y demostrar cun cerca o alejados estn estos datos de los que se
hubieran obtenido, si los mismos hubieran sido obtenidos de la totalidad de la poblacin. Por lo
tanto, es evidente que la estadstica inferencial se desarrolla a travs de muestras, que son sectores
de la poblacin, y no de la informacin proveniente de la totalidad de la misma. A continuacin
presentamos un diagrama que explica la relacin entre poblacin y la muestra.

Poblacin

Probabilidad

Muestra
Error

Generalizacin

Muestra
aleatoria

Muestras aleatorias
Igual oportunidad de ser seleccionadas
Margen de error conocido
Tamao muestral especfico
Inferencia estadstica: Generalizar los datos estadsticos
muestrales a los parmetros poblacionales.

Muestra no
aleatoria

FIGURA 91

Como se puede observar en la Figura 91, la muestra es un segmento de la poblacin, una parte de
la poblacin que ha sido segregada de la misma con fines de investigacin. Al trabajar con
segmentos de la poblacin, es evidente que algunas caractersticas de sta no estarn presentes en la
muestra, porque los tamaos muestrales son muy inferiores a los poblacionales: n < N. Esta
situacin trae como consecuencia, que entre la informacin proveniente de la muestra y la existente
en la poblacin real, se produzcan diferencias a la cuales denominaremos errores de muestreo.

80
En realidad la estadstica inferencial est constituida por dos aspectos:
(1) la estimacin de parmetros, que se refiere a establecer con la mayor precisin posible,
cules son los valores correspondientes a los principales indicadores o parmetros que hay en la
poblacin y que estn siendo utilizados en las investigaciones muestrales. Como debe recordar,
esto se realiza a partir de la informacin de la muestra y no de la poblacin, y (2) el desarrollo de
la prueba de hiptesis, en el cual el investigador intenta demostrar si las hiptesis que han
presentado sobre diversos aspectos comportamentales que l espera que se estn manifestando
en la poblacin, se pueden o no demostrar a travs del anlisis de las muestras.
Otro aspecto relevante que se observa en al diagrama antes mencionado lo son las dos categoras de
muestreo que pueden ser utilizadas en una investigacin: el muestreo aleatorio, por un lado, que
permite seleccionar los sujetos de la poblacin a partir de la condicin de que todos tengan igual
probabilidad de ser seleccionados al momento de constituirse la muestra. Es evidente que, para
efectos de representar a la poblacin, este tipo de muestreo es el ms indicado. Por otro lado, est el
muestreo no aleatorio, en el cual no hay garantas de que todos los sujetos de la poblacin hayan
tenido la misma probabilidad de ser seleccionados al momento de constituir la muestra, y por lo
tanto, sus resultados son dudosos en cuanto a representar a la poblacin.
En ambos casos de muestreo se cometen errores. La diferencia estriba en que en el muestreo
aleatorio, el error puede ser determinado de antemano por el investigador, al igual que la
probabilidad de cometer el mismo; mientras que en el muestreo no aleatorio, el investigador no
cuenta con informacin objetiva sobre el margen de error y la probabilidad asociada con l.
Se considera que el muestreo aleatorizado es ms eficiente para generalizar sus resultados hacia la
poblacin por las siguientes razones:

se determina el margen de error,

se determina la probabilidad de este margen de error,

y adems, a partir de la informacin anteriormente sealada, se puede establecer el tamao


muestral (n) mnimo requerido para que estos dos primeros aspectos se cumplan.

TEORA DE LA PROBABILIDAD (TP)


La explicacin terica sobre la relacin matemtica entre las observaciones poblacionales y las
muestrales la ofrece la Teora de la Probabilidad. Sera ostentoso concebir que en este libro se
pueda hacer una presentacin efectiva de dicha teora; tampoco es uno de los objetivos que se tratan
de alcanzar con esta obra. Sin embargo, es necesario plantear algunos principios de la probabilidad,
que permitirn un mayor nivel de comprensin de los aspectos bsicos de la inferencia estadstica.
En la TP, hay algunos conceptos que deben ser comprendidos con claridad, especialmente por los
que no somos especialistas en las matemticas, con el fin de que los mismos puedan ser utilizados

81
de la manera ms correcta al momento de aplicar la TP. A continuacin, detallaremos los ms
importantes y los ms utilizados en la investigacin del comportamiento.
El Experimento Aleatorio
Siempre que se desarrolle una investigacin, y que el mtodo (actos o pruebas) para obtener los
resultados se desarrolle en las mismas condiciones, estamos ante un experimento aleatorio. Por
ejemplo, en el juego de la lotera oficial nacional, siempre se repite el mismo acto: las bolas
numeradas estn en una urna que se hace girar para que las mismas se revuelvan y as se evite
cualquier picarda. Se detiene la urna, se abre, un nio selecciona una de las bolas, se la pasa a la
autoridad, sta la abre y dentro de la misma se encuentra un nmero entre el 0 y el 9. Este acto se
repite tantas veces como sea necesario, sin que se observen cambios de ninguna clase en la
metodologa. Por esta razn, la lotera es un experimento aleatorio, en vista de que en cada acto,
cualquier nmero entre 0 y 9, tiene la misma probabilidad de aparecer.
Veamos ahora, una actividad que no se refiere a un juego de azar, sino a una medicin educativa. El
profesor confecciona un examen de 30 preguntas, todas de seleccin mltiple con cuatro
alternativas, con las mismas instrucciones, con el mismo procedimiento para responder a las
preguntas y para corregirlas. Esta metodologa ser la misma para todos los estudiantes que reciban
la prueba, al igual que la metodologa que se exigi para extraer una bola de la urna de la lotera.
Como la prueba tiene cuatro alternativas, todos los estudiantes tienen la misma probabilidad de
escoger cualquiera de las cuatro alternativas, y si el examen vale 30 puntos, y los puntajes finales
pueden ser entre 0 y 30, todos los estudiantes tendrn la misma probabilidad de obtener cualquiera
de estos puntajes totales al corregirse su examen. Esto significa que la medicin educativa se regula
por las mismas reglas que regulan el juego de azar de la lotera; por lo tanto, para la ciencia, la
medicin cientfica tambin es un experimento aleatorio.
Cada acto que se desarrolla en un experimento aleatorio genera un resultado que se denomina punto
muestral. En el examen que pusimos de ejemplo, si un estudiante gana 6 puntos, esto es un punto
muestral, al igual que lo es los 30 puntos que gana el que obtuvo todas las respuestas correctas. Bajo
esta perspectiva, un experimento aleatorio genera un espacio muestral (S), que no es otra cosa, que
todos los posibles resultados que se pueden obtener al desarrollar el experimento. Veamos a
continuacin algunos ejemplos de espacios muestrales:

Lanzamiento de una moneda: S: (C, S), 2 puntos muestrales.

Lanzamiento de un dado comn: S (1, 2, 3, 4, 5 6), 6 puntos muestrales

82

Lanzamiento de un dado y una moneda juntos: S(12 puntos muestrales)

Cara
Sello

1
C1
S1

2
C2
S2

Dado
3
C3
S3

4
C4
S4

5
C5
S5

6
C6
S6

Los resultados de un examen como el del ejemplo de los 30 reactivos: S (31 puntos muestrales,
porque se incluye el cero (0)
xito: 1 punto
Fracaso: 0 puntos
Resultados exitosos: espacio muestral, desde 0 hasta 30.

Los resultados de la Lotera Nacional


El juego de la lotera es un buen ejemplo de lo que son los juegos de azar. Los controles
metodolgicos que se aplican en el mismo, han dado suficiente confianza a la
poblacin como para asegurar que en el mismo no hay picarda, aunque muchas
personas digan lo contrario. Este juego se caracteriza porque se cumple la condicin
de que todas las bolas tienen la misma probabilidad de ser seleccionadas, y el
espacio muestral que se genera es el siguiente S: (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9). Los
eventos del S se combinan de acuerdo con el tipo de jugada que el cliente haya
comprado: chances o billetes, y a medida que el juego se desarrolla (experimento
aleatorio), siempre hay la certeza de que su nmero est en la urna y que tiene la
misma probabilidad de ocurrencia que cualquier otro nmero.

Es evidente que el proceso de seleccin aleatoria es muy importante para el estudio de las
inferencias estadsticas, en vista de que a travs del mismo se cumple el requisito estadstico de que
cada evento posible de un espacio muestral, debe tener la misma probabilidad de ser seleccionado.
En un experimento aleatorio, la seleccin de una unidad del total se denomina acto o prueba. Cada
acto o prueba produce un resultado que debe corresponder a algunos de los posibles eventos del
espacio muestral (S). En el espacio muestral (S), los posibles resultados o eventos se denominan
puntos muestrales.

83
Probabilidad

Por lo general, la probabilidad de un evento P(x), se define como el cociente entre el nmero de
veces que se da un evento en el espacio muestral y la totalidad de posibles eventos del espacio
muestral; o, el nmero de veces que se da un evento entre el nmero de pruebas en un experimento
o investigacin. Como se puede observar, se han presentado dos definiciones de probabilidad,
aunque ambas comparten el concepto de que la probabilidad es un cociente y se presenta como un
valor que tiene un rango entre 0.00 hasta 1.00, siendo el primero ausencia total de probabilidad y el
ltimo probabilidad mxima de un evento. Sin embargo, para efectos descriptivos, la probabilidad
se puede expresar en porcentajes: P(A) = 0.60, es equivalente al 60%. Para aclarar esta situacin, es
necesario estudiar la probabilidad desde el punto de vista de dos teoras o escuelas, que pasaremos a
discutir a continuacin.
1. Escuela Clsica de la Probabilidad:
Tambin se conoce como la Escuela a Priori, en vista de que las probabilidades pueden ser
determinadas por la razn. Esto es factible en vista de que los espacios muestrales son conocidos
antes de desarrollarse los experimentos, tal y como sucede con algunos juegos de azar tales
como: las barajas, los dados, la lotera, etc. La regla bsica (frmula) para el clculo de las
probabilidades en estos casos es:
( )

( )
( )

m(A): nmero de eventos clasificables como A en el espacio muestral.


n(S): nmero total de eventos posibles en el espacio muestral (S).
Ejemplos:

Se lanza un dado. Cul es la probabilidad de que resulte el nmero 1?


( )

Se extrae una carta de un paquete de 52. Cul es la probabilidad de que sea el


No.8?
( )

00

2. Escuela Emprica o Aposteriori:


En este caso del clculo de las probabilidades, se requiere de la recoleccin previa de la data; o
sea, se requiere de una muestra sobre la cual se hace una medicin; no se conoce previamente y
con exactitud, el espacio muestral del experimento. La regla bsica (frmula) para el clculo de
probabilidades es la siguiente:

84

( )

( )
( )

m(a): nmero de veces que ocurre A en la experimentacin.


n(S): nmero de pruebas en el experimento

Ejemplos:

En una muestra de 250 sujetos, 130 son estudiantes sin educacin secundaria.
Cul es la probabilidad de seleccionar a un estudiante sin educacin
secundaria?
(

0
0

Mientras mayor sea el nmero de pruebas que se desarrollen en el experimento, mejor ser la
aproximacin de la probabilidad a su valor terico. Esto es muy importante porque indica que,
mientras ms sujetos de una poblacin se seleccionen, las probabilidades obtenidas de dicha
muestra estarn ms prximas a las probabilidades reales de dichos eventos en la poblacin.
Axiomas De Probabilidad
La probabilidad est condicionada por una serie de axiomas que favorecen el desarrollo de los
modelos y procedimientos requeridos para el clculo de la misma.
A continuacin se presentan los tres axiomas bsicos asociados con el clculo de las probabilidades.
1. Axioma de la positi vidad:
Este axioma seala que la probabilidad de un evento no puede ser negativa; la probabilidad es
igual a cero (0) o mayor que cero (0). P(A) 0.
2. Axioma de la certidumbre:
La probabilidad de todo el espacio muestral es igual a 1: P(S) = 1

De los axiomas 1 y 2 podemos deducir que: 0 P(E) 1.


3. Axioma de las uniones:
Este axioma se aplica especialmente en el caso de los eventos compuestos. Los eventos
compuestos
son
aquellos
que
estn
constituidos
por
eventos
simples:
P(EC) = p(e1) + P(e2)++P(ek).
Por ejemplo: Cul es la probabilidad de un nmero par al lanzar un dado? Un nmero par en un
dado seran: 2, 4 y 6; cada uno de ellos tiene en el espacio muestral una
regla: (

( )

( )

( )

0 0

. Aplicando la

85
ASPECTOS BSICOS EN ELCLCULO DE PROBABILIDADES
1.

Un evento que tiene una P(X) = 1, es seguro que ocurrir en cada una de las pruebas que se
registren en el experimento. Un evento con P(X) = 0, es seguro que no ocurrir en ninguno de
los actos del experimento.
2. La probabilidad de un evento, P(E), se expresa como una fraccin, en vista de que los lmites de
sus posibles valores estn entre 0 y 1. Se acostumbra expresar la probabilidad como un valor
decimal: 0.55, 0.83, 0.19, etc.
3. Las probabilidades tambin pueden expresarse en base a 100, o sea, porcentajes, como por
ejemplo: P = 0.05 se puede expresar descriptivamente como 5%; P= 0.28, es semejante a 28%,
y as sucesivamente.
4. Las probabilidades pueden expresarse a favor o en contra de un evento, tal y como se explica a
continuacin:
La P de que suceda un evento es de 3 a 1 (3/4), o sea, que tiene una
P = 0.75.
Tambin se puede expresar en contra: la P de que el evento anterior no suceda
es de 1 a 3 (1/4), o sea, que tiene una probabilidad P= 0.25.

El clculo de probabilidades puede ser muy complejo. Para efectos de este curso, tomaremos en
consideracin algunas reglas bsicas aplicadas a eventos particulares, que se consideran
fundamentales para el clculo de probabilidades en las investigaciones comportamentales.
1. Eventos Mutuamente Excluyentes:

Dos eventos se definen como mutuamente excluyentes, si no pueden suceder al unsono o en


un solo acto. Tambin se conocen como eventos simples. Por ejemplo:
1. Se lanza una moneda una sola vez; o sale cara o sale sello, pero no ambas en el mismo acto.
2. Se extrae una carta de un mazo de 52 cartas, o es roja o es negra, pero no puede ser ambas en un
solo acto.
3. Se desarrolla un reactivo de seleccin mltiple con cuatro alternativas de las cuales una es la
correcta y las otras tres restantes, son incorrectas. En este caso, el reactivo se tiene como bueno
o como malo, pero no ambos en una sola respuesta.
La regla para calcular probabilidades para eventos mutuamente excluyentes es la siguiente:

86
(

( )

( )

Por ejemplo:

Al seleccionar una carta (baraja), cul es la probabilidad de que sea un As o


una K?
(

( )

Al seleccionar una carta (baraja) de un paquete, cul es la probabilidad de que


sea un corazn o un trbol?
(

( )

( )

0 0

2. Eventos Solap ados:


Dos eventos son solapados o tambin se conocen como unidos, si tienen puntos muestrales en
comn. La regla o frmula para el clculo de estas probabilidades es:
(

( )

( )

Como se puede observar en la frmula, se determina la probabilidad de A y B como si fueran


mutuamente excluyentes, pero se les resta el rea compartida por ambos eventos.

B
Ejemplo:

Se selecciona una baraja, cul es la probabilidad de que sea una K o un trbol?


En el paquete de barajas existe una carta que es K y es trbol al unsono, por lo
tanto, se refiere al caso de dos eventos solapados.

87

( )

( )

Se lanza una moneda y un dado juntos. Sea A, el evento sello en la moneda y


B, el evento 3 4 en el dado. Cul es la probabilidad de que A o B aparezcan?
DADO
1
Cara

X X X X X X

Sello X X X X X X

3. Eventos Independientes :

Dos eventos son unidos o compuestos, si aparecen al unsono o en consecuencia. De acuerdo a


lo anteriormente sealado, los eventos unidos o compuestos son independientes, si el resultado
de uno no afecta la probabilidad de ocurrencia del otro. La regla o frmula para el clculo de las
probabilidades de estos eventos es:
(

( )

( )

Ejemplo:

Se lanzan al unsono dos dados. Cul es la probabilidad de que el dado B 5 y


el dado A 4?
(

) (

( )( )

Observacin:

B 5 = 5 y 6 (dos eventos de posibles seis en el dado B)

A 4 = 4, 3, 2, 1 (cuatro eventos de posibles seis en el dado A)

4. Eventos dependientes:
Los eventos dependientes tambin estn referidos a eventos compuestos, o sea, que pueden
suceder al unsono o en consecuencia. En este caso, dos eventos son dependientes, si la
ocurrencia de uno, afecta la probabilidad de ocurrencia del otro. La regla o frmula para el
clculo de sus probabilidades es:
(

( )

( )

Si A ya sucedi, cul es la probabilidad de que suceda B, si la aparicin de A afecta la


probabilidad de aparicin de B.
Ejemplo:

88

Cul es la probabilidad de extraer dos cartas rojas de un paquete, sin


reemplazamiento? En la primera extraccin hay 26 cartas rojas en el paquete
(26/52); pero en la segunda extraccin, como no ha habido sustitucin, ya no
quedan 26 rojas sino nicamente 25, o sea, 25/51. Por lo tanto si aplicamos la
frmula el resultado sera:
)

) (

) (

)(

(0 0)(0

5. Eventos Complementarios:
Dos eventos son complementarios, E1 y E2, si el segundo de ellos contiene todos los elementos
del espacio muestral que no estn en el primero. La suma de las probabilidades de los eventos
complementarios debe ser igual a 1. La regla para el clculo de estas probabilidades es:
(

( )

Ejemplo:

Se tienen 500 bolas rojas y blancas en una urna. Si 300 son rojas, cul es la
probabilidad de extraer una bola blanca?
( )

00
00

( )

0 0

0 0

6. Eventos Condicionados:
Los eventos condicionados son aquellos que se manifiestan como un sub conjunto del espacio
muestral. Por ejemplo: en un mazo de 52 cartas, los eventos que son iguales o mayores que 10:
10, J, Q y K, se consideran un sub conjunto dentro del espacio muestral de las 52 cartas. Si
estuviera interesado en saber cul es la probabilidad de un evento, dentro de este sub conjunto de
eventos, tendra que aplicar la regla correspondiente:
( | )

)
( )

Que se lee: cul es la probabilidad de que ocurra A, habiendo ocurrido B?


Para efectos del desarrollo de este evento, desarrollemos el siguiente problema:

Se lanza una moneda y un dado juntos. Si la moneda cae cara, cul es la


probabilidad de que el dado resulte par?
ESPACIO MUESTRAL

Cara
Sello

1
C1
S1

2
C2
S2

Dado
3
C3
S3

4
C4
S4

5
C5
S5

6
C6
S6

89

1.

nicamente se toman en consideracin los eventos correspondientes a cara. Estos son C1, C2,
C3, C4, C5, C6
2. En los eventos Cara, se dan tres eventos pares: C2, C4 y C6, los cuales corresponden al 50% de
los eventos asociados con cara (en negrita)
3. En tal caso, la P pedida en el problema es igual a 3/6 = 0.50.
4. Este procedimiento es vlido cuando usted conoce todo el espacio muestral.

Hay ocasiones en que el clculo de la probabilidad condicional no se puede desarrollar


directamente por la observacin del espacio muestral En tales casos, se utiliza la regla o frmula
anteriormente presentada, bajo la condicin de que, al momento de reemplazar en la misma, se
debe considerar todos los eventos del espacio muestral. A continuacin presentamos el
procedimiento correspondiente.
(

)
(

)(

0 0

Observacin: Las probabilidades dentro de los sub conjuntos, son mayores que las
probabilidades dentro de todo el espacio muestral.

El conocimiento exhaustivo de la Teora de la Probabilidad, es una garanta en cuanto a la


comprensin e interpretacin correcta de la estadstica inferencial. A pesar de que en este captulo,
el enfoque de la probabilidad no ha sido profundo, consideramos que los conceptos emitidos sern
de gran ayuda para la interpretacin correcta de los captulos que a continuacin se presentarn,
relacionados con la inferencia estadstica.
CONCEPTOS IMPORTANTES

Estimacin de parmetros
Teora de la probabilidad
Experimento aleatorio
Espacio muestral
Eventos
Acto o Prueba
Eventos mutuamente excluyentes
Eventos solapados
Eventos independientes
Eventos dependientes
Eventos complementarios
Eventos condicionados

90
EJERCICIOS PRCTICOS
1. Determine la probabilidad de los siguientes eventos:
Al lanzar un dado el resultado sea un nmero impar
Un 10, un 9 de trbol o el 5 de diamantes, en la extraccin de una baraja.
Al lanzar dos dados, la suma de las caras sea mayor que 9
2. Una caja contiene 6 bolas rojas, 4 blancas y 5 azules. Hallar la probabilidad de que la bola
extrada sea:
Roja
Blanca
Azul
No roja
Roja o blanca
3. Un dado se lanza dos veces. Hallar la probabilidad de obtener 4, 5 6 en la primera tirada y 1,
2, 3 4 en la segunda.
4. Se sacan sucesivamente tres bolas de la caja del problema 2. Hallar la probabilidad de que
salgan en el orden roja, blanca y azul, si cada bola: (a) se repone y (b) si no se repone.
5. Hallar la probabilidad de que salga al menos un 4 en dos tiradas de un dado.
6. Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5 bolas
negras. Si se saca una bola de cada bolsa, hallar la probabilidad de que: (a) ambas sean blancas,
(b) ambas sean negras y (c) una sea blanca y la otra negra.
7. A y B juegan 12 partidas de ajedrez .A gana 6, B gana 4 y en 2 hacen tablas (empate).Juegan un
nuevo torneo de 3 partidas. Hallar la probabilidad de que: (a) A gane las 3, (b) hagan tablas en
2, (c) A y B ganen alternadamente y (d) B gane al menos una partida.
8. Se lanza un par de dados corrientes. Hallar la probabilidad de que la suma de sus nmeros sea
10 o mayor si:
Aparece un 5 en el primer dado
Aparece un 5 en uno de los dos dados por lo menos
9. Se lanzan tres monedas corrientes. Hallar la probabilidad de que todas sean caras si:
La primera de las monedas es cara
Una de las monedas es cara
10. Una clase tiene 12 nios y 4 nias. Se escogen tres estudiantes de la clase al azar, cul es la
probabilidad de que todos sean nios?
11. Una urna contiene 7 bolas rojas y 3 bolas blancas. Se sacan 3 bolas de la urna una tras otra.
Hallar la probabilidad de que las dos primeras sean rojas y la tercera blanca.
12. Una urna contiene 3 bolas blancas y 7 negras; se extraen dos bolas sin reemplazamiento. Cul
es la probabilidad de los siguientes eventos?
Blanca y blanca
Blanca y negra
Negra y blanca
Negra y negra
13. Al extraer una carta de un mazo de 52, cul es la probabilidad de que el resultado sea una
carta entre 3 y 13 inclusive?
14. Al seleccionar una carta de un paquete de 52, cul es la probabilidad de obtener una carta igual
o menor que 6 o un 3?

91
15. Se lanzan dos dados. Cul es la probabilidad de que uno resulte impar, si el otro muestra un 6?
16. En una universidad hay 200 estudiantes distribuidos de la siguiente forma: bachilleres en
ciencias, letras y humanidades, hombres y mujeres. Atendiendo a estas condiciones se sabe que:
20 son bachilleres en ciencias y hombres
88 son mujeres y bachilleres en letras
87 son hombres
140 son bachilleres en letras
30 son bachilleres en ciencias
Construya el espacio muestral de todos los eventos.
A partir del espacio muestral determine:
La p de seleccionar un bachiller en ciencias
La p de seleccionar un bachiller en ciencias hombre
La p de seleccionar una mujer
L p de seleccionar un bachiller en letras si fue hombre
La p de no seleccionar una mujer
La p de seleccionar un hombre de ciencias o una mujer de letras
La probabilidad de seleccionar una mujer de letras, si fue mujer
La p de seleccionar un hombre de letras y una mujer de
Humanidades.
17. En un vuelo de cierta lnea area viajan 18 muchachos, 178 adultos hombres, 10 mexicanos del
sexo masculino, dos muchachos mexicanos, 26 personas de nacionalidad mexicana y 14
muchachas extranjeras, sin contar la tripulacin. Desarrolle el espacio muestral correspondiente,
y calcule sus probabilidades.

92

CAPTULO 10
DE LA POBLACIN A LA MUESTRA
El objetivo principal de un investigador del comportamiento es el de describir, analizar,
diagnosticar y pronosticar el comportamiento de una variable en una poblacin determinada. Esta
meta se alcanza, por lo general, seleccionando una muestra de la poblacin, midiendo la variable de
inters en la misma y aplicando procesos y modelos estadsticos que permitan llegar a una decisin
final con relacin a la variable en estudio y su comportamiento en la muestra y en la poblacin. Es
evidente que el trabajar con una muestra es ms econmico que hacerlo con toda la poblacin, pero
para alcanzar tal objetivo, se deben satisfacer ciertos requerimientos estadsticos, que pasaremos a
discutir a continuacin.
Qu es una variable aleatoria?
Una variable aleatoria es aquella que se genera tras un proceso de seleccin aleatoria. Si recordamos
los temas anteriormente discutidos, para que un experimento sea aleatorio, todos los miembros de la
poblacin deben tener la misma probabilidad de ser seleccionados. Si la variable que se estudia en
la poblacin puede asumir X posibles valores, entonces los sujetos seleccionados aleatoriamente
pueden asumir cualquiera de estos X valores, y si adems, cada uno de estos valores tiene una
probabilidad en la poblacin, entonces una definicin ms acertada de variable aleatoria sera:
aquella que puede tomar cualquier valor de un nmero total de valores, teniendo cada uno de ellos
una probabilidad asignada. Veamos los siguientes ejemplos:
1.

Se lanzan un dado, identifique los posibles valores (Xi) que puede asumir cada lanzamiento y
determine sus probabilidades.

Resultado
Probabilidad

1
1/6

TABLA 10-1
POSIBLES RESULTADOS
2
3
4
1/6
1/6
1/6

5
1/6

6
1/6

Como se puede observar, del lanzamiento del dado se puede obtener uno de 6 posibles
resultados y cada uno de ellos tiene una probabilidad asignada. Por lo tanto, el resultado del
lanzamiento de un dado es una variable aleatoria porque combina ambas condiciones: un
resultado y su probabilidad de ocurrencia.

93
2. En una poblacin escolar hay 300 estudiantes de los cuales 175 son mujeres y 125 son hombres.
Se selecciona aleatoriamente un estudiante. Demuestre que el sexo es una variable aleatoria.
TABLA 10-2
Total
Probabilidad

Masculino
125
0.42

Femenino
175
0.58

Total
300
1.00

En este ejemplo, sexo es una variable aleatoria en vista de que puede asumir uno de dos valores
(masculino o femenino) y cada uno de ellos tiene una probabilidad de ocurrencia.
De acuerdo a Chou (1974), podemos presentar los siguientes conceptos asociados con una variable
aleatoria:

Una variable aleatoria es aquella cuyo valor es un nmero determinado por el resultado de un
experimento aleatorio.

Si X es una variable aleatoria que puede asumir distintos valores (xi), y si cada uno de estos
valores est asociado a una probabilidad (p), entonces la combinacin de cada valor de X con su
probabilidad, X(p), se denomina Funcin de Probabilidad o Distribucin de Probabilidad. Por
lo tanto, los resultados organizados en la Tabla 10-1 y en la Tabla 10-2, son ejemplos de
Distribuciones de Probabilidad.

De todo lo anteriormente sealado se desprende que para el investigador es muy importante


conocer los posibles resultados que se pueden obtener con cada observacin, adems de las
probabilidades asociadas con los mismos.

Los ejemplos anteriormente desarrollados indican que, en el proceso de investigacin del


comportamiento, al momento de seleccionarse una muestra, los resultados obtenidos en la medicin
de cada uno de ellos deben reflejar, por un lado, un valor y por el otro, el mismo debe corresponder
a una probabilidad existente en la poblacin. Esta situacin no se cumple con precisin con un solo
sujeto o con una muestra muy pequea de sujetos, pero a medida que aumenta el nmero de
selecciones, aumenta la posibilidad de que se cumpla la probabilidad real de dicho evento en la
poblacin.
Al momento de hacerse una medicin en una muestra, los resultados deben corresponder a una de
las dos posibles alternativas de variables aleatorias: discretas o continuas. Es importante que el
investigador determine con claridad a cul de estas categoras pertenece la medicin de la variable
estudiada; tambin puede suceder que en una misma investigacin se combinen ambas categoras de
variables. A continuacin discutiremos el significado de cada una de ellas.

94

Variable aleatoria discreta (categrica):


Se refiere a aquella variable que al momento de ser medida, los resultados
correspondientes no pueden asumir valores fraccionales. Segn Kerlinger y Lee
(2001), tambin se reconocen como variables nominales y se caracterizan por tener
dos o ms subconjuntos del tipo de objetos medidos. Los sujetos que estn en una
clase se caracterizan por poseer o no la propiedad definitoria: es un asunto del todo
o nada. Algunos ejemplos simples seran: masculino-femenino, correcto-incorrecto,
etc. Por lo general, cada categora se identifica con un nombre o un nmero:
correcto o incorrecto, 1 si posee la caracterstica, 0 si no la posee. En estos
casos, los nmeros no tienen significado cuantitativo, sino nicamente nominal.

Variable aleatoria continua:


Es aquella que es capaz de asumir un conjunto ordenado de valores dentro de cierto
rango y que adems puede asumir valores fraccionales. Esto implica que dicha
variable refleja, al menos, un orden de rango, o sea, que un valor mayor implica
ms de la propiedad estudiada que un valor menor. Las medidas continuas estn
contenidas dentro de rangos y los sujetos obtienen un puntaje dentro del mismo. Por
ejemplo, si se miden actitudes, la escala puede ser de 1 a 5: 1 significa una actitud
muy negativa y 5 una actitud my positiva. Adems, dentro de la escala, se pueden
asumir valores fraccionales tales como: 1.75, 3.25, 4.50, etc. Por esta razn, las
variables continuas se miden por lo menos en una escala de intervalos.

Es evidente que los resultados obtenidos en las mediciones psicolgicas corresponden a una de estas
dos categoras de variables, y que los mismos deben reflejar, hasta donde la muestra lo permita, el
espacio muestral de los resultados de la investigacin y sus posibles probabilidades. En otras
palabras, deben corresponder a una distribucin muestral de probabilidades
Qu es una Distribucin Muestral de Probabilidades?
Se puede definir una a una distribucin muestral como una descripcin matemtica de todos los
posibles resultados de los eventos muestrales y de sus probabilidades. Este concepto se aplica a
todas las muestras de un mismo tamao que se pueden seleccionar de una poblacin y a los
estadsticos calculados en las mismas. Especficamente, una distribucin muestral se refiere a la
distribucin de cualquier estadstico calculado sobre todas las posibles muestras de un mismo
tamao, seleccionadas de una poblacin. Este concepto estadstico se cumple con mayor certeza,
cuando la poblacin es grande y genera muestras lo suficientemente grandes como para que se
cumplan algunos criterios que pasaremos a analizar a continuacin; el ejemplo no es el ms vlido
porque la poblacin es pequea, pero se cumplen con claridad los principios bsicos de las
distribuciones muestrales.
Supongamos que tenemos una poblacin de tamao N de la cual se seleccionan todas las posibles
muestras de tamao n. Si para cada muestra es factible calcular la media, la varianza y la desviacin

95
estndar, entonces es factible generar la distribucin muestral de cada uno de estos estadsticos, las
cuales se denominaran: distribucin muestral de medias, distribucin muestral de varianzas y
distribucin muestral de desviaciones estndares; esto es posible para cualquier estadstico
muestral. El siguiente ejemplo nos ayudar a comprender mejor el concepto:
1.

Suponga que tenemos la siguiente poblacin de datos: 2, 4, 6, 8, 10.


Calculamos la Media () y la Desviacin Estndar (S) de dicha poblacin de
datos: = 6; S = 2.83
Seleccionamos todas las posibles muestras de tamao 2 de dicha poblacin.
Son un total de 25 combinaciones o muestras:

10

2,2

2,4

2,6

2,8

2,10

4,2

4,4

4,6

4,8

4,10

6,2

6,4

6,6

6,8

6,10

8,2

8,4

8,6

8,8

8,10

10

10,2

10,4

10,6

10,8

10,10

Si calculamos la media aritmtica de cada una de las muestras, los resultados


seran los siguientes:
2.0

3.0

4.0

5.0

6.0

3.0

4.0

5.0

6.0

7.0

4.0

5.0

6.0

7.0

8.0

5.0

6.0

7.0

8.0

9.0

6.0

7.0

8.0

9.0

10.0

Si calculamos la media de todas las medias anteriores tendramos como


resultado:

0
00

Como se puede observar:


00

Se ha podido demostrar que la media de la poblacin original de los cinco datos (6.00) es igual a
la media de todas las 25 medias de tamao 2 (6.00). Las 25 medias constituyen lo que se
denomina la distribucin muestral de las medias, lo cual es una importantsima propiedad
estadstica en la cual se fundamenta el proceso de muestreo. Esta propiedad es cierta para
cualquiera distribucin de muestras del mismo tamao. A partir de esta propiedad, podemos
llegar a las siguientes conclusiones:

96

La distribucin muestral de todas las medias se aproxima a una curva normal,


independientemente de la forma de la distribucin de los puntajes originales. Si se graficaran
todas las medias muestrales, la forma se aproximara a una curva. Esta propiedad est
fundamentada en el Teorema Central del Lmite.

La media de una distribucin de medias (media de medias) es igual a la media original de la


poblacin de los puntajes.

La desviacin estndar de la distribucin muestral de medias es menor que la desviacin


estndar de la poblacin original.

Es evidente que al seleccionar muestras aleatorias, las medias aritmticas resultantes de ellas sern
diferentes y esta diferencia se considera aleatoria, o sea, independiente del proceso de seleccin; es
inevitable. Es tambin lgico esperar que entre la media real de la poblacin y la media de la
muestra seleccionada exista una diferencia; esta diferencia se denomina error de muestreo.
Ante esta situacin, el investigador se enfrenta a la situacin de que, independientemente de que su
proceso de seleccin sea el ms adecuado, l sabe que la media obtenida de la muestra no ser igual
a la media de la poblacin, la cual es desconocida para el investigador. En estos casos, Qu hace el
investigador para determinar el error o diferencia que hay entre la media de su muestra y la de la
poblacin desconocida?
El primer paso para conocer el grado de aproximacin que hay entre la media muestral y la
poblacional, es el clculo de un estadstico denominado error estndar de la media. A travs de
este indicador, el investigador se ahorra el largo proceso de determinar la distribucin muestral de
las medias de cada muestra y calcular el promedio de las mismas para conocer el valor de la media
poblacional, o en ltima instancia, calcular la media poblacional sobre la totalidad de sujetos de la
poblacin. Veremos algunos ejemplos:

Si estoy interesado en conocer el promedio de la habilidad verbal de los 19,000


aspirantes a ingresar a la Universidad, tendra que aplicar una prueba que mida
dicha variable a cada uno de ellos, determinar la puntuacin individual, el valor
por cada sujeto y promediarla. Adems de ser un trabajo metodolgicamente
complicado, debe resultar muy caro.

Otra alternativa es que lo haga a travs del promedio de la distribucin muestral


de las medias de cada muestra de un mismo tamao. Para el ejemplo anterior, si
establecemos muestras de 1,250 personas, necesitaramos un nmero
infinitamente grande de muestras de este tamao, lo cual hace de este
procedimiento algo imposible de lograr.

Para evitar estas situaciones complicadas, partiendo de la premisa de que la distribucin muestral de
las medias se aproxima una curva normal, se calcula un estimador de la desviacin estndar de la
distribucin muestral de medias denominado: error estndar de la media, a partir de los datos
recogidos en una sola muestra. La frmula para alcanzar este valor es:

97

: error estndar de la media

s : desviacin estndar de la muestra


n : tamao de la muestra
Veamos un ejemplo: Una muestra de 75 entrevistados determin una media de 46 con una
desviacin estndar de 4.8. Cul sera el error estndar de la media aritmtica?

A partir del valor del error estndar, estamos en capacidad de poder desarrollar una metodologa
que nos permitir aproximar la media aritmtica conocida de la muestra, a la media poblacional
desconocida. A este procedimiento se le denomina ESTIMACIN, y es el primer objetivo de la
inferencia estadstica.
ESTIMACIN ESTADSTICA
Se entiende por estimacin estadstica al conjunto de procedimientos estadsticos dirigidos a
aproximar los valores muestrales a los correspondientes valores poblacionales. Solamente podemos
aproximarlos; nunca se podrn calcular con exactitud. Hay dos mtodos de estimacin estadstica:

la estimacin puntual, y,

la estimacin por intervalos

A continuacin analizaremos cada uno de ellos.


Estimacin Puntual:
Se refiere al procedimiento de seleccionar una muestra aleatoriamente de una poblacin, calcular
uno o ms valores estadsticos determinados por el problema de investigacin (media, varianzas,
desviaciones estndar, etc.) y considerarlos como estimadores de sus correspondientes valores
poblacionales (parmetros). A este valor se le considera un buen estimador, aunque no se tenga
evidencia estadstica de cun cerca o lejos est de su correspondiente valor poblacional; el
investigador depende plenamente de su juicio cientfico y, principalmente del mtodo de muestreo
que se sugiere sea completamente aleatorio. Ante las dudas que presenta la estimacin puntual, se
ha desarrollado un segundo mtodo que no calcula el valor poblacional con exactitud, pero que
establece una estimacin probabilstica entre la muestra y la poblacin. A este mtodo se le
denomina: estimacin por intervalos.
Estimacin Por Intervalos:
Se refiere al procedimiento a travs del cual se estima, probabilsticamente, que a partir de los datos
muestrales, el parmetro poblacional se encuentre dentro de un intervalo bajo la curva normal. Esto

98
es posible porque al determinar que la distribucin muestral de las medias se aproxima a la curva
normal y que es factible determinar la desviacin estndar de las distribucin muestral de las
medias, stas quedan definidas por los lmites de la curva normal, que estn entre -3z y + 3z a partir
de la media aritmtica muestral. En otras palabras, se puede inferir probabilsticamente que la media
poblacional est ubicada dentro de un intervalo bajo la curva normal. Esta es la estimacin ms
precisa que se puede hacer de la media poblacional desconocida, a partir de la informacin obtenida
a travs de una muestra aleatoria.
Para tal efecto se define lo que se denomina un intervalo de confianza, que es una zona de
probabilidad bajo la curva normal y que toma a la media muestral como estimadora de la media
poblacional. De esta manera, las puntuaciones Z se ubicarn por encima y por debajo de la media
muestral hasta -3z y + 3z, asocindose esta zona con un valor probabilstico. Si recordamos las
probabilidades bajo la curva, tenemos que:
o

entre 1z y +1z hay un 0.6826 de probabilidades: zc = 1.64

entre 2z y +2z hay un 0.9544 de probabilidades: zc = 1.96

entre 3z y +3z hay un 0.9900 de probabilidades: zc = 2.58

O sea, que la probabilidad de que la media poblacional est entre z y +z es de 68.26%, la


probabilidad de que est entre -2z y +2z es de 95.44%, y la probabilidad de estar entre -3z y +3z es
de 0.99.
Para tener claro el concepto, volvamos al ejemplo de la muestra de 75 entrevistados que obtuvo una
S = 4.8, y un error estndar de estimacin de 0.55. Cul es el intervalo de confianza en el que se
espera que se encuentre la media poblacional desconocida?
Para responder a este cuestionamiento, debemos decidir dentro de cul nivel de probabilidad
queremos hacer la estimacin. Por lo general, se calculan los intervalos de confianza en los niveles
de probabilidad del 95% o el 99%. Para el 95%, el valor de Z es de 1.96, mientras que para el 99%,
el valor de Z ser de 2.58. Para estos casos, Z se identificar como Zc (Z crtica)
La frmula para determinar el intervalo de confianza es:
( ) si la poblacin es infinita

( )

..si la poblacin es finita

Donde Np es el tamao de la poblacin y n el de la muestra.


Supongamos que para el problema planteado queremos calcular el intervalo de confianza al 95%.
Como no se conoce el tamao de la poblacin, se utiliza la frmula de poblaciones infinitas:
(

)(
)

Lmite superior: 46 + 0.55 = 46.55


Lmite inferior: 46 0.55 = 45.45

)(

99
Este resultado indica que, con un 95% de probabilidad, la media poblacional
desconocida estar entre 45.45 y 46.55.
Suponga que, para el mismo problema se conoce el tamao de la poblacin, N = 500. cul sera el
intervalo de confianza al 95%? En este caso se utiliza el mtodo de las poblaciones finitas.
0

00
00
(0

)(0

Lmite superior: 46 + 0.51 = 46.51


Lmite inferior: 46 0.51 = 45.49
Este resultado indica que con un 95% de probabilidad, la media poblacional
desconocida estar entre 45.49 y 46.51.
El procedimiento anteriormente sealado, el clculo del intervalo de confianza para la media
poblacional, es el ms preciso con que se cuenta en estadstica para aproximarnos al valor verdadero
de la media. Tambin se pueden desarrollar intervalos de confianza para otros valores
poblacionales, pero para efectos de este texto, slo nos referiremos a la media aritmtica, por ser el
estadstico en el que se fundamentarn los procedimientos de prueba de hiptesis que se estudiarn
en captulos posteriores.
Es evidente que la estimacin estadstica determina, en gran parte, la utilidad que se le podr dar a
la muestra de estudio. A continuacin introduciremos las tcnicas de muestreo ms efectivas, con la
intencin de tener un panorama amplio de la relacin que debe existir entre la muestra y su
correspondiente poblacin.
MTODOS DE MUESTREO
El muestreo es el procedimiento a travs del cual se seleccionan subconjuntos de las poblaciones a
las que se les denomina muestras. Las muestras son herramientas importantes para la investigacin
del comportamiento, en vista de que favorecen el estudio de las poblaciones sin necesidad de
utilizar todas las observaciones poblacionales. Las muestras, adems de ser mtodos econmicos en
comparacin con los estudios poblacionales, mantienen un alto nivel de representatividad de dichas
poblaciones, si el procedimiento de muestreo es desarrollado de manera adecuada, respetndose los
criterios metodolgicos que las estadsticas sealan al respecto.
Bsicamente hay dos tipos de muestreo que pueden ser utilizados en el proceso de organizacin de
una muestra: el muestreo aleatorio que se caracteriza porque todos los sujetos de la poblacin
tienen la misma probabilidad de ser seleccionados para conformar la muestra, y el muestreo no
aleatorio, en el cual cada miembro de la poblacin no tiene la misma probabilidad de ser
seleccionado. A continuacin analizaremos cada una de estas alternativas.

100
Muestreo No Aleatorio:
Tambin se le conoce como muestreo no probabilstico, en vista de que la seleccin de cada unidad
(sujeto) no est determinada por su probabilidad en la poblacin, ni est sustentada por un
procedimiento que asegure que dicha probabilidad poblacional ha sido considerada al momento de
hacer la seleccin. Algunos ejemplos de muestreo no aleatorio son.
1. Muestreo dirigido:
Se caracteriza porque los tems (sujetos) son seleccionados con base en el juicio del encuestador;
en otras palabras, se escogen de la poblacin aquellas unidades, que de acuerdo al investigador,
son representativos de la misma. En tales casos, La Probabilidad de seleccin del tem (sujeto) es
desconocida. En estos casos, no se pueden establecer intervalos de confianza y la estimacin es
de tipo puntual nicamente. A pesar de esta limitacin, es un tipo de muestreo que se utiliza con
relativa frecuencia en estudios econmicos y comerciales (Chou, 1974)
2. Muestreo por cuota s:
Se caracteriza porque a cada investigador (encuestador) se le da una cuota o nmero de
encuestas para ser cubiertas por el mismo. Los sujetos que constituyen la cuota que debe cubrir
el encuestador, deben satisfacer ciertas caractersticas previamente establecidas tales como:
nacionalidad, gnero, raza, afiliacin poltica, etc. En algunas ocasiones se considera que se
puede obtener informacin de ciertos estratos, a bajos costos y con problemas metodolgicos
inferiores a la verdadera estratificacin. La limitacin principal de este tipo de muestreo es que
la seleccin de las unidades refleja de manera significativa el juicio del encuestador. Bajo estas
caractersticas, las muestras no pueden ser tratadas como aleatorias en el mejor sentido de la
palabra. A pesar de esto, se utiliza con relativa frecuencia en estudios de opiniones y actitudes.
3. Muestreo deliberado:
Tambin se le denomina muestreo por segmento. Se caracteriza porque se utiliza un segmento de
la poblacin en funcin de su accesibilidad y comodidad para el investigador. Las guas
telefnicas, las listas de compradores de supermercados, etc., son ejemplos de unidades
observacionales en este tipo de muestreo. Sin embargo, los resultados obtenidos suelen ser muy
sesgados y poco representativos. No obstante, no se puede negar su utilidad como investigacin
piloto, en vista de que se puede someter a prueba preguntas de los cuestionarios, encuestas, etc.,
antes de disear el estudio de manera definitiva.
Muestreo Aleatorio:
Se caracteriza porque todos los miembros de la poblacin tienen igual oportunidad de ser
seleccionados para la muestra. Esta situacin determina que cada uno de los miembros de la
poblacin debe ser identificado previamente, tal y como sucedera, por ejemplo, con los estudiantes
de una escuela, los miembros de una empresa, los habitantes de un corregimiento, etc. La poblacin
y cada una de sus unidades participantes del muestreo, deben ser conocidas previamente y se debe
desarrollar una metodologa para su correcta identificacin al momento de la seleccin. Es evidente
que la definicin de la poblacin y la identificacin de cada uno de sus miembros, es una de las

101
dificultades ms importantes a la que se deben enfrentar los investigadores. Los principales tipos de
muestreo aleatorio son los siguientes:
1. Muestreo Aleatorio Si mple:
Se refiere a la extraccin de una muestra de una poblacin, a travs de un procedimiento en el
cual todos los sujetos de la poblacin tuvieron la misma oportunidad de ser seleccionados. Para
alcanzar este objetivo, el procedimiento de seleccin debe ser meticulosamente planificado de tal
manera que se cumplan todos los controles exigidos para este tipo de actividad.
En teora, para que se cumpla la aleatoriedad, los sujetos seleccionados deben ser devueltos a la
poblacin original, manteniendo los eventos y sus probabilidades invariantes. Pero en la prctica
esto no es necesario, porque por lo general, el tamao de la poblacin es muy grande en
comparacin con el de la muestra y el error cometido por la no sustitucin no tiene importancia
prctica. Sin embargo, si la poblacin es muy grande, en ocasiones se hace difcil numerar a
cada uno de los miembros de la poblacin para poder identificarlos. En la actualidad, este
inconveniente est superado con el desarrollo de la informtica que agiliza estos procedimientos
de manera significativa.
El proceso de seleccin de la muestra, una vez identificados de manera adecuada todos los
sujetos de la poblacin, se lleva a cabo utilizando una Tabla de Nmeros Aleatorios, que no es
otra cosa que una serie de nmeros generados electrnicamente sin ningn patrn u orden pre
establecido. A continuacin presentamos una parte de una Tabla de Nmeros Aleatorios, tomada
de Pagano, 2006.
TABLA 10-3:
Tabla de nmeros aleatorios (PAGANO, 2006)
1

32942

95416

42339

59045

26693

49057

87596

20624

07410

99859

83828

21409

29094

65114

36701

25762

59981

68155

45673

76210

58219

45738

29550

24736

46251

25437

69654

99716

11563

08803

86027

51867

65558

51904

93123

27887

53138

21488

09095

78777

99187

19258

86421

16401

19397

83297

40111

49326

35641

00301

16096

34775

21562

97983

45040

19200

Como se puede observar, una Tabla de Nmeros Aleatorios no es otra cosa que una matriz
(combinacin de filas y columnas) constituida por celdillas, dentro de las cuales se observan
series numricas en desorden, generadas a travs de ordenadores. Para nuestro ejemplo, las
celdillas estn constituidas por series de cinco nmeros, pero cada celdilla puede generar
cualquier conjunto de nmeros, desde 1 hasta k; lo importante es que los mismos no representen
ningn orden predeterminado. Como en la poblacin cada sujeto estar identificado por un
nmero o combinacin de nmeros, se entra a la Tabla de manera aleatoria y se va

102
seleccionando a los sujetos de acuerdo la aparicin del nmero que corresponde a los mismos.
En los Laboratorios se estudiar el mtodo para utilizar la Tabla en la seleccin aleatoria de
sujetos.
2. Muestreo Aleatorio Si stemtico:
Se trata de una forma de muestreo aleatorio simple, en la cual no es necesario utilizar la Tabla de
Nmeros Aleatorios a lo largo del muestreo; se utiliza para hacer la primera seleccin
nicamente. El resto del muestreo se har sistemticamente, o sea, a travs de intervalos fijos
previamente establecidos por el investigador. A los intervalos fijos los llamaremos K, y los
mismos sern definidos a travs de la siguiente regla: . Por ejemplo, si se tiene una
poblacin de N=1000 sujetos y se desea seleccionar una muestra de 100 sujetos, se divide el
tamao de la poblacin entre el tamao de la muestra, obtenindose K o intervalo de seleccin
aleatoria. Para nuestro ejemplo sera
000 00
0. Esto significa que a partir del primer
sujeto seleccionado aleatoriamente utilizando la Tabla, el resto de los sujetos de la muestra se
seleccionarn en intervalos de tamao 10, directamente de la poblacin hasta obtener los 100
sujetos que conforman la muestra. Como el primer sujeto fue seleccionado aleatoriamente, el
resto de las selecciones que se hagan utilizando el intervalo de tamao 10 tambin se consideran
aleatorias. Este procedimiento es ms rpido y por lo tanto ms econmico que el muestreo
aleatorio simple, mantenindose el concepto de aleatoriedad a lo largo del proceso.
3. Muestreo Aleatorio Estratificado:
Se trata de una aplicacin del mtodo aleatorio simple, que permite desarrollar un muestreo ms
eficiente y completo. Este caso requiere que la poblacin est dividida en estratos o categoras
homogneos internamente pero heterogneos entre ellos. Este sera el caso de poblaciones
estratificadas por gnero, por nivel acadmico, por nivel socioeconmico, por gnero y tipo de
organizacin familiar, etc. Para estos casos, una vez determinado el tamao muestral a utilizar,
se selecciona de cada estrato una sub muestra utilizando uno de los mtodos aleatorios
anteriormente explicados, de tal manera que en la muestra estarn representados los estratos
originales de la poblacin.
Hay dos tipos de muestra aleatoria estratificada: la proporcional y la no proporcional. Una
muestra es aleatoria estratificada proporcional, si el nmero de sujetos seleccionados de cada
estrato es proporcional a su representacin en la poblacin. A continuacin presentamos un
ejemplo:

Para ingresar a una carrera universitaria hay un total de 450 aspirantes, los
cuales pertenecen a los siguientes bachilleratos:
Estrato

Ciencias

250

0.50

Letras

100

0.20

Comercio

150

0.30

Total

500

1.00

103

Se va a seleccionar una muestra de 75 estudiantes para ingresar a la


universidad. Cul sera la cuota de estudiantes por estrato y de qu
manera seran seleccionados?
Se trata de un muestro aleatorio estratificado proporcional.
Estrato

n!(p)

Ciencias

37.5

Letras

75(0.50)
75(0.50)

Comercio

75(0.50)

22.5

15.0

Como se observa en el ejemplo anterior, los 75 estudiantes seleccionados estn conformados por
los tres bachilleratos, pero el nmero de estudiantes de cada bachillerato es proporcional a la
cantidad de estudiantes que originalmente constituan el estrato en la poblacin. Este
procedimiento permite seleccionar una muestra que representa al universo con relacin a la
proporcin de cada estrato de la poblacin. Sin embargo, es prudente utilizar este procedimiento
en aquellos casos en los que no hay gran diferencia en la dispersin entre los estratos.
Una vez asignada la cuota de muestreo a cada uno de los estratos, se les trata como si fueran una
poblacin y se selecciona la cuota asignada a cada uno de ellos, utilizando cualquiera de los
mtodos de muestreo aleatorio anteriormente analizados: simple o sistemtico.
Es evidente que el muestreo estratificado no proporcional no es una alternativa adecuada para la
seleccin de muestras constituidas por estratos. Este tipo de muestreo puede presentar
distorsiones de la informacin proveniente de cada uno de los estratos, especialmente si hay
diferencias marcadas en la dispersin entre los estratos. Este mtodo de muestreo no es
recomendable para el desarrollo de investigaciones aplicadas en psicologa.
DETERMINACIN DEL TAMAO DE LA MUESTRA: n
Este captulo sobre poblaciones y muestras no poda darse por concluido, si no se abordaba el
problema del tamao de la muestra. A continuacin discutiremos los aspectos bsicos que deben ser
tomados en consideracin, para determinar el tamao mnimo que debe tener una muestra al
momento de desarrollarse un estudio. Es importante destacar que el concepto de la aleatoriedad se
mantiene como un aspecto bsico en el desarrollo del tema. Adems, los principios que se
presentarn a continuacin se refieren especficamente a la determinacin de n, para la estimacin
de la media de la poblacin, por ser ste el parmetro que ms se utiliza en investigaciones del
comportamiento.
Para determinar n, es importante tomar en consideracin los siguientes aspectos estadsticos
bsicos:
1. El intervalo de confianza para la media, ya sea del 95% o del 99%
2. El nivel de probabilidad que desea para el intervalo de confianza

104
3. La diferencia que espera entre los lmites del intervalo y el valor de la media verdadera: d
4. La 2 de la poblacin
En el caso de la 2, en pocas ocasiones el investigador cuenta con este dato; por lo general se
requiere que el mismo sea estimado de la poblacin, para lo cual se sugiere una de las siguientes
alternativas:

El investigador saca de la poblacin una muestra piloto, por lo general pequea, y hace una
estimacin de la 2.

Se investigan estudios previos en los cuales se han tocado temas similares a los que le interesan
al investigador. Si los temas, objetivos y contenidos de dichos estudios son lo suficientemente
similares, puede hacer uso de las varianzas muestrales obtenidas y considerarlas estimadoras de
la 2.

Al momento de determinar n, el investigador debe considerar si la poblacin en la cual se har el


muestreo es infinita (desconocido el nmero de sujetos o significativamente grande), o si es finita,
en cuyo caso, se tiene informacin sobre el amao de la poblacin. A continuacin se presentan las
frmulas correspondientes a cada una de estas alternativas.
Tamao De Poblacin Desconocido

z2: cuadrado de la puntuacin z correspondiente al 95% (1.96) o al 99% (2.58)


2 : varianza de la poblacin o un estimador de ella
d2: diferencia esperada entre la media de la muestra y la de la poblacin
Tamao De Poblacin Conocido

z2: cuadrado de la puntuacin z correspondiente al 95% (1.96) o al 99% (2.58)


2 : varianza de la poblacin o un estimador de ella
d2: diferencia esperada entre la media de la muestra y la de la poblacin
N : tamao de la poblacin

105
CONCEPTOS IMPORTANTES

Variables aleatorias
Variable aleatoria contnua
Variable aleatoria nominal (discreta)
Distribucin muestral
Error de muestreo
Error tpico de la media
Estimacin estadstica
Intervalo de confianza

106
EJERCICIOS PRCTICOS

DISEO DE MUESTREO
TABLA 1
POBLACIN
HOMBRES

MUJERES

01

17

33

49

65

02

18

34

50

66

03

19

35

51

67

04

20

36

52

68

05

21

37

53

69

06

22

38

54

71

07

23

39

55

71

08

24

40

56

72

09

25

41

57

73

10

26

42

58

74

11

27

43

58

75

12

28

44

60

76

13

29

45

61

77

14

30

46

62

78

15

31

47

63

79

16

32

48

64

80

A partir de la poblacin anterior, seleccionaremos muestras de manera aleatoria.


1. Selecciones una muestra aleatoria de tamao n = 30, utilizando el mtodo de muestreo aleatorio
simple.
2. Seleccione una muestra aleatoria de tamao n= 30, utilizando el mtodo sistemtico
3. Seleccione una muestra aleatoria de tamao n=30, utilizando el mtodo de muestreo
estratificado proporcional.

107
DISEO DE MUESTREO
SEGUNDA PARTE
TABLA 2
POBLACIN
HOMBRES

MUJERES

60

75

72

92

85

72

64

75

49

94

55

88

64

79

68

45

73

85

83

71

82

68

71

69

65

84

77

87

64

55

93

67

83

82

62

63

89

81

72

73

94

82

57

75

77

85

78

62

70

72

90

81

91

66

67

76

68

73

85

87

78

70

78

98

61

69

81

79

72

76

56

71

72

78

82

73

78

93

76

90

Suponga que a los sujetos de la poblacin de la Tabla 1, se les aplic una prueba de Conocimientos
Generales y los resultados estn descritos en la Tabla 2 de este laboratorio. Como usted seleccion
muestras de tamao 30, acredite a cada sujeto de las muestras seleccionadas el puntaje que obtuvo
en la prueba y desarrolle el laboratorio que presentamos a continuacin. Recuerde: la Tabla 1
identifica a los sujetos de la poblacin; la Tabla 2 identifica los puntajes que obtuvo cada uno de
ellos en la prueba.
4. A partir de la muestra aleatoria simple de tamao 30 seleccionada anteriormente determine:
La media aritmtica de la muestra y la desviacin estndar de la muestra
El error estndar de la media aritmtica
El intervalo de confianza para la media aritmtica al:
95%
99%
5. A partir de la muestra aleatoria estratificada de tamao 30, seleccionada anteriormente,
determine: :
La media aritmtica y la desviacin estndar del estrato masculino

108
El error estndar de la media del estrato masculino
El intervalo de confianza para la media del estrato masculino al:
95%
99%
6. Desarrolle el mismo procedimiento del punto 2, para el estrato femenino
7. A partir de la poblacin hipottica resumida en la Tabla 2 del captulo, y sin tomar en
consideracin diferencias por sexo, determine el tamao de muestra (n) mnimo requerido, si el
intervalo de confianza es del 95% y la estimacin (margen de error) aceptada con relacin a la
media real es de 2 puntos. La varianza estimada a travs de otros estudios semejantes fue de
121 puntos.
8. Un investigador desea hacer una estimacin de la puntuacin promedio de la ansiedad, de un
grupo de estudiantes que pertenecen a cierta rea de la ciudad. El investigador desea que su
estimacin se encuentre a 0.25 puntos del valor verdadero, con un intervalo de confianza del
99%. La desviacin estndar obtenida en estudios previos fue de 0.75. Qu tamao de muestra
debe tener el estudio?

109

CAPTULO 11
INTRODUCCIN A LA PRUEBA DE HIPTESIS
Uno de los objetivos de la inferencia estadstica es la prueba de hiptesis. Para tener una idea ms
clara de su real significado, es necesario discutir el concepto hiptesis estadstica. En el plano de la
investigacin psicolgica, una hiptesis es una afirmacin referente al comportamiento esperado de
una o ms variables y de las posibles relaciones que pueden existir entre las mismas. Las hiptesis
de investigacin se plantean, por lo general, desde una perspectiva conceptual, y se fundamentan en
modelos tericos, evidencia emprica obtenida a travs de otras investigaciones, e inclusive, la
intuicin, experiencia o sentido comn del investigador. Las hiptesis de investigacin requieren ser
verificadas empricamente, lo cual permitir decidir sobre la veracidad o no de la afirmacin
efectuada. La verificacin de las hiptesis de investigacin se realiza a travs de una herramienta de
la estadstica inferencial denominada hiptesis estadsticas.

Problemas
Teoras

Hiptesis
estadsticas

Hiptesis de
investigacin

FIGURA 111

El problema bsico al que se enfrenta el investigador es el de establecer un vnculo entre la(s)


hiptesis de investigacin que se refieren a variables y las relaciones de las mismas definidas
conceptualmente, y el comportamiento observable de las mismas en el contexto de la investigacin.
En las ciencias del comportamiento, ese vnculo se logra a travs de las definiciones operacionales
de dichas variables, o sea, la descripcin precisa de la forma en que las mismas sern medidas. A
travs de la medicin podemos pasar del concepto (constructo o variable) al dato, favorecindose de
esta manera, la aplicacin de procedimientos matemticos y estadsticos capaces de verificar con
objetividad, las afirmaciones (o conjeturas) planteadas a travs de las hiptesis de investigacin.
Veamos un ejemplo hipottico.
Un psiclogo cree poseer evidencias como para considerar que el razonamiento analgico est
relacionado con el rendimiento en las matemticas. Para ser ms especfico, conjetura que la
relacin entre ambas variables es directamente proporcional, o sea que, incrementos en una, van
acompaados de incrementos en la otra. Para solucionar esta sospecha, el primer paso que debe
satisfacer el investigador es el de determinar si estas variables pueden ser definidas
operacionalmente, o sea, que puedan ser medidas. Descubri que el razonamiento analgico se
puede medir a travs de la Prueba del WISC mientras que el rendimiento en las matemticas lo

110
mide a travs de las notas obtenidas en el colegio; bajo estas perspectivas, ambas variables
pueden ser transformadas de conceptos a datos o valores cuantitativos. De cada sujeto
investigado se puede obtener informacin que permita determinar: si poseen los atributos y la
magnitud (cantidad) de los mismos. A partir de la cuantificacin, el investigador est en
capacidad de verificar si su hiptesis es acertada o no, sobre la base de la aplicacin de las
estadsticas inferenciales, especficamente a travs de una prueba de hiptesis.
LA PRUEBA DE HIPTESIS
Es un procedimiento que permite establecer si el comportamiento esperado de los datos estadsticos
provenientes de una investigacin, se han cumplido tal y como conjetur el investigador, o si por el
contrario, dicho comportamiento no se manifest de acuerdo a lo esperado. Para desarrollar esta
accin se requiere de evidencia estadstica proveniente de la(s) muestra(s) de estudio y de una
acertada aplicacin de la teora de la probabilidad. Esto ltimo es fundamental, en vista de que las
investigaciones comportamentales se desarrollan sobre muestras extradas de poblaciones y toda la
teora del muestreo est basada en probabilidades.

Evidencia
muestral

Teora de
probabilidad

Hiptesis
estadstica

FIGURA 112

La Prueba de Hiptesis es un procedimiento que consta de seis pasos que deben ser cumplidos con
la mayor objetividad posible. A continuacin se desarrolla cada uno de ellos. El estudiante debe
comprender, analizar y sintetizar el contenido, de tal manera que al momento de llevar a la prctica
el procedimiento, el mismo est correctamente sustentado.

111

PASO 1:

PASO 2:

PASO 3

Hiptesis estadsticas

Nivel de significacin

Identificar el
estadstico de prueba

PASO 4

PASO 5

PASO 6

Formular una regla de


decisin

Tomar una muestra y


llegar a una decisin

Decisin

FIGURA 113

PASO 1: Hiptesis Estadstica


Una hiptesis estadstica es una que hace el investigador acerca del comportamiento de uno o ms
parmetros poblacionales, de acuerdo a la hiptesis de investigacin planteada en el estudio. La
hiptesis estadstica se hace sobre valores cuantitativos que deben representar la misma relacin
planteada en la hiptesis de investigacin. Para tal efecto, la Prueba de Hiptesis est constituida
por dos hiptesis que deben ser rivales y mutuamente excluyentes: la Hiptesis nula (H0) y la
Hiptesis alterna (H1).
La Hiptesis Nula, H0, se plantea de manera opuesta a la hiptesis de investigacin; en otras
palabras, rivaliza con la hiptesis de investigacin. Por otro lado, la Hiptesis Alterna, H1, se
plantea de tal manera que debe coincidir totalmente con la hiptesis de investigacin, por lo tanto,
es opuesta a la hiptesis nula. Bajo estas circunstancias, la Prueba de Hiptesis se disea con la
intencin de rechazar la H0 y confirmar la H1. Si se rechaza la H0, se confirma la H1; si no se
rechaza la H0, no se confirma la H1 y por lo tanto, tampoco se confirma la hiptesis de
investigacin. El planteamiento formal de ambas hiptesis es el siguiente:
H0: Se plantea la hiptesis nula
H1: Se plantea la hiptesis alterna
Veamos el ejemplo del razonamiento analgico y el rendimiento en matemticas. La hiptesis del
investigador se verifica con un procedimiento de correlacin del cual se desprende un coeficiente
que l espera que sea positivo y mayor que cero (0). Las hiptesis estadsticas correspondientes
seran:
0
0

112
Como se puede observar, la H1 coincide con la hiptesis de investigacin que deca que la relacin
esperada deba ser directamente proporcional entre ambas variables, situacin que se corrobora
cuando el coeficiente rxy es mayor que cero (0). Lo importante en el ejemplo es observar que si se
rechaza la H0, automticamente se considera confirmada la H1; de no ser rechazada la H0, no se
podra confirmar o aceptar la H1. Este es un ejemplo, y ms adelante, explicaremos los diversos
estadsticos que se utilizan al plantear las hiptesis.
Otros ejemplos de planteamiento de hiptesis estadsticas
1.

El Ingreso mensual promedio de los jubilados panameos es menor de B/385.00


00
00

2. El ndice acadmico de las estudiantes de psicologa del sexo femenino es mayor que el de los
estudiantes del sexo masculino

3. El nivel de conocimientos de matemticas bsicas es diferente entre los bachilleres en letras y


los bachilleres en comercio.

Como se puede observar en los ejemplos, la Hi se puede plantear en una direccin (> <) al igual
que en dos direcciones ( ). Cuando se plantea en una direccin, la prueba es de una cola a la
derecha y el operador utilizado es >, o de una cola a la izquierda y el operador corresponde a <. En
el caso de una cola a la derecha se indica que el resultado esperado debe ser positivo y se ubicar a
la derecha de la distribucin de probabilidad que se est utilizando. Por el contrario, si la prueba es
de una cola a la izquierda se indica que el resultado esperado debe ser negativo y debe ubicarse a la
izquierda de la distribucin de probabilidad correspondiente. En el caso de dos colas se indica que
no hay certeza por parte de investigador con relacin a la direccin en que se darn los resultados, o
sea, que pueden darse a la derecha y ser positivos, o pueden darse a la izquierda y ser negativos. Es
importante volver a destacar que la hiptesis alterna debe ser semejante a la hiptesis de
investigacin, lo que significa que la direccin de la prueba de hiptesis debe corresponder a lo
planteado en la hiptesis de investigacin.
PASO II: Nivel De Significacin
El nivel de significacin se refiere a una zona de probabilidad bajo la distribucin probabilstica,
que determinar el rechazo de la Ho y por consiguiente la confirmacin de la Hi. Siempre que los
resultados de la prueba de hiptesis caigan dentro del nivel de significacin, se ha verificado la
hiptesis alterna. El nivel de significacin se identifica por el smbolo el cual se lee como alfa y
por lo general, en las investigaciones comportamentales puede tener uno de los siguientes valores:
1.

= 0.05.

113
En ese caso se indica que la probabilidad asignada a la ocurrencia de la H1 por azar, es
de 0.05, y la misma se ubicar siempre en los extremos de la distribucin de
probabilidad, ya sea para una o para dos colas.
2. = 0.01
Para este caso, la probabilidad asignada a la ocurrencia de la Hi por azar, es de 0.01 y,
al igual que en el caso anterior, se ubicar en los extremos de la distribucin, tanto
para una como para dos colas.
Como se puede observar, los alfas tienen tamaos diferentes y esta situacin es importante al
momento de disear y desarrollar la prueba de hiptesis. Cuando se establece un alfa de 0.05, se
comete lo que se denomina el error de tipo I. Este error se refiere a la probabilidad de rechazar la
Ho y confirmar la Hi cuando la primera no debi de haberse rechazado. O sea, que el rechazo se
debe principalmente a que alfa tiene un tamao grande y de esa manera aumenta la probabilidad de
que los resultados caigan en esta zona. Esta situacin nos lleva a concluir que cada vez que
decidimos tomar un alfa ms grande, se aumenta la probabilidad de cometer el error de tipo I, o sea,
verificar su hiptesis alterna, cuando no debi ser verificada. Cuando se establece un alfa de 0.01,
se comete lo que se denomina el error de tipo II, que se refiere a la probabilidad de no rechazar la
Ho y por lo tanto, no confirmar su Hi, cuando la primera debi haberse rechazado. En este caso,
como alfa es tan pequea, se ubica muy al extremo de la distribucin de probabilidad haciendo
difcil que resultados muy importantes sean considerados como tales en vista de que no caen en
dicha zona de probabilidades. A continuacin se presentan algunas figuras que favorecen la
comprensin del tema.

114

Error de tipo I:
grande

Error de tipo II:


pequea

FIGURA 114

La figura anterior presenta la situacin tpica de una prueba de hiptesis en la que se ha definido
alfa. Como se puede observar, la distribucin ha sido dividida en dos reas: la del extremo derecho,
la ms pequea, representa a alfa, la cual puede ser de 0.05 de 0.01 de acuerdo a las necesidades
del investigador. Este es el caso tpico de una prueba de una cola a la derecha, porque se est
indicando que la zona de alfa est en el extremo derecho. Si por el contrario, la prueba hubiese sido
de una cola hacia la izquierda, entonces la zona de alfa se hubiese ubicado en la cola de la izquierda
de la distribucin.
Tal y como hemos observado, al definirse alfa, se divide la distribucin en dos partes: una para alfa
que es la ms pequea y otra mayor que se denomina beta y se identifica por el smbolo . Beta
representa la probabilidad asociada con la H0, es complementaria con alfa y ambas son mutuamente

115
excluyentes. Por lo tanto, la prueba de hiptesis puede caer en alguna de las dos reas: si cae en alfa
se rechaza la H0 y se confirma la Hi; si cae en beta, no se rechaza la H0 y no se ha podido confirmar
la Hi.
En el caso de que la prueba de hiptesis sea de dos colas, entonces alfa se divide entre dos ( / 2) y
se asignan las correspondientes probabilidades a cada extremo de la curva; o sea, que hay dos zonas
de rechazo probables para la H0. El rea central que queda entre las dos zonas de alfa corresponde a
beta.
La figura a continuacin permite observar la situacin anteriormente sealada, identificando cada
uno de los componentes de la situacin de prueba de hiptesis planteada.

= 0.025 0.005

= 0.025 0.005

= 0.95 0.99

representa la probabilidad de ocurrencia de H1 por azar


representa la probabilidad de ocurrencia de Ho por azar

FIGURA 115

Es importante destacar que + = 1, por ser eventos mutuamente excluyentes y complementarios.


Cambios en alfa representan automticamente cambios en beta. El investigador decide cul valor de
alfa va a utilizar, o sea, cul tipo de error est dispuesto a cometer. Es evidente que mientras ms
importante sea la decisin a tomar, ms exigente se hace la prueba de hiptesis, y por lo tanto, ms
pequeo ser alfa. En psicologa, educacin y ciencias sociales, estos dos niveles de significacin
son los que se estudian y utilizan con mayor generalidad. Sin embargo, es importante sealar que
existen procedimientos muy especficos para determinar estos niveles de probabilidad, tales como la
determinacin de la potencia y eficiencia de una prueba de hiptesis. Estos temas se estudian en
niveles superiores de educacin universitaria.

116
PASO III: Estadstico De Prueba
Una vez definidas las hiptesis y establecido el nivel de significacin, se debe establecer el
procedimiento estadstico a travs del cual se va a desarrollar la prueba de hiptesis. El
procedimiento estadstico seleccionado debe tomar en consideracin varios aspectos crticos:

El tamao de la muestra: si la muestra es a 30, el estadstico a seleccionar debe ser adecuado


para esta restriccin del muestreo, o en otras palabras, debe corresponder a una muestra
pequea. Si la muestra es > 30, el estadstico debe corresponder a una muestra grande.

El nivel de medicin de la(s) variable(s): se debe considerar si la(s) variable(s) han sido
medidas como continuas o discretas, y si corresponden al nivel nominal, ordinal, de intervalo o
de proporcin.

El tipo de parmetro poblacional que est bajo estudio a travs de la evidencia muestral

Si las muestras analizadas (estimadores a someter a prueba) provienen de poblaciones


semejantes o diferentes.

Bajo estas consideraciones, los estadsticos de prueba que se utilizarn para el estudio de las
pruebas de hiptesis son:
1.

El estadstico z para las pruebas de hiptesis de dos medias o dos proporciones provenientes de
muestras grandes y que supongan que las variables son continuas, se distribuyen normalmente
y la es conocida.
2. El estadstico t de Student, para las pruebas de hiptesis de dos medias aritmticas,
desarrolladas en muestras pequeas (o grandes) y que se asume que las variables son continuas
y la es desconocida por lo que se utiliza la S muestral.
3. El estadstico F de Fisher para las pruebas de hiptesis de medias aritmticas, muestras
pequeas y variables continuas, cuando se comparan dos o medias aritmticas.
4. La prueba Chi Cuadrado para muestras pequeas, variables discretas medidas en escala
nominal. La prueba de proporcin y asociacin de Chi Cuadrado requiere de muestras grandes.
Recuerde que si la frecuencia esperada es menor a 5 no aplica; para el caso de muestras
pequeas y tablas slo 2x2, la prueba sera la Exacta de Fisher.
Para el caso de pruebas de hiptesis para medias aritmticas, a continuacin presentamos una tabla
en la que se resumen los valores crticos de Z, a diferentes niveles , a una o a dos colas.
TABLA 11-1:
Valores crticos de z para diferentes niveles de , a una o a dos colas
Alfa
0.05
0.01
Una cola

1.96 -1.64

2.33 -2.33

Dos colas

1.96 -1.96

2.58 - 2.58

117
Para cada uno de los estadsticos sealados, se ha definido una regla (frmula) para calcular su
valor exacto, las cuales sern presentadas a medida que se vayan desarrollando los diferentes tipos
de pruebas de hiptesis.
PASO IV: Regla De Decisin
La regla de decisin identifica los hechos estadsticos que permitirn determinar si la H 0 se rechaza
o no se rechaza. Al momento de determinarse alfa, la distribucin de probabilidad utilizada se
divide en dos partes: la zona de aceptacin y la de rechazo. El punto en que se divide la distribucin
debe ser representado por un valor crtico proveniente de la Tabla de Probabilidades
correspondiente a la distribucin de probabilidad utilizada para el estudio, el alfa de la prueba y el
tipo de cola de la hiptesis alterna. Esto significa que se determinarn valores crticos para z, t, F y
Chi Cuadrado, y que los mismos sern los criterios contra lo que vamos a comparar los resultados
obtenidos al aplicar las pruebas estadsticas. La regla de decisin establecer que se rechazar la H 0,
si el estadstico obtenido de los datos de la investigacin, supera el valor crtico obtenido en la tabla.
Por ejemplo, si est haciendo una prueba de hiptesis para una media poblacional, con alfa de 0.05,
una cola a la derecha y una muestra grande, el valor crtico que separa alfa de beta se obtiene de la
Tabla de la Curva Normal y el mismo es igual a Zc = 1.64. Quiere decir que para rechazar la H0, la
z que obtenga de los datos de la investigacin (Zo) debe ser superior al valor crtico de 1.64. Si esto
sucede, la z de los datos cae en la zona de alfa y por lo tanto se rechaza la Ho confirmndose la
alterna; de lo contrario, no se puede rechazar la H0. Esto debe estar debidamente explicado en la
prueba de hiptesis, ms o menos en los siguientes trminos:
Se rechaza la H0 si la Zo (z obtenida) es mayor que la Zc (z crtica) que es igual a 1.64.

Regin
de
rechazo

Regin de aceptacin

Z = 1.64

Probabilidad 0.95
Probabilidad
0.05

FIGURA 116

PASO V: Aplicacin de la Prueba Estadstica


Se refiere al procesamiento estadstico de los datos provenientes de la(s) muestra(s) de estudio y del
desarrollo de la prueba estadstica seleccionada. Como ya hemos dicho anteriormente, se utilizarn

118
las pruebas z, t, F y Chi Cuadrado de acuerdo a las necesidades. Los resultados obtenidos sern
comparados con los correspondientes valores crticos provenientes de las Tablas y se determinar si
los valores observados superan o no a los crticos lo cual permitir tomar una decisin final.
PASO VI: Decisin
La decisin se refiere al rechazo o no de la H0, atendiendo al planteamiento de la prueba de
hiptesis, a los resultados de la prueba estadstica y a la regla de decisin establecida en el estudio.
Si el valor observado en la prueba supera al valor crtico de la Tabla, se rechaza la Ho y se confirma
la alterna; de no ser as, no se rechaza la Ho y por lo tanto no se confirma la hiptesis alterna.
CONCEPTOS IMPORTANTES

Hiptesis estadstica
Prueba de hiptesis
Hiptesis nula
Hiptesis alterna
Nivel de significacin
Alfa y Beta
Errores Tipo I y Tipo II
Prueba de una cola
Prueba de dos colas

119

CAPTULO 12
PRINCIPALES TIPOS DE PRUEBA DE HIPTESIS

Al iniciar el captulo de Poblaciones y Muestras sealamos que se hara nfasis en los estudios
relacionados con la media aritmtica, en vista de que este estadstico es posiblemente el ms
importante, junto con la desviacin estndar, para los anlisis de resultados provenientes de
investigaciones comportamentales. Por tal razn, las pruebas de hiptesis que a continuacin se
discutirn, se dirigen en particular hacia este estadstico.
PRUEBAS DE HIPTESIS PARA
DISTRIBUIDOS NORMALMENTE.

POBLACIONES

DATOS

Cuando se presume que los datos estn distribuidos normalmente, ya sea porque la muestra es
grande o porque se tiene suficiente evidencia como para aseverar la distribucin normal, se puede
estudiar la significancia de las puntuaciones correspondientes a la(s) media(s), utilizando el
estadstico estandarizado z. Para tal efecto se deben satisfacer ciertas condiciones:

Los datos se distribuyen normalmente

Los datos han sido medidos por lo menos en una escala de intervalos

La poblacional es conocida

La 2 poblacional es conocida

Si la 2 es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser


utilizada como estimadora de su correspondiente parmetro poblacional.

Si las condiciones anteriores son satisfechas, se pueden desarrollar dos tipos de pruebas de hiptesis
para la media: a) el caso de una media poblacional y, b) el caso de dos medias poblacionales. A
continuacin presentaremos las principales caractersticas de ambos procedimientos.
El Caso De Una Media Poblacional
En muchas ocasiones, los investigadores estn interesados en evaluar si una media poblacional
conocida ha variado o se mantiene igual. En estos casos, una vez verificadas las propiedades
anteriormente sealadas, se extrae una muestra aleatoria de la poblacin y se calcula la media
aritmtica de la misma. El estadstico de anlisis es:

A continuacin presentamos un ejemplo de una prueba de hiptesis para el caso de una media
poblacional.

120
La media de las aptitudes generales de los aspirantes a ingresar a la Universidad A, en los
ltimos diez aos, es de 43, con una = 8.56. Una muestra de 275 aspirantes del ao 2010
obtuvo una media de 46.65. Con alfa de 0.05 determine si la media de las aptitudes generales de
los aspirantes ha aumentado en comparacin con los ltimos diez aos.
1. Hiptesis estadsticas

2. Ni vel de si gnificacin
00

3. Estadstico de prueba

4. Regla de decisin
Rechazar Ho si la Zo es mayor que la Zc = 1.64
5. Resultados

6. Decisin:
En vista de que zo > zc, hay evidencias estadsticas para rechazar la Ho y confirmar la H1;
la media de la muestra actual es mayor que la de la poblacin de los ltimos 10 aos.

En este problema, la informacin correspondiente a la 2 poblacional formaba parte de los datos del
mismo. Sin embargo, en la mayora de los casos, este dato se desconoce y el error estndar de la
media no es posible determinarlo, por lo que el investigador debe echar mano de otros recursos que
la estadstica inferencial pone a su disposicin, los cuales analizaremos a continuacin.

121

Si el tamao de la muestra es grande (se considera una muestra grande la que es de al menos 30
sujetos), es factible hacer una estimacin de la poblacional, y a partir de ella calcular el error
estndar de la media aritmtica. Esto es factible por el poder de los nmeros grandes (muestras
grandes) combinados con el Teorema Central del Lmite.

Si la variable objeto de estudio est distribuida normalmente, o existe suficiente evidencia


estadstica para considerar que esta situacin est presente, se puede asumir que la distribucin
muestral de las medias aritmticas de tamao n se distribuye normalmente. En tal caso, la
prueba z es pertinente para llevar adelante la prueba de hiptesis.

El Caso De Dos Medias Poblacionales


Muchas investigaciones en el campo de la psicologa se refieren a la comparacin de dos medias
poblacionales. Para tal efecto, el procedimiento es semejante al seguido en el ejemplo de una media
poblacional, aunque en este caso, se comparan las medias muestrales obtenidas de muestras que
fueron seleccionadas de dos poblaciones. Para el desarrollo de este tipo de prueba de hiptesis se
deben cumplir con los siguientes requisitos:

Los datos se distribuyen normalmente en ambas poblaciones o existen suficientes evidencias


que le permiten al investigador lanzar este supuesto

Los datos han sido medidos por lo menos en una escala de intervalos

Las 2 poblacionales pueden ser conocidas como tambin desconocidas; por lo general son
desconocidas.

Si la 2 es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser


utilizada como estimadora de su correspondiente parmetro poblacional.

El estadstico requerido para desarrollar este tipo de prueba de hiptesis es:


, en donde,

, que representa el error estndar de la diferencia de dos

medias.
A continuacin se presenta un ejemplo:
El nivel promedio de la ansiedad evaluada en una muestra de 50 estudiantes femeninas de una
universidad fue de 68.2 puntos con una desviacin estndar de 2.5 puntos. Una muestra
semejante de varones, obtuvo una media de 67.5 con una desviacin estndar de 2.8. Verifique
la hiptesis de que los niveles de ansiedad de las mujeres fueron mayor que los de los varones,
con alfa de 0.05.
1. Hiptesis estadsticas

122
2. Ni vel de si gnificacin
00
(

3. Estadstico de prueba
, en donde,

4. Regla de decisin
Rechazar Ho si la Zo es mayor que la Zc = 1.64
5. Resultados
0
0
0
0
0
0

)
0
0
0

)
0

6. Decisin:
En vista de que Zo = 1.32 es menor que la Zc = 1.64, no hay evidencias estadsticas para
rechazar Ho y considerar confirmada la hiptesis alterna. No hay diferencias
estadsticamente significativas entre las medias de la ansiedad de las estudiantes femeninas
y la de los estudiantes masculinos.
Como se pudo observar, ambos grupos satisfacen los requerimientos exigidos para desarrollar
pruebas de hiptesis para muestras grandes, o sea, que la aproximacin normal es favorable: los
tamaos son mayores de 30, la variable de inters es continua porque la medicin de la misma
refleja magnitud, y dicha variable ha sido medida en una escala de intervalos; se asume la
aleatoriedad.

123
Pero qu sucede si la normalidad no se puede asumir, principalmente porque las muestras son
pequeas, o sea n < 30? En tales casos, las propiedades de la normal no se satisfacen y se requiere
tomar en consideracin la teora estadstica de las muestras pequeas, la cual discutiremos, de
manera sencilla, a continuacin.
PRUEBA DE HIPTESIS PARA MUESTRAS PEQUEAS
En muchas ocasiones, los investigadores del comportamiento requieren desarrollar estudios
poblacionales, sin contar con los supuestos bsicos de las grandes poblaciones: tamao de muestra
grande, desviacin estndar conocida, etc. En tales situaciones, los investigadores tienen que
fundamentar sus decisiones a partir de la informacin obtenida en las muestras pequeas, las cuales
presentan limitaciones en lo referente a la aproximacin normal, especialmente el Teorema Central
del Lmite.
A pesar de estas limitaciones, el procedimiento de prueba de hiptesis no difiere con relacin al
utilizado en las muestras grandes, excepto que no se puede asumir que las distribuciones muestrales
son normales y por lo tanto, las propiedades asociadas con la normalidad no se pueden sostener. En
el caso de las grandes muestras, se supone que las distribuciones muestrales son normales, mientras
que en las pequeas muestras este supuesto no puede mantenerse, en vista de que ellas pueden
asumir diversas formas. A pesar de esta limitacin, las muestras pequeas mantienen una gran
relacin con la teora de las muestras grandes, a tal punto, que si la n muestral aumentara, se
aproximara a la normal, siendo esta aproximacin ms evidente, a medida que n aumenta. Es como
si considerramos que las muestras pequeas se transforman y funcionan como muestras grandes.
Grados De Libertad
La introduccin a la prueba de hiptesis para muestras pequeas, nos obliga a analizar el concepto
de grados de libertad, que a partir de este momento se indicar por gl. Este concepto es aplicable
tanto en las muestras pequeas como en las grandes, aunque su importancia fundamental radica en
las muestras pequeas.
Si se tuviera la oportunidad de comparar la varianza de una poblacin con la varianza de una
muestra (2 vs s2) se observara que entre ambas hay una diferencia, la cual se denomina sesgo, el
cual es ms pronunciado a medida que n < N. Para corregir este sesgo muestral, la varianza
muestral se calcula dividiendo las diferencias cuadrticas obtenidas entre los puntajes X y la media
muestral entre n-1, de tal manera que la s2 se considera un estimador insesgado de la varianza
poblacional
(

o sea, que corrige el sesgo y permite la utilizacin de la varianza de la muestra como un estimador
eficiente de la varianza muestral.

124
Al denominador de la varianza muestral, n 1, se le denomina grados de libertad (gl), y significa, el
nmero de observaciones muestrales que pueden variar libremente (asumir cualquier valor) cuando
se estima un parmetro poblacional.
Veamos un ejemplo: suponga que a cinco sujetos se les ha hecho una medicin sobre un atributo
psicolgico X, y que la media obtenida por los cinco sujetos fue de 25 puntos. Cuntos puntos
gan cada uno de los sujetos?
Sujeto

X (puntuaciones arbitrarias)

15

16

29

30

Los cuatro primeros sujetos pudieron obtener cualquier puntaje dentro del rango establecido por
la escala de medicin utilizada. Pero el sujeto nmero 5, slo tena una opcin: su puntaje deba
ser aquel que asegurara que al sumarse los 5 datos y dividirse entre n = 5, la media aritmtica
sera igual a 25, tal y como se observa a continuacin.
Sujeto

15

16

29

30

35

que comprueba lo planteado anteriormente.

125
Otro ejemplo de los gl lo podramos observar en la propiedad de que la d (sumatoria de las
diferencias) alrededor de la media real es igual a cero; para tal efecto, utilizaremos el ejemplo
anterior.
Sujeto

15

15-25=-10

16

16-25=-9

29

29-25=4

30

30-25=5

35

35-25=10

Como se puede observar, siempre que se estime un parmetro a partir de un valor muestral, podrn
variar libremente n 1 de los valores muestrales; el ltimo, corresponde al valor requerido para
calcular el estadstico muestral. Por esta razn, en las muestras pequeas, al estimar el valor de la
varianza o la desviacin estndar, es necesario que se utilicen los grados de libertad, con el fin de
que dichas medidas de variabilidad sean consideradas estimadoras eficientes de sus
correspondientes parmetros poblacionales. Recuerde que la variabilidad es fundamental en la
prueba de hiptesis, especialmente para determinar el error estndar de la estimacin.
A partir de los conceptos presentados anteriormente, daremos inicio al estudio de las principales
pruebas de hiptesis para muestras pequeas: la prueba t de student para una y dos medias, y la
prueba F para tres o ms medias.
La Prueba t de Student
La prueba t est respaldada por la distribucin muestral del mismo nombre, en la cual las
variables se consideran normales, estandarizadas e independientes. Es una distribucin continua y
se aplica tanto en muestras pequeas como en las grandes. Vara entre - hasta +, es simtrica con
una media igual a cero. En realidad es una familia de distribuciones, asociadas cada una de ellas a
su correspondiente grado de libertad; de acuerdo al tamao de la muestra sus s varan. En
comparacin con la normal, t es menos aguda en el centro que la normal y es ms extendida. A
medida que n aumenta, la curva de t se aproxima a la curva normal. Sus valores estandarizados se
denominan t y tiene una Tabla asociada con las probabilidades de cada uno de estos valores.
Para desarrollar pruebas de hiptesis con t, es necesario tener evidencias de que las varianzas
muestrales no son estadsticamente diferentes. A esta condicin se le denomina homogeneidad de
las varianzas, y debe ser comprobada en cada prueba; ms sin embargo, en la mayora de las
ocasiones los investigadores suponen que dicha condicin est presente siempre y cuando las
muestras comparadas estn formadas por la misma cantidad de sujetos (n).
Adems, debe conocerse la media de la(s) muestra(s), aunque la es desconocida. La misma ser
estimada a partir de la S de la muestra tomando en consideracin los grados de libertad (gl).

126
Es importante sealar que la Distribucin t de Student cuenta con una Tabla de valores t
crticos, definida por los grados de libertad y el nivel de significacin, tanto para una como para dos
colas. La comparacin de los valores t observados y crticos, determinar si se rechaza o no la Ho.
Prueba t para el caso de una media poblacional
El estadstico t para el caso de una media poblacional es el siguiente:

, en donde

( )

( )

Hay ocasiones en que se sospecha que una media poblacional conocida ha sufrido cambios: ya sea a
favor o en contra de los valores conocidos sobre la misma. En estos casos, se sigue el procedimiento
de los 5 pasos estudiados en las muestras grandes, tal y como lo presentamos en el siguiente
ejemplo a continuacin.
Una investigadora sospecha que el peso corporal de una poblacin de adolescentes infractoras
internadas en un Centro de Observacin, ha sufrido cambios recientemente. La ltima medicin
desarrollada hace tres aos, sealaba un promedio 61 kilos y no se tena informacin sobre la
desviacin estndar del pesos corporal. La investigadora toma una muestra aleatoria de 8
menores y mide sus pesos corporales, obteniendo los siguientes resultados: 63, 60, 59, 65, 67,
66, 59 y 65. Con estos datos desarrolla una prueba de hiptesis con alfa () = 0.01. A qu
conclusin lleg la investigadora?
Para desarrollar la prueba de hiptesis, es recomendable que resuma los datos que va a requerir y
con los mismos desarrolle la prueba.
DATOS
(
(
0

)
)

1. Hiptesis estadsticas

2. Ni vel de si gnificacin
00
0

127
3. Estadstico de prueba
, en donde

( )

( )

4. Regla de decisin
Rechazar Ho si to > 3.50 si to < -3.50
5. Resultados
( 0 )

( )

6. Decisin:
En vista de que to = 1.74 es < que tc = 3.50, no hay evidencias estadsticas para rechazar
la Ho. La poblacional del peso no es diferente que 61, por lo tanto, la sospecha de la
investigadora no se ha demostrado
Como se pudo observar, se trat de una prueba de hiptesis de una media poblacional de dos colas.
El procedimiento es semejante al seguido para muestras grandes.
Prueba t para el caso de dos medias independientes
Este caso se refiere a la situacin en la que el investigador desea determinar si dos medias
muestrales difieren en alguna medida entre ellas, y si esa diferencia es significativa, o sea, que va
ms all de una simple fluctuacin muestral. Est claro que las dos medias provienen de dos
muestras independientes las que presentan los efectos de dos condiciones diferentes; el inters
radica en determinar, de acuerdo a la hiptesis planteada, si ambas medias son estadsticamente
diferentes.
Para estos casos se sugiere que se presenten las siguientes condiciones previas:

Las muestras son pequeas y se desconoce la varianza poblacional de cada una,

Los sujetos han sido, preferiblemente seleccionados aleatoriamente de la poblacin y


distribuidos de la misma manera en ambas condiciones.
A continuacin se presenta un ejemplo de una prueba de hiptesis para dos medias.
Un Psiclogo Escolar considera que el nivel de ansiedad de los hombres es mayor que el de las
mujeres, antes de desarrollar un examen. Para demostrar esta sospecha, aplica una prueba de
ansiedad antes de un examen de fsica a una muestra de 10 estudiantes varones y 10 estudiantes

128
mujeres, seleccionados ambos grupos de manera aleatoria de sus correspondientes poblaciones.
Los resultados obtenidos en la medicin de la ansiedad fueron los siguientes:
Grupos

Puntuaciones de ansiedad

Hombres

10

10

12

11

Mujeres

Con los resultados anteriores, se desarroll una prueba de hiptesis con un alfa de 0.05. A
qu conclusin lleg el Psiclogo?
Se recomienda que resuma los datos que necesitar para desarrollar su prueba de hiptesis.
Hombres

Mujeres

1. Hiptesis estadsticas

2. Ni vel de si gnificacin
00
0

3. Estadstico de prueba
, en donde

)(

);

4. Regla de decisin
Rechazar Ho si to > 1.73
5. Resultados
(

)(

0 0

( )

129

0 0
6. Decisin:
En vista de que to = 4.12 es > que tc = 1.73, se rechaza Ho y se confirma H1: la media de
la ansiedad de los hombres es > que la media de la ansiedad de las mujeres.
Prueba t para dos muestras correlacionadas
Se considera que dos muestras estn correlacionadas, si los resultados obtenidos en una de ellas
afectan los resultados obtenidos en la otra. Esto es caracterstico de las situaciones siguientes:

Un mismo grupo es medido dos veces y se intenta determinar las diferencias observadas entre
las medias de ambos. Tal es el caso de las investigaciones de carcter experimental o cuasi
experimental, en las cuales la condicin de antes-despus es caracterstica.

Cuando se organizan dos grupos apareados y se intenta establecer las diferencias existentes
entre ambos. Apareados debe ser interpretado como la situacin en que se intenta que parejas de
sujetos que pertenecen a grupos diferentes, mantengan las mismas caractersticas que rivalizan
con la variable independiente (por ejemplo, CI, gnero, edad, aptitudes, etc.). En estos casos, la
aleatoriedad no fue el factor que distribuy a los sujetos de manera semejante en cada muestra,
sino la accin del investigador: el apareamiento.

En estas situaciones, no se cuenta con la condicin previa de independencia estadstica que se


considera se alcanza plenamente con la aleatoriedad, y se utiliza una forma de t de student,
que adems de tomar en consideracin la magnitud de las diferencias entre ambas mediciones,
toma en consideracin la direccin de la misma a travs del signo. Para estos casos, los grados
de libertad son iguales a n-1

A continuacin presentamos un problema en el cual, una muestra de sujetos se mide antes y despus
de aplicada una intervencin o tratamiento. Ambas mediciones se desarrollan en el mismo grupo de
sujetos, lo que hace de las mismas mediciones correlacionadas.
A fin de motivar a los ciudadanos al ahorro en el consumo de luz , una ONG estudia la idea de
emprender una campaa nacional a favor del ahorro de la misma. Sin embargo, antes de
emprender dicha campaa, la organizacin decide realizar un experimento que le permita
evaluar la eficiencia de la campaa. Para el experimento, realiza la campaa de ahorro de luz
en un rea geogrfica representativa. Doce (12) familias de esa rea son elegidas al azar y se
determina el costo (en balboas) del consumo durante el mes anterior al lanzamiento de la
campaa de publicidad; al mes siguiente de la campaa de publicidad, nuevamente se
determina el costo del consumo. La idea de los investigadores es la de determinar si hubo o no
diferencias entre el consumo de luz, antes y despus de la campaa publicitaria, y de esta forma,
evaluar la capacidad de dicha campaa para modificar los hbitos de consumo. Como se puede
observar, se trata de 12 personas medidas dos veces, antes y despus, caso tpico de muestras
correlacionadas. A continuacin se presenta un ejemplo de la prueba de hiptesis
correspondiente

130

Despus
(costo)
58

Diferencia
D

Diferencia
D2

Antes
(costo)
65

49

53

48

25

61

63

-2

72

68

16

45

46

-1

58

52

36

68

65

55

50

25

58

59

-1

64

60

16

66

68

-2

42

35

49

Familia

Totales

235

1. Hiptesis estadsticas
0
0
2. Ni vel de si gnificacin
00
0
3. Estadstico de prueba
en donde

4. Regla de decisin
Rechazar H0, si to > 2.201 rechazar H0, si to < 2.201
5. Resultados
(

( )

131

00

00

6. Decisin:
En vista de que to = 2.90 > tc = 2.201, se rechaza H0 y se confirma la H1. La campaa
publicitaria si afect a la comunidad experimental, en vista de que se disminuy el consumo
de luz en al grupo experimental.
Como se pudo observar en el ejemplo anterior, el procedimiento de prueba de hiptesis se mantiene
igual que en los casos anteriores, hacindose las modificaciones requeridas por el tipo de problema
y el modelo estadstico a utilizar, siendo en ste caso la t de student para datos correlacionados.
Este ejemplo se aplic en un caso de antes-despus; de igual manera se hubiese procedido si se
tratara de grupos apareados. Cmo se pudo observar, para ste caso, los grados de libertad son
iguales a n 1.
Prueba t para correlaciones
Las correlaciones son uno de los procedimientos ms utilizados en el anlisis de resultados
obtenidos en investigaciones del comportamiento. Siendo el comportamiento humano un factor
afectado por un nmero plural de variables, es evidente que las mismas interactan mutuamente y
se afectan unas a otras, asocindose de diversas maneras. La correlacin es una tcnica estadstica
que permite estudiar el nivel de asociacin de dos o ms variables. Para efectos de este curso de
prueba de hiptesis, vamos a estudiar si el coeficiente de correlacin obtenido entre dos variables es
estadsticamente diferente que cero y por lo tanto, si la asociacin de estas variables es vlida.
Para representar al coeficiente correlacin se utilizar en smbolo rxy, y la prueba de hiptesis se
desarrollar siguiendo el mismo procedimiento que en los casos anteriores: los cinco pasos. La H 0
que dice que entre las dos variables no existe correlacin, contra las hiptesis alternas de que: 1) la
H1: r > 0 si se espera una correlacin positiva, 2) H1: r < 1 si la correlacin esperada es menor que 1,
3), r 0 si el investigador sospecha de que hay correlacin pero no puede sealar de antemano una
direccin en especial. Para este caso, los grados de libertad son iguales a n 2. A continuacin
presentamos un ejemplo.
A una muestra de 20 estudiantes universitarios se les aplic una prueba de razonamiento verbal,
con el fin de determinar si esta variable se asocia positivamente con los puntajes
correspondientes al ndice acadmico de los dos primeros semestres de una carrera
universitaria. El coeficiente de correlacin obtenido fue de 0.38. Es esta correlacin
estadsticamente significativa, o sea, es verdaderamente positiva? Sea alfa igual a 0.05.
1. Hiptesis estadsticas
0
0

132
2. Ni vel de si gnificacin
00
0

3. Estadstico de prueba

4. Regla de decisin
Rechazar Ho si to > tc = 2.101
5. Resultados
0

(0
0

0
0

6. Decisin:
En vista de que to = 1.810 es < que tc = 2.101, no hay evidencias para rechazar la H0; la
correlacin entre estas variables no es diferente que cero.

Como se ha podido observar, en el caso de una correlacin es posible determinar si la relacin entre
las variables es estadsticamente significativa o es simplemente una fluctuacin de la muestra, como
lo fue el caso anterior. De esta misma manera, pero con su estadstico correspondiente, se puede
determinar la significancia de otros valores correlacionales (comparacin de dos correlaciones) y de
parmetros de regresin (a0 y a1), los cuales no sern tratados en este libro.
CONCEPTOS IMPORTANTES

Muestras grandes
Muestras pequeas
Sesgo muestral
t de Student
Homogeneidad de varianzas

133
EJERCICIOS PRCTICOS

Muestras grandes: pruebas de hiptesis para medias


1. Una muestra de 42 sujetos infractores, seleccionada de una poblacin de sujetos privados de
libertad, obtuvo una media de 42 con una desviacin tpica de 9, en una prueba de razonamiento
abstracto. En los ltimos 5 aos, los resultados obtenidos indicaban una media de 48. De
acuerdo a estos resultados se puede concluir que el promedio de la poblacin de infractores ha
disminuido en comparacin de los ltimos cinco aos? Sea alfa 0.05.
2. Los aspirantes a ingresar al servicio de Guardia Costera de los ltimos 10 aos obtuvieron un
promedio de ansiedad de 26 puntos con una desviacin tpica de 4 puntos. Se seleccion una
muestra de 45 sujetos que aspiraron en el presente ao, los cuales obtuvieron una media de 29
puntos. De acuerdo a estos resultados se puede considerar que los niveles de ansiedad de los
aspirantes han aumentado en comparacin con los aos anteriores? Utilice alfa de 0.05 y 0.01.
3. Un estudio desarrollado en 75 personas que residen en una comunidad sub urbana indic que el
promedio de ingreso familiar fue de B/235.00 mensuales, con una desviacin tpica de 25.00.
Verifique la hiptesis de que el promedio salarial en sta comunidad es menor a B/250.00. Sea
alfa = 0.05.
4. Se analiz el rendimiento acadmico de dos muestras independientes de estudiantes
universitarias de sexo femenino, pertenecientes a la misma carrera en una Facultad, pero
matriculadas en turnos diferentes. En el grupo matutino, el promedio del rendimiento
acadmico fue de 3.66 con una desviacin estndar tpica de 0.15. Por otro lado, el grupo
vespertino obtuvo una media de 3.53 con una desviacin tpica de 0.19. De acuerdo a estos
resultados, existen diferencias en el rendimiento acadmico de ambos grupos? Sea alfa = 0.05
y 0.01.
5. Un grupo de estudiantes de primer ingreso a la Facultad de Ciencias Sociales se dividi
aleatoriamente en dos, uno denominado experimental y otro control. El grupo de experimental
constituido por 40 personas, recibi en el verano un programa de matemticas generales,
mientras que el grupo de control, compuesto por 43 personas, recibi un placebo. Al finalizar el
primer semestre, se determin el promedio de la puntuacin final obtenida por cada grupo en el
curso de de Estadsticas Aplicadas. El grupo experimental obtuvo una media de 67 con una
desviacin estndar de 9. Por otro lado, el grupo de control obtuvo un promedio de 62 con una
desviacin tpica 12. Con alfa de 0.05 determine si hay diferencias entre los dos grupos con
relacin al conocimiento alcanzado en la asignatura. Sea alfa = 0.05 y 0.01.

134
6. Se desarrolla una investigacin para determinar si las horas dedicadas diariamente al estudio
afectan el rendimiento acadmico de los estudiantes. Se distribuyeron aleatoriamente en dos
grupos a 30 estudiantes, del mismo nivel acadmico y que tenan al mismo profesor: 15 en el
Grupo A y 15 en el Grupo B. El Grupo A dedic 5 horas diarias al estudio, mientras que el
grupo B dedic 3.5 horas diarias a la misma actividad. Al terminar el ao acadmico se evalu
el rendimiento promedio de cada grupo, los cuales se presentan a continuacin:
Grupo
A
B

Promedio
3.97
3.77

Desviacin
0.56
0.87

Con alfa de 0.05, determin si el promedio del grupo A fue mayor que el grupo B.

Muestras
pequeas:
correlaciones
7.

pruebas

de

hiptesis

para

medias

Los problemas 1, 2, 3, desarrllelos utilizando la distribucin t de Student

8. Un Psiclogo Industrial est interesado en evaluar la efectividad de un programa de incentivos


en la produccin de vestidos en una fbrica. Para tal efecto, seleccion a 26 operarios para que
trabajaran siguiendo el plan tradicional (T) de incentivos, y por otro lado, seleccion a otros 26
operarios a quienes pusieron a trabajar con el nuevo plan de incentivos (N). El programa dur
10 das y a continuacin se presentan el nmero de trajes confeccionado por cada operario, en
cada uno de los planes:
Plan T
Plan N

75
80

72
83

73
84

76
78

78
79

72
81

80
84

74
85

76
78

75
56

Los salarios por hora para ambos grupos eran iguales; la diferencia la haca el plan de
incentivos. Se puede concluir que el nuevo plan de incentivos es ms eficiente y
productivo que el tradicional? Sea alfa = 0.05
9. Una investigacin se dise para establecer si cierto tipo de comportamiento estaba o no
influenciado por una droga. La variable criterio fue el nmero de intentos que se requeran para
alcanzar el comportamiento evaluado. Se organizaron dos grupos: el experimental (Ex) que
recibi la droga, y el control (CL) que recibi un placebo. Los resultados se presentan a
continuacin:
EX
CL

6
4

8
5

14
3

Nmero de intentos
9
10
7
4

4
2

7
1

Con alfa de 0.01, determine si hay diferencias entre los promedios de intentos entre los
dos grupos.

135
10. Un Psiclogo Clnico desarrolla un estudio del autoconcepto familiar en dos grupos de sujetos
adultos con problemas de adiccin: un grupo masculino (A) y otro femenino (B) Los resultados
obtenidos con la Escala de Autoconcepto Tennessee fueron los siguientes:
A
B

72
36

83
52

57
41

71
44

72
39

68
51

70
47

68
41

77
55

67
46

Con alfa de 0.05, determine si hay diferencias en las medias del autoconcepto familiar
entre ambos grupos.
11. En un estudio dirigido para determinar la efectividad de una nueva dieta, una compaa de
seguros seleccion una muestra de 10 sujetos con sobrepeso entre las edades de 40 y 50 aos.
Se les midi el peso al iniciar el tratamiento (A) y se volvi a medir 60 das despus (D). Los
resultados fueron los siguientes:
A
D

202
180

237
221

173
175

161
158

185
180

210
197

209
205

191
196

200
185

189
187

Con alfa de 0.05, determine si la nueva dieta produjo los resultados esperados.
12. Una muestra de 10 nios fueron diagnosticados inicialmente con el trastorno de Dficit de
Atencin tipo Hiperactivo-Impulsivo. Se kles aplic un tratamiento co0n el fin de disminuir los
sntomas de ste trastorno. A continuacin se presentan los puntajes obtenidos en la Escala de
Conners antes y despus del tratamiento.
Antes
Despus

80
70

75
71

78
70

82
71

71
71

79
73

73
74

86
78

79
74

84
79

Con alfa de 0.05, determine si el tratamiento logr disminuir los puntajes obtenidos en la
prueba.
13. Dos investigadores del comportamiento desarrollaron un estudio para determinar si existe una
correlacin significativa entre ansiedad y razonamiento lgico. Seleccionaron una muestra de
28 sujetos, obtuvieron mediciones de estas variables y correlacionaron las mismas,
obtenindose u coeficiente de correlacin r=0.30. Determine la significancia de esta
correlacin, con alfa de 0.05.
14. Una muestra de 45 estudiantes fue evaluada en los factores depresin y rendimiento en
matemticas. Los resultados obtenidos obtuvieron un coeficiente de correlacin r= 0.29. Es sta
correlacin significativa, a un nivel alfa de 0.05?

136

CAPTULO 13
ANLISIS DE LA VARIANZA
Las pruebas de hiptesis analizadas en los captulos anteriores, hacan nfasis en la comparacin de
la media aritmtica de una muestra con una media poblacional, o se comparaban dos medias
aritmticas provenientes de dos muestras. Estas situaciones se analizaron tanto para el caso de
muestras grandes (n>30 sujetos), en los cuales se utilizaba el estadstico z y la curva normal como
modelo de probabilidades, al igual que para las muestras pequeas (n 30) casos en los que se
utilizaba la prueba t de student, respaldada por el modelo de probabilidades denominado t de
student. En ambos casos, el nmero mximo de medias aritmticas que se podan comparar era de
dos; pero si hay tres o ms medias, ninguno de los dos modelos probabilsticos anteriormente
discutidos, sera el adecuado para la comparacin de dicho nmero de medias. En estos casos, el
procedimiento adecuado se denomina ANOVA o Anlisis de la Varianza, que utiliza como modelo
de probabilidades una distribucin denominada F de Fisher y la Prueba F como procedimiento de
anlisis estadstico.
LA DISTRIBUCIN F
El ANOVA es un procedimiento de anlisis estadstico que se aplica cuando estamos interesados en
determinar si tres o ms medias son estadsticamente diferentes. Aunque este procedimiento permite
determinar la diferencia entre las medias, se vale de la varianza de los datos para determinar si hay
o no diferencias. El procedimiento permite obtener una Fo que proviene del cociente de la
estimacin de dos varianzas que provienen de la misma poblacin:
1.
2.

: que es la estimacin de la varianza que proviene de los efectos observados en las muestras
que se estn analizando, los cuales son independientes entre s,
: que es la estimacin de los errores aleatorios dentro de cada una de las muestras analizadas.

Esta relacin se puede presentar a travs de la siguiente ecuacin:

El resultado obtenido a travs de este cociente, Fo, se compara con la F crtica (Fc) obtenida de la
tabla correspondiente, de acuerdo al nivel alfa establecido y los grados de libertad correspondientes
al problema. Esto significa que, al igual que como sucede con la normal y la t, existe una
distribucin muestral resumida en una tabla, en la cual se asocian los valores tericos de F con sus
correspondientes probabilidades, dando como resultado los valores Fc que son los que separan la
zona de rechazo de Ho con la zona de no rechazo de dicha hiptesis.
Por ser la Prueba F un procedimiento aplicado en muestras pequeas, los valores de Fc variarn de
acuerdo con los grados de libertad, que para efectos de esta distribucin, se deben tomar en cuenta
dos valores: los gl para el numerador (efectos de cada muestra) que son iguales a n 1-1 y los gl para
el denominador (efectos aleatorios dentro de cada muestra) que son iguales a n-1.

137
La prueba F tiene algunas propiedades particulares que pasaremos a sealar a continuacin:

no tiene valores negativos, por ser el cociente de dos 2,

es una distribucin sesgada positivamente

el valor mediano de F es aproximadamente igual a 1

Para la prueba F existe una familia de curvas, tal y como sucede con la t, aunque en este caso, hay
un valor de F para cada combinacin de S2 en el numerador y en el denominador, lo cual est
debidamente contemplado en las tablas de valores crticos de F. Para determinar si se rechaza o no
la Ho, se compara el valor Fo que proviene de los datos experimentales, con la Fc de la tabla; si Fo
> Fc, se rechaza Ho y se considera confirmada la H1, lo cual significa que por lo menos una de las
medias es estadsticamente diferente al resto.
Es importante destacar que la H1 no se presenta direccionadamente, o sea, que no se plantea hacia
la derecha o hacia la izquierda, tal y como sucede con t. Esto se debe a que Fo por provenir de
comparaciones de S2, siempre tendr valores positivos y los valores crticos de la tabla siempre
sern positivos. Por lo tanto, la H1 sera del tipo: 1 2 . k. Si se diera el caso de que se
rechaza la Ho y se confirma la H1, los resultados indican nicamente que por lo menos una media
aritmtica es diferente; para determinar cul o cules son las diferentes, hay que desarrollar otras
pruebas adicionales que arrojaran luces sobre las diferencias existentes en el modelo.
Los valores crticos de F (Fc), asociados con la distribucin de probabilidad F, se presentan
resumidos en Tablas para valores de 0.05 y 0.01, los cuales estn relacionados con los grados de
libertad. Para efectos de la distribucin F, los grados de libertad dentro se refieren a los efectos
dentro de los grupos o de error (gldentro); por otro lado, los grados de libertad entre, estn
asociados con los efectos entre los tratamientos. En algunos casos, la Tabla se presenta para 0.05 y
0.01 de manera independiente, pero en otros casos, en una misma Tabla, se presentan los dos alfas
para cada grado de libertad. En estos casos, 0.05 se coloca arriba y 0.01 se coloca abajo, y en
muchas ocasiones el valor est en negrita.
A continuacin presentaremos un ejemplo de este ltimo tipo de organizacin de la Tabla F, aunque
el estudiante debe estar preparado para interpretar los valores de Fcrtica cuando estos provienen de
tablas separadas.

138
Ejemplo de la Tabla de valores crticos de la Distribucin F
gl
dentro(denominador)

gl entre (numerador)
1

..

161

200

216

225

230

254

4052

4999

5403

5625

5764

6366

18.51

19.00

19.16

19.25

19.30

19.50

98.49

99.00

99.17

88.25

99.30

99.50

10.13

9.55

9.28

9.12

9.01

8.53

34.12

30.82

29.46

28.71

28.24

26.12

7.71

6.94

6.59

6.39

6.26

5.63

21.20

18.00

16.69

15.98

15.52

13.46

6.61

5.79

5.41

5.19

5.05

4.36

16.26

13.27

12.06

11.39

10.97

9.02

3.84

2.99

2.60

2.37

2.21

1.00

6.64

4.60

3.78

3.32

3.02

1.00

Para utilizar la Tabla de F, se combinan los grados de libertad entre, con los grados de libertad
dentro. Por ejemplo, si un experimento presenta glentre=3 y gldentro= 5, con alfa de 0.05, la F(c) =
5.41. Debe recordar que los valores crticos se presentan en pares: el primero corresponde a 0.05 y
el segundo a 0.01 (negrita).
Otro aspecto a destacar es que la Prueba F se utiliza para evaluar los efectos de una variable
independiente a varios niveles, al igual que en los casos en que hay ms de una variable
independiente tambin a varios niveles. Para ambos casos, los efectos de la(s) variable(s)
independiente(s) se asocian con una sola variable dependiente; si hay ms de una variable
dependiente, tendramos que analizar dichos efectos a travs de modelos multivariados, los cuales
escapan a los objetivos de este libro.
Principios del ANOVA
Tal y como se mencion anteriormente, el ANOVA es una tcnica estadstica que permite evaluar
experimentos en los que intervienen tres o ms grupos. El objetivo final es el de establecer si las
medias aritmticas de dichos grupos difieren o las mismas son estadsticamente iguales. Si nos
refiriramos a tratamientos psicolgicos, estaramos interesados en determinar a travs de las
medias aritmticas, si los tratamientos ejercen efectos diferentes sobre las muestras o si todos ellos

139
producen efectos semejantes. Existen diversos tipos de ANOVA que se aplican para situaciones
experimentales en las cuales hay tres o ms muestras. En primera instancia, presentaremos y
discutiremos el modelo denominado ANOVA SIMPLE O EN UN SOLO SENTIDO,
Anova Simple o en un solo sentido
Esta tcnica de anlisis estadstico se caracteriza porque se refiere a una sola fuente de variacin, o
sea, una variable independiente a distintos niveles, tal y como se puede observar en el siguiente
ejemplo.
Tres psiclogos de la Escuela de Psicologa han desarrollado, de manera independiente, tres
tratamientos dirigidos a disminuir la ansiedad en los estudiantes que desarrollan las pruebas de
admisin a dicha escuela. Como se puede observar, se trata de una sola variable independiente, la
cual se aplica en tres niveles, considerndose como nivel, cada tratamiento desarrollado por cada
uno de los profesores. Se supone que los tres tratamientos van dirigidos a modificar una sola
variable dependiente: la ansiedad. El experimento trata de verificar el efecto de los tratamientos
sobre la ansiedad y si se observan diferencias entre dichos tratamientos con relacin al efecto
producido en la ansiedad. Como son tres grupos, se ha decidido aplicar una ANOVA para
determinar la efectividad de los tratamientos.
Para que ANOVA pueda aplicarse de manera vlida, es necesario que se cumplan algunos
requisitos de carcter metodolgico y estadstico:

Las muestras deben estar constituidas preferiblemente por igual nmero de sujetos,

Los sujetos deben ser elegidos aleatoriamente para cada muestra y los tratamientos deben ser
asignados de la misma forma para cada una de ellas,

Se supone o demuestra estadsticamente, que las varianzas de los grupos son iguales; a esto, se
le denomina homogeneidad de las varianzas

Los grupos se suponen independientes entre s, o sea, que cada grupo recibe un nivel de la
variable independiente diferente al recibido por cualquiera de los otros grupos.

El objetivo del ANOVA es el de establecer cunto de la variabilidad observada en los grupos se


debe a los efectos entre los tratamientos y cuanto se debe a efectos aleatorios dentro de los
tratamientos. El supuesto bsico es que las medias deben ser afectadas por la calidad de los
tratamientos y no las varianzas dentro de cada grupo. La siguiente figura describe el procedimiento
del ANOVA simple:

140

ESTRUCTURA DEL ANOVA

S2entre

SCentre

Fobt= S2entre

SC total

S2dentro
SCdentro

S2dentro

SCtotal: Variabilidad total de los datos


Scentre: Variabilidad entre lo grupos
Scdentro: Variabilidad dentro de los grupos
S2entre: Varianza entre los grupos: S2B
S2dentro: Varianza dentro de los grupos: S2w
Fobt: Razn F

La SC total se puede interpretar como la totalidad de la variabilidad observada en las puntuaciones


individuales, sin tomar en consideracin cunto de esta variabilidad proviene de los efectos de
tratamiento y cunto proviene de la aleatoriedad dentro de las muestras: es una variabilidad confusa
en la cual no se discrimina entre las fuentes de variabilidad. El ANOVA divide esta variabilidad en
dos componentes: el que corresponde a los efectos de los tratamientos entre cada uno de los grupos
(SCentre), y el que corresponde a la variabilidad proveniente del azar dentro de cada grupo (SCdentro).
Posteriormente se determina la cantidad de varianza que proviene de cada fuente: S 2entre que es el
numerador, y la S2dentro que es el denominador. Se dividen ambas varianzas y se obtiene la

La comparacin de la Fo con la Fc determina si se rechaza o no se rechaza la Ho siguiendo el


modelo que a continuacin presentamos:
Si Fo > Fc, se rechaza la Ho,
Si Fo Fc, no se rechaza la Ho
Para determinar la variabilidad proveniente de cada una de las fuentes, SCentre, SCdentro y SCtotal, se
utilizan las siguientes frmulas:

( )

( )
( )

141
Una vez desarrollada la particin de la varianza, que no es otra cosa que determinar cunto de la
varianza total proviene de las dos fuentes principales: tratamientos y error, se organizan estos datos
en un cuadro resumen que permite la integracin de todos los elementos requeridos para rechazar o
no la hiptesis nula, o sea: verificar o no la hiptesis alterna. El cuadro resumen est constituido por
los siguientes elementos:

Fuente

CUADRO RESUMEN DEL ANOVA


SC
Gl

Entre grupos

Dentro de grupos

Fo

( )

Total

La Fo se compara con la F de la Tabla de Fisher, la cual se denomina Fcrtica (Fc): si la Fo es > que la
Fc, se rechaza la Ho que dice que todas las medias son iguales: Ho: 1=2=.=k, y se considera
confirmada la H1 que dice que por lo menos una de las medias es diferente; 12.k. En este
caso, los resultados indican que hay medias que son diferentes, pero no da informacin sobre cul o
cules medias lo son. Para determinar esta(s) diferencia(s), se requiere la aplicacin de pruebas
especializadas que permitirn obtener dicha informacin. Para efectos de este texto, presentaremos
la Prueba de Tukey como un ejemplo de pruebas especiales para determinar cules medias son las
diferentes. Si la Fo no fuese significativa, o sea, que la misma es igual o menor que la F c, se ha
determinado que las medias son iguales estadsticamente y el ANOVA finalizara con este
indicador.
A continuacin presentamos los resultados del experimento de la ansiedad, al que nos referimos con
anterioridad, y el desarrollo estadstico del Anova Simple correspondiente:

142
Tres psiclogos clnicos han desarrollado, de manera independiente, tres tratamientos para
reducir la ansiedad en estudiantes que aspiran a ingresar a la Escuela de Psicologa. Los
tratamientos se aplican a tres muestras aleatorias de aspirantes, y posteriormente se les evala
su nivel de ansiedad, con el fin de evaluar si los tratamientos ejercen distintos efectos sobre los
grupos. A continuacin se presentan los resultados obtenidos.
RESULTADOS DE LOS TRATAMIENTOS APLICADOS
T1
T2
T3
12
15
9
14
14
6
15
17
7
14
18
8
13
15
7
12
19
8
13
20
6
10
17
7
12
16
8
9
9
9
n
115
151
66
( )
13225
22801
4356
1487
2565
492
12.78
16.78
7.33
1.48
1.99
1.00

Pasos sugeridos para el desarrollo de anova simple


A partir de las puntuaciones originales obtenidas por cada sujeto en cada tratamiento, determine los
estadsticos bsicos para el clculo de ANOVA, tal y como se muestra en la Tabla anterior. Estos
estadsticos permitirn la particin de la varianza y el desarrollo del cuadro resumen, anteriormente
explicados.
A continuacin se desarrolla la prueba de hiptesis.
1. Hiptesis estadsticas

2. Ni vel de si gnificacin
00
0

143
3. Estadstico de prueba

4. Regla de decisin
Rechazar H0, si Fo > Fc = 3.40
5. Resultados
[

]
(

( 0

Fuente
Entre grupos

CUADRO RESUMEN DEL ANOVA


SC
Gl
S2
0
404.51
0

Dentro de grupos

57.12

Total

461.63

Fo
0

6. Decisin:
En vista de que Fo = 84.98 > Fc = 3.40, se rechaza la H0 y se confirma la H1: por lo menos
una de las medias es estadsticamente significativa.

De esta manera se ha concluido con esta etapa del ANOVA, y en vista de que los resultados son
significativos, es necesario determinar estadsticamente cul o cules medias han resultado
diferentes. Este objetivo se alcanza desarrollando pruebas de significacin que permiten comparar
las medias entre s, tales como: la Prueba de Tukey, la Prueba de Newman-Keuls, la Prueba t si la
comparacin es planeada previamente, la prueba de Scheffe, etc. En este caso, desarrollaremos la
prueba de Tukey para dos medias, por ser la misma de fcil desarrollo y comprensin.
Es importante que el estudiante recuerde que si la Fo no es significativa, no hay que desarrollar
ninguna prueba de comparacin de medias, en vista de que la hiptesis nula no se ha rechazado, lo
cual indica que las medias aritmticas analizadas no son estadsticamente diferentes.
La Prueba de comparacin de dos medias de Tukey.
La prueba de Tukey ha sido diseada para comparar todos los pares de medias aritmticas
provenientes de un experimento; adems, requiere que los tamaos muestrales sean iguales para

144
todas las muestras que participan del experimento. El estadstico de prueba es Qobtenida (Qo), cuya
frmula es la siguiente

La prueba Q se utiliza para comparar las medias tomadas de dos en dos y su valor ser siempre
positivo en vista de que en el numerador, la primera media ser siempre la mayor y la segunda ser
la media menor. Adems, para estimar el error estndar en el denominador, se utiliza la varianza
dentro de los grupos (S2d) que ya fue determinada en el cuadro resumen.
La Qo se compara con la Qcrtica (obtenida de la Tabla Q de Rangos estudiantizados) a la cual se
ingresa con el nmero de medias del experimento (columnas) y los gl dentro para las filas. En el
punto en que se cruzan ambos valores, se obtiene la Qcrtica (Qc) o Q de la tabla, el cual ser el
criterio de comparacin de la Qo. Si la Qo es > que la Qc, se rechaza la H0 que dice que ambas
medias son iguales y se verifica la H1 que dice que dichas medias son diferentes, especficamente, la
primera es mayor que la segunda. A continuacin se presenta la aplicacin de la prueba Q,
utilizando el ejemplo con el que se desarroll el ANOVA.
7. Prueba Q
Las tres medias ordenadas de mayor a menor:
00
(

1.

Comparacin
00

Decisin: en vista de que Qo = 7.84 > Qc = 3.53, se rechaza Ho y se confirma H1. La media
del tratamiento 2 es mayor que la del tratamiento 1. El tratamiento 1 present un promedio
de ansiedad menor que el tratamiento 2. Dicho tratamiento es ms efectivo en la reduccin
de la ansiedad.
2. Comparacin

Decisin: en vista de que Qo = 18.53 > Qc = 3.53, se rechaza Ho y se confirma H1. La


media del tratamiento 2 es mayor que la media del tratamiento 3. El tratamiento 3 present

145
un promedio de ansiedad menor que el del tratamiento 2. Este tratamiento es ms efectivo
en la reduccin de la ansiedad.
3. Comparacin

Decisin: en vista de que Qo = 10.69 > Qc = 3.53, se rechaza Ho y se confirma H1. La


media del tratamiento 1 es mayor que la media del tratamiento 3. El tratamiento 3 present
un promedio de ansiedad menor que el del tratamiento 1. Este tratamiento es ms efectivo
en la reduccin de la ansiedad.
El nivel de efectividad de los tratamientos para reducir la ansiedad fue el siguiente: 3, 1 y 2.
A continuacin presentaremos los fundamentos del Anova Factorial, que es una aplicacin de
dicha tcnica pero para el caso en que hay ms de una variable independiente afectando a una
variable dependiente. Se har nfasis en el caso de dos variables independientes a distintos niveles
cada una, pero queda claro que el modelo se puede generalizar a ms de dos variables
independientes.
Anova Factorial (dos o ms variables independientes)
En muchas ocasiones, la investigacin del comportamiento se enfrenta a situaciones en las cuales,
una variable dependiente se encuentra afectada o intervenida por dos o ms variables
independientes. A estos casos se les denomina Diseo factorial, y el procedimiento de anlisis es a
travs del desarrollo de un ANOVA especializado para el caso. No hay muchas diferencias con
relacin al modelo simple, salvo que la fuente de variacin entre (tratamiento) se divide y toma en
consideracin cada una de las variables independientes participantes del modelo.
Para aplicar el ANOVA Factorial, es necesario satisfacer los siguientes supuestos:

La poblacin original de la cual se extraen las muestras tiene una distribucin normal

Hay homogeneidad de varianzas en cada una de las condiciones experimentales analizadas


(celdillas)

Los tamaos muestrales deben ser iguales, de tal manera que se minimicen las violaciones a
algunos supuestos.

Veamos un ejemplo basado en la variable dependiente ansiedad.


Un psiclogo investigador est interesado en evaluar los efectos que tienen dos tratamientos
experimentales en la reduccin de la ansiedad en aspirantes a ingresar a la Escuela de
Psicologa. Adems considera que la ansiedad tambin estar afectada al momento del
experimento por la situacin laboral de los sujetos, la cual ha dividido en dos categoras:
trabaja y no trabaja.

146
Como se puede observar, la variable dependiente (ansiedad) estar afectada por dos variables
independientes: en primer lugar est la variable tratamiento a la que denominaremos (A), que
se presenta a dos niveles: el tratamiento 1 (A1) y el tratamiento 2 (A2); en segundo lugar, est la
variable situacin laboral a la que denominaremos B y que se presenta tambin a dos niveles
trabaja (B1), no trabaja (B2).
El modelo se puede describir de la siguiente manera:
DISEO FACTORIAL 2 X 2
Tratamientos(A)

Situacin
Laboral(B)

A1

A2

B1

A 1B 1

A 2B 2

B2

A 1B 2

A 2B 1

La variable A est colocada de manera vertical y sub dividida en dos categoras, las cuales
corresponden a los dos tratamientos. La variable B, est colocada horizontalmente y corresponde
a la situacin laboral en los niveles trabaja y no trabaja. El modelo se denomina de acuerdo al
nmero de variables participantes. En este caso, son 2 variables a 2 niveles, que generan un 2x2.
Si hubiese una variable a 3 niveles y otra a dos, el modelo se denominara 2x3 3x2, y as
sucesivamente. La colocacin de las variables (columnas o filas) es una decisin que no afecta el
resultado del ANOVA.
En las celdillas A1B1..hasta A2B2, se deben presentar, los puntajes de ansiedad de cada sujeto,
dependiendo del tratamiento recibido ms su condicin laboral. Es evidente que para cada
celdilla habr una muestra de sujetos, preferiblemente asignados aleatoriamente y con igual
nmero de sujetos
El modelo de Anova Factorial determina que la variable dependiente, en este caso la ansiedad,
est afectada por cuatro fuentes principales de variabilidad:
1.

Las diferencias en la ansiedad por recibir el tratamiento A1 en comparacin con haber recibido
el tratamiento A2; En este caso, los efectos observados en A son independientes de los efectos
de la variable B.
2. Las diferencias en la ansiedad por pertenecer a una de las dos condiciones laborales: trabaja
(B1) o no trabaja (B2), son independientes de los efectos de la variable A.
3. Las diferencias en la ansiedad por haber recibido la combinacin de las dos variables A y B, en
sus diferentes niveles, a lo cual se le denomina, interaccin
4. Las diferencias en la ansiedad que provienen de la variabilidad aleatoria dentro de cada grupo,
la cual se considera que no es aditiva con ninguna de las fuentes anteriormente sealadas.

147
Al igual que en el ANOVA Simple, se estima la variacin total proveniente de todas las fuentes,
y luego se hace una particin de la misma para evaluar cunto aporta cada uno de los factores
participantes, tal y como se presenta a continuacin:
Suma de
cuadrados
(SC)

Estimacin de
la varianza
(2)

Grados de
libertad (gl)

Valor Fo

Nmero de
filas 1
Nmero de
columnas - 1

Suma de
Cuadrados
total
(SCT)

Total de
sujetos celdas

A continuacin se presentan las frmulas y los gl requeridos para desarrollar la particin de los
cuadrados correspondientes al Anova Factorial.

1.

1.1.

2.

2.1.

3.

1.1.

4.

1.1.

5.
El desarrollo de la prueba de hiptesis para el problema de la ansiedad en estudiantes
universitarios, se presenta a continuacin:

148
DATOS GENERALES
DISEO FACTORIAL 2 X 2
Tratamientos(A)

Situacin
Laboral(B)

B1

B2

Totales

Totales

A1
12
10
9
11
9

A2
16
15
12
13
14

Media: 10.2
17
15
14
15
16

Media: 15.4
X
X2= 1718
n = 10
Media= 12.8

0
Media: 14
20
21
18
16
15

0
Media: 18
X
0
X2= 2636
n = 10
Media= 16

1. Hiptesis estadsticas

(efectos por fila)

(efectos por columna)

(efectos por interaccin)

2. Ni vel de si gnificacin
00

0
(

X
X2= 1517
n = 10
Media= 12.1

X 167
X2= 2837
n = 10
Media=16.7
Xt
X2t= 4354

149
3. Estadstico de prueba

4. Regla de decisin
Rechazar Ho si Fo > Fc = 4.49 para las tres principales fuentes de variacin: filas, columnas
e interaccin.
5. Resultados
Particin de cuadrados

)
)

0)

0
( 0)
(
[

0
(

)
0

( 0)

( 0)
(

)
0

( 0)

Fuente

CUADRO RESUMEN DEL ANOVA


SC
Gl
2

Fo

Fila (B)

105.8

105.8

35.27*

Columna (A)

51.2

51.2

17.07*

Interaccin (A*B)

1.8

1.8

0.60

Dentro

48

16

3.0

Total

206.8

16

* Fo > Fc: estadsticamente significativa

6. Decisin:
De acuerdo a los resultados obtenidos, se rechaza la Ho para las filas y las columnas, pero
no se rechaza para la interaccin. Estos resultados indican que:

150
a. Las medias de ansiedad son diferentes atendiendo a la condicin laboral. Los que laboran
presentaron un promedio de ansiedad inferior a los que no laboran.
b. Las medias de ansiedad son diferentes atendiendo al tipo de tratamiento recibido. Los que
recibieron el tratamiento A1 presentaron un promedio de ansiedad inferior a los que
recibieron el tratamiento A2.
c. No hay diferencias significativas entre los promedios por la interaccin de ambas variables
observados en cada una de las celdillas
Como se puede observar, la interaccin (AxB) no result significativa, o sea, que los niveles de
ansiedad no son diferentes por la combinacin de las dos variables independientes. En estos
casos, el anlisis de la interaccin finaliza al sealarse la ausencia de significatividad estadstica.
Cuando la interaccin es significativa, debe confeccionarse un Grfico que refleje las diferencias
observadas entre las celdillas, especficamente entre las medias de las mismas; de no ser as, este
grfico no es necesario confeccionarlo. Sin embargo, con el fin de que se observe como se
refleja la no significatividad en este ejemplo, presentaremos el grfico de estos resultados.
INTERACCIN

A
N
S
I
E
D
A
D

20
18
16
14
12
10
8
6
4
2
0

A2, 18
A1, 15

A2, 14
A1, 10

B1

B2

LABORAL

Como se puede observar en la figura anterior, la lnea azul representa las medias aritmticas
correspondientes al efecto combinado del tratamiento A1 con las dos condiciones laborales,
observndose que la ansiedad es ms baja en los sujetos que trabajan en comparacin con los
que no trabajan. Si se observa la lnea rosada, representa los efectos combinados del tratamiento
A2 con las condiciones laborales: tambin en este caso, la condicin de trabajo al combinarse
con dicho tratamiento, produce un nivel de ansiedad ms bajo que con la condicin de no
trabajar. En ambos casos el comportamiento es el mismo, lo que indica que no hay diferencias en
la ansiedad cuando se combinan ambos factores. Por esta razn, la interaccin fue no
significativa.
Pero, qu sucede cuando los resultados indican efectos diferentes por interaccin? A
continuacin utilizaremos el mismo ejemplo de la ansiedad, pero cambiaremos las medias de
manera premeditada, para observar los efectos producidos. Suponga que las medias fueron las
siguientes:

151
A1B1 = 18
A1B2 = 10
A2B1 = 11
A2B1 = 16
En este caso, el grfico sera el siguiente:
INTERACCIN
20

B1, 18

18
A
N
S
I
E
D
A
D

B2, 16

16
14
12

B1, 11

10

B2, 10

B1
B2

8
6
4
2
0
A1

A2

TRATAMIENTOS

Al inspeccionar este grfico se observa, a diferencia del anterior, que las dos rectas se cortan, lo
cual es una evidencia inequvoca de que existe interaccin entre las variables. Cuando A1 se
combina con B1, el promedio de la ansiedad es ms elevado que cuando se combina con B2.
Sucede lo contrario con el tratamiento A2, que al combinarse con B1, el promedio de la ansiedad
es menor que cuando se combina con B2. Si esta combinacin de valores se hubiese sometido al
ANOVA, la Fo hubiese resultado significativa, lo cual obliga a la confeccin del grfico y a su
debida explicacin.
Recapitulamos:

Si la Fo para la interaccin resulta estadsticamente significativa, es necesario desarrollar el


grfico de interaccin y explicar el comportamiento de las variables. Este grfico se caracteriza
porque las lneas rectas que representan las combinaciones de las variables, tienden a cortarse,
o, por lo menos, no tienden a ser paralelas.

Si la Fo para la interaccin resulta no significativa, no se rechaza la Ho, lo que significa que las
medias dentro de las celdas no son estadsticamente significativas; las combinaciones de
variables no producen efectos diferentes. En estos casos, no hay necesidad de desarrollar el
grfico.

152
CONCEPTOS IMPORTANTES

Anova
F obtenida (Fo)
F crtica (Fc)
Anova simple
Suma de cuadrados (SC)
Particin de la varianza
Prueba de Tukey
Anova Factorial
Niveles de tratamiento
Interaccin

153
EJERCICIOS PRCTICOS
Anlisis de la Varianza Simple o de Un Solo factor

1. Un psiclogo escolar de un colegio comercial est interesado en comparar la velocidad que


alcanzan en el teclado de una computadora (palabras por minuto) las estudiantes graduandas de
cuatro colegios( C ) diferentes. Selecciona cuatro colegios, de cada uno de ellos selecciona seis
estudiantes graduandas y les aplica una prueba de velocidad al escribir en una computadora.
Los resultados fueron los siguientes:
C1
51
50
56
60
45
55

C2
56
60
66
55
71
65

C3
51
65
76
55
61
65

C4
71
80
66
70
76
60

Hay diferencias significativas en la velocidad de escritura en la computadora, entre las


estudiantes de los cuatro colegios. Si la hay, determine las diferencias. Sea alfa de 0.05.
2. Se desarrolla una investigacin para establecer la eficacia de tres mtodos de enseanza de un
curso de psicofisiologa. Los mtodos investigados son los siguientes: 1. Lectura personalizada,
2. Discusin de grupos y 3. Tutoras. Se conforman aleatoriamente 3 grupos de 10 estudiantes
cada uno, con los mismos pre-requisitos para recibir el curso. Los resultados con los siguientes:
G1
G2
G3

5
6
4

8
7
6

10
4
2

7
9
5

10
4
5

7
3
6

6
6
8

8
7
4

8
8
6

10
6
4

Con alfa de 0.05, determine si hay diferencias significativas entre los tratamientos. De
ser as, determine las mismas.
3. Un psiclogo escolar est interesado en establecer si la ansiedad en los exmenes est afectada
por. A. el sexo (masculino y femenino) y B. situacin laboral (trabaja tiempo completo, trabaja
parcialmente y no trabaja. Se Seleccionan 24 estudiantes universitarios de una misma carrera y
nivel acadmico, 12 hombres y 12 mujeres, y se distribuyen aleatoriamente en las condiciones
experimentales. Adems, se les aplica una prueba de ansiedad una hora antes del desarrollo de
una prueba de matemticas. Los resultados son los siguientes:

154
A

B1

B2

B3

A1

A2

10
8
10
10
6
8
7
5
4
5
5
4

5
4
6
5
8
6
6
6
8
7
7
6

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
Efectos de fila
Efectos de columna
Efectos de interaccin
En los casos en que se encuentren diferencias estadsticamente significativas,
debe aplicar la Prueba de Tukey.
4. Un psiclogo organizacional desarroll un estudio en una empresa para determinar si la
productividad en las bodegas, se vea afectada por la presencia de dos variables: tipo de trabajo
(A) (individual o grupal), y ansiedad inducida (B) (alta y baja). Para desarrollar el proyecto,
selecciona 16 trabajadores y los organiza en dos grupos de 8; un grupo trabajar
individualmente y otro lo har de manera compartida. Se escoge un da de alto nivel de
actividad y a un grupo se le rene una hora antes de iniciar las labores y se les indica que, por
razones econmicas, sern suspendidos por espacio de dos meses; al otro grupo no se les da
ninguna informacin adicional. A lo largo del da experimental, se evala la productividad de
cada sujeto, la cual se resume a continuacin:

Ansiedad inducida
Trabajo

Individual

Grupal

Alta
9
7
5
8
12
10
11
10

Baja
3
5
5
3
7
5
7
5

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
Efectos de fila

155

Efectos de columna
Efectos de interaccin
En los casos en que se encuentren diferencias estadsticamente significativas,
debe aplicar la Prueba de Tukey.

APNDICE

157

APNDICE 1
Distribucin normal

La primera columna muestra los incrementos de Z en dcimos.


La primera fila muestra los incrementos de Z en centsimos.
La interseccin de ambos muestra el rea correspondiente entre el valor Z
representado y la lnea central. Como la curva normal es simtrica, el valor ser el
mismo tanto para el valor positivo como el valor negativo del puntaje Z.
Para encontrar el rea complementaria del valor Z, reste de 0.5000 el valor del
rea encontrada en la tabla.

Z
0.0
0.1
0.2
0.3
0.4

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0000
0.0398
0.0793
0.1179
0.1554

0.0040
0.0438
0.0832
0.1217
0.1591

0.0080
0.0478
0.0871
0.1255
0.1628

0.0120
0.0517
0.0910
0.1293
0.1664

0.0160
0.0557
0.0948
0.1331
0.1700

0.0199
0.0596
0.0987
0.1368
0.1736

0.0239
0.0636
0.1026
0.1406
0.1772

0.0279
0.0675
0.1064
0.1443
0.1808

0.0319
0.0714
0.1103
0.1480
0.1844

0.0359
0.0753
0.1141
0.1517
0.1879

0.5
0.6
0.7
0.8
0.9

0.1915
0.2257
0.2580
0.2881
0.3159

0.1950
0.2291
0.2611
0.2910
0.3186

0.1985
0.2324
0.2642
0.2939
0.3212

0.2019
0.2357
0.2673
0.2967
0.3238

0.2054
0.2389
0.2704
0.2995
0.3264

0.2088
0.2422
0.2734
0.3023
0.3289

0.2123
0.2454
0.2764
0.3051
0.3315

0.2157
0.2486
0.2794
0.3078
0.3340

0.2190
0.2517
0.2823
0.3106
0.3365

0.2224
0.2549
0.2852
0.3133
0.3389

1.0
1.1
1.2
1.3
1.4

0.3413
0.3643
0.3849
0.4032
0.4192

0.3438
0.3665
0.3869
0.4049
0.4207

0.3461
0.3686
0.3888
0.4066
0.4222

0.3485
0.3708
0.3907
0.4082
0.4236

0.3508
0.3729
0.3925
0.4099
0.4251

0.3531
0.3749
0.3944
0.4115
0.4265

0.3554
0.3770
0.3962
0.4131
0.4279

0.3577
0.3790
0.3980
0.4147
0.4292

0.3599
0.3810
0.3997
0.4162
0.4306

0.3621
0.3830
0.4015
0.4177
0.4319

1.5
1.6
1.7
1.8
1.9

0.4332
0.4452
0.4554
0.4641
0.4713

0.4345
0.4463
0.4564
0.4649
0.4719

0.4357
0.4474
0.4573
0.4656
0.4726

0.4370
0.4484
0.4582
0.4664
0.4732

0.4382
0.4495
0.4591
0.4671
0.4738

0.4394
0.4505
0.4599
0.4678
0.4744

0.4406
0.4515
0.4608
0.4686
0.4750

0.4418
0.4525
0.4616
0.4693
0.4756

0.4429
0.4535
0.4625
0.4699
0.4761

0.4441
0.4545
0.4633
0.4706
0.4767

2.0
2.1
2.2
2.3
2.4

0.4772
0.4821
0.4861
0.4893
0.4918

0.4778
0.4826
0.4864
0.4896
0.4920

0.4783
0.4830
0.4868
0.4898
0.4922

0.4788
0.4834
0.4871
0.4901
0.4925

0.4793
0.4838
0.4875
0.4904
0.4927

0.4798
0.4842
0.4878
0.4906
0.4929

0.4803
0.4846
0.4881
0.4909
0.4931

0.4808
0.4850
0.4884
0.4911
0.4932

0.4812
0.4854
0.4887
0.4913
0.4934

0.4817
0.4857
0.4890
0.4916
0.4936

2.5
2.6
2.7
2.8
2.9
3.0

0.4938
0.4953
0.4965
0.4974
0.4981
0.4987

0.4940
0.4955
0.4966
0.4975
0.4982
0.4987

0.4941
0.4956
0.4967
0.4976
0.4982
0.4987

0.4943
0.4957
0.4968
0.4977
0.4983
0.4988

0.4945
0.4959
0.4969
0.4977
0.4984
0.4988

0.4946
0.4960
0.4970
0.4978
0.4984
0.4989

0.4948
0.4961
0.4971
0.4979
0.4985
0.4989

0.4949
0.4962
0.4972
0.4979
0.4985
0.4989

0.4951
0.4963
0.4973
0.4980
0.4986
0.4990

0.4952
0.4964
0.4974
0.4981
0.4986
0.4990

158

APNDICE 2
Valores crticos de la Distribucin t de Student

-t

Grados de libertad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

0.500
1.00
0.82
0.76
0.74
0.73
0.72
0.71
0.71
0.70
0.70
0.70
0.70
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.250

0.250
2.41
1.60
1.42
1.34
1.30
1.27
1.25
1.24
1.23
1.22
1.21
1.21
1.20
1.20
1.20
1.19
1.19
1.19
1.19
1.18
1.18
1.18
1.18
1.18
1.18
1.18
1.18
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
1.17
0.125

Niveles de significancia a dos colas


0.200 0.100 0.050 0.025 0.020
3.08
6.31 12.71 25.45 31.82
1.89
2.92
4.30
6.21
6.96
1.64
2.35
3.18
4.18
4.54
1.53
2.13
2.78
3.50
3.75
1.48
2.02
2.57
3.16
3.36
1.44
1.94
2.45
2.97
3.14
1.41
1.89
2.36
2.84
3.00
1.40
1.86
2.31
2.75
2.90
1.38
1.83
2.26
2.69
2.82
1.37
1.81
2.23
2.63
2.76
1.36
1.80
2.20
2.59
2.72
1.36
1.78
2.18
2.56
2.68
1.35
1.77
2.16
2.53
2.65
1.35
1.76
2.14
2.51
2.62
1.34
1.75
2.13
2.49
2.60
1.34
1.75
2.12
2.47
2.58
1.33
1.74
2.11
2.46
2.57
1.33
1.73
2.10
2.45
2.55
1.33
1.73
2.09
2.43
2.54
1.33
1.72
2.09
2.42
2.53
1.32
1.72
2.08
2.41
2.52
1.32
1.72
2.07
2.41
2.51
1.32
1.71
2.07
2.40
2.50
1.32
1.71
2.06
2.39
2.49
1.32
1.71
2.06
2.38
2.49
1.31
1.71
2.06
2.38
2.48
1.31
1.70
2.05
2.37
2.47
1.31
1.70
2.05
2.37
2.47
1.31
1.70
2.05
2.36
2.46
1.31
1.70
2.04
2.36
2.46
1.31
1.70
2.04
2.36
2.45
1.31
1.69
2.04
2.35
2.45
1.31
1.69
2.03
2.35
2.44
1.31
1.69
2.03
2.35
2.44
1.31
1.69
2.03
2.34
2.44
1.31
1.69
2.03
2.34
2.43
1.30
1.69
2.03
2.34
2.43
1.30
1.69
2.02
2.33
2.43
1.30
1.68
2.02
2.33
2.43
1.30
1.68
2.02
2.33
2.42
0.100 0.050 0.025 0.013 0.010
Niveles de significancia a una cola

0.010
63.66
9.92
5.84
4.60
4.03
3.71
3.50
3.36
3.25
3.17
3.11
3.05
3.01
2.98
2.95
2.92
2.90
2.88
2.86
2.85
2.83
2.82
2.81
2.80
2.79
2.78
2.77
2.76
2.76
2.75
2.74
2.74
2.73
2.73
2.72
2.72
2.72
2.71
2.71
2.70
0.005

0.005
127.32
14.09
7.45
5.60
4.77
4.32
4.03
3.83
3.69
3.58
3.50
3.43
3.37
3.33
3.29
3.25
3.22
3.20
3.17
3.15
3.14
3.12
3.10
3.09
3.08
3.07
3.06
3.05
3.04
3.03
3.02
3.01
3.01
3.00
3.00
2.99
2.99
2.98
2.98
2.97
0.003

-t

159

APNDICE 3
Valores crticos de la de Distribucin F de Fisher

=0.05 (normal) y 0 01 (negritas)

glentre

gld
1

10

11

12

14

16

20

24

30

40

50

75

100

200

500

161
4052

199
4999

216
5404

225
5624

230
5764

234
5859

237
5928

239
5981

241
6022

242
6056

243
6083

244
6107

245
6143

246
6170

248
6209

249
6234

250
6260

251
6286

252
6302

253
6324

253
6334

254
6350

254
6360

254
6366

18.51
98.50

19.00
99.00

19.16
99.16

19.25 19.30
99.25 99.30

19.33
99.33

19.35
99.36

19.37 19.38 19.40 19.40


99.38 99.39 99.40 99.41

19.41 19.42
99.42 99.43

19.43 19.45 19.45


99.44 99.45 99.46

19.46 19.47
99.47 99.48

19.48 19.48
99.48 99.48

19.49 19.49
99.49 99.49

19.49 19.50
99.50 99.50

10.13
34.12

9.55
30.82

9.28
29.46

9.12
28.71

9.01
28.24

8.94
27.91

8.89
27.67

8.85
27.49

8.81
27.34

8.79
27.23

8.76
27.13

8.74
27.05

8.71
26.92

8.69
26.83

8.66
26.69

8.64
26.60

8.62
26.50

8.59
26.41

8.58
26.35

8.56
26.28

8.55
26.24

8.54
26.18

8.53 8.53
26.15 26.13

7.71
21.20

6.94
18.00

6.59
16.69

6.39
15.98

6.26
15.52

6.16
15.21

6.09
14.98

6.04
14.80

6.00
14.66

5.96
14.55

5.94
14.45

5.91
14.37

5.87
14.25

5.84
14.15

5.80
14.02

5.77
13.93

5.75
13.84

5.72
13.75

5.70
13.69

5.68
13.61

5.66
13.58

5.65
13.52

5.64 5.63
13.49 13.46

6.61
16.26

5.79
13.27

5.41
12.06

5.19
11.39

5.05
10.97

4.95
10.67

4.88
10.46

4.82
10.29

4.77
10.16

4.74
10.05

4.70
9.96

4.68
9.89

4.64
9.77

4.60
9.68

4.56
9.55

4.53
9.47

4.50
9.38

4.46
9.29

4.44
9.24

4.42
9.17

4.41
9.13

4.39
9.08

4.37
9.04

4.37
9.02

5.99
13.75

5.14
10.92

4.76
9.78

4.53
9.15

4.39
8.75

4.28
8.47

4.21
8.26

4.15
8.10

4.10
7.98

4.06
7.87

4.03
7.79

4.00
7.72

3.96
7.60

3.92
7.52

3.87
7.40

3.84
7.31

3.81
7.23

3.77
7.14

3.75
7.09

3.73
7.02

3.71
6.99

3.69
6.93

3.68
6.90

3.67
6.88

5.59
12.25

4.74
9.55

4.35
8.45

4.12
7.85

3.97
7.46

3.87
7.19

3.79
6.99

3.73
6.84

3.68
6.72

3.64
6.62

3.60
6.54

3.57
6.47

3.53
6.36

3.49
6.28

3.44
6.16

3.41
6.07

3.38
5.99

3.34
5.91

3.32
5.86

3.29
5.79

3.27
5.75

3.25
5.70

3.24
5.67

3.23
5.65

5.32
11.26

4.46
8.65

4.07
7.59

3.84
7.01

3.69
6.63

3.58
6.37

3.50
6.18

3.44
6.03

3.39
5.91

3.35
5.81

3.31
5.73

3.28
5.67

3.24
5.56

3.20
5.48

3.15
5.36

3.12
5.28

3.08
5.20

3.04
5.12

3.02
5.07

2.99
5.00

2.97
4.96

2.95
4.91

2.94
4.88

2.93
4.86

5.12
10.56

4.26
8.02

3.86
6.99

3.63
6.42

3.48
6.06

3.37
5.80

3.29
5.61

3.23
5.47

3.18
5.35

3.14
5.26

3.10
5.18

3.07
5.11

3.03
5.01

2.99
4.92

2.94
4.81

2.90
4.73

2.86
4.65

2.83
4.57

2.80
4.52

2.77
4.45

2.76
4.41

2.73
4.36

2.72
4.33

2.71
4.31

10

4.96
10.04

4.10
7.56

3.71
6.55

3.48
5.99

3.33
5.64

3.22
5.39

3.14
5.20

3.07
5.06

3.02
4.94

2.98
4.85

2.94
4.77

2.91
4.71

2.86
4.60

2.83
4.52

2.77
4.41

2.74
4.33

2.70
4.25

2.66
4.17

2.64
4.12

2.60
4.05

2.59
4.01

2.56
3.96

2.55
3.93

2.54
3.91

160
=0.05 (normal) y 0 01 (negritas)

glentre

gld
1

10

11

12

14

16

20

24

30

40

50

75

100

200

500

11

4.84
9.65

3.98
7.21

3.59
6.22

3.36
5.67

3.20
5.32

3.09
5.07

3.01
4.89

2.95
4.74

2.90
4.63

2.85
4.54

2.82
4.46

2.79
4.40

2.74
4.29

2.70
4.21

2.65
4.10

2.61
4.02

2.57
3.94

2.53
3.86

2.51
3.81

2.47
3.74

2.46
3.71

2.43
3.66

2.42
3.62

2.40
3.60

12

4.75
9.33

3.89
6.93

3.49
5.95

3.26
5.41

3.11
5.06

3.00
4.82

2.91
4.64

2.85
4.50

2.80
4.39

2.75
4.30

2.72
4.22

2.69
4.16

2.64
4.05

2.60
3.97

2.54
3.86

2.51
3.78

2.47
3.70

2.43
3.62

2.40
3.57

2.37
3.50

2.35
3.47

2.32
3.41

2.31
3.38

2.30
3.36

13

4.67
9.07

3.81
6.70

3.41
5.74

3.18
5.21

3.03
4.86

2.92
4.62

2.83
4.44

2.77
4.30

2.71
4.19

2.67
4.10

2.63
4.02

2.60
3.96

2.55
3.86

2.51
3.78

2.46
3.66

2.42
3.59

2.38
3.51

2.34
3.43

2.31
3.38

2.28
3.31

2.26
3.27

2.23
3.22

2.22
3.19

2.21
3.17

14

4.60
8.86

3.74
6.51

3.34
5.56

3.11
5.04

2.96
4.69

2.85
4.46

2.76
4.28

2.70
4.14

2.65
4.03

2.60
3.94

2.57
3.86

2.53
3.80

2.48
3.70

2.44
3.62

2.39
3.51

2.35
3.43

2.31
3.35

2.27
3.27

2.24
3.22

2.21
3.15

2.19
3.11

2.16
3.06

2.14
3.03

2.13
3.00

15

4.54
8.68

3.68
6.36

3.29
5.42

3.06
4.89

2.90
4.56

2.79
4.32

2.71
4.14

2.64
4.00

2.59
3.89

2.54
3.80

2.51
3.73

2.48
3.67

2.42
3.56

2.38
3.49

2.33
3.37

2.29
3.29

2.25
3.21

2.20
3.13

2.18
3.08

2.14
3.01

2.12
2.98

2.10
2.92

2.08
2.89

2.07
2.87

16

4.49
8.53

3.63
6.23

3.24
5.29

3.01
4.77

2.85
4.44

2.74
4.20

2.66
4.03

2.59
3.89

2.54
3.78

2.49
3.69

2.46
3.62

2.42
3.55

2.37
3.45

2.33
3.37

2.28
3.26

2.24
3.18

2.19
3.10

2.15
3.02

2.12
2.97

2.09
2.90

2.07
2.86

2.04
2.81

2.02
2.78

2.01
2.75

17

4.45
8.40

3.59
6.11

3.20
5.19

2.96
4.67

2.81
4.34

2.70
4.10

2.61
3.93

2.55
3.79

2.49
3.68

2.45
3.59

2.41
3.52

2.38
3.46

2.33
3.35

2.29
3.27

2.23
3.16

2.19
3.08

2.15
3.00

2.10
2.92

2.08
2.87

2.04
2.80

2.02
2.76

1.99
2.71

1.97
2.68

1.96
2.65

18

4.41
8.29

3.55
6.01

3.16
5.09

2.93
4.58

2.77
4.25

2.66
4.01

2.58
3.84

2.51
3.71

2.46
3.60

2.41
3.51

2.37
3.43

2.34
3.37

2.29
3.27

2.25
3.19

2.19
3.08

2.15
3.00

2.11
2.92

2.06
2.84

2.04
2.78

2.00
2.71

1.98
2.68

1.95
2.62

1.93
2.59

1.92
2.57

19

4.38
8.18

3.52
5.93

3.13
5.01

2.90
4.50

2.74
4.17

2.63
3.94

2.54
3.77

2.48
3.63

2.42
3.52

2.38
3.43

2.34
3.36

2.31
3.30

2.26
3.19

2.21
3.12

2.16
3.00

2.11
2.92

2.07
2.84

2.03
2.76

2.00
2.71

1.96
2.64

1.94
2.60

1.91
2.55

1.89
2.51

1.88
2.49

20

4.35
8.10

3.49
5.85

3.10
4.94

2.87
4.43

2.71
4.10

2.60
3.87

2.51
3.70

2.45
3.56

2.39
3.46

2.35
3.37

2.31
3.29

2.28
3.23

2.22
3.13

2.18
3.05

2.12
2.94

2.08
2.86

2.04
2.78

1.99
2.69

1.97
2.64

1.93
2.57

1.91
2.54

1.88
2.48

1.86
2.44

1.84
2.42

21

4.32
8.02

3.47
5.78

3.07
4.87

2.84
4.37

2.68
4.04

2.57
3.81

2.49
3.64

2.42
3.51

2.37
3.40

2.32
3.31

2.28
3.24

2.25
3.17

2.20
3.07

2.16
2.99

2.10
2.88

2.05
2.80

2.01
2.72

1.96
2.64

1.94
2.58

1.90
2.51

1.88
2.48

1.84
2.42

1.83
2.38

1.81
2.36

22

4.30
7.95

3.44
5.72

3.05
4.82

2.82
4.31

2.66
3.99

2.55
3.76

2.46
3.59

2.40
3.45

2.34
3.35

2.30
3.26

2.26
3.18

2.23
3.12

2.17
3.02

2.13
2.94

2.07
2.83

2.03
2.75

1.98
2.67

1.94
2.58

1.91
2.53

1.87
2.46

1.85
2.42

1.82
2.36

1.80
2.33

1.78
2.31

23

4.28
7.88

3.42
5.66

3.03
4.76

2.80
4.26

2.64
3.94

2.53
3.71

2.44
3.54

2.37
3.41

2.32
3.30

2.27
3.21

2.24
3.14

2.20
3.07

2.15
2.97

2.11
2.89

2.05
2.78

2.01
2.70

1.96
2.62

1.91
2.54

1.88
2.48

1.84
2.41

1.82
2.37

1.79
2.32

1.77
2.28

1.76
2.26

24

4.26
7.82

3.40
5.61

3.01
4.72

2.78
4.22

2.62
3.90

2.51
3.67

2.42
3.50

2.36
3.36

2.30
3.26

2.25
3.17

2.22
3.09

2.18
3.03

2.13
2.93

2.09
2.85

2.03
2.74

1.98
2.66

1.94
2.58

1.89
2.49

1.86
2.44

1.82
2.37

1.80
2.33

1.77
2.27

1.75
2.24

1.73
2.21

25

4.24
7.77

3.39
5.57

2.99
4.68

2.76
4.18

2.60
3.85

2.49
3.63

2.40
3.46

2.34
3.32

2.28
3.22

2.24
3.13

2.20
3.06

2.16
2.99

2.11
2.89

2.07
2.81

2.01
2.70

1.96
2.62

1.92
2.54

1.87
2.45

1.84
2.40

1.80
2.33

1.78
2.29

1.75
2.23

1.73
2.19

1.71
2.17

26

4.23
7.72

3.37
5.53

2.98
4.64

2.74
4.14

2.59
3.82

2.47
3.59

2.39
3.42

2.32
3.29

2.27
3.18

2.22
3.09

2.18
3.02

2.15
2.96

2.09
2.86

2.05
2.78

1.99
2.66

1.95
2.58

1.90
2.50

1.85
2.42

1.82
2.36

1.78
2.29

1.76
2.25

1.73
2.19

1.71
2.16

1.69
2.13

27

4.21
7.68

3.35
5.49

2.96
4.60

2.73
4.11

2.57
3.78

2.46
3.56

2.37
3.39

2.31
3.26

2.25
3.15

2.20
3.06

2.17
2.99

2.13
2.93

2.08
2.82

2.04
2.75

1.97
2.63

1.93
2.55

1.88
2.47

1.84
2.38

1.81
2.33

1.76
2.26

1.74
2.22

1.71
2.16

1.69
2.12

1.67
2.10

28

4.20
7.64

3.34
5.45

2.95
4.57

2.71
4.07

2.56
3.75

2.45
3.53

2.36
3.36

2.29
3.23

2.24
3.12

2.19
3.03

2.15
2.96

2.12
2.90

2.06
2.79

2.02
2.72

1.96
2.60

1.91
2.52

1.87
2.44

1.82
2.35

1.79
2.30

1.75
2.23

1.73
2.19

1.69
2.13

1.67
2.09

1.65
2.06

161
=0.05 (normal) y 0 01 (negritas)

glentre

gld
1

10

11

12

14

16

20

24

30

40

50

75

100

200

500

29

4.18
7.60

3.33
5.42

2.93
4.54

2.70
4.04

2.55
3.73

2.43
3.50

2.35
3.33

2.28
3.20

2.22
3.09

2.18
3.00

2.14
2.93

2.10
2.87

2.05
2.77

2.01
2.69

1.94
2.57

1.90
2.49

1.85
2.41

1.81
2.33

1.77
2.27

1.73
2.20

1.71
2.16

1.67
2.10

1.65
2.06

1.64
2.03

30

4.17
7.56

3.32
5.39

2.92
4.51

2.69
4.02

2.53
3.70

2.42
3.47

2.33
3.30

2.27
3.17

2.21
3.07

2.16
2.98

2.13
2.91

2.09
2.84

2.04
2.74

1.99
2.66

1.93
2.55

1.89
2.47

1.84
2.39

1.79
2.30

1.76
2.25

1.72
2.17

1.70
2.13

1.66
2.07

1.64
2.03

1.62
2.01

32

4.15
7.50

3.29
5.34

2.90
4.46

2.67
3.97

2.51
3.65

2.40
3.43

2.31
3.26

2.24
3.13

2.19
3.02

2.14
2.93

2.10
2.86

2.07
2.80

2.01
2.70

1.97
2.62

1.91
2.50

1.86
2.42

1.82
2.34

1.77
2.25

1.74
2.20

1.69
2.12

1.67
2.08

1.63
2.02

1.61
1.98

1.59
1.96

34

4.13
7.44

3.28
5.29

2.88
4.42

2.65
3.93

2.49
3.61

2.38
3.39

2.29
3.22

2.23
3.09

2.17
2.98

2.12
2.89

2.08
2.82

2.05
2.76

1.99
2.66

1.95
2.58

1.89
2.46

1.84
2.38

1.80
2.30

1.75
2.21

1.71
2.16

1.67
2.08

1.65
2.04

1.61
1.98

1.59
1.94

1.57
1.91

36

4.11
7.40

3.26
5.25

2.87
4.38

2.63
3.89

2.48
3.57

2.36
3.35

2.28
3.18

2.21
3.05

2.15
2.95

2.11
2.86

2.07
2.79

2.03
2.72

1.98
2.62

1.93
2.54

1.87
2.43

1.82
2.35

1.78
2.26

1.73
2.18

1.69
2.12

1.65
2.04

1.62
2.00

1.59
1.94

1.56
1.90

1.55
1.87

38

4.10
7.35

3.24
5.21

2.85
4.34

2.62
3.86

2.46
3.54

2.35
3.32

2.26
3.15

2.19
3.02

2.14
2.92

2.09
2.83

2.05
2.75

2.02
2.69

1.96
2.59

1.92
2.51

1.85
2.40

1.81
2.32

1.76
2.23

1.71
2.14

1.68
2.09

1.63
2.01

1.61
1.97

1.57
1.90

1.54
1.86

1.53
1.84

40

4.08
7.31

3.23
5.18

2.84
4.31

2.61
3.83

2.45
3.51

2.34
3.29

2.25
3.12

2.18
2.99

2.12
2.89

2.08
2.80

2.04
2.73

2.00
2.66

1.95
2.56

1.90
2.48

1.84
2.37

1.79
2.29

1.74
2.20

1.69
2.11

1.66
2.06

1.61
1.98

1.59
1.94

1.55
1.87

1.53
1.83

1.51
1.81

42

4.07
7.28

3.22
5.15

2.83
4.29

2.59
3.80

2.44
3.49

2.32
3.27

2.24
3.10

2.17
2.97

2.11
2.86

2.06
2.78

2.03
2.70

1.99
2.64

1.94
2.54

1.89
2.46

1.83
2.34

1.78
2.26

1.73
2.18

1.68
2.09

1.65
2.03

1.60
1.95

1.57
1.91

1.53
1.85

1.51
1.80

1.49
1.78

44

4.06
7.25

3.21
5.12

2.82
4.26

2.58
3.78

2.43
3.47

2.31
3.24

2.23
3.08

2.16
2.95

2.10
2.84

2.05
2.75

2.01
2.68

1.98
2.62

1.92
2.52

1.88
2.44

1.81
2.32

1.77
2.24

1.72
2.15

1.67
2.07

1.63
2.01

1.59
1.93

1.56
1.89

1.52
1.82

1.49
1.78

1.48
1.75

46

4.05
7.22

3.20
5.10

2.81
4.24

2.57
3.76

2.42
3.44

2.30
3.22

2.22
3.06

2.15
2.93

2.09
2.82

2.04
2.73

2.00
2.66

1.97
2.60

1.91
2.50

1.87
2.42

1.80
2.30

1.76
2.22

1.71
2.13

1.65
2.04

1.62
1.99

1.57
1.91

1.55
1.86

1.51
1.80

1.48
1.76

1.46
1.73

48

4.04
7.19

3.19
5.08

2.80
4.22

2.57
3.74

2.41
3.43

2.29
3.20

2.21
3.04

2.14
2.91

2.08
2.80

2.03
2.71

1.99
2.64

1.96
2.58

1.90
2.48

1.86
2.40

1.79
2.28

1.75
2.20

1.70
2.12

1.64
2.02

1.61
1.97

1.56
1.89

1.54
1.84

1.49
1.78

1.47
1.73

1.45
1.70

50

4.03
7.17

3.18
5.06

2.79
4.20

2.56
3.72

2.40
3.41

2.29
3.19

2.20
3.02

2.13
2.89

2.07
2.78

2.03
2.70

1.99
2.63

1.95
2.56

1.89
2.46

1.85
2.38

1.78
2.27

1.74
2.18

1.69
2.10

1.63
2.01

1.60
1.95

1.55
1.87

1.52
1.82

1.48
1.76

1.46
1.71

1.44
1.68

55

4.02
7.12

3.16
5.01

2.77
4.16

2.54
3.68

2.38
3.37

2.27
3.15

2.18
2.98

2.11
2.85

2.06
2.75

2.01
2.66

1.97
2.59

1.93
2.53

1.88
2.42

1.83
2.34

1.76
2.23

1.72
2.15

1.67
2.06

1.61
1.97

1.58
1.91

1.53
1.83

1.50
1.78

1.46
1.71

1.43
1.67

1.41
1.64

60

4.00
7.08

3.15
4.98

2.76
4.13

2.53
3.65

2.37
3.34

2.25
3.12

2.17
2.95

2.10
2.82

2.04
2.72

1.99
2.63

1.95
2.56

1.92
2.50

1.86
2.39

1.82
2.31

1.75
2.20

1.70
2.12

1.65
2.03

1.59
1.94

1.56
1.88

1.51
1.79

1.48
1.75

1.44
1.68

1.41
1.63

1.39
1.60

65

3.99
7.04

3.14
4.95

2.75
4.10

2.51
3.62

2.36
3.31

2.24
3.09

2.15
2.93

2.08
2.80

2.03
2.69

1.98
2.61

1.94
2.53

1.90
2.47

1.85
2.37

1.80
2.29

1.73
2.17

1.69
2.09

1.63
2.00

1.58
1.91

1.54
1.85

1.49
1.77

1.46
1.72

1.42
1.65

1.39
1.60

1.37
1.57

70

3.98
7.01

3.13
4.92

2.74
4.07

2.50
3.60

2.35
3.29

2.23
3.07

2.14
2.91

2.07
2.78

2.02
2.67

1.97
2.59

1.93
2.51

1.89
2.45

1.84
2.35

1.79
2.27

1.72
2.15

1.67
2.07

1.62
1.98

1.57
1.89

1.53
1.83

1.48
1.74

1.45
1.70

1.40
1.62

1.37
1.57

1.35
1.54

80

3.96
6.96

3.11
4.88

2.72
4.04

2.49
3.56

2.33
3.26

2.21
3.04

2.13
2.87

2.06
2.74

2.00
2.64

1.95
2.55

1.91
2.48

1.88
2.42

1.82
2.31

1.77
2.23

1.70
2.12

1.65
2.03

1.60
1.94

1.54
1.85

1.51
1.79

1.45
1.70

1.43
1.65

1.38
1.58

1.35
1.53

1.33
1.50

100

3.94
6.90

3.09
4.82

2.70
3.98

2.46
3.51

2.31
3.21

2.19
2.99

2.10
2.82

2.03
2.69

1.97
2.59

1.93
2.50

1.89
2.43

1.85
2.37

1.79
2.27

1.75
2.19

1.68
2.07

1.63
1.98

1.57
1.89

1.52
1.80

1.48
1.74

1.42
1.65

1.39
1.60

1.34
1.52

1.31
1.47

1.28
1.43

162
=0.05 (normal) y 0 01 (negritas)

glentre

gld
1

10

11

12

14

16

20

24

30

40

50

75

100

200

500

125

3.92
6.84

3.07
4.78

2.68
3.94

2.44
3.47

2.29
3.17

2.17
2.95

2.08
2.79

2.01
2.66

1.96
2.55

1.91
2.47

1.87
2.39

1.83
2.33

1.77
2.23

1.73
2.15

1.66
2.03

1.60
1.94

1.55
1.85

1.49
1.76

1.45
1.69

1.40
1.60

1.36
1.55

1.31
1.47

1.27
1.41

1.25
1.37

150

3.90
6.81

3.06
4.75

2.66
3.91

2.43
3.45

2.27
3.14

2.16
2.92

2.07
2.76

2.00
2.63

1.94
2.53

1.89
2.44

1.85
2.37

1.82
2.31

1.76
2.20

1.71
2.12

1.64
2.00

1.59
1.92

1.54
1.83

1.48
1.73

1.44
1.66

1.38
1.57

1.34
1.52

1.29
1.43

1.25
1.38

1.22
1.33

200

3.89
6.76

3.04
4.71

2.65
3.88

2.42
3.41

2.26
3.11

2.14
2.89

2.06
2.73

1.98
2.60

1.93
2.50

1.88
2.41

1.84
2.34

1.80
2.27

1.74
2.17

1.69
2.09

1.62
1.97

1.57
1.89

1.52
1.79

1.46
1.69

1.41
1.63

1.35
1.53

1.32
1.48

1.26
1.39

1.22
1.33

1.19
1.28

400

3.86
6.70

3.02
4.66

2.63
3.83

2.39
3.37

2.24
3.06

2.12
2.85

2.03
2.68

1.96
2.56

1.90
2.45

1.85
2.37

1.81
2.29

1.78
2.23

1.72
2.13

1.67
2.05

1.60
1.92

1.54
1.84

1.49
1.75

1.42
1.64

1.38
1.58

1.32
1.48

1.28
1.42

1.22
1.32

1.17
1.25

1.13
1.19

1000

3.85
6.66

3.00
4.63

2.61
3.80

2.38
3.34

2.22
3.04

2.11
2.82

2.02
2.66

1.95
2.53

1.89
2.43

1.84
2.34

1.80
2.27

1.76
2.20

1.70
2.10

1.65
2.02

1.58
1.90

1.53
1.81

1.47
1.72

1.41
1.61

1.36
1.54

1.30
1.44

1.26
1.38

1.19
1.28

1.13
1.19

1.08
1.12

3.84
6.63

3.00
4.61

2.60
3.78

2.37
3.32

2.21
3.02

2.10
2.80

2.01
2.64

1.94
2.51

1.88
2.41

1.83
2.32

1.79
2.25

1.75
2.18

1.69
2.08

1.64
2.00

1.57
1.88

1.52
1.79

1.46
1.70

1.39
1.59

1.35
1.52

1.28
1.42

1.24
1.36

1.17
1.25

1.11
1.15

1.00
1.00

163

APNDICE 4
Probabilidades binomiales
n

1
1

p
0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

0
1

0.9500
0.0500

0.9000
0.1000

0.8500
0.1500

0.8000
0.2000

0.7500
0.2500

0.7000
0.3000

0.6500
0.3500

0.6000
0.4000

0.5500
0.4500

0.5000
0.5000

2
2
2

0
1
2

0.9025
0.0950
0.0025

0.8100
0.1800
0.0100

0.7225
0.2550
0.0225

0.6400
0.3200
0.0400

0.5625
0.3750
0.0625

0.4900
0.4200
0.0900

0.4225
0.4550
0.1225

0.3600
0.4800
0.1600

0.3025
0.4950
0.2025

0.2500
0.5000
0.2500

3
3
3
3

0
1
2
3

0.8574
0.1354
0.0071
0.0001

0.7290
0.2430
0.0270
0.0010

0.6141
0.3251
0.0574
0.0034

0.5120
0.3840
0.0960
0.0080

0.4219
0.4219
0.1406
0.0156

0.3430
0.4410
0.1890
0.0270

0.2746
0.4436
0.2389
0.0429

0.2160
0.4320
0.2880
0.0640

0.1664
0.4084
0.3341
0.0911

0.1250
0.3750
0.3750
0.1250

4
4
4
4
4

0
1
2
3
4

0.8145
0.1715
0.0135
0.0005
0.0000

0.6561
0.2916
0.0486
0.0036
0.0001

0.5220
0.3685
0.0975
0.0115
0.0005

0.4096
0.4096
0.1536
0.0256
0.0016

0.3164
0.4219
0.2109
0.0469
0.0039

0.2401
0.4116
0.2646
0.0756
0.0081

0.1785
0.3845
0.3105
0.1115
0.0150

0.1296
0.3456
0.3456
0.1536
0.0256

0.0915
0.2995
0.3675
0.2005
0.0410

0.0625
0.2500
0.3750
0.2500
0.0625

5
5
5
5
5

0
1
2
3
4

0.7738
0.2036
0.0214
0.0011
0.0000

0.5905
0.3281
0.0729
0.0081
0.0005

0.4437
0.3915
0.1382
0.0244
0.0022

0.3277
0.4096
0.2048
0.0512
0.0064

0.2373
0.3955
0.2637
0.0879
0.0146

0.1681
0.3602
0.3087
0.1323
0.0284

0.1160
0.3124
0.3364
0.1811
0.0488

0.0778
0.2592
0.3456
0.2304
0.0768

0.0503
0.2059
0.3369
0.2757
0.1128

0.0313
0.1563
0.3125
0.3125
0.1563

0.0000

0.0000

0.0001

0.0003

0.0010

0.0024

0.0053

0.0102

0.0185

0.0313

6
6
6
6
6

0
1
2
3
4

0.7351
0.2321
0.0305
0.0021
0.0001

0.5314
0.3543
0.0984
0.0146
0.0012

0.3771
0.3993
0.1762
0.0415
0.0055

0.2621
0.3932
0.2458
0.0819
0.0154

0.1780
0.3560
0.2966
0.1318
0.0330

0.1176
0.3025
0.3241
0.1852
0.0595

0.0754
0.2437
0.3280
0.2355
0.0951

0.0467
0.1866
0.3110
0.2765
0.1382

0.0277
0.1359
0.2780
0.3032
0.1861

0.0156
0.0938
0.2344
0.3125
0.2344

6
6

5
6

0.0000
0.0000

0.0001
0.0000

0.0004
0.0000

0.0015
0.0001

0.0044
0.0002

0.0102
0.0007

0.0205
0.0018

0.0369
0.0041

0.0609
0.0083

0.0938
0.0156

7
7
7
7
7

0
1
2
3
4

0.6983
0.2573
0.0406
0.0036
0.0002

0.4783
0.3720
0.1240
0.0230
0.0026

0.3206
0.3960
0.2097
0.0617
0.0109

0.2097
0.3670
0.2753
0.1147
0.0287

0.1335
0.3115
0.3115
0.1730
0.0577

0.0824
0.2471
0.3177
0.2269
0.0972

0.0490
0.1848
0.2985
0.2679
0.1442

0.0280
0.1306
0.2613
0.2903
0.1935

0.0152
0.0872
0.2140
0.2918
0.2388

0.0078
0.0547
0.1641
0.2734
0.2734

7
7
7

5
6
7

0.0000
0.0000
0.0000

0.0002
0.0000
0.0000

0.0012
0.0001
0.0000

0.0043
0.0004
0.0000

0.0115
0.0013
0.0001

0.0250
0.0036
0.0002

0.0466
0.0084
0.0006

0.0774
0.0172
0.0016

0.1172
0.0320
0.0037

0.1641
0.0547
0.0078

8
8
8
8
8

0
1
2
3
4

0.6634
0.2793
0.0515
0.0054
0.0004

0.4305
0.3826
0.1488
0.0331
0.0046

0.2725
0.3847
0.2376
0.0839
0.0185

0.1678
0.3355
0.2936
0.1468
0.0459

0.1001
0.2670
0.3115
0.2076
0.0865

0.0576
0.1977
0.2965
0.2541
0.1361

0.0319
0.1373
0.2587
0.2786
0.1875

0.0168
0.0896
0.2090
0.2787
0.2322

0.0084
0.0548
0.1569
0.2568
0.2627

0.0039
0.0313
0.1094
0.2188
0.2734

8
8
8
8

5
6
7
8

0.0000
0.0000
0.0000
0.0000

0.0004
0.0000
0.0000
0.0000

0.0026
0.0002
0.0000
0.0000

0.0092
0.0011
0.0001
0.0000

0.0231
0.0038
0.0004
0.0000

0.0467
0.0100
0.0012
0.0001

0.0808
0.0217
0.0033
0.0002

0.1239
0.0413
0.0079
0.0007

0.1719
0.0703
0.0164
0.0017

0.2188
0.1094
0.0313
0.0039

9
9

0
1

0.6302
0.2985

0.3874
0.3874

0.2316
0.3679

0.1342
0.3020

0.0751
0.2253

0.0404
0.1556

0.0207
0.1004

0.0101
0.0605

0.0046
0.0339

0.0020
0.0176

164

9
9
9

p
0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

2
3
4

0.0629
0.0077
0.0006

0.1722
0.0446
0.0074

0.2597
0.1069
0.0283

0.3020
0.1762
0.0661

0.3003
0.2336
0.1168

0.2668
0.2668
0.1715

0.2162
0.2716
0.2194

0.1612
0.2508
0.2508

0.1110
0.2119
0.2600

0.0703
0.1641
0.2461

9
9
9
9
9

5
6
7
8
9

0.0000
0.0000
0.0000
0.0000
0.0000

0.0008
0.0001
0.0000
0.0000
0.0000

0.0050
0.0006
0.0000
0.0000
0.0000

0.0165
0.0028
0.0003
0.0000
0.0000

0.0389
0.0087
0.0012
0.0001
0.0000

0.0735
0.0210
0.0039
0.0004
0.0000

0.1181
0.0424
0.0098
0.0013
0.0001

0.1672
0.0743
0.0212
0.0035
0.0003

0.2128
0.1160
0.0407
0.0083
0.0008

0.2461
0.1641
0.0703
0.0176
0.0020

10
10
10
10
10

0
1
2
3
4

0.5987
0.3151
0.0746
0.0105
0.0010

0.3487
0.3874
0.1937
0.0574
0.0112

0.1969
0.3474
0.2759
0.1298
0.0401

0.1074
0.2684
0.3020
0.2013
0.0881

0.0563
0.1877
0.2816
0.2503
0.1460

0.0282
0.1211
0.2335
0.2668
0.2001

0.0135
0.0725
0.1757
0.2522
0.2377

0.0060
0.0403
0.1209
0.2150
0.2508

0.0025
0.0207
0.0763
0.1665
0.2384

0.0010
0.0098
0.0439
0.1172
0.2051

10
10
10
10
10
10

5
6
7
8
9
10

0.0001
0.0000
0.0000
0.0000
0.0000
0.0000

0.0015
0.0001
0.0000
0.0000
0.0000
0.0000

0.0085
0.0012
0.0001
0.0000
0.0000
0.0000

0.0264
0.0055
0.0008
0.0001
0.0000
0.0000

0.0584
0.0162
0.0031
0.0004
0.0000
0.0000

0.1029
0.0368
0.0090
0.0014
0.0001
0.0000

0.1536
0.0689
0.0212
0.0043
0.0005
0.0000

0.2007
0.1115
0.0425
0.0106
0.0016
0.0001

0.2340
0.1596
0.0746
0.0229
0.0042
0.0003

0.2461
0.2051
0.1172
0.0439
0.0098
0.0010

11
11
11
11
11

0
1
2
3
4

0.5688
0.3293
0.0867
0.0137
0.0014

0.3138
0.3835
0.2131
0.0710
0.0158

0.1673
0.3248
0.2866
0.1517
0.0536

0.0859
0.2362
0.2953
0.2215
0.1107

0.0422
0.1549
0.2581
0.2581
0.1721

0.0198
0.0932
0.1998
0.2568
0.2201

0.0088
0.0518
0.1395
0.2254
0.2428

0.0036
0.0266
0.0887
0.1774
0.2365

0.0014
0.0125
0.0513
0.1259
0.2060

0.0005
0.0054
0.0269
0.0806
0.1611

11
11
11
11
11

5
6
7
8
9

0.0001
0.0000
0.0000
0.0000
0.0000

0.0025
0.0003
0.0000
0.0000
0.0000

0.0132
0.0023
0.0003
0.0000
0.0000

0.0388
0.0097
0.0017
0.0002
0.0000

0.0803
0.0268
0.0064
0.0011
0.0001

0.1321
0.0566
0.0173
0.0037
0.0005

0.1830
0.0985
0.0379
0.0102
0.0018

0.2207
0.1471
0.0701
0.0234
0.0052

0.2360
0.1931
0.1128
0.0462
0.0126

0.2256
0.2256
0.1611
0.0806
0.0269

11
11

10
11

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0002
0.0000

0.0007
0.0000

0.0021
0.0002

0.0054
0.0005

12
12
12
12
12

0
1
2
3
4

0.5404
0.3413
0.0988
0.0173
0.0021

0.2824
0.3766
0.2301
0.0852
0.0213

0.1422
0.3012
0.2924
0.1720
0.0683

0.0687
0.2062
0.2835
0.2362
0.1329

0.0317
0.1267
0.2323
0.2581
0.1936

0.0138
0.0712
0.1678
0.2397
0.2311

0.0057
0.0368
0.1088
0.1954
0.2367

0.0022
0.0174
0.0639
0.1419
0.2128

0.0008
0.0075
0.0339
0.0923
0.1700

0.0002
0.0029
0.0161
0.0537
0.1208

12
12
12
12
12

5
6
7
8
9

0.0002
0.0000
0.0000
0.0000
0.0000

0.0038
0.0005
0.0000
0.0000
0.0000

0.0193
0.0040
0.0006
0.0001
0.0000

0.0532
0.0155
0.0033
0.0005
0.0001

0.1032
0.0401
0.0115
0.0024
0.0004

0.1585
0.0792
0.0291
0.0078
0.0015

0.2039
0.1281
0.0591
0.0199
0.0048

0.2270
0.1766
0.1009
0.0420
0.0125

0.2225
0.2124
0.1489
0.0762
0.0277

0.1934
0.2256
0.1934
0.1208
0.0537

12
12
12

10
11
12

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0002
0.0000
0.0000

0.0008
0.0001
0.0000

0.0025
0.0003
0.0000

0.0068
0.0010
0.0001

0.0161
0.0029
0.0002

13
13
13
13
13

0
1
2
3
4

0.5133
0.3512
0.1109
0.0214
0.0028

0.2542
0.3672
0.2448
0.0997
0.0277

0.1209
0.2774
0.2937
0.1900
0.0838

0.0550
0.1787
0.2680
0.2457
0.1535

0.0238
0.1029
0.2059
0.2517
0.2097

0.0097
0.0540
0.1388
0.2181
0.2337

0.0037
0.0259
0.0836
0.1651
0.2222

0.0013
0.0113
0.0453
0.1107
0.1845

0.0004
0.0045
0.0220
0.0660
0.1350

0.0001
0.0016
0.0095
0.0349
0.0873

13
13
13
13

5
6
7
8

0.0003
0.0000
0.0000
0.0000

0.0055
0.0008
0.0001
0.0000

0.0266
0.0063
0.0011
0.0001

0.0691
0.0230
0.0058
0.0011

0.1258
0.0559
0.0186
0.0047

0.1803
0.1030
0.0442
0.0142

0.2154
0.1546
0.0833
0.0336

0.2214
0.1968
0.1312
0.0656

0.1989
0.2169
0.1775
0.1089

0.1571
0.2095
0.2095
0.1571

165

13

p
0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

0.0000

0.0000

0.0000

0.0001

0.0009

0.0034

0.0101

0.0243

0.0495

0.0873

13
13
13
13

10
11
12
13

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0001
0.0000
0.0000
0.0000

0.0006
0.0001
0.0000
0.0000

0.0022
0.0003
0.0000
0.0000

0.0065
0.0012
0.0001
0.0000

0.0162
0.0036
0.0005
0.0000

0.0349
0.0095
0.0016
0.0001

14
14
14
14
14

0
1
2
3
4

0.4877
0.3593
0.1229
0.0259
0.0037

0.2288
0.3559
0.2570
0.1142
0.0349

0.1028
0.2539
0.2912
0.2056
0.0998

0.0440
0.1539
0.2501
0.2501
0.1720

0.0178
0.0832
0.1802
0.2402
0.2202

0.0068
0.0407
0.1134
0.1943
0.2290

0.0024
0.0181
0.0634
0.1366
0.2022

0.0008
0.0073
0.0317
0.0845
0.1549

0.0002
0.0027
0.0141
0.0462
0.1040

0.0001
0.0009
0.0056
0.0222
0.0611

14
14
14
14
14

5
6
7
8
9

0.0004
0.0000
0.0000
0.0000
0.0000

0.0078
0.0013
0.0002
0.0000
0.0000

0.0352
0.0093
0.0019
0.0003
0.0000

0.0860
0.0322
0.0092
0.0020
0.0003

0.1468
0.0734
0.0280
0.0082
0.0018

0.1963
0.1262
0.0618
0.0232
0.0066

0.2178
0.1759
0.1082
0.0510
0.0183

0.2066
0.2066
0.1574
0.0918
0.0408

0.1701
0.2088
0.1952
0.1398
0.0762

0.1222
0.1833
0.2095
0.1833
0.1222

14
14
14
14
14

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0003
0.0000
0.0000
0.0000
0.0000

0.0014
0.0002
0.0000
0.0000
0.0000

0.0049
0.0010
0.0001
0.0000
0.0000

0.0136
0.0033
0.0005
0.0001
0.0000

0.0312
0.0093
0.0019
0.0002
0.0000

0.0611
0.0222
0.0056
0.0009
0.0001

15
15
15
15
15

0
1
2
3
4

0.4633
0.3658
0.1348
0.0307
0.0049

0.2059
0.3432
0.2669
0.1285
0.0428

0.0874
0.2312
0.2856
0.2184
0.1156

0.0352
0.1319
0.2309
0.2501
0.1876

0.0134
0.0668
0.1559
0.2252
0.2252

0.0047
0.0305
0.0916
0.1700
0.2186

0.0016
0.0126
0.0476
0.1110
0.1792

0.0005
0.0047
0.0219
0.0634
0.1268

0.0001
0.0016
0.0090
0.0318
0.0780

0.0000
0.0005
0.0032
0.0139
0.0417

15
15
15
15
15

5
6
7
8
9

0.0006
0.0000
0.0000
0.0000
0.0000

0.0105
0.0019
0.0003
0.0000
0.0000

0.0449
0.0132
0.0030
0.0005
0.0001

0.1032
0.0430
0.0138
0.0035
0.0007

0.1651
0.0917
0.0393
0.0131
0.0034

0.2061
0.1472
0.0811
0.0348
0.0116

0.2123
0.1906
0.1319
0.0710
0.0298

0.1859
0.2066
0.1771
0.1181
0.0612

0.1404
0.1914
0.2013
0.1647
0.1048

0.0916
0.1527
0.1964
0.1964
0.1527

15
15
15
15
15
15

10
11
12
13
14
15

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0001
0.0000
0.0000
0.0000
0.0000
0.0000

0.0007
0.0001
0.0000
0.0000
0.0000
0.0000

0.0030
0.0006
0.0001
0.0000
0.0000
0.0000

0.0096
0.0024
0.0004
0.0001
0.0000
0.0000

0.0245
0.0074
0.0016
0.0003
0.0000
0.0000

0.0515
0.0191
0.0052
0.0010
0.0001
0.0000

0.0916
0.0417
0.0139
0.0032
0.0005
0.0000

16
16
16
16
16

0
1
2
3
4

0.4401
0.3706
0.1463
0.0359
0.0061

0.1853
0.3294
0.2745
0.1423
0.0514

0.0743
0.2097
0.2775
0.2285
0.1311

0.0281
0.1126
0.2111
0.2463
0.2001

0.0100
0.0535
0.1336
0.2079
0.2252

0.0033
0.0228
0.0732
0.1465
0.2040

0.0010
0.0087
0.0353
0.0888
0.1553

0.0003
0.0030
0.0150
0.0468
0.1014

0.0001
0.0009
0.0056
0.0215
0.0572

0.0000
0.0002
0.0018
0.0085
0.0278

16
16
16
16
16

5
6
7
8
9

0.0008
0.0001
0.0000
0.0000
0.0000

0.0137
0.0028
0.0004
0.0001
0.0000

0.0555
0.0180
0.0045
0.0009
0.0001

0.1201
0.0550
0.0197
0.0055
0.0012

0.1802
0.1101
0.0524
0.0197
0.0058

0.2099
0.1649
0.1010
0.0487
0.0185

0.2008
0.1982
0.1524
0.0923
0.0442

0.1623
0.1983
0.1889
0.1417
0.0840

0.1123
0.1684
0.1969
0.1812
0.1318

0.0667
0.1222
0.1746
0.1964
0.1746

16
16
16
16
16

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0002
0.0000
0.0000
0.0000
0.0000

0.0014
0.0002
0.0000
0.0000
0.0000

0.0056
0.0013
0.0002
0.0000
0.0000

0.0167
0.0049
0.0011
0.0002
0.0000

0.0392
0.0142
0.0040
0.0008
0.0001

0.0755
0.0337
0.0115
0.0029
0.0005

0.1222
0.0667
0.0278
0.0085
0.0018

16
16

15
16

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0000
0.0000

0.0001
0.0000

0.0002
0.0000

166

17
17
17
17
17

p
0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

0
1
2
3
4

0.4181
0.3741
0.1575
0.0415
0.0076

0.1668
0.3150
0.2800
0.1556
0.0605

0.0631
0.1893
0.2673
0.2359
0.1457

0.0225
0.0957
0.1914
0.2393
0.2093

0.0075
0.0426
0.1136
0.1893
0.2209

0.0023
0.0169
0.0581
0.1245
0.1868

0.0007
0.0060
0.0260
0.0701
0.1320

0.0002
0.0019
0.0102
0.0341
0.0796

0.0000
0.0005
0.0035
0.0144
0.0411

0.0000
0.0001
0.0010
0.0052
0.0182

17
17
17
17
17

5
6
7
8
9

0.0010
0.0001
0.0000
0.0000
0.0000

0.0175
0.0039
0.0007
0.0001
0.0000

0.0668
0.0236
0.0065
0.0014
0.0003

0.1361
0.0680
0.0267
0.0084
0.0021

0.1914
0.1276
0.0668
0.0279
0.0093

0.2081
0.1784
0.1201
0.0644
0.0276

0.1849
0.1991
0.1685
0.1134
0.0611

0.1379
0.1839
0.1927
0.1606
0.1070

0.0875
0.1432
0.1841
0.1883
0.1540

0.0472
0.0944
0.1484
0.1855
0.1855

17
17
17
17
17

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0004
0.0001
0.0000
0.0000
0.0000

0.0025
0.0005
0.0001
0.0000
0.0000

0.0095
0.0026
0.0006
0.0001
0.0000

0.0263
0.0090
0.0024
0.0005
0.0001

0.0571
0.0242
0.0081
0.0021
0.0004

0.1008
0.0525
0.0215
0.0068
0.0016

0.1484
0.0944
0.0472
0.0182
0.0052

17
17
17

15
16
17

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0000
0.0000
0.0000

0.0001
0.0000
0.0000

0.0003
0.0000
0.0000

0.0010
0.0001
0.0000

18
18
18
18
18

0
1
2
3
4

0.3972
0.3763
0.1683
0.0473
0.0093

0.1501
0.3002
0.2835
0.1680
0.0700

0.0536
0.1704
0.2556
0.2406
0.1592

0.0180
0.0811
0.1723
0.2297
0.2153

0.0056
0.0338
0.0958
0.1704
0.2130

0.0016
0.0126
0.0458
0.1046
0.1681

0.0004
0.0042
0.0190
0.0547
0.1104

0.0001
0.0012
0.0069
0.0246
0.0614

0.0000
0.0003
0.0022
0.0095
0.0291

0.0000
0.0001
0.0006
0.0031
0.0117

18
18
18
18
18

5
6
7
8
9

0.0014
0.0002
0.0000
0.0000
0.0000

0.0218
0.0052
0.0010
0.0002
0.0000

0.0787
0.0301
0.0091
0.0022
0.0004

0.1507
0.0816
0.0350
0.0120
0.0033

0.1988
0.1436
0.0820
0.0376
0.0139

0.2017
0.1873
0.1376
0.0811
0.0386

0.1664
0.1941
0.1792
0.1327
0.0794

0.1146
0.1655
0.1892
0.1734
0.1284

0.0666
0.1181
0.1657
0.1864
0.1694

0.0327
0.0708
0.1214
0.1669
0.1855

18
18
18
18
18

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0001
0.0000
0.0000
0.0000
0.0000

0.0008
0.0001
0.0000
0.0000
0.0000

0.0042
0.0010
0.0002
0.0000
0.0000

0.0149
0.0046
0.0012
0.0002
0.0000

0.0385
0.0151
0.0047
0.0012
0.0002

0.0771
0.0374
0.0145
0.0045
0.0011

0.1248
0.0742
0.0354
0.0134
0.0039

0.1669
0.1214
0.0708
0.0327
0.0117

18
18
18
18

15
16
17
18

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000

0.0002
0.0000
0.0000
0.0000

0.0009
0.0001
0.0000
0.0000

0.0031
0.0006
0.0001
0.0000

19
19
19
19
19

0
1
2
3
4

0.3774
0.3774
0.1787
0.0533
0.0112

0.1351
0.2852
0.2852
0.1796
0.0798

0.0456
0.1529
0.2428
0.2428
0.1714

0.0144
0.0685
0.1540
0.2182
0.2182

0.0042
0.0268
0.0803
0.1517
0.2023

0.0011
0.0093
0.0358
0.0869
0.1491

0.0003
0.0029
0.0138
0.0422
0.0909

0.0001
0.0008
0.0046
0.0175
0.0467

0.0000
0.0002
0.0013
0.0062
0.0203

0.0000
0.0000
0.0003
0.0018
0.0074

19
19
19
19
19

5
6
7
8
9

0.0018
0.0002
0.0000
0.0000
0.0000

0.0266
0.0069
0.0014
0.0002
0.0000

0.0907
0.0374
0.0122
0.0032
0.0007

0.1636
0.0955
0.0443
0.0166
0.0051

0.2023
0.1574
0.0974
0.0487
0.0198

0.1916
0.1916
0.1525
0.0981
0.0514

0.1468
0.1844
0.1844
0.1489
0.0980

0.0933
0.1451
0.1797
0.1797
0.1464

0.0497
0.0949
0.1443
0.1771
0.1771

0.0222
0.0518
0.0961
0.1442
0.1762

19
19
19
19
19

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0001
0.0000
0.0000
0.0000
0.0000

0.0013
0.0003
0.0000
0.0000
0.0000

0.0066
0.0018
0.0004
0.0001
0.0000

0.0220
0.0077
0.0022
0.0005
0.0001

0.0528
0.0233
0.0083
0.0024
0.0006

0.0976
0.0532
0.0237
0.0085
0.0024

0.1449
0.0970
0.0529
0.0233
0.0082

0.1762
0.1442
0.0961
0.0518
0.0222

167

19
19
19
19
19

p
0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

15
16
17
18
19

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0001
0.0000
0.0000
0.0000
0.0000

0.0005
0.0001
0.0000
0.0000
0.0000

0.0022
0.0005
0.0001
0.0000
0.0000

0.0074
0.0018
0.0003
0.0000
0.0000

20
20
20
20
20

0
1
2
3
4

0.3585
0.3774
0.1887
0.0596
0.0133

0.1216
0.2702
0.2852
0.1901
0.0898

0.0388
0.1368
0.2293
0.2428
0.1821

0.0115
0.0576
0.1369
0.2054
0.2182

0.0032
0.0211
0.0669
0.1339
0.1897

0.0008
0.0068
0.0278
0.0716
0.1304

0.0002
0.0020
0.0100
0.0323
0.0738

0.0000
0.0005
0.0031
0.0123
0.0350

0.0000
0.0001
0.0008
0.0040
0.0139

0.0000
0.0000
0.0002
0.0011
0.0046

20
20
20
20
20

5
6
7
8
9

0.0022
0.0003
0.0000
0.0000
0.0000

0.0319
0.0089
0.0020
0.0004
0.0001

0.1028
0.0454
0.0160
0.0046
0.0011

0.1746
0.1091
0.0545
0.0222
0.0074

0.2023
0.1686
0.1124
0.0609
0.0271

0.1789
0.1916
0.1643
0.1144
0.0654

0.1272
0.1712
0.1844
0.1614
0.1158

0.0746
0.1244
0.1659
0.1797
0.1597

0.0365
0.0746
0.1221
0.1623
0.1771

0.0148
0.0370
0.0739
0.1201
0.1602

20
20
20
20
20

10
11
12
13
14

0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000

0.0002
0.0000
0.0000
0.0000
0.0000

0.0020
0.0005
0.0001
0.0000
0.0000

0.0099
0.0030
0.0008
0.0002
0.0000

0.0308
0.0120
0.0039
0.0010
0.0002

0.0686
0.0336
0.0136
0.0045
0.0012

0.1171
0.0710
0.0355
0.0146
0.0049

0.1593
0.1185
0.0727
0.0366
0.0150

0.1762
0.1602
0.1201
0.0739
0.0370

20
20
20
20
20
20

15
16
17
18
19
20

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.0003
0.0000
0.0000
0.0000
0.0000
0.0000

0.0013
0.0003
0.0000
0.0000
0.0000
0.0000

0.0049
0.0013
0.0002
0.0000
0.0000
0.0000

0.0148
0.0046
0.0011
0.0002
0.0000
0.0000

168

APNDICE 5
Distribucin t de Student:
Significancia de correlaciones de Pearson
Grados de libertad
gl= N-2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

0.050
0.988
0.900
0.805
0.729
0.669
0.622
0.582
0.549
0.521
0.497
0.476
0.458
0.441
0.426
0.412
0.400
0.389
0.378
0.369
0.360
0.352
0.344
0.337
0.330
0.323
0.317
0.311
0.306
0.301
0.296
0.275
0.257
0.243
0.231
0.211
0.195
0.183
0.173
0.164
0.10

Niveles de significacin a dos colas


0.025
0.010
0.997
1.000
0.950
0.980
0.878
0.934
0.811
0.882
0.754
0.833
0.707
0.789
0.666
0.750
0.632
0.716
0.602
0.685
0.576
0.658
0.553
0.634
0.532
0.612
0.514
0.592
0.497
0.574
0.482
0.558
0.468
0.542
0.456
0.528
0.444
0.516
0.433
0.503
0.423
0.492
0.413
0.482
0.404
0.472
0.396
0.462
0.388
0.453
0.381
0.445
0.374
0.437
0.367
0.430
0.361
0.423
0.355
0.416
0.349
0.409
0.325
0.381
0.304
0.358
0.288
0.338
0.273
0.322
0.250
0.295
0.232
0.274
0.217
0.256
0.205
0.242
0.195
0.230
0.050
0.02
Niveles de significacin a una cola

0.005
1.000
0.990
0.959
0.917
0.874
0.834
0.798
0.765
0.735
0.708
0.684
0.661
0.641
0.623
0.606
0.590
0.575
0.561
0.549
0.537
0.526
0.515
0.505
0.496
0.487
0.479
0.471
0.463
0.456
0.449
0.418
0.393
0.372
0.354
0.325
0.303
0.283
0.267
0.254
0.01

169

APNDICE 6
Valores crticos del estadstico de Q
Gl
(N K)
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

00 (

2
3.64
5.70
3.46
5.24
3.34
4.95
3.26
4.75
3.20
4.60
3.15
4.48
3.11
4.39
3.08
4.32
3.06
4.26
3.03
4.21
3.01
4.17
3.00
4.13
2.98
4.10
2.97
4.07
2.96
4.05
2.95
4.02
2.92
3.96
2.89
3.89
2.86
3.82
2.83
3.76
2.80
3.70
2.77
3.64

3
4.60
6.98
4.34
6.33
4.16
5.92
4.04
5.64
3.95
5.43
3.88
5.27
3.82
5.15
3.77
5.05
3.73
4.96
3.70
4.89
3.67
4.84
3.65
4.79
3.63
4.74
3.61
4.70
3.59
4.67
3.58
4.64
3.53
4.55
3.49
4.45
3.44
4.37
3.40
4.28
3.36
4.20
3.31
4.12

4
5.22
7.80
4.90
7.03
4.68
6.54
4.53
6.20
4.41
5.96
4.33
5.77
4.26
5.62
4.20
5.50
4.15
5.40
4.11
5.32
4.08
5.25
4.05
5.19
4.02
5.14
4.00
5.09
3.98
5.05
3.96
5.02
3.90
4.91
3.85
4.80
3.79
4.70
3.74
4.59
3.68
4.50
3.63
4.40

r a ) y 0 0 ( e r tas)
K niveles de K

5
5.67
8.42
5.30
7.56
5.06
7.01
4.89
6.62
4.76
6.35
4.65
6.14
4.57
5.97
4.51
5.84
4.45
5.73
4.41
5.63
4.37
5.56
4.33
5.49
4.30
5.43
4.28
5.38
4.25
5.33
4.23
5.29
4.17
5.17
4.10
5.05
4.04
4.93
3.98
4.82
3.92
4.71
3.86
4.60

6
6.03
8.91
5.63
7.97
5.36
7.37
5.17
6.96
5.02
6.66
4.91
6.43
4.82
6.25
4.75
6.10
4.69
5.98
4.64
5.88
4.59
5.80
4.56
5.72
4.52
5.66
4.49
5.60
4.47
5.55
4.45
5.51
4.37
5.37
4.30
5.24
4.23
5.11
4.16
4.99
4.10
4.87
4.03
4.76

7
6.33
9.32
5.90
8.32
5.61
7.68
5.40
7.24
5.24
6.91
5.12
6.67
5.03
6.48
4.95
6.32
4.88
6.19
4.83
6.08
4.78
5.99
4.74
5.92
4.70
5.85
4.67
5.79
4.65
5.73
4.62
5.69
4.54
5.54
4.46
5.40
4.39
5.26
4.31
5.13
4.24
5.01
4.17
4.88

8
6.58
9.67
6.12
8.61
5.82
7.94
5.60
7.47
5.43
7.13
5.30
6.87
5.20
6.67
5.12
6.51
5.05
6.37
4.99
6.26
4.94
6.16
4.90
6.08
4.86
6.01
4.82
5.94
4.79
5.89
4.77
5.84
4.68
5.69
4.60
5.54
4.52
5.39
4.44
5.25
4.36
5.12
4.29
4.99

9
6.80
9.97
6.32
8.87
6.00
8.17
5.77
7.68
5.59
7.33
5.46
7.05
5.35
6.84
5.27
6.67
5.19
6.53
5.13
6.41
5.08
6.31
5.03
6.22
4.99
6.15
4.96
6.08
4.92
6.02
4.90
5.97
4.81
5.81
4.72
5.65
4.63
5.50
4.55
5.36
4.47
5.21
4.39
5.08

10
6.99
10.24
6.49
9.10
6.16
8.37
5.92
7.86
5.74
7.49
5.60
7.21
5.49
6.99
5.39
6.81
5.32
6.67
5.25
6.54
5.20
6.44
5.15
6.35
5.11
6.27
5.07
6.20
5.04
6.14
5.01
6.09
4.92
5.92
4.82
5.76
4.73
5.60
4.65
5.45
4.56
5.30
4.47
5.16

170

APNDICE 7
Tabla de nmeros al azar
Primera serie
1
2
3
4
5

1-4
20 77
09 42
93 04
95 99
40 82

5-8
81 43
70 58
55 07
93 67
40 08

9 - 12
63 92
14 76
83 92
54 96
05 80

13 - 16
68 61
27 02
26 76
35 98
60 50

17 - 20
70 79
29 73
50 57
84 64
33 93

21 - 24
88 81
87 66
05 97
80 88
68 58

25 - 28
05 47
47 73
12 85
29 39
83 62

29 - 32
63 07
31 59
01 30
07 00
06 09

33 - 36
13 10
02 96
82 45
97 95
20 56

37 - 40
46 19
41 07
52 08
59 24
91 36

6
7
8
9
10

78
56
76
41
17

11
41
42
14
42

44
30
48
93
51

01
34
52
39
18

19
77
69
41
60

42
26
11
11
28

06
83
70
56
10

02
55
01
76
87

32
26
23
60
61

19
08
21
04
25

99
69
99
24
88

23
53
22
75
92

94
66
30
18
04

02
16
75
06
30

29
19
42
14
90

27
43
61
42
80

29
77
99
91
32

38
69
20
25
26

17
70
91
31
91

82
77
90
92
22

11
12
13
14
15

96
24
78
29
34

66
81
65
27
16

80
91
68
78
38

87
42
07
63
45

48
70
07
25
71

97
40
95
00
04

22
96
15
14
00

47
75
50
51
72

84
48
67
15
44

24
30
10
18
03

58
48
01
18
63

51
66
62
14
46

41
21
36
03
49

10
54
75
96
56

54
20
93
63
50

26
98
76
08
76

93
12
40
85
57

19
00
54
49
32

90
86
97
16
84

20
61
68
14
43

16
17
18
19
20

82
18
46
59
38

76
93
84
52
12

24
50
90
94
76

97
05
64
41
09

43
65
55
54
53

39
07
19
33
32

05
39
12
08
80

39
37
20
80
07

93
51
32
51
19

69
99
11
39
34

61
78
56
35
18

80
42
30
64
55

25
52
00
22
60

47
78
54
90
86

90
82
75
59
33

15
86
95
82
22

70
81
54
79
36

06
17
22
76
15

74
69
80
23
79

13
09
38
22
85

21
22
23
24
25

14
44
50
11
12

72
29
10
19
16

18
94
67
88
81

71
19
79
34
62

55
34
43
80
90

19
91
27
11
38

09
62
66
94
45

25
94
85
03
23

27
56
52
56
13

36
81
00
28
08

10
35
97
53
18

35
00
65
52
57

60
79
07
86
67

87
15
58
83
45

96
62
31
51
15

55
92
74
38
75

74
66
90
97
86

86
16
09
02
07

08
67
24
50
77

54
29
75
20
57

171
Segunda serie
1
2
3
4
5

1-4
83 79
27 98
75 57
60 73
27 42

5-8
21 68
04 97
42 55
07 27
15 67

9 - 12
54 51
52 48
59 91
71 94
94 44

13 - 16
23 50
19 33
72 75
68 70
48 62

17 - 20
78 17
82 16
66 75
48 81
37 53

21 - 24
73 51
00 34
39 70
40 91
83 15

25 - 28
94 71
30 67
55 24
16 24
90 90

29 - 32
91 31
58 00
09 19
45 24
60 19

33 - 36
29 97
80 80
70 22
54 03
78 62

37 - 40
13 16
92 26
42 10
18 03
44 70

6
7
8
9
10

57
22
61
24
06

27
79
94
28
75

77
42
32
53
46

75
39
42
76
13

38
32
83
13
77

18
65
81
61
68

24
83
92
73
97

32
60
40
22
05

91
74
99
50
56

53
63
00
51
73

78
56
05
75
34

91
77
66
08
86

33
47
33
10
42

38
21
61
90
22

31
88
32
71
37

95
36
10
58
75

85
43
43
22
94

11
10
15
42
87

33
19
49
46
57

87
41
25
83
72

11
12
13
14
15

83
33
63
84
36

81
66
14
43
75

98
09
10
66
92

41
91
59
38
36

67
21
10
65
76

38
26
68
72
77

97
52
27
14
89

30
57
91
55
27

12
47
00
93
06

31
14
17
78
57

87
27
36
24
37

76
75
79
57
70

81
07
01
38
36

07
84
79
10
09

32
50
65
54
99

88
96
43
53
90

42
95
13
92
66

29
12
98
41
44

94
25
52
82
91

58
01
21
56
89

16
17
18
19
20

17
57
33
80
45

23
09
49
52
29

20
57
47
82
44

39
60
96
00
64

81
40
50
02
44

03
64
21
12
70

49
00
75
67
22

79
77
68
61
10

68
31
28
43
70

20
05
12
23
26

94
83
46
14
43

45
44
25
53
49

95
96
72
10
28

92
62
64
66
51

63
56
50
16
69

06
42
72
29
52

55
42
75
06
85

29
68
16
60
95

20
46
67
23
98

82
42
00
20
58

21
22
23
24
25

16
81
20
43
27

04
09
61
17
84

54
97
83
00
00

67
91
96
05
90

60
19
58
86
41

53
60
12
39
44

51
91
64
95
05

60
96
99
58
43

82
53
78
12
36

45
66
24
35
93

56
45
94
84
01

26
33
36
31
37

08
75
99
97
91

89
09
60
75
93

42
67
07
50
24

25
42
70
52
78

93
59
27
06
00

76
02
40
88
12

69
18
97
27
04

73
97
15
79
12

172
Tercera serie
1
2
3
4
5

1-4
35 87
16 58
44 20
36 04
92 15

5-8
68 11
21 36
51 20
26 10
17 81

9 - 12
29 27
34 35
95 87
46 13
81 67

13 - 16
78 34
92 56
87 37
47 92
17 00

17 - 20
74 92
72 85
37 05
34 02
76 64

21 - 24
86 13
03 91
06 43
53 54
77 34

25 - 28
33 22
31 33
61 75
97 57
20 18

29 - 32
34 75
26 62
51 99
24 18
88 01

33 - 36
59 44
08 30
52 03
37 62
88 31

37 - 40
61 63
95 09
23 29
98 35
18 40

6
7
8
9
10

29
19
14
02
31

12
37
92
19
18

08
78
75
07
25

74
71
64
98
46

26
07
31
20
66

94
12
51
98
31

48
90
00
21
15

03
53
20
10
27

85
13
86
69
09

60
34
47
15
80

23
19
07
39
13

69
49
04
55
44

65
81
40
80
72

52
36
26
23
58

53
85
57
80
42

18
96
62
26
93

26
19
34
63
71

72
81
95
33
72

47
68
57
81
69

62
65
17
26
17

11
12
13
14
15

51
11
93
19
26

96
78
10
32
84

70
29
34
42
50

26
90
79
52
36

99
66
41
58
62

94
21
18
31
73

81
63
07
29
35

55
60
79
38
95

72
39
30
39
56

29
87
84
31
00

57
77
77
00
76

37
34
27
68
61

29
55
07
71
16

36
26
40
25
40

99
56
54
28
08

55
94
24
05
80

35
74
90
27
71

99
43
96
55
87

22
71
43
56
20

79
04
63
18
48

16
17
18
19
20

05
45
71
47
33

50
14
44
46
95

36
18
13
52
58

40
03
65
39
94

59
19
14
25
59

22
34
74
41
65

90
32
67
96
09

33
93
80
96
99

76
93
11
98
47

82
37
11
22
45

58
97
01
11
70

66
11
90
51
06

30
37
47
90
60

65
04
58
91
66

68
64
36
82
75

23
62
86
16
22

38
60
13
96
43

98
53
68
43
93

39
86
85
11
79

92
33
64
05
62

21
22
23
24
25

28
33
85
04
47

74
68
38
29
20

81
25
32
07
21

01
37
52
21
03

28
96
85
28
47

31
38
14
33
88

47
70
64
85
47

96
64
87
69
25

55
36
82
93
51

75
19
11
51
49

26
60
85
57
70

61
48
11
30
21

48
71
19
02
07

51
41
29
14
71

10
05
80
58
07

20
53
35
12
03

50
77
09
84
08

43
56
99
34
69

83
81
54
30
69

28
78
23
71
35

173
Cuarta serie
1
2
3
4
5

1-4
72 43
34 71
94 75
28 97
75 89

5-8
49 72
89 58
59 95
88 17
87 84

9 - 12
61 99
13 15
98 99
22 80
83 13

13 - 16
36 48
56 47
88 03
49 80
56 59

17 - 20
80 20
41 24
83 67
81 22
46 28

21 - 24
10 31
57 70
75 75
07 83
26 11

25 - 28
66 31
96 69
92 73
41 63
62 28

29 - 32
84 83
59 17
56 60
15 27
81 61

33 - 36
87 39
28 25
91 80
25 72
42 86

37 - 40
93 25
55 05
59 53
00 01
35 50

6
7
8
9
10

77
46
53
55
38

44
06
46
23
44

16
66
28
44
74

92
76
21
40
56

59
61
43
08
06

93
89
74
34
24

41
59
40
48
85

27
75
07
33
13

08
61
15
12
22

86
68
60
12
04

09
68
52
28
07

45
50
15
12
70

47
47
39
69
00

43
98
94
81
18

35
47
67
14
43

19
21
29
58
99

66
84
90
25
03

71
05
83
01
53

81
52
08
00
77

08
95
61
13
98

11
12
13
14
15

08
34
19
39
38

12
27
98
05
96

50
77
90
72
83

56
14
19
32
88

81
64
27
69
05

86
22
12
87
76

61
20
80
95
23

59
77
34
50
20

77
22
87
82
09

00
41
97
76
33

11
50
73
50
08

71
92
09
79
02

00
51
98
82
10

47
67
80
18
74

29
70
66
72
93

62
54
74
77
22

68
14
77
88
09

87
26
59
60
75

25
54
11
92
83

30
47
54
11
23

16
17
18
19
20

72
86
14
24
92

94
61
78
17
52

21
52
87
92
08

37
23
24
19
30

57
80
89
81
47

90
46
77
85
44

48
97
62
71
31

48
81
94
91
36

43
15
19
02
80

96
83
26
41
12

66
88
16
45
73

75
88
08
08
65

33
71
78
44
98

08
98
08
99
06

09
73
97
72
15

65
73
24
36
69

62
43
19
84
59

00
63
03
23
18

94
93
47
59
38

38
74
46
51
58

21
22
23
24
25

94
47
76
90
44

47
21
89
93
93

16
92
16
86
41

55
90
29
13
83

89
36
20
61
33

88
20
24
32
43

64
85
00
15
31

29
34
47
62
74

02
96
33
99
85

59
73
89
30
47

48
11
74
63
44

90
69
11
47
45

06
71
59
88
91

90
36
62
87
36

57
65
84
86
40

14
16
53
12
48

65
49
03
59
56

55
89
14
30
84

75
41
74
69
10

97
78
77
44
09

174

BIBLIOGRAFA
1. Aron, A., Aron E. (2001). Estadstica para Psicologa. Buenos Aires: Pearson Education, S.A.
2. Cohen, R., Swerdlik, M. (2001). Pruebas y Evaluacin Psicolgica. Mxico: McGrawHill/Interamericana de Mxico, S.A.
3. Chow, Ya-Lun (1977). Anlisis Estadstico. Mxico: Nueva Editorial Interamericana, S.A.
4. Daniel, Wayne (1995). Estadsticas con Aplicaciones a las Ciencias Sociales y a la Educacin.
Mxico: McGraw-Hill/Interamericana de Mxico, S.A.
5. Hopkins K., Hopkins, B.R., Glass, Gene (1997). Estadsticas Bsica par a las Ciencias
Sociales y del Comportamiento. 3. Edicin. Mxico: Pearson Education
6. Kerlinger, F., Lee,H. (2002) Investigacin del Comportamiento. Mtodos de Investigacin en
Ciencias Sociales. Mxico: McGraw-Hill/Interamericana de Mxico, S.A.
7. Pagano, Robert (2006). Estadsticas para las Ciencias del Comportamiento. 7. Edicin.
Mxico: Editorial Thompson.
8. Pagano, Robert (2001). Bioestadsticas. Mxico: Editorial Thompson.
9. Prez, Csar (2002). Estadstica aplicada a travs de Excel. Mxico: Pearson Education, S.A.
10. Ritchey, Ferris (2008). Estadsticas para las Ciencias Sociales. 2. Edicin. Mxico: McGrawHill/Interamericana de Mxico, S.A.
11. Triola, Mario (2004). Estadstica. 9. Edicin. Mxico: Pearson Education.
12. Walpole,R, Myers, R. (1992). Probabilidad y Estadstica. Mxico: Editorial McGrawHill/Interamericana de Mxico, S.A.

You might also like