Professional Documents
Culture Documents
2 R.C.
2
1
ESTADSTICA APLICADA A LA
EDUCACIN
PREPARADO POR:
Derechos Reservados:
Diagramacin y Composicin:
Vladimiro Ibaez Quispe
Estadstica Aplicada a la Educacin -3-
PRESENTACION
El Autor
Abril, 2007
-4- V. Ibaez Q.
Estadstica Aplicada a la Educacin -5-
INDICE
Pg.
Presentacin .................................................................................... 03
Indice .............................................................................................. 05
CAPITULO 1: CONCEPTOS BSICOS DE ESTADSTICA ........... 07
1.1. Clasificacin de la Estadsticas............................................ 08
1.2. Poblacin y Muestra ............................................................ 09
1.3. Parmetro y Estadgrafo ...................................................... 11
CAPITULO 2: PROC. Y MTODOS DE RECOLECCIN DE DATOS . 13
2.1. Fuentes de Informacin ....................................................... 13
2.2. Sistema de recoleccin ........................................................ 15
2.3. Tcnica de recoleccin ........................................................ 15
2.4. Tipos de datos ..................................................................... 20
CAPITULO 3: ETAPA DE ELABORACIN DE DATOS ...................... 25
3.1. Revisin y correccin de la informacin recogida ................ 25
3.2. Tablas de distribucin de frecuencias .................................. 26
Ejercicios propuestos ........................................................... 44
CAPITULO 4: ETAPA DE PRESENTACIN DE DATOS ..................... 47
4.1. Representacin tabular ........................................................ 47
4.1.1. Cuadros estadsticos .................................................. 47
4.1.2. Partes de un cuadro estadstico ................................... 47
4.1.3. Tipos de tablas estadsticas ........................................ 50
4.2. Representacin grfica ........................................................ 55
CAPITULO 5: ESTADGRAFOS DE POSICIN .................................. 77
5.1. Introduccin ........................................................................ 77
5.2. Medidas o estadgrafos de tendencia central ......................... 78
5.3. Medidas de posicin o cuantiles ........................................... 111
Ejercicios Propuestos ................................................................ 131
CAPITULO 6: ESTADGRAFOS DE DISPERSIN.............................. 133
6.1. Introduccin ............................................................................ 133
6.2. Recorrido o rango (R) .............................................................. 133
6.3. Recorrido intercuartlico (RI) .................................................... 134
6.4. Recorrido interdecil (RID) ........................................................ 136
6.5. El rango semi-intercuartil (Q) ................................................... 136
-6- V. Ibaez Q.
Pg.
6.6. La desviacin media (DM) ........................................................ 136
6.7. Desviacin mediana absoluta (DMe) ......................................... 139
6.8. La varianza .............................................................................. 141
6.9 Desviacin estndar o desviacin tpica ................................... 146
6.10 Error estndar (E.S.) ............................................................... 149
6.11 Correccin Sheppard ............................................................... 151
6.12 Medidas de dispersin relativa ................................................ 151
6.13 Coeficiente de variacin (CV) .................................................. 153
6.14 Estadgrafos de deformacin .................................................... 155
6.15 Estadgrafos de Apuntamiento o Kurtosis ................................ 162
Ejercicios propuestos 6 ............................................................. 165
CAPITULO 7: PROBABILIDADES...................................................... 167
7.1. Experimento aleatorio................................................................. 167
7.2. Conceptos de probabilidad.......................................................... 168
7.3. Teoremas................................................................................... 174
CAPITULO 8: DISTRIBUCIN DE LA PROBABILIDAD...................... 185
8.1. Distribucin Bernoull................................................................ 186
8.2. Distribucin Binomial................................................................ 187
8.3. Distribucin de Poisson.............................................................. 191
8.4. Distribucin normal................................................................... 195
8.5. Distribucin Ji-cuadrado............................................................ 203
8.6. Distribucin t-Student................................................................ 206
8.6. Distribucin t-Student................................................................ 206
8.7. Distribucin F........................................................................... 208
CAPITULO 9: INFERENCIA ESTADSTICA....................................... 215
9.1. Estimacin................................................................................ 215
9.2....9.11 Intervalos confidenciales................................................. 218
CAPITULO 10: PRUEBA DE HIPTESIS............................................ 251
10.1. Hiptesis estadsticas................................................................ 251
10.2. Hiptesis Nula y Alternativa..................................................... 252
10.3. Procedimiento de la prueba de hiptesis - 10.12....................... 256
CAPITULO 11: ANLISIS DE REGRESIN......................................... 307
CAPITULO 12: DISEOS EXPERIMENTALES................................... 335
CAPITULO 13: EXPERIMENTOS FACTORIALES.............................. 349
CAPITULO 14: PRUEBA NO PARAMTRICAS.................................. 367
BIBLIOGRAFA CITADA .............................................................. 409
Estadstica Aplicada a la Educacin -7-
1
CONCEPTOS BSICOS DE
ESTADSTICA
Qu es Estadstica?. La estadstica es una ciencia que nos proporciona un con-
junto de mtodos y procedimientos para recoleccin, clasificacin (organizacin),
anlisis e interpretacin del comportamiento de los datos para tomar decisiones con
respecto a una caracterstica materia de estudio o investigacin.
La estadstica es parte del mtodo cientfico y se define como un conjunto de
tcnicas usadas para recopilar, organizar, presentar, analizar e interpretar datos, con
el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fen-
menos en estudio.
El trmino estadstica tambin se emplea para designar un rea de estudio,
una disciplina. Por ejemplo, cuando se emplea esta palabra en el ttulo de un libro o
cuando nos referimos a los cursos de estadstica de la currcula de una profesin, etc.
Etimologa. La etimologa de la palabra estadstica no tiene un origen claro, por
lo que hay varias teoras; unos dicen que proviene del griego STATERA que quiere
decir balanza, otros del griego STATIZEIN que significa comprobar, otros del latn
STATUS que indica situacin y otros del alemn STAAT que quiere decir estado
poltico.
Tablas
Grficas
POBLACIN
Estimacin
muestreo
Inferencial
muestra
1 2 3 4 5 6 7 8 9
Compilacin Reglas Organizacin Sistematizac. Anlisis Interpretacin Decisin Conclusin Inferencia a
de datos Normas de datos de datos X, s,r de Resultados Buena slida Poblacin
Mu
n
est
i
ra
ac
bl
Po
Inferencia
Estadstica
estadstica
descriptiva
Error
Probabilidades
- 10 - V. Ibaez Q.
Ejemplos:
- La poblacin humana infectadas con SIDA.
- Los ciudadanos de un pas en edad de votar en las elecciones.
- Poblacin de puntajes de rendimiento en la lectura de todos los alumnos del
primer nivel del sistema universitario.
- Poblacin de todos los posibles resultados de cara y sello que se obtienen al
arrojar una moneda un nmero indefinido de veces.
- La poblacin de estudiantes de la UNA-Puno.
Poblacin Finita.- Una poblacin finita es aquella que tiene un nmero limitado
de elementos.
Ejemplo:
- Todo los pacientes atendido con cncer en el ao 2004 en el HRMNB-Puno.
- Las estaturas de todos los estudiantes que actualmente estudian en las Universi-
dades del Per.
- Alumnos matriculados enl a Universidad Nacional del Altiplano - Puno.
- Todas las personas que compran telfono celular.
Ejemplo:
- Calidad de todas las unidades producida mediante un proceso manufacturero.
- Los peces del Lago Titicaca.
- El nmero de peces en un ro.
- El nmero de granos de arroz recolectados en una regin.
- Los gases, los lquidos y algunos slidos, tales como talco, puesto que las unida-
des no pueden identificarse ni contarse.
- (Media poblacional).
- 2 (Varianza poblacional).
- P (Proporcin poblacional).
- x (Media muestral)
- s (Varianza muestral).
2
- p$ (proporcin muestral)
- 12 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 13 -
2
PROCEDIMIENTOS Y
MTODOS DE
RECOLECCIN DE DATOS
Ejemplo:
Este tipo de informacin se puede encontrar en los informes estadsticos
de las Instituciones Pblicas y Privadas. En el Per, el Instituto Nacional
de Estadstica e Informtica (INEI), publica boletines estadsticos con
respecto a la produccin, inversin, poblacin, migracin, salud. sta
institucin se encarga de formular y desarrollar el sistema Estadstico
Nacional; adems levanta los censos nacionales de poblacin y vivienda
cada 10 aos y los censos econmicos cada 10 aos, etc. Otras publica-
ciones pueden ser la Tesis, Anuarios, Series de Compendios, Revistas,
Folletos, etc.
2.2.1. Registros.
Mediante los registros se anotan los datos en forma regular, permanente
y obligatoria, obteniendo la informacin total y sistemtica de los hechos ocurridos.
Ejemplo:
- Registro de contribuyentes.
- Registro Electoral.
- Registro Civil, etc.
2.2.1. Encuestas.
Es la recoleccin de datos en forma temporal (a travs de una muestra) y
puede ser:
- Observacin.
- La tcnica documental.
- Entrevista.
- El cuestionario.
- Preparacin del cuestionario y formulario.
- 16 - V. Ibaez Q.
2.3.1. Observacin.
Tipos de observacin:
a) Segn el lugar o mbito donde se encuentran los datos, se tienen:
- Observacin documental, cuando los datos son recogidos en ma-
nuscritos o impresos.
- Observacin de campo, que puede ser observacin de monumen-
tos de campo y observacin de conductas.
2.3.3. Entrevista.
La entrevista es una situacin de interrelacin o dilogo entre perso-
nas es una tcnica donde una persona llamada entrevistador, encuestador o
empadronador solicita al entrevistado, le proporciona algunos datos o informacin.
La entrevista es un dilogo intencionado entre personas. El xito de la entrevista
como tcnica de recoleccin, depende de la eficiencia del trabajo del entrevistador.
2.3.4. El cuestioanrio.
El cuestionario es un instrumento constitudo por un conjunto de pre-
guntas sistemticamente elaboradas, que se formulan al encuestado o entrevistado,
con el propsito de obtener los datos de las variables consideradas en el estudio.
Cuando las preguntas se organian y se imprimen, se obtiene el formulario o cdula,
que es el instrumento que se utiliza para registrar las respuestas o datos.
- 18 - V. Ibaez Q.
La elaboracin del cuestionario requiere de un conocimiento previo
del fenmeno, tener precisado cules son las unidades de anlisis y qu aspectos
interesa estudiar. El cuestionario debe ser adaptado a las necesidades de la investiga-
cin y a las caractersticas del grupo que se estudia, su estructura y su forma deben
estar cuidadosamente elaboradas, la redaccin de las preguntas requiere de una ex-
periencia y para comprobar su comprensin, es recomendable someter a prueba todo
tipo de cuestionario.
Ejemplo:
Ejemplo: Las horas extras trabajadas por los trabajadores de la UNA y los valo-
res de esta variable vendran dadas por las diferentes horas trabajados por cada traba-
jador fuera de la jornada normal: ninguna, una, dos, tres, .....,. Las variables se deno-
tan por X, Y, etc.
A. Variable Cualitativa.
Expresan una cualidad, caracterstica, atributo o condicin social.
Es decir, son variables cuyos valores son cualidades que presenta la poblacin o son
aquellas cuyo dominio de variacin son objeto de clasificacin. Las variables cualita-
tivas se clasifican en: 1) Nominales y 2) Ordinales.
Ejemplos:
- Color de cabello: Negro, Castao, pelirrojo, rubio.
- Color de ojos: Marrn, gris, verde, azul.
- Estado civil: soltero, casado, viudo, divorciado.
- Partidos polticos: Conservador, liberal, independiente y so-
cialista.
- En el sexo: Masculino y Femenino.
B. Variables cuantitativas.
Es aquella variable que est asociada a una caracterstica cuantitati-
va. Se obtienen como resultado de mediciones y conteos.
Nominal (cualidad)
Variable
cualitativa
Ordinal (categorizar)
TIPOS DE DATOS
Discreta (conteo)
Variable
cuantitativa
Contnuas (intervalo)
A. Variables Nominales.
Son aquellas que establecen dos o ms categoras que no guardan solu-
cin entre ellas.
Ejemplo: - Sexo: Masculino, femenino
- Estado civil: Soltero, Casado, Viudo, Divorciado.
- Ocupacin: Profesor, Enfermera, Artesano, etc.
- Lugar de nacimiento: Puno, Juliaca, Arequipa, etc.
- Raza de los seres humanos: Blanca, Negra, Amarilla.
B. Variables Ordinales.
C. Variables de Intervalos.
Ejemplo:
- Cociente de inteligencia.
- Puntuacin en una escala de calificacin,
- Temperatura, presin arterial, etc.
Ejemplo:
- Pesos, estatura, produccin anual, cantidad de accidentes, tiempo de
reaccin mental
Escala de
Medicin:
NOMINAL
CUALITATIVAS
ORDINALES
ORDINAL
VARIABLES
INTERVALO
CUANTITATIVAS:
- Discretas
- Contnuas
RAZN O
PROPORCIN
- 24 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 25 -
3
ETAPA DE ELABORACIN
DE DATOS
Una vez recogida la informacin, es necesario revisarla cuidadosamente y luego
resumirla y presentarla convenientemente. En esta etapa de organizacin, se consi-
deran tres pasos siguientes:
- Revisin y correccin de la informacin recogida.
- Presentacin de la informacin en tablas de frecuencias.
1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ...,
Xmx.
2. Determinacin del rango (R). Se observa, cul es el valor ms alto
(Xmx) que se llamar lmite superior y el valor ms bajo (Xmn), se le
llamar lmite inferior.
El rango est dado por la diferencia del Xmx menos el Xmn.
R = Xmx - Xmn
3. Encontrar el nmero aproximado de intervalos (NC), para esto exis-
ten varios criterios. No hay una frmula exacta para calcular el n-
mero de intervalos de clase. Este nmero es determinado por tenta-
tivas y aproximaciones. Entre ms datos se tengan, ms intervalos
de clase deben considerarse, aqu presentamos algunos criterios:
i. Tomar un nmero arbitrario que sea mayor o igual a 5, y menor o
igual a 16.
5 NC 16
ii. Mtodo muy utilizado es la regla de Sturges: K = 1+3.3Log10(n),
n 10 .
iii. Un procedimiento, no muy recomendado, es calculando cuando
K = 5, si n < 25 y K = n , si n >25.
iv. En la prctica se determina NC atendiendo a varios factores
tales como: finalidad del estudio, grado de variabilidad de los
datos, necesidad de efectuar comparaciones con otros estudios
para mantener intervalos y su nmero.
4. Encontrar la amplitud de clase o intervalo de clase (C), para esto
divdase el rango de las observaciones entre el nmero de intervalos
de clase, esto es:
R
C=
NC
Estadstica Aplicada a la Educacin - 27 -
5. Determinar el nuevo Rango: R = KxC R = NCxC, donde R debe
ser mayor al rango encontrado de las observaciones.
6. Hallar la diferencia de Rangos: x = R ' - R
7. Clculo de lmites de clase (se encontrar el lmite inferior de la
primera clase del intervalo y el lmite superior del ltimo intervalo
de clase).
x
LCI = X mn (redondear al valor inmediato superior, an
2
cuando la parte decimal sea menor a 5).
x
LCS = X mx +
2
8. Una vez que se tiene los nuevos lmites, se comienza a construir la
tabla de la distribucin de frecuencias por intervalos de clase, te-
niendo en cuenta que los valores sean mutuamente excluyentes.
Las diferentes tablas de frecuencias que se pueden confeccionar para
un conjunto de datos contnuos est dada en la siguiente tabla.
* * *
Y'i-1 - Y'i ni Ni Yi hi Hi hix100 Hix100 N i H i 100xH i
*
Y'0 - Y'1 n1 N1 Y1 h1 H1 h1x100 H1x100 N 1 1 100
* * *
Y'1- Y'2 n2 N2 Y2 h2 H2 h2x100 H2x100 N 2 H 1 100xH 1
* * *
Y'2 - Y'3 n3 N3 Y3 h3 H3 h3x100 H3x100 N 3 H 2 100xH 2
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
* * *
Y'm-1 - Y'm nm n Ym hm 1 100xhm 100 N m H m 100xH m
Totales n 1 100
EJEMPLO:
SOLUCIN:
1. Ordenar los datos en forma ascendente.
2. Determinacin del rango (R): R = Xmx - Xmn = 97-41 = 56
3. Encontrar el nmero aproximado de intervalos (NC), usaremos la frmula
de Sturges:
K = 1+3.3Log10(n) = 1 + 3.3Log(50) = 6.6 ~ 7
4. Encontrar la amplitud de clase o intervalo de clase (C):
R 56
C= = =8
NC 7
5. Determinar el nuevo Rango: R = KxC=8x7 = 56
6. Hallar la diferencia de Rangos: x = R - R = 56 - 56 = 0
7. Clculo de lmites de clase:
x 0
L C I = X m n = 41 = 41
2 2
x 0
L C S = X mx += 97 + = 97
2 2
8. Asignar cada dato obtenido al intervalo de clase correspondiente.
Calificativos
Y'i-1 - Y'i Conteo o Paloteo ni
41 - 49 47 41 43 46 46 5
49 - 57 50 50 53 3
57 - 65 58 64 59 60 64 61 6
65 - 73 67 69 65 67 71 70 70 69 70 9
73 - 81 76 76 78 75 76 78 77 74 75 80 74 73 12
81 - 89 87 84 81 87 81 88 84 83 85 9
89 - 97 92 92 90 91 89 97 6
Total 50
Estadstica Aplicada a la Educacin - 29 -
Completando la tabla de distribucin de frecuencias se tiene:
* * *
[Y'i-1 - Y'i> ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
41 - 49 5 5 45 0.10 0.10 10 10 50 1.00 100
49 - 57 3 8 53 0.06 0.16 6 16 45 0.90 90
57 - 65 6 14 61 0.12 0.28 12 28 42 0.84 84
65 - 73 9 23 69 0.18 0.46 18 46 36 0.72 72
73 - 81 12 35 77 0.24 0.7 24 70 27 0.54 54
81 - 89 9 44 85 0.18 0.88 18 88 15 0.30 30
89 - 97 6 50 93 0.12 1 12 100 6 0.12 12
Totales 50 1 100
INTERPRETACIN:
n1 = 5 alumnos tienen calificativos mayor o igual a 41 puntos y menores a 49
puntos en el curso de matemticas.
n5 = 12 alumnos tienen calificativos mayor o igual a 73 y menores a 81 puntos,
respectivamente, en el curso de matemticas.
n2 = 3 alumnos que tienen calificativos mayor o igual a 49 y menores a 57 puntos
en el curso de matemticas.
h5x100 = 24%, es el porcentaje de alumnos que tienen calificativos de 73 o ms
pero menos de 81 puntos, son altos en el en el curso de matemticas.
h4 = 0.18, es la proporcin de alumnos que presentan puntajes comprendido entre
65 o ms pero menos de 73 puntos.
N*5 = 27, es el nmero de alumnos que presentan puntajes por lo menos 73 pun-
tos.
H6 = 0.88, es la proporcin de alumnos que presentan puntajes menos de 89
puntos.
H*3 = 0.84, es la proporcin de alumnos que presentan puntajes por lo menos de
57 puntos.
1. CLASE.- Se llama clase a cada uno de los intervalos de clase o grupos de datos
en las que se distribuye el total de observaciones.
Xmx = mx{X/i = 1,2,3, ..., n}
- 30 - V. Ibaez Q.
Xmn = mn{X/i = 1,2,3, ..., n}
Ejemplo:
N1 = n1 = 5, es el nmero de personas con calificativos menores a 49 puntos.
N2 = n1 + n2 = 5 + 8 = 8
N3 = n1 + n2 + n3 = 5 + 3 +6 = 14
N4 = n1 + n2 + n3 + n4= 5 + 3 + 6 + 9 = 23
N5 = n1 + n2 + n3 + n4 + n5 = 5 + 3 + 6 + 9 + 12 = 35
N6 = n1 + n2 + n3 + n4 + n5 + n6 = 5 + 3 + 6 + 9 + 12 + 9 = 44
N7 = n1 + n2 + n3 + n4 + n5 + n6 + n7 = 5 + 3 + 6 + 9 + 12 + 9 + 6 = 50
N8 = n = 50
Ejemplo:
n1 5
h1 = = = 0 .1 , prop. de muestras de personas que tienen puntajes 49.
n 50
n2 3
h2 = = = 0.06
n 50
n3 6
h3 = = = 0.12
n 50
.... = .... = ...... = ......
n7 6
h7 = = = 0.12
n 50
Ejemplo:
H1 = 0.10
H2 = h1 + h2 = 0.10 + 0.06 = 0.16
H3 = h1 + h2 + h3 = 0.10 + 0.06 + 0.12 = 0.28
H4 = h1 + h2 + h3 + h4= 0.10 + 0.06 + 0.12 + 0.18 = 0.46
H5 = h1 + h2 + h3 + h4 + h5=0.10 + 0.06 + 0.12 + 0.18 + 0.24 = 0.70
H6 = h1 + h2 + h3 + h4 + h5 + h6 = 0.10 + 0.06 + 0.12 + 0.18 + 0.24 + 0.18= 0.88
H7 = h1+h2+h3+h4+h5+h6+h7 = 0.10+0.06+0.12+0.18+0.24+0.18+0.12 = 1.00
Ejemplo:
N*1 = n1 + n2 + n3 + n4 + n5 + n6 + n7 = n = 50
N*2 = n2 + n3 + n4 + n5 + n6 + n7 = 3 + 6 + 9 +12 + 9 + 6 = 45
N*3 = n3 + n4 + n5 + n6 + n7 = 6 + 9 +12 + 9 + 6 = 42
N*4 = n4 + n5 + n6 + n7 = 9 + 12 + 9 + 6 = 36
N*5 = n5 + n6 + n7 = 12 + 9 + 6 = 27
N*6 = n6 + n7 = 9 + 6 = 15
N*7 = n7 = 6 = 6
Ejemplo:
H*1 = h1 + h2 + h3 + h4 + h5 + h6 + h7 = 1.00
H*2 = h2+h3+h4+h5+h6+h7 = 0.06+0.12+0.18+0.24+0.18+0.12 = 0.90
Estadstica Aplicada a la Educacin - 33 -
H*3 = h3 + h4 + h5 + h6 + h7 = 0.12+0.18+0.24+0.18+0.12 = 0.84
H*4 = h4 + h5 + h6 + h7 = 0.18+0.24+0.18+0.12 = 0.72
H*5 = h5 + h6 + h7 = 0.24+0.18+0.12 = 0.54
H*6 = h6 + h7 = 0.18+0.12 = 0.3
H*7 = h7 = 0.12 = 0.12
PROCEDIMIENTO.
1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn+ 1 (para intervalos de
clase no traslapados).
3. Determinacin del nmero de intervalos de clase (NC): Utilizando la regla
de Sturges: K = 1+3.3Log10(n), n 10 .
4. Encontrar la amplitud de clase o intervalo de clase (C), para esto divdase
el rango de las observaciones entre el nmero de intervalos de clase, esto
es:
R
C=
NC
5. Determinar el nuevo Rango: R = KxC R = NCxC, donde R ' R .
6. Hallar la diferencia de Rangos: x = R ' - R
7. Determinacin de los lmites de clase:
x x
LCI = X mn , LCS = X mx +
2 2
NOTA: Agregar C - 1 para obtener el lmite superior de clase, para usar
intervalos no traslapados y se aaden los dems intervalos. Para
formar el primer intervalo de clase, se toma el valor mnimo de la
distribucin (LCI) y a ella le sumamos C-1, entonces LCS1.
SOLUCION:
1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn+ 1= 132 - 40 + 1 = 93 (+1
por ser discreta).
3. Determinacin del nmero de intervalos de clase (NC): Por Sturges
K = 1+3.3Log10(n) = 1 + 3.3Log(40) = 6.29 ~ K = 6
Observacin:
In t. D e c la s e Va lo re s q u e c a e n d e n t ro d e l in te rv a lo ni
39 - 54 40, 52, 54 3
55 - 70 57, 56, 60, 64, 67 5
71 - 86 80, 76, 77, 83, 82, 84, 73, 77, 74, 76, 82, 76, 78 13
87 - 102 94, 92, 88, 87, 96, 102, 100, 93, 96 9
103 - 118 106, 118, 103, 118, 108, 113, 118 7
119 - 134 128, 132, 120 3
T o ta le s 40
* * *
Int. De clase ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
39 - 54 3 3 46.5 0.075 0.075 7.5 7.5 40 1.000 100
55 - 70 5 8 62.5 0.125 0.200 12.5 20.0 37 0.925 92.5
71 - 86 13 21 78.5 0.325 0.525 32.5 52.5 32 0.800 80.0
87 - 102 9 30 94.5 0.225 0.750 22.5 75.0 19 0.475 47.5
103 - 118 7 37 110.5 0.175 0.925 17.5 92.5 10 0.250 25.0
119 - 134 3 40 126.5 0.075 1.000 7.5 100 3 0.075 7.5
Totales 40 1.000 100
- 36 - V. Ibaez Q.
INTERPRETACIN:
1. Ordenar los datos en forma ascendente o descendente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn = 132 - 40 = 92
3. Determinacin del nmero de intervalos de clase (NC), por Sturges es:
K = 1+3.3Log10(n) = 1 + 3.3Log(40) = 6.29 ~ K = 6
4. Encontrar la amplitud de clase o intervalo de clase (C):
R 92
C= = = 15.33 16
K 6
5. Determinacin del nuevo Rango: R = KxC = 6x16 = 96.
6. Clculo del nmero de rango: x = R - R = 96 - 92 = 4, donde R ' R .
Entonces:
2 ( S e l e r e s t a a l Xmn , e s t o e s : 4 0 - 2 = 3 8
x = 4
2 (Se le suma al X mx, esto es: 132 + 2 = 134
OBSERVACIN:
Ejemplo:
2 (Se le resta al primer dato).
x = 4
2 (Se le suma al ltimo dato)
Estadstica Aplicada a la Educacin - 37 -
b) Si la diferencia es un nmero impar, se reparte en dos nmeros consecuti-
vos el menor para el primer dato y el mayor para el ltimo dato.
Ejemplo:
1 (Se le resta al primer dato).
x = 3
2 (Se le suma al ltimo dato)
* * *
Int. De clase ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
38 - 54 2 2 46 0.050 0.050 5.0 5.0 40 1.000 100
54 - 70 6 8 62 0.150 0.200 15.0 20.0 38 0.950 95.0
70 - 86 13 21 78 0.325 0.525 32.5 52.5 32 0.800 80.0
86 - 102 9 30 94 0.225 0.750 22.5 75.0 19 0.475 47.5
102 - 118 6 36 110 0.150 0.900 15.0 90.0 10 0.250 25.0
118 - 134 4 40 126 0.100 1.000 10.0 100 4 0.100 10.0
Totales 40 1.000 100
* * *
Valores de Yi ni Ni hi Hi hix100 Hix100 N i H i 100xH i
* * *
Y1 n1 N1 h1 H1 h1x100 H1x100 N 1 H 1 100xH 1
* * *
Y2 n2 N2 h2 H2 h2x100 H2x100 N 2 H 2 100xH 2
* * *
Y3 n3 N3 h3 H3 h3x100 H3x100 N3 H3100xH 3
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
* * *
Ym nm Nm hm Hm 100xhm Hmx100 N m H m 100xH m
m m
Totales n = ni h =1 i 100
i=1 i=1
Donde:
Yi = Son los valores de la variable.
ni = Son frecuencias absolutas.
Ni = Son frecuencias absolutas acumuladas (o menor que).
hi = Son frecuencias relativas.
Hi = Son frecuencias absolutas acumuladas.
Ni* = Frecuencia absoluta acumulada mayor que.
Hi* = Frecuencia relativa acumulada mayor que.
100xhi = Frecuencia relativa porcentual.
100xHi = Frecuencia relativa acumulada porcentual.
100xHi* = Frecuencia relativa acumulada porcentual.
EJEMPLO:
Construya una tabla de frecuencias para los datos que corresponden a 42 pacien-
tes con infeccin dentaria; registrndose el nmero de extracciones o curaciones
durante el ao 2000 en el Hospital Regional Manuel Nuez Butrn - Puno.
Nmero de pacientes
9 8 7 2 3 9 0 9 2 4 5 7 8 1
6 4 3 4 0 1 6 3 9 1 7 2 2 6 n = 42
4 2 8 2 2 4 5 6 1 3 3 3 7 4
Estadstica Aplicada a la Educacin - 39 -
SOLUCION:
INTERPRETACIN:
n3 = 7, significa que en 7 pacientes hay 2 para extraccin.
N5 = 25, significa que en 25 pacientes, hay 0,1,2,3, y 4 para curaciones o extrac-
cin en el HRMNB-Puno.
h4 = 0.14, significa la proporcin de pacientes en la muestra que tiene 3 extrac-
ciones, la cual expresado en porcentaje es 14%.
h5x100 = 14%, porcentaje de pacientes con 4 extracciones.
100xH7 = 75%, es el porcentaje de pacientes en la muestra, por lo menos 6 extrac-
ciones.
N1* = 42, significa que en la encuesta hay 0 y 9 curaciones o extracciones de
dientes en HRMNB-Puno.
N2* = 40, significa que en la encuesta hay 40 pacientes que tienen por lo menos 1
extraccin.
n i 0, N i 0 y N *i 0 para i = 1,2,...., m
2) La suma de todas las frecuencias absolutas es igual al nmero total del conjun-
to de observaciones.
m
n
i =1
i = n1 + n 2 +L+ n m = n
3) Las frecuencias relativas (hi) y las frecuencias relativas acumuladas (Hi) son
siempre nmeros fraccionarios no negativos, no mayores que uno.
0 h i 1, 0 H i 1 y 0 H *i 1 para i = 1, 2, ...., m
4) La frecuencia absoluta acumulada menor que correspondiente al valor Xm co-
incide con el nmerto total del conjunto de observaciones.
m
N m = n i = n.
i =1
5) La frecuencia absoluta acumulada mayor que correspondiente al valor X1 coin-
cide con el nmero total del conjunto de datos.
m
N = n i = n.
*
1
i =1
6) La frecuencia relativa acumulada menor que correspondiente al valor Xm co-
incide con la unidad.
m
H m =
i=1
hi = 1
EJEMPLO:
SOLUCION:
DESVENTAJAS:
1. Los resultados obtenidos por una clase en el desarrollo del test de Raven, fueron:
37 39 32 12 28 45 30 11 38 41 37 32 39 29 12 17 20 39 18 35 33 22 41
32 21 37 37 10 42 18 42 47 23 19 45 32 36 10 40 38 21 29 44 21 35 36
a) Elaborar una tabla de distribucin de frecuencias.
b) Construir el polgono de frecuencias.
c) Construir el polgono acumulativo de frecuencias y ojivas.
2. Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguien-
tes:
27.8 43.0 28.7 19.1 45.7 33.5 16.9 43.6 24.7 9.7 28.4 27.2 19.8 21.0 39.5
44.6 25.5 34.1 0.6 15.4 35.0 35.0 13.4 11.8 17.0 48.8 40.6 38.6 32.0 16.4
19.2 11.8 3.9 33.4 27.9 32.5 0.2 13.5 3.53 31.0
Construya:
a) La tabla de distribucin de frecuencias.
b) Graficar el histograma de frecuencias, polgono de frec. absolutas y relativas y,
ojivas.
3. Hallar las frecuencias que faltan en el siguiente cuadro de frecuencias:
In terv alo s ni hi Hi
- 24 0.15
- 0.25
- 44 0.90
45 -
T o tal 60
Intervalos ni hi Hi
- 3 0.08
- 5 0.40
- 12
- 9 0.36
Total
Completar el cuadro de distribucin de frecuencias.
Estadstica Aplicada a la Educacin - 45 -
1.66 1.59 1.72 1.61 1.79 1.67 1.69 1.59 1.60 1.72
1.64 1.56 1.67 1.67 1.73 1.68 1.67 1.76 1.66 1.64
1.61 1.57 1.62 1.68 1.69 1.80 1.67 1.69 1.65 1.57
1.61 1.75 1.68 1.76 1.69 1.61 1.53 1.66 1.75 1.65
1.66 1.66 1.75 1.55 1.60 1.69 1.68 1.78 1.69 1.65
1.72 1.70 1.64 1.57 1.76 1.66 1.62 1.64 1.70 1.63
1.62 1.68 1.63 1.76 1.64 1.60 1.78 1.64 1.65 1.57
1.62 1.73 1.67 1.68 1.54 1.76 1.65 1.62 1.63 1.79
1.66 1.78 1.70 1.64 1.66 1.73 1.63 1.77 1.67 1.63
1.59 1.64 1.68 1.60 1.53 1.70 1.67 1.64 1.65 1.79
- 46 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 47 -
4
ETAPA DE PRESENTACIN
DE DATOS
EJEMPLO:
A. De acuerdo al Uso.
CUADRON 4.2
UNIVERSIDADFEMENINADEL SAGRADOCORAZN
ALUMNASMATRICULADASPORDEPARTAMENTOSDE PROCEDENCIA, SEGNDATOSPERSONALES1992
CUADRO N 4.3
UNIVERSIDAD FEM ENINA DEL SAGRADO CORAZN
ALUM NAS M ATRICULADAS POR DEPARTAM ENTOS DE PROCEDENCIA
SEGN EDAD 1992.
Dpto. de EDAD
Procedencia 16 - 19 20 - 23 24 - 27 28 y + TOTAL
Arequipa
Cajamarca
Cuzco
Ica
Junn
La Libertad
Lambayeque
Lima - Callao
Piura
Tacna
FUENTE: UNIFE, Secretara General.
NIVEL DE
INSTRUCCIN NM ERO %
A nalfabeto 38 31.67
Primaria 63 52.50
Secundaria 16 13.33
Superior 3 2.50
TOTA L 120 100.00
FUENTE: Hos pital M anuel Nuez Butrn, Oficina de Es tads tica
- 52 - V. Ibaez Q.
C U A D R O N 4 .5
H O S P IT A L M A N U E L N U E Z B U T R O N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R ED A D . PU N O : M A R Z O 1998.
ED A D
(A o s c u m p lid o s ) N M ER O
0 - 9 9
10 - 19 15
20 - 29 26
30 - 39 30
40 - 49 34
50 - 59 5
60 - 69 1
TOTA L 120
F U E N T E : H o s p it a l M a n u e l N u e z B u t r n , O fic in a d e E s t a d s t ic a
C U A D R O 4 .6
H O S P IT A L M A N U E L N U E Z B U T R N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R N IV E L D E IN ST R U C C I N , SE G N SE X O . M A R Z O 1 9 9 8
N IV E L D E S E X O
IN S T R U C C I N M a s c u lin o F e m e n in o TOTA L
A n a lfa b e t o 28 10 38
P rim a ria 32 31 63
S e c u n d a ria 9 7 16
S u p e rio r 1 2 3
TOTA L 70 50 120
F U E N T E : H o s p it a l M a n u e l N u e z B u t ro n . O fic . D e E s t a d s t ic a .
Estadstica Aplicada a la Educacin - 53 -
C U A D R O 4.7
H O S P IT A L M A N U EL N U E Z B U T R N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R E D A D , S E G N T I P O D E R E SI D E N C IA - M A R Z O 1 9 9 8
ED A D T IP O D E R ES ID E N C IA
(A o s c u m p lid o s ) U RBA N A RURA L TOTA L
00 - 0 9 1 8 9
10 - 1 9 4 11 15
20 - 2 9 8 18 26
30 - 3 9 10 20 30
40 - 4 9 7 27 34
50 - 5 9 - 5 5
60 - 6 9 - 1 1
TOTA L 30 90 12 0
F U EN T E: H o s p it a l M a n u e l N u e z B u t ro n . O fic . D e Es t a d s t ic a .
3. Tablas Complejas.
CUADRO N 4.8
TIPO DE RESIDENCIA
NIVEL DE Zona Urbano Zona Rural TOTAL
INSTRUCCIN Masculino Femenino Masculino Femenino
Analfabeto 6 4 22 6 38
Primaria 9 6 23 25 63
Secundaria 3 2 6 5 16
Superior - - 1 2 3
TOTAL 18 12 52 38 120
FUENTE: Hospital Manuel Nuez Butrn, Oficina de Estadstica.
CUADRO N 4.9
TIPO DE RESIDENCIA
EDAD Zona Urbano Zona Rural TOTAL
Masculino Femenino Masculino Femenino
00 - 09 1 - 3 5 9
10 - 19 3 1 6 5 15
20 - 29 4 4 11 7 26
30 - 39 7 3 12 8 30
40 - 49 3 4 16 11 34
50 - 59 - - 3 2 5
60 - 69 - - 1 - 1
TOTAL 18 12 52 38 120
FUENTE: Hospital Manuel Nuez Butron. Oficina de Estadstica.
Estadstica Aplicada a la Educacin - 55 -
Se puede apreciar en los ejemplos que cada tabla presenta tres variables: Ni-
vel de Instruccin, Tipo de Residencia y Sexo (Cuadro N 4.8); Edad, Tipo de Resi-
dencia y Sexo (Cuadro N 4.9). En el ttulo observamos que en el criterio de clasifi-
cacin, las variables estn precedidas de las palabras: POR, SEGN, (POR nivel de
instruccin, SEGN tipo de residencia, y Sexo; POR edad, SEGN tipo de residen-
cia y sexo), las mismas que ayudan a conectar las variables.
Importancia.
Los grficos son importantes por lo siguiente:
- Son esenciales en el estudio y presentacin de trabajos estadsticos. Los
datos transformados en dibujo permite un examen visual que constituye,
muchas veces, la primera etapa de un anlisis e interpretacin de datos.
- Permiten observar en forma instantnea el comportamiento de la variable o
variables materia de estudio.
- Permiten formar una idea bastante aproximada sobre la tendencia de las
variables en el futuro.
1. Grfico de Barras.
Es usado generalmente para representar hechos o fenmenos
sin continuidad, sin movimiento, de tal forma que permita visualizar la magnitud y
comparar los elementos en que se clasifican las variables. Los grficos de barras,
pueden ser de los siguientes tipos:
CU A D RO N 4.10
N M ER O D E N I O S EN F ER M O S EN EL D EP A R T A M EN T O D E P U N O
1998
IRA N M ERO %
En fe rme d a d mu y g ra v e 390 45.35
N e u mo n a 170 19.77
N e u mo n a g ra v e 250 29.07
N o n e u mo n a 50 5.81
T o ta l 860 100.00
FU EN T E: Es -Sa lu d -Pu n o .
400
350
300
N de Nios
250
200
150
100
50
0
En f. M u y N e u mo n a N e u mo n a No
g ra v e g ra v e n e u mo n a
En fe r m e dad IR A
GRFICO N 4.2
PORCENTAJES DE NIOS CON IRA, 1998
50
45
40
Porcentajes (%)
35
30
25
20
15
10
5
0
En f. M uy Neumo na Neumo na No
grave grave neu mona
Enfermedad IRA
EJEMPLO:
Se considera el nmero de nios de ambos sexos con la enfermedad IRA.
CUADRO N 4.11
Nmero nios con enfermedad IRA, 1998
Sexo
IRA Varn Mujer Total
Enf. Muy grave 185 205 390
Neumona 100 70 170
Neumona grave 95 155 250
No neumona 10 40 50
Total 390 470 860
FUENTE: Es-Salud - Puno.
Estadstica Aplicada a la Educacin - 59 -
GRFICO N 4.3
220
200
180
Varn
N de enfermos
160
140 Mujer
120
100
80
60
40
20
0
Enf. M uy Neumona Neumona No
grave grave neu mo na
Enfe rme dad IR A
NOTA: Los grficos compuestos deben contener una leyenda que identifi-
quen los componentes de cada clasificacin.
SOLUCIN:
GRFICO N 4.4
400
380
360
340
320
300 Mujer
280
N de nios
260 Varn
240
220
200
180
160
140
120
100
80
60
40
20
0
Enf. M u y Neu mon a Neu mon a No
g rav e g rav e n eumo n a
Sexo
Total (%)
IRA Varn (%) Mujer (%)
Enf. Muy grave 47.44 52.56 100
Neumona 58.82 41.18 100
Neumona grave 38.00 62.00 100
No neumona 20.00 80.00 100
FUENTE: Es-Salud - Puno.
Estadstica Aplicada a la Educacin - 61 -
GRFICO N 4.5
PORCENTAJE DE ENFERMEDADES EN NIOS CON IRA, SEGN SEXO,
1998
100
95
90
85
80
75 Mujer
PORCENTAJES
70
65 Varn
60
55
50
45
40
35
30
25
20
15
10
5
0
Enf. Muy Neumona Neumona No
grave grave neumona
Enfermedad de IRA
m
Total (n) 360 con n = ni
i =1
parte (ni) X
EJEMPLO:
Construya un grfico de sector para los datos de los nios enfermos con IRA.
Frec. Absoluta
IRA ni
Enf. Muy grave 390
Neumona 170
Neumona grave 250
No neumona 50
Total 860
SOLUCIN:
391x360
Para enferdad muy grave: 860 360 X = = 163
860
390 X
170x 360
Para neumona: X = = 71
860
250x360
Para neumona grave: X = = 105
860
50 x 360
Para no neumona: X = = 21
860
Estadstica Aplicada a la Educacin - 63 -
GRFICO N 4.6
21
No
neum.
71
100% 360
Parte % X, entonces
(parte%)x360
X = nmero de grados =
100%
= (parte %)x(3.6)
- 64 - V. Ibaez Q.
EJEMPLO:
Colores de alpacas del CIP. La Raya.
Frec. Absoluta
IRA ni hi x100%
Enf. Muy grave 390 45.3
Neumona 170 19.8
Neumona grave 250 29.1
No neumona 50 5.8
Total 860 100.0
SOLUCIN:
Para Enf. muy grave: X = (45.3)x(3.6) = 163
Neumona: X = (19.8)x(3.6) = 71
Neumona grave: X = (29.1)x(3.6) = 105
No neumona: X = (5.8)x(3.6) = 21
360
GRFICO N 4.7
No
neumona
Neumona 5.8% Enf. Muy
grave
grave
29.1%
45.3%
Neumona
19.8%
EJEMPLO:
GRFICO N 4.8
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
RENDIMIENTO (%) DE VELLN DE ALPACAS HUACAYA Y SURI, POR
EDADES.
96
94
92
Rendimiento (%)
90
88
86
84
82
80
1 2 3 4 5 6
EDAD ES (aos)
CUADRO N 4.13
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
LONGITUD DE MECHA (cm) DE ALPACAS POR EDAD Y SEGN RAZA
(Varios aos de Estudio)
RAZA
Edad Wacaya Sury TOTAL
1 ao 12.30 16.80 29.10
2 aos 12.10 16.20 28.30
3 aos 11.30 15.50 26.80
4 aos 10.90 13.40 24.30
5 aos 10.50 12.90 23.40
6 aos 10.60 12.10 22.70
7 aos 9.60 11.60 21.20
8 aos 9.20 11.20 20.40
9 aos 8.70 11.00 19.70
10 aos 8.50 10.50 19.00
Fuente: CIP-La Raya, Oficina de Registros.
GRFICO N 4.9
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
LONGITUD DE MECHA (cm) DE ALPACAS POR EDAD Y SEGN RAZA.
20.0
16.0
LONGITUD (cm
12.0
W acaya
8.0
Su ry
4.0
0.0
1 2 3 4 5 6 7 8 9 10
EDAD (aos )
CUADRO N 4.14
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
NMERO DE ALPACAS DE RAZA HUACAYA POR AOS (1 ao de Edad)
1982 - 1991
N de
A O
A lp a c a s
1982 570
1983 546
1984 507
1985 636
1986 780
1987 715
1988 963
1989 991
1990 991
1991 937
T o tal 7636
F u e n t e : C IP - L a R a y a , O fic in a d e R e g is t ro s .
GRFICO N 4.10
1200
1000
N de Alpacas
800
600
400
200
0
1 98 2 1 98 3 1 98 4 1 98 5 1 98 6 1 98 7 1 98 8 1 98 9 1 99 0 1 99 1
AO S
EJEMPLO:
La poblacin Bovino de Brown Swiss en las 3 provincias del Departamento de
Puno.
La provincia de Megar : 300 bovinos
La provincia de Azngaro : 200 bovinos
La provincia de San Romn: 100 bovinos
Tomando como unidad = 100 bovinos se tiene:
La poblacin de bovino para la Prov. de Melgar :
GRFICO N 4.11
EVOLUCIN DE UNA POBLACIN POR ESPECIES ANIMALES
1998 - 1999
1. Histograma de Frecuencias.
Se usa para representar grficamente las distribuciones de fre-
cuencias absolutas o relativas de datos cuantitativos contnuos agrupados en clases y
queda representado por una serie de rectngulos semejantes a los diagramas de ba-
rra. Las barras del histograma se colocan slo verticalmente y deben ir uno al lado de
las otras sin que haya un espacio que las separe. La base de cada rectngulo es la
amplitud de la clase de la variable correspondiente. Estos grficos reciben el nombre
de Histograma de frecuencias Absolutas histogramas de frecuencias relativas. Se
traza en el plano cartesiano en el eje de las X se coloca las variables y en el eje de
las Y cualesquiera de las frecuencias formndose rectngulos unidos entre si, con-
servando la misma amplitud intervlica.
CUADRO N 4.15
CALIFICACIONES DE LA PRUEBA
MATEMTICA (PUNTAJES)
12 0.24
13 0.24
12 0.22
11 0.20 0.18 0.18
Frec. absoluta (ni )
Frec. relativa (h i)
10 9 9 0.18
9 0.16
8 0.14 0.12 0.12
7 6 6 0.10
5 0.12
6 0.10
5 0.08 0.06
4 3
3 0.06
2 0.04
1 0.02
0 0.00
45 53 61 69 77 85 93 45 53 61 69 77 85 93
2. Polgono de Frecuencias.
GRFICO N 4.14
13 Polgono de Frecuencia
12
13 Polgono de Frecuencia 11
12
10
9 8
8 7
7 6
6 5
5
4 4
3 3
2 2
1 1
0 0
45 53 61 69 77 85 93
45 53 61 69 77 85 93
Calificativos (puntajes)
Calificativos (puntajes)
a) b)
EJEMPLO:
Construir la ojiva menor que de frecuencias absolutas acumuladas y de
frecuencias relativas acumuladas para los calificativos de la prueba de matemtica
(puntajes).
SOLUCIN:
Escribimos las tablas de distribucin de frecuencias absolutas acumuladas
y frecuencias relativas acumuladas de la siguiente manera:
CUADRO N 4.16
CALIFICATIVOS DE LA PRUEBA DE MATEMTICA DE 50 ALUMNOS
(puntajes)
Hi 1.00
Ni 50
45 0.90
40 0.80 Ojiva menor que
35 Ojiva menor que 0.70
30 0.60
25 0.50
20 0.40
15 0.30
10 0.20
5 0.10
0 0.00
41 49 57 65 73 81 89 97 41 49 57 65 73 81 89 97
Calificativos (puntajes) Calificativos (puntajes)
CUADRO N 4.17
CALIFICATIVOS (puntajes) MAYOR O IGUAL QUE DE ALUMNOS DE
MATEMTICA
Calificativos
(puntajes ) N*i H*i
mayor o igual que 41 50 1.00
mayor o igual que 49 45 0.90
mayor o igual que 57 42 0.84
mayor o igual que 65 36 0.72
mayor o igual que 73 27 0.54
mayor o igual que 81 15 0.30
mayor o igual que 89 6 0.12
mayor o igual que 97 0 0.00
Estadstica Aplicada a la Educacin - 75 -
GRFICO N 4.17 GRFICO N 4.18
Distribucin acumulada menor que Distribucin relativa acumulada
de las calificaciones de la prueba de las calificaciones de la prueba
matemtica (puntos) matemtica (puntos)
50
N*i H*i 1.0
45 Ojiva mayor o igual que (N*i) Ojiva mayor o igual que (H*i)
40 0.9
35 0.8
30 0.7
0.6
25
0.5
20 0.4
15 0.3
10 0.2
5 0.1
0 0.0
41 49 57 65 73 81 89 97 41 49 57 65 73 81 89 97
GRFICO N 4.19
OJIVAS MAYOR O IGUAL QUE Y OJIVA MENOR O IGUAL QUE
PARA LOS CALIFICATIVOS (puntos)
1.0 H* i Hi
hi
0.9
ojiva
ojiva
0.8 menor
mayor
0.7 o igual que
o igual que
0.6
0.5
0.4
0.3
0.2
0.1
0.0
41 49 57 65 73 81 89 97
Mediana
Calificativo (puntaje s)
CUADRO N 4.18
PACIENTES CON INFECCION DENTARIA EN EL HRMNB - PUNO, 2000.
ni 7 hi 0.20
0.18
6 0.16
5 0.14
4 0.12
3 0.10
0.08
2 0.06
1 0.04
0 0.02
0.00
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
5
ESTADGRAFOS DE
POSICIN
5.1. INTRODUCCIN.
X + X 2 +L+ X N Xi X i
= M ( ) = 1 = i =1
o = i =1
N N N
Estadstico (muestra):
n n
x + x 2 +L + x n xi x i
x = M ( x) = 1 = i =1
o x= i =1
n n n
donde n es el tamao de la muestra nmero de elementos del con-
junto de datos u observaciones.
EJEMPLO:
Encuentre la media aritmtica de los siguientes datos.
6.4, 9.5, 8.3, 2.3, 5.0, 3.7, 13.4, 7.4, 5.4, 7.5
X i
.
6.4+9.5+8.3+2.3+5.0+3.7+13.4+7.4+5.4+7.5 689
x = i=1 = = = 689
.
10 10 10
El promedio de la longitud de mecha (cm) de las 100 alpacas es 10.25 cm.
Estadstica Aplicada a la Educacin - 79 -
Ejemplo: Con los datos discretos que corresponde a los pacientes con infec-
cin dentaria en el HRMNB-Puno. Calcular el promedio.
42
x i
9 + 6 + 4 + 8+L+1 + 6 + 4
x= i =1
= = 4.33
42 42
Y n + Y2 n 2 +L+ Yi n i Yi n i Yn i i
Y = M ( Y) = 1 1 = i =1
= i =1
m
n
n n
i
i =1
m
con frecuencia relativa Y = h Y
i =1
i i
EJEMPLO:
Calcular la media aritmtica de los datos agrupados en la distribucin de
frecuencias para los calificativos (puntos) de los alumnos de matemtica.
Calificativos ni Yi niYi
41 - 49 5 45 225.00
49 - 57 3 53 159.00
57 - 65 6 61 366.00
65 - 73 9 69 621.00
73 - 81 12 77 924.00
81 - 89 9 85 765.00
89 - 97 6 93 558.00
8 8
Totales n i = 50 nY i i = 3618.00
i =1 i =1
- 80 - V. Ibaez Q.
Luego, la media aritmtica de stos datos es:
7
n
50
i
i =1
Yn i i
3618
Y = i =1
= = 72.36
50 50
n Y i i
X = M ( x) = Y = M ( Y) , Y= i =1
n
EJEMPLO:
Calcular la media aritmtica de los datos agrupados que corresponden a los
pacientes con infeccin dentaria.
Ext ra c . O c u ra c io n e s P a c ie n t e s
(Y i ) ni Y ini
0 2 0
1 4 4
2 7 14
3 6 18
4 6 24
5 2 10
6 4 24
7 4 28
8 3 24
9 4 36
10 10
T o ta l n i = 42 Yn i i = 182
i=1 i=1
10
OBSERVACIN:
Cuando los datos tabulados son contnuos hay prdida de informacin
en relacin con el conjunto original de datos y esto afecta a los estadgrafos calcula-
dos a partir de los datos agrupados: y =M(y) es una aproximacin a la media arit-
mtica del conjunto original x1,x2,...,xn, x =M(x), porque se considera en el clculo
de y , las marcas de clase Yi como representante de la clase i, i = 1,2,..,m. Es decir
estamos suponiendo que las frecuencias de cada clase estn condensadas en la marca
de clase puntos medios.
m
Yn i i
X = M ( x) Y = M ( y) = i =1
n
EJEMPLO:
Realizamos una comparacin con datos no agrupados y datos que estn tabu-
lados en una distribucin de frecuencias.
100
X i
10251
.
Datos no agrupados: X = i =1
= = 10.251
n 100
8
n Y i i
1025.6
Datos agrupados: Y= i =1
= = 10.256
n 100
La diferencia es en: Y X = 10.256 10.251 = 0.005
- 82 - V. Ibaez Q.
Es decir, se pierde informacin con datos originales cuando se calcula con
datos agrupados en 0.005, esto es: X Y 10.251 10.256
k /
nk
M ( x) = X k = i =1
= =k
n n/
EJEMPLO:
Se tiene los siguientes datos: 5, 5, 5, 5, 5, 5, 5, entonces k = 5
7
5 7x5
X5 = i =1
= =5
7 7
P-2. Si a cada valor de las observaciones X 1, X2, ... , Xn se le suma o resta una
constante, la media aritmtica del nuevo conjunto transformado Yi = Xi
k, i = 1,2,..,n, es la media aritmtica del conjunto original ms o
menos la constante.
y = M(y) = M(x)k, donde Yi = Xi k, k = constante, i = 1,2,..,n
n
y
b g
i
1 n 1 n 1 n
Y= i =1
n
= i
n i =1
X k = i n
n i =1
X
i =1
k
/
nk
Y = X = Xk
n/
EJEMPLO: 6, 8, 4, 2, 4, 6 y k = 4
Y=
1 6
i
6 i =1
X 4b=
1 6
i 6
6 i =1
X g
1 6
i =1
4
Estadstica Aplicada a la Educacin - 83 -
=
6 + 8 + 4 + 2 + 4 + 6 6/ x4 30
= 4 = 5 4
9 RS
6 6/ 6 1 T
P-3. Si cada valor de un conjunto X1, X2, ... , Xn se multiplica por una cons-
tante diferente de cero, la media aritmtica del conjunto transformado
Yi = kXi, i = 1,2,..,n, es la media aritmtica del conjunto original mul-
tiplicado por la constante:
y = M(y) = kM(x)
Prueba:
1 n 1 n k n
Y = M(y) = i n = i n = Xi =kM(x) = kX
n i=1
y = kX =
i 1 i 1
Fy I 5
GGH 5 JJK MN 5 PQ H 5 K
i =1
cX Xh = 0
n
(para datos no agrupados)
i
i =1
n cY Yh = 0
m
(para datos agrupados).
i i
i=1
Donde: m = Es el nmero de clases.
ni = Frecuencia absoluta de la clase i.
Yi = Punto medio marcas de clase del intervalo i.
P-5. La suma de los cuadrados de las desviaciones de cada una de las observa-
ciones X1, X2, ... , Xn con respecto a su media es mnima. Si k es
cualquier valor, entonces:
c h b g
n n
Xi X Xi k
2 2
(para datos no agrupados).
i =1 i =1
- 84 - V. Ibaez Q.
c h b g
m m
i =1 i =1
P-6. Si X1, X2, ... , Xn y Y1, Y2, ... , Yn son dos conjuntos de observaciones de
n valores cada uno de dos variables X e Y, expresados en las mismas
unidades:
M(XY)=M(x)M(Y)
LM X OP = M(X )
m m
M
N Q
i =1
i
i =1
i
w x + w 2 x 2 +L+ w k x k w x i i
XP = 1 1 = i =1
w1 + w 2 +L+ w k k
w i =1
i
X W i i
68.50
XP = i =1
3
= = 114
. 11 ,
W
6
i
i =1
EJEMPLO:
Se registr a 10 pacientes varones su peso (kg). Las medidas son las siguien-
tes:
- 86 - V. Ibaez Q.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, n = 10
Calcular la Media Geomtrica ( X g )
SOLUCIN:
i) Xg = Mg = 10 74x70x73xL83x80 = 76.41671885 , entonces X g = 76.
Xi 74 70 73 77 78 83 70 77.5 83 80 Log(X ) =
i=1
i
Log(Xi) 1.86923 1.84510 1.86332 1.88649 1.89209 1.91908 1.84510 1.88930 1.91908 1.90309 18.83188
10
Log ( X ) i
18.83188386
Xg = i =1
= = 1.883188386
n 10
LM Log( X ) OP
10
= Anti log M
MM n PPP = Anti log(1883188386
i
Pero: X g i =1
. ) = 76.4167188
N Q
X g = 76 cm., es igual al i).
Yini , donde n = n i
m
Yg = n Y1n1 . Y2n2 . Y3n3 L Ymnm = n
i =1 i =1
Yi = Marcas de clase, i = 1,2,...,m, m = Nmero de clases.
Estadstica Aplicada a la Educacin - 87 -
Aplicando logaritmos a ambos miembros de la ecuacin anterior es:
1
LogYg =Logn Y1n1.Y2n2 .Y3n3LYmnm = nL
1 ogY1 +n2LogY2+L+nmLogYm
n
1 m
= n i LogYi
n i =1
LM n LogY OP
m
Y = Anti log M
MM n PPP
i i
i =1
g
N Q
EJEMPLO:
Hallar la media geomtrica Yg para los siguientes datos agrupados:
Marcas de clase Yi 45 53 61 69 77 85 93
Frecuencia (ni) 5 3 6 9 12 9 6
SOLUCIN:
8
1 92 .514068
L ogYg =
n
n L ogY
i =1
i i =
50
= 1.85028
- 88 - V. Ibaez Q.
Luego: Y g = A n t i lo g ( 1 .8 5 0 2 8 ) = 7 0 .8 4
Yg 7 1
Es el promedio geomtrico para la variable calificaciones (puntajes) en
personas con dao cerebral post-meningtico.
DESVENTAJAS:
- Su clculo es engorroso.
- Esta limitado para valores positivos para que pueda ser interpretado.
- Si algn valor de la variable es cero, la X g ser cero.
- Si aparece algn valor negativo, la media geomtrica toma un valor
imaginario.
PROPIEDADES DE LA X g
X1 X 2 X n n X1 X 2 L X n
n L =
Y1 Y2 Yn n Y1 Y2 L Yn
P-3. La X g de trminos positivos es siempre menor o igual que la X (media
aritmtica). Es igual a la media aritmtica, solo en el caso en que todos
los trminos sean iguales entre si X Xg .
P-4. El promedio geomtrico es menor que el promedio aritmtico, pero ma-
yor que el promedio armnico: X Xg X H .
1 n
XH = M H = n
= n
1 1
X
i =1
X
i =1
i i
n
Donde: n = Nmero de observaciones
Xi = Observaciones de la muestra.
EJEMPLO:
SOLUCIN:
10
Xi 74 70 73 77 78 83 70 77.5 83 80
i=1
1
Xi =
1/Xi 0.0135 0.0143 0.0137 0.0130 0.0128 0.0120 0.0143 0.0129 0.0120 0.0125 0.1310907
n 10
XH = 10
= = 76.283 XH = 76.28 cm.
1
X
0131090709
.
i =1 i
1
Tambin se puede usar con frecuencias relativas: YH = m
h
Yi
i =1 i
USOS:
- Determinar la velocidad promedio de recorrido de reacciones qumicas,
de precios, de rendimientos, etc.
- Para estimar el nmero de repeticiones por tratamiento, cuando se trata
de estimar el error estndar en un anlisis de varianza (datos
desbalanceados).
EJEMPLO:
Encontrar la Media Armnica YH para los datos agrupados en intervalos de
calificativos (puntajes) de los alumnos de matemtica.
7
n 50
YH = 7
= = 69.1799 , n = ni = 50
ni 0.722753
i =1 Yi
i =1
Respuesta:
El promedio armnico es 69 puntos para los alumnos de matemticas.
Entonces podemos comprobar que:
Y Yg YH entonces 72 .36 70.84 69 .18
- XH Xg X
X 2
i
Xq = Mq ( x) = i =1
n
Donde: X q = Media cuadrtica.
Xi = Valores de las observaciones.
n = Tamao de la muestra.
- 92 - V. Ibaez Q.
EJEMPLO:
Encontrar la media cuadrtica de los 10 pacientes con infeccin dentaria para
la variable peso (kg).
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, n = 10
SOLUCIN:
10
Xi 74 70 73 77 78 83 70 77.5 83 80 X =
i=1
2
i
2
Xi 5476 4900 5329 5929 6084 6889 4900 6006.25 6889 6400 58802.25
10
X 2
i
58802.25
Xq = i =1
= = 76.6826
n 10
Xq = 76.68 kg.
Respuesta:
El promedio curtico de la variable peso en personas con infeccin denta-
ria es 76.68 kg.
n Y i i
2
m
Yq = M q (Y) = i =1
, Donde: n = n i
n i=1
Yi = Marca de clase
EJEMPLO:
Encontrar la Media Cuadrtica Yq para los datos agrupados en intervalos de
clase de los alumnos del curso de matemtica (puntos).
Estadstica Aplicada a la Educacin - 93 -
2 2
[Y'i-1 - Y' i> Yi ni Y i niY i
41 - 49 45 5 2025.0000 10125.00
49 - 57 53 3 2809.0000 8427.00
57 - 65 61 6 3721.0000 22326.00
65 - 73 69 9 4761.0000 42849.00
73 - 81 77 12 5929.0000 71148.00
81 - 89 85 9 7225.0000 65025.00
89 - 97 93 6 8649.0000 51894.00
Totales 50 n Y i i
2
= 271794.00
271794
Yq = = 73.728 kg.
50
Rpta: El promedio curtico de la calificacin es 73.73 puntos.
PROPIEDADES:
1. La media curtica es mayor o igual que la media aritmtica: X Xq = Mq(X)
50% 50%
X1 Me Xn
- 94 - V. Ibaez Q.
A. MEDIANA CON DATOS NO AGRUPADOS.
En este caso no es fcil localizar la mediana cuando se trata de un
nmero considerable de observaciones, a menos que la muestra tenga pocas observa-
ciones, para lo cual es necesario ordenar los datos. Hay que distinguir dos situacio-
nes: Nmero de observaciones IMPAR y nmero de observaciones es PAR.
1. Si el nmero de observaciones n es impar, se ordenan los
datos en orden creciente X(1), X(2), X(3), ...., X(n), denotado a X(1) como la observacin
ms pequea, X(2) la segunda observacin menor, ....., X(n), denota la observacin
mayor, es decir X (1) X ( 2 ) L X ( n ) , y tomar como valor de la mediana el valor de
la observacin que ocupa la posicin central.
Me = X c n+1 h
2
{X~ = Me(x) = Me = X n+1
2
EJEMPLO:
Encontrar la mediana de los 9 estudiantes de un Colegio, para la variable
peso (kg).
74, 70, 73, 77, 78, 83, 70, 83, 80
SOLUCIN:
i) Se ordenan los datos: X1= 70, X2= 70, X3= 73, X4= 74,
X5= 77, X6= 78, X7= 80, X8= 83, X9= 83
70 70 73 74 77 78 80 83 83
X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 )
tomar como mediana cualquiera de ellos, o cualquier valor entre stos dos, para esto
se toma como mediana la semisuma de ambos valores.
Estadstica Aplicada a la Educacin - 95 -
X n + XF nI
~ GH 2 JK + 1
X = Me =
2
2
EJEMPLO:
Encontrar la mediana de los 10 estudiantes, para la variable peso (kg).
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10
SOLUCIN:
i) Se ordenan los datos: X1= 70, X2= 70, X3= 73, X4= 74, X5= 77,
X6= 77.5, X7= 78, X8= 80, X9= 83, X10= 83
X10 + X10
~ +1 X(5) + X(6) 77 + 775
.
X = Me = 2 2
= = = 77.25
2 2 2
70 70 73 74 77 77.5 78 80 83 83
X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 ) X (1 0 )
T
2 2
, si " n" es nm ero entero par.
2
Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . .
Yj-1 nj-1 Nj-1 n
> N j1
Yj nj Nj 2
. . .
. . .
Ym nm n
Total n
n
ii) Cuando = Nj-1, entonces Yj-1 Yj y cualquier valor
2
entre stos dos se puede considerar como la media-
na, y se calcula como:
Yj1 + Yj
Me =
2
Estadstica Aplicada a la Educacin - 97 -
Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . Nj-2 n
= N j1
Yj-1 n j-1 Nj-1 2
Yj nj Nj
. . .
. . .
Ym nm n
Total n
EJEMPLO:
Encontrar la mediana para los datos que corresponden a 42 pacientes con
infeccin dentaria; registrndose el nmero de extracciones o curaciones durante el
ao 2000 en el Hospital Regional Manuel Nuez Butrn - Puno.
SOLUCIN:
1) Construir la tabla de distribucin de frecuencias absolutas acumuladas
menor que.
Extr. O curac.
(Yi) ni Ni
0 2 2
1 4 6
2 7 13
3 6 19 n
= 21 > N 4 = 19
44 6 25 2
5 2 27
6 4 31
7 4 35
8 3 38
9 4 42
10
Total n
i =1
i = 42
- 98 - V. Ibaez Q.
n 42
2) Ubicar la posicin de la mediana: n = 42, = =21, entonces la menor
2 2
frecuencia absoluta que supera a 21 es N5 = 25 >21, luego j = 5 y j-1=5-
1=4.
n 42
3)
2
=
2
=21>Nj-1 = N4 = 19. Entonces la mediana es Me = Y5 = 4
b) VARIABLE CONTNUA.
Cuando la variable es contnua, entonces el problema consiste
en determinar un punto dentro del intervalo en que est comprendido la mediana,
esto se puede lograr con el procedimiento que consiste en:
1. Construir la tabla de distribucin de frecuencias absolutas acu-
muladas (Ni) menor que.
2. Se determina la menor frecuencia absoluta acumulada Nj que
n
supera n , entonces se puede tener que: N j1 < N j .
2 2
n
i) Si ocurre que =Nj-1, la mediana es: Me(Y) = Yj-1, donde
2
Yj-1= Lmite inferior de la clase mediana.
Y'i-1 - Y'i Yi ni Ni
Y'0 - Y'1 Y1 n1 N1
Y'1 - Y'2 Y2 n2 N2
Y'2 - Y'3 Y3 n3 N3
. . . .
. . . .
. . . .
n
Y'j-2 - Y'j-1 Yj-1 n j-1 Nj-1 = N j 1
2
Y'j-1 - Y'j Yj nj Nj
. . . .
. . . .
Y'm-1 - Y'm Ym nm n
Totales n
Estadstica Aplicada a la Educacin - 99 -
n
ii) Si >Nj-1, la mediana se debe encontrar dentro de la clase
2
j, es decir, en el intervalo [Yj-1,Yj>, llamada clase me-
diana. La frmula de la mediana es:
LM n N OP
+c M 2 PP
j1
Me = Yj'1
MN N N
j
j j1
Q
Donde: cj = Amplitud de la clase mediana.
Nj = Frecuencia absoluta acumulada de la clase mediana.
n = Nmero de observaciones en la muestra.
Yj-1 = Lmite inferior de la clase mediana.
Y'i-1 - Y'i Yi ni Ni
Y'0 - Y'1 Y1 n1 N1
Y'1- Y'2 Y2 n2 N2
Y'2 - Y'3 Y3 n3 N3
. . . .
. . . .
. . . .
Y'j-2 - Y'j-1 Yj-1 nj-1 Nj-1 n
> N j1
Y'j-1 - Y'j Yj nj Nj 2
. . . .
. . . .
Y'm-1 - Y'm Ym nm n
Totales n
LM 1 H OP
+c M 2 PP
j1
Me = Y '
j 1 j
MN H H
j j 1
Q
- 100 - V. Ibaez Q.
Donde: cj = Amplitud de la clase mediana.
Hj = Frecuencia relativa acumulada de la clase mediana.
Yj-1 = Lmite inferior de la clase mediana.
Y'i-1 - Y'i hi Hi
Y'0 - Y'1 h1 H1
Y'1 - Y'2 h2 H2
Y'2 - Y'3 h3 H3
. . .
. . .
. . .
Y'j-2 - Y'j-1 h j-1 Hj-1 1
> H j1
Y'j-1 - Y'j hj Hj 2
. . .
. . .
EJEMPLO:
Calcular la Mediana (Me) para los calificativos (puntos) de alumnos del curso
de matemticas.
SOLUCIN:
n 50
2) Ubicar la posicin de la mediana: n = 50, entonces = =25, entonces la
2 2
menor frecuencia absoluta acumulada que supera es N5 = 35 >25, luego j =
5 y j-1=5-1=4, La clase mediana es Y4 - Y5 = 73 - 81
n 50
3) Como = =25>23 = N4 , la mediana esta dada por:
2 2
LM n N OP LM50 N OP
+c M 2 PP =Y +8MM N2 N PP = 73+8LMN25352323OPQ
j 1 4
Me = Yj'1 '
j
MN N N
j j 1
4
Q N Q 5 4
LM 2 OP = 74.33 puntos.
Me = 73 + 8
N12 Q
Respuesta: La mediana de los calificativos (puntos) en alumnos de matemti-
ca es 74.33 puntos.
EJEMPLO:
Se obtienen 40 datos de pesos (kg) en pacientes con caries del Hospital Regio-
nal Manuel Nuez Butrn - Puno.
SOLUCIN:
n 40
2) Ubicar la posicin de la mediana: n=40, entonces = =20, entonces N3
2 2
= 21 >20, luego j=3 y j-1=3-1=2, la clase mediana es Y2 - Y3 = 70.5 -
86.5
n 40
3) Como = =20>8 = N2, la mediana esta dada por:
2 2
LM n N OP LM 40 N OP
+c M 2 PP = Y + 16MM N2 N PP = 705. + 16LMN2021 88OPQ
j1 2
Me = Y ' '
j1 j
MN N Nj j1
Q
2
N 3 2
Q
LM12 OP = 85.27 kg.
Me = 70.5 + 16
N13 Q
Respuesta: La mitad de los pacientes con caries poseen menos de 85 personas
y la otra mitad poseen mayores a esa suma.
PROPIEDADES DE LA MEDIANA.
X
i =1
i Me = mnimo , para datos no agrupados.
i =1
X i M e X i a , para datos no agrupados.
i =1
m m
n
i=1
i Y i M e n i Y i a , para datos agrupados.
i =1
Me = Ym' , si m es par.
2
Donde: Yi = Marca de clase puntos medios.
m = Nmero de clases.
Yi = Lmite de clase.
VENTAJAS DE LA MEDIANA.
- La mediana es un estadgrafo que no est afectada por valores extremos, y
por lo tanto es ms representativa que la media aritmtica cuando alguno de
los valores de la variable se aleja mucho de los dems o cuando las series
son poco simtricas.
- Es til cuando los datos agrupados tienen clases abiertas en los extremos.
- Se aplica tambin a variables que pertenecen a la escala ordinal.
DESVENTAJAS DE LA MEDIANA.
- Se deben organizar los datos antes de realizar cualquier tipo de clculo para
determinar la mediana.
- Ciertos procedimientos estadsticos que usan la mediana son mucho ms
complejos que aquellos que usan la media.
- La mediana no es adecuado a manipulaciones algebraicas posteriores.
EJEMPLO:
Se registr los pesos de los estudiantes varones del sexto grado del sector rural
en el Distrito de Acora. La informacin se presenta a continuacin:
Peso del nio (kg: 39, 42, 40, 40, 41, 41, 42, 42, 45, 42
Ordenado : 39, 40, 40, 41, 41, 42, 42, 42, 42, 45
Determine, y presente grficamente la moda de las observaciones dadas ante-
riormente:
SOLUCIN:
39 40 40 41 41 42 42 42 42 45
: 1
1
424
3 1424
2
3 144424443
2 4
:
1
ni 5
Valor de la Frec. Absolut. 4
var. Xi ni 3
39 1
40 2
2
41 2 1
42 4 0
45 1
Total 10
39 40 41 42 45
Xi
SOLUCIN:
a) VARIABLE DISCRETA.
b) VARIABLE CONTNUA.
ni
Yi'1 + Yi'
Md = Yi =
2
0 Marcas de clase
Y' i-1 M d Y' i
ni M Q
c
P
n j+1 T
c
n j1 R
Clase Pos-Modal
c
Clase Pre-Modal
'
Yj1 Md Y j'
Md = Yj'1 + c
LM n n j1
OP Md = Yj'1 + c
LM OP
MNdn n i + dn n iPQ N + Q
j 1
j j1 j j+1 1 2
Donde:
'
Yj1 : Lmite inferior de la clase modal.
SOLUCIN:
1) Se identifica el intervalo de la clase modal, observando la tabla de frecuen-
cias absolutas, en este caso es 12 que est en el cuarto intervalo. Entonces:
5
MN(12 9 ) + (12 9 ) PQ
6
Int. De clase ni
[0 - 1 > 3
[1 - 2 > 10
[2 - 3 > 17 Frec. Ms alta.
[3 - 4 > 8
[4 - 5 > 5
Total 43
Estadstica Aplicada a la Educacin - 109 -
SOLUCIN:
1) Se identifica el intervalo de la clase modal observado en la frecuencia abso-
luta n3 = 17, entonces:
Yj-1 - Yj = Y2 - Y3 =2 - 3, luego j = 3, j -1 = 2
nj = n3 = 17
nj-1 = n2 = 10 c=1
nj+1 = n4 = 8
LM n n OP = 2 +1L 17 10 O = 2.44
Nbn n g + bn n gQ MN(17 10) + (17 8) PQ
Md = Y2' + c 3 2
3 2 3 4
Entonces la Md = 2.44 ~ 2.
VENTAJAS DE LA MODA
1. La moda, se puede usar como una localizacin, tanto para datos cualita-
tivos y cuantitativos.
2. La moda no est indebidamente afectada por valores extremos. An si los
valores altos son muy altos y los valores pequeos muy pequeos, se escoge
el valor ms frecuente del conjunto de datos como el valor modal.
3. La moda se puede calcular an cuando una ms de las clases sean abiertas
en los extremos.
4. La moda al igual que la mediana, es de fcil comprensin, y no queda
influenciada por los valores extremos.
DESVENTAJAS DE LA MODA
1. Muy a menudo, no hay un valor modal, porque el conjunto de datos no
contiene valores que se repitan ms de una vez. Otras veces, cada valor es
la moda, porque cada una aparece el mismo nmero de veces. Por consi-
guiente, la moda no es una medida til en estos casos.
2. Cuando el conjunto de observaciones contiene dos, tres o ms modas, stas
son difciles de interpretar y comparar.
3. Al igual que la mediana, presenta una gran inestabilidad en el muestreo y
tampoco permite un tratamiento algebraico.
4. La moda es an menos importante que la mediana, debido a su ambige-
dad.
- 110 - V. Ibaez Q.
5.2.10. RELACIN ENTRE MODA, MEDIA y MEDIANA.
A. DISTRIBUCIONES SIMTRICAS.
Es cuando los valores de la variable, cuya representacin grfica es
acampanada y adems unimodal; en este caso coinciden exactamente en el mismo
los estadgrafos como: Media, Mediana y Moda. Tal como se puede apreciar en el
siguiente grfico.
X = Me = Md
X = Me = Md
B. DISTRIBUCIONES ASIMTRICAS.
Si la distribucin tiene la forma acampanada, es unimodal, pero
no tiene simetra, las 3 medidas estadsticas toman valores diferentes y la mediana
queda comprendida generalmente entre la Moda (Md) y la Media Artimtica ( x ).
i) Si la distribucin es ms alargada o sesgada para valores grandes
de la variable (asimetra a la derecha o positiva), entonces debe
cumplir que:
Sesgada a la derecha
X > Me > Md
Md Me X
Sesgada a la izquierda
X < Me < Md
X Me Md
5.3.1. CUARTILES.
Los cuartiles son estadgrafos de posicin que dividen a un conjunto
de datos o distribucin de frecuencias ordenados en forma ascendente o descendente
en CUATRO PARTES de igual tamao, esto significa que entre dos cuartiles conse-
cutivos se encuentran no ms de 25% del total de n observaciones, y se denota por
Qi, i = 1,2,3. En forma esquemtica se puede observar que:
Xmn. Xmx.
0% Q1 Q2 = Me Q3 100%
n 2n n 3n
25% 25% = 25% 25%
4 4 2 4
50% 50%
75%
25% de n Q1 75% de n
- 112 - V. Ibaez Q.
n +1
ii) Si no es un entero, realizar una interpolacin lineal entre los
4
dos valores de las dos observaciones entre las cuales se encuentra
la fraccin.
EJEMPLO:
Determinar el primer cuartil Q1 de pesos (kg) de los pacientes en el HRMNB-
Puno.
74, 71, 73, 77, 78, 83, 70, 77.5, 83, 80
SOLUCIN:
1. Se ordena los datos:
Q1
70 70 73 74 77 77.5 78 80 83 83
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)
70 70 73 74 77 77.5 78 80 83 83 84
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)
n
en qu amplitud d N j1 observaciones
4
Esto es: ci N j N j1 U| LM n N OP
V| de donde: d = M 4 PPc
j1
MN N N
n
d N j1
W
j
4 j j1
Q
Luego:
LM n N OP
+c M 4 PP
j1
'
MN N N
Q1 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q1.
cj = Amplitud de la clase que contiene a Q1.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Q1.
Nj-1 = Frecuencia absoluta acumulada inmediatamente anterior a la clase de Q1.
LM 1 H OP
+c M 4 PP
j1
'
MN H H
Q1 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q1.
cj = Amplitud de la clase que contiene a Q1.
Hj = Frecuencia relativa acumulada de la clase que contiene a Q1.
Hj-1 = Frec. relativa acumul. inmediatamente anterior a la clase de Q1.
EJEMPLO:
Calcular el primer cuartil (Q1) con los datos de que corresponden a los califi-
cativos (puntajes) de los alumnos del curso de matemticas.
SOLUCIN:
1) Construir la tabla de distribucin de frecuencias.
n 50
2. Ubicar la posicin de Q1: n = 50, entonces = =12.5, entonces la menor
4 4
n
frecuencia absoluta acumulada (Ni) que supera a =25 es N3 =14 >8, luego
4
j = 3 y j-1=3-1=2, entonces el intervalo que contiene a Q1 es: Y2 - Y3 = 57
- 65.
n 50
3) Como = =12.5>N2 =8, entonces el primer cuartil es:
4 4
LM n N OP LM 50 N OP
+c M 4 PP = Y + c MM N4 N PP = 57 + 8LMN1214.5-88 OPQ = 63.0
j 1 2
' '
Q1 = Y j-1 j
MN N Nj j 1
Q
2 j
N 3
Q 2
Q3 = 63.0 puntos.
- 116 - V. Ibaez Q.
n
Se debe comprobar que: N j1 < N j esto es igual a: 8 12.5 < 14
4
Respuesta: Significa que el 25% del total de personas, es decir 12.5 califica-
ciones se encuentran inferiores a 57 puntos y los 75% de los alumnos restantes tienen
calificativos superiores a 57 puntos.
LM 2/ n N OP LM n N OP
+ c M 4/ PP = Y +c M 2 PP
j1 j1
Q 2 = Me = Y ' '
j1
MN N N
j
j j1
Q
j1 j
MN N N
j j1
Q
C. TERCER CUARTIL (Q3).
Es un valor que supera a no ms del 75% de las n observaciones
y que es superado por no ms del 25% de las n observaciones. Es decir, que el 75%
de las observaciones tienen valores inferiores o iguales a Q3 y el 25% restante tienen
valores superiores a Q3.
75% de n Q3 25% de n
3 ( n + 1)
i) Si es un entero, entonces Q3 = al punto de posicin de
4
3( n + 1)
= X3( n+1)
4 4
Estadstica Aplicada a la Educacin - 117 -
3 ( n + 1)
ii) Si no es un entero, es decir es fraccionario, realizar una
4
interpolacin lineal entre los dos valores correspondientes a las
dos observaciones entre las cuales se encuentra la fraccin.
EJEMPLO:
Determinar para el tercer cuartil Q3 para los datos del ejemplo anterior que
corresponde al peso (kg) de pacientes del HRMNB-Puno.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, 84 n = 11
SOLUCIN:
1. Se ordena los datos en forma ascendente:
Q3
70 70 73 74 77 77.5 78 80 83 83 84
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)
3(11 + 1) 36
2. Como n = 11, entonces = = 9 , el valor de Q3 es la novena obser-
4 4
Q3
70 70 73 74 77 77.5 78 80 83 83
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)
3n
en qu amplitud d N j1 observaciones
4
Esto es: ci N j N j1 U| LM 3n N OP
V| de donde: d = c M 4 PP
j1
MN N N
3n
d N j1
W
j
4 j j1
Q
Luego:
LM 3n N OP
+c M 4 PP
j1
'
MN N N
Q3 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q3.
cj = Amplitud de la clase que contiene a Q3.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Q3.
Nj-1 = Frecuencia absoluta acumulada inmediatamente anterior a la clase de Q3.
LM 3 H OP
+c M 4 PP
j1
'
MN H H
Q3 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q3.
cj = Amplitud de la clase que contiene a Q3.
Hj = Frecuencia relativa acumulada de la clase que contiene a Q3.
Hj-1 = Frecuencia relativa acumulada inmediatamente anterior a la clase de Q 3.
- 120 - V. Ibaez Q.
EJEMPLO:
Calcular el tercer cuartil (Q3) con los datos que corresponde a los calificativos
(puntajes) de personas con dao cerebral post-meningtico.
SOLUCIN:
1) Construir la tabla de distribucin de frecuencias.
Calificativos ni Ni
41 - 49 5 5
49 - 57 3 8
57 - 65 6 14
65 - 73 9 23
73 - 81 12 35 3n 3( 50 )
= = 375
. > N5 = 35
81 - 89 9 44 4 4
89 - 97 6 50
Totales 50
3 n 3( 50 )
2) Ubicar la posicin de Q3: n = 50, entonces = =37.5, entonces, j = 6,
4 4
j-1 = 5, por lo tanto, la clase que contiene a Q3 es Y5 - Y6 = 81 - 89.
3n
3) Como =37.5>N5 =35, el tercer cuartil es:
4
n
Se debe comprobar que: N j1 < N j esto es igual a: 35 375
. < 44
4
LM 3n N OP LM 3(50) N OP
+c M 4 PP = Y + c MM N4 N PP = 81 + 8LMN 3744.5-3535OPQ = 83
j 1 5
' '
Q3 = Y j-1 j
MN N N
j j 1
Q
5 j
N 6 5
Q
Q3 = 83.22 puntos.
Respuesta: Significa que del total de alumnos, el 75%, es decir 37.5 tienen
calificativos (puntos) inferiores o iguales a 83.22 puntos, y el 25% restante tienen
calificativos superiores a los 83.22 puntos.
Estadstica Aplicada a la Educacin - 121 -
0% 10% D1 10% D2 10% D3 10% D4 10% D5 10% D6 10% D7 10% D8 10% D9 10% 100%
X min n 2n 3n 4n 5n 6n 7n 8n 9n X mx
10 10 10 10 10 10 10 10 10
14444444
4244444444
35n=n14444444
4244444444
3
50% 10 2 50%
i ( n) 5
ii) Si + no es un entero exacto, Di se obtiene por interpolacin
10 10
lineal entre los dos valores correspondientes a las dos observacio-
nes entre las cuales se encuentra la fraccin.
EJEMPLO:
Determinar el primer decil (Di ) para los datos del ejemplo anterior que co-
rresponde al peso (kg) de los pacientes del HRMNB - Puno.
- 122 - V. Ibaez Q.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, 84 n = 11
SOLUCIN:
1. Se ordena los datos en forma ascendente:
D1
70 70 73 74 77 77.5 78 80 83 83 84
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)
D5 = ?
i) ubicar la posicin de D5: 5(11) + 5 = 60 = 6, D5 = X 5(11) 5 = X ( 6) = 77.5 cm.
10 10 10 +
10 10
70 70 73 74 77 77.5 78 80 83 83
X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 ) X (1 0 )
5(10) 5 55
2) ubicar la posicin de D5: + = . , D5 = 77 + ( 77.5 77) x0.5 = 77.25 cm.
= 55
10 10 10
Si n = 11, calcular D9:
9 (11) 5 104
i) ubicar la posicin de D9: + = = 10.4 , D 9 = 83 + (84 83) x1 = 84 cm.
10 10 10
Respuesta: D9= 84 kg, nos indica que el 90% de los pesos de personas,
tienen medidas inferiores o igual a 84 kg. y el resto de medidas (10%), tienen pesos
(kg) superiores a 84 kg.
Estadstica Aplicada a la Educacin - 123 -
b) DECILES CON DATOS AGRUPADOS TABULADOS (Di).
i( n) i
2. Se determina la posicin o si se considera la tabla de Hj, i = 1,2,3,
10 10
..., 9.
i(n) i
i. Si N j1 = H j1 = , entonces Di, = Yj-1.
10 10
i(n) i
ii. Si > N j1 > H j1 , entonces Di = Yj-1 +d.
10 10
i(n)
en qu amplitud d Nj1 observaciones
10
MN N N
in
d N j1
W
j
10 j j1
Q
Luego:
LM i(n) N OP
+ c M 10 PP,
j1
'
i = 1,2,...,9
MN N N
Di = Y j-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Di.
cj = Amplitud de la clase que contiene a Di.
Nj = Frecuencia absoluta acumulada de la clase que contiene a D i.
Nj-1 = Frec. absoluta acumulada inmediatamente anterior a la clase de Di.
LM i H OP
+ c M 10 PP,
j 1
'
i = 1,2,....,9
MN H H
D i = Yj-1 j
j j 1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Di.
cj = Amplitud de la clase que contiene a Di.
Hj = Frecuencia relativa acumulada de la clase que contiene a Di.
Hj-1 = Frec. relativa acumulada inmediatamente anterior a la clase de Di.
EJEMPLO:
Calcular los siguientes deciles: D1, D2,D3, ... , D9 para las calificaciones de la
prueba de matemticas de 50 alumnos que corresponde al ejemplo anterior:
Estadstica Aplicada a la Educacin - 125 -
SOLUCIN:
calificativos ni Ni
41 - 49 5 5
49 - 57 3 8
57 - 65 6 14
D4
65 - 73 9 23
D5 , D6
73 - 81 12 35
D8
81 - 89 9 44
89 - 97 6 50
Totales 50
4(n) 4( 50 )
1) Ubicar la posicin de D4: n = 50, entonces = =20, ste nmero
10 10
esta comprendido entre 14 y 23, entonces j =4, j-1 = 3, con: Y3 - Y4 = 65 - 73.
4 ( 50 )
2) Como =20>N3 = 14, entonces reemplazando en la frmula se tiene:
10
LM 4(50) N OP
= Y + c M 10 P L 20 14 OP = 70.33
= 65 + 8M
3
N 23-14 Q
'
D4 3
MN N N PQ
j
4 3
D4 = 70.33 puntos.
5( 50 )
2) Como =25>N4 =23, entonces reemplazando en la frmula se tiene:
10
LM 5(50) N OP
= Y + c M 10 PP = 73 + 8LMN 2535- 2323OPQ = 74.33
4
'
MN N N
D5 4 j
5 4
Q
D5 = 74.33 puntos (este valor coincide con la Me).
Xmn. P 50 Xmx.
0%
P1 P2 P3 ...... ...... P 50 ...... P 97 P 98 P 99 100%
1% 1% 1% 1% ...... ...... 1% 1% 1%
2% 98%
98% 2%
99% 1%
i(n)
en qu amplitud d N j1 observaciones
100
MN N N
in
d N j1
W
j
100 j j1
Q
- 128 - V. Ibaez Q.
Luego:
LM i(n) N OP
+ c M 100 PP ,
j 1
'
i = 1,2 , ... ,99
MN N N
Pi = Y j-1 j
j j 1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Pi.
cj = Amplitud de la clase que contiene a Pi.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Pi.
Nj-1 = Frec. absoluta acumulada inmediatamente anterior a la clase de Pi.
n = Tamao de muestra.
Cuando se usa las frecuencias acumulada relativa, la frmula es la si-
guiente:
LM i H OP
+ c M 100 PP,
j1
'
i = 1,2,....,99
MN H H
Pi = Y j-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Pi.
cj = Amplitud de la clase que contiene a Pi.
Hj = Frecuencia relativa acumulada de la clase que contiene a Pi.
Hj-1 = Frec. relativa acumulada inmediatamente anterior a la clase de Pi.
EJEMPLO:
Calcular los percentiles: P10, P17, P20, P30, P25, P50, P75, P90 para los calificativos
(puntos) de los alumnos de matemticas del ejemplo anterior.
PERCENTIL (P10)
1. Se construye la tabla de distribucin de frecuencias:
LM 25(50) N OP
+ c M 100 PP = 57 + 8 LMN 1214.5-88 OPQ = 63.0
2
'
MN N N
P25 = Y 2 j
3 2
Q
P25 = Q1 = 63.0 puntos.
PERCENTIL (P50)
i(n) 50( 50 )
1) Ubicar la posicin de P50: n = 100, entonces = =25, entonces ste
100 100
valor est comprendido entre 23 y 35, luego j =5, j-1 = 4, por lo tanto, la
clase que contiene a P50 es Y4 - Y5 = 73 - 81.
50( 50 )
2) Como =25>N4 =23, entonces: Y4 - Y5 = 73 - 81.
100
Reemplazando en la frmula de Percentil, se tiene:
LM 50(50) N OP
= Y + c M 100 P L25 23OP = 74.33
= 73 + 8M
4
N 35-23 Q
'
MN N N PQ
P50 4 j
5 4
PERCENTIL (P75)
i(n) 75( 50 )
1) Ubicar la posicin de P75: n = 50, entonces = =37.5, entonces
100 100
ste valor est comprendido entre 35 y 44, luego j =6, j-1 = 5, por lo tanto,
la clase que contiene a P75 es Y5 - Y6 = 81 - 89.
- 130 - V. Ibaez Q.
75( 50 )
2) Como =37.5>N5 =35, entonces, reemplazar en la frmula:
100
LM 75(50) N OP
= Y + c M 100 P L37.5 35OP = 83.22
= 81 + 8M
5
N 44 - 35 Q
'
MN N N PQ
P75 5 j
6 5
FRMULA GENERAL:
R| Cuartil U| LM ? n N OP
C=S
| Qu int il |V = Y '
+c M ?
j1
PP
|| Decil || j1
MN N N
j
j1
Q
TPercentilW
j
Estadstica Aplicada a la Educacin - 131 -
EJERCICIOS 5.1
6
ESTADGRAFOS DE
DISPERSIN
6.1. INTRODUCCIN.
R = Xmx - Xmn.
EJEMPLO:
i) Rango Rc = Xmx - Xmn= 47 - 25 = 22 kg.
ii) Rango Rpg = Xmx - Xmn= 42 - 32 = 10 kg.
EJEMPLO:
Para el ejemplo anterior que corresponde a los calificativos de la prueba de
matemticas de los 50 alumnos, se tiene tabulados o agrupados en tablas de distribu-
cin de frecuencias:
RECORRIDO INTERCUARTLICO
X (1) X (n)
Dato menor Primer cuartil Segundo cuartil Tercer cuartil Dato mayor
Q 1 = P 25 Q 2 = P 50 Q 3 = P 75
EJEMPLO:
Calcular el RI para la siguiente informacin de que corresponde a los pesos
de nios de 6to. grado de primaria.
SOLUCIN:
Clculo de Q1 = ?; n = 20
Q1 Q3
Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pesos (kg) 25 25 26 26 27 27 27 28 28 29 30 30 34 35 37 38 38 38 42 47
X ( 5) = 27 UV
Q 1 = X ( 5) + X ( 6) X ( 5) ( 0.25)
X (6) = 27 W Q1 = 27 + ( 27 27)( 0.25) = 27 kg
Clculo de Q3.
1. Ubicar la posicin del Q3, entonces 3 ( n + 1) = 3 ( 2 1) = 1 5.7 5
4 4
X(15) = 37 UV
Q1 = X(15) + X(16) X(15) (0.75)
X(16) = 38 W Q1 = 37 + (38 37)(0.75) = 37.75 kg
X i X
DM = i =1
n
Donde: x = Promedio aritmtico de la muestra.
xi = Son las observaciones individuales de la muestra.
n = Es el nmero total de observaciones tamao de la muestra.
= Indica valor absoluto de una observacin dado.
n i Yi Y
DM = i =1
n
Donde: m = Nmero de clases.
ni = Frecuencia absoluta de la clase i.
Yi = Marcas de clase o puntos medios de la clase i.
Tambin se puede calcular con frecuencia relativas, usando la siguien-
te frmula:
m m
ni
DM =
i =1 n
Yi Y = h
i =1
i Yi Y
EJEMPLO:
n Y i i
3618
Y = i =1
= = 72.36 puntos
n 50
5
n Y Yi i
586.56
DM = i =1
= = 1173
. puntos. esto quiere decir que el promedio de
n 50
las desviaciones de calificaciones (puntos), respecto a la calificacin promedio es
11.73 puntos.
VENTAJAS:
DESVENTAJAS:
X i Me
DMe = i =1
n
EJEMPLO:
Encontrar la desviacin mediana absoluta de los pesos de los profesores de un
colegio.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10
SOLUCIN:
1. Ordenar en forma ascendente de menor a mayor los datos:
70 70 73 74 77 77.5 78 80 83 83
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)
X10 + X10
+1 X( 5 ) + X( 6 ) 77 + 77.5
Me = 2 2
= = = 7725
. kg.
2 2 2
X i Me
37.5
DMe = i =1
= = 3.75 kg.
n 10
- 140 - V. Ibaez Q.
6.7.2. DESVIACIN MEDIANA ABSOLUTA CON DATOS AGRUPA-
DOS.
La desviacin mediana absoluta es la diferencia absoluta de cada uno
de las marcas de clase o puntos medios con respecto a la mediana y multiplicado por
las frecuencias absolutas, dividido entre el nmero total de datos. Esta definido por:
m
n Y Mei i m
DMe = i=1
, n = ni
n i =1
EJEMPLO:
Con los datos agrupados de las calificaciones de los alumnos de matemticas.
Calcular la desviacin mediana absoluta (DMe).
[Y'i-1 - Y'i> ni Yi Ni Yi Me ni Yi Me
41 - 49 5 45 5 29.33 146.65
49 - 57 3 53 8 21.33 63.99
57 - 65 6 61 14 13.33 79.98
65 - 73 9 69 23 n
= 25 > N4 = 23
5.33 47.97
73 - 81 12 77 35 2 2.67 32.04
81 - 89 9 85 44 10.67 96.03
89 - 97 6 93 50 18.67 112.02
5
Totales 50 n
i =1
i Yi Me = 578.68
SOLUCIN:
LM 50 N OP
Me = Y + 8M 2 P
4
F 25 23IJ = 74.33
= 73 + 8G
H 35 23K
'
3
MN N N 5PQ 4
Me = 74.33 puntos.
n Y Mei i
578.68
DMe = i =1
= = 11.57 puntos.
50 50
Estadstica Aplicada a la Educacin - 141 -
6.8. LA VARIANZA.
La varianza, es una medida que cuantifica el grado de dispersin o de varia-
cin de los valores de una variable cuantitativa con respecto a su media aritmtica. Si
los valores tienden a concentrarse alrededor de su media, la varianza ser pequea,
en cambio si los valores tienden a distribuirse lejos de la media, la varianza ser
grande.
(X i ) 2
2 = i =1
= M ( X ) 2
N
(X i X) 2
V( x) = S2x = i =1
n
Si se conoce la media aritmtica poblacional , la mejor estimacin
de la varianza poblacional 2 a partir de una muestra esta definido por:
n
(X i ) 2
V( x) = i =1
, n = Nmero de elementos de la muestr
n
Pero en la prctica rara vez se conoce , por esta razn se realiza la
estimacin de la muestra x , que lo sustituye a , lo cual nos permite que la suma
de cuadrados debe ser mnimo, es decir:
- 142 - V. Ibaez Q.
(x
i =1
i x ) 2 = mnimo
N N
N N
N X 2i ( X i ) 2
N
X 2
i NX 2
iii) 2 = i =1 iv) 2 = i =1
2
i =1
N N
n n n
n x 2i ( x i ) 2 x 2
i nx 2
iii) S =2 i =1 i =1
iv) S2 = i =1
n2 n n 1
EJEMPLO:
Los datos corresponden a la variable peso (kg) de los profesores de un Cole-
gio.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 Calcular la varianza?.
bx xg
10 10
2
Xi i
765.5 203.225
X = i =1
= = 76 .55 kg. ; S = 2 i =1
= = 22.58 kg.
10 10 n 1 9
Estadstica Aplicada a la Educacin - 143 -
10
10 ( xi )2
x i
2
i =1
n
58802.25
10
. )2
( 7655
S2 = i =1
= = 22.58 kg.
n 1 9
c h n cY Yh
m m
ni Yi Y
2 2
i i
S2 = i =1
, para (n 30); S2 = i=1
, para (n>30)
n 1 n
Frmulas equivalentes
m m m
n n i Yi2 ( n i Yi ) 2 ( n i Yi ) 2 m
, S = n i Yi nY
m 2 2 2
S =
2 i =1 i =1
, S = n iY
2
i
2 i =1
n2 i =1 n i =1
1. Para n>30.
m
( n i Yi ) 2
c h
m
n Y
m
n i Yi Y
2 2 i =1
i i
n
i) S = i =1
ii) S = i =1
2 2
n n
- 144 - V. Ibaez Q.
m m
n n i Yi2 ( n i Yi ) 2
m
ni Yi2 nY 2
iii) S 2 = i =1 iv) S 2 = i =1 i =1
n n2
2.Para n 30 (Varianza de la muestra).
m
( n i Yi ) 2
n cY Y h
m m
n Y
2
i i i i
2
i =1
n
i) S = 2 i =1
ii) S = 2 i =1
n 1 n 1
m m
n n i Yi2 ( n i Yi ) 2
m
n Y i i
2
nY 2
iii) S2 = i =1 iv) S2 = i =1 i =1
n 1 n2 n
EJEMPLO:
Calcular la varianza para las calificaciones (puntos) de los alumnos del curso
de matemticas.
n Y i i
3618
Y = i =1
= = 72.36 puntos.
n 50
Reemplazando a la frmula:
n cY Y h
7
2
i i
9995.52
S2 = i =1
= = 199.9 puntos.
n 50
n cY Y h
8
2
i i
999552
.
S2 = i =1
= = 203.99 puntos.
n 1 49
Entonces: S2 = 199.9 puntos.
PROPIEDADES DE LA VARIANZA.
S = V ( x ) = + S2
N
( X i )2
c h
N N
X
2
Xi X 2
i i =1
N
i) = ii) =
i =1 i =1
N N
N N
N X 2i ( X i ) 2
N
X2i NX2
iii) = i =1 iv) = i =1 i =1
N N2
n
( xi ) 2
bx g
n n
x x
2
i
2
i i =1
n
i) S = i =1
ii) S = i =1
n 1 n 1
x
n n
n x 2i ( x i ) 2 nx 2
2
i
iii) S = i =1 i =1
iv) S= i =1
n2 n n 1
Donde: n = tamao de la muestra.
Xi = Variable observado.
x = Promedio aritmtico.
EJEMPLO:
Con los datos de peso (kg) que corresponde a los nios del sexto grado de
educacin primaria, calcular la desviacin estndar (S).
Desviacin estndar (S) para los nios.
20
20 ( x i ) 2
x 2
i i =1
n
21053
(637) 2
20 = 764.55 = 6.343 kg
S= i =1
=
n 1 19 19
Es decir que los pesos (kg) de los nios del sexto grado de primaria es
6.34 kg mayores o menores que el peso promedio 31.85 kg.
R 47 25
= = 3.468
S 6.34
m
( n i Yi ) 2
n cY Y h
m m
nY
2 2 i =1
i i i i
n
ii) S =
i =1
i) S = i =1
n 1 n 1
m m
n n i Yi2 ( n i Yi ) 2
m
nY i i
2
nY 2
iii) S = i =1 iv) S = i =1 i =1
n 1 n2 n
EJEMPLO:
Calcular la desviacin estndar (S) de los calificativos del curso de matem-
ticas (puntos) de los alumnos.
n Y i i
3618
Y = i =1
= = 72.36 puntos.
n 50
n cY Y h
7
2
i i
.
999552
Reemplazando a la frmula: S = i =1
= = 14.139 puntos.
n 50
n cY Y h
8
2
i i
9995.52
S= i =1
= = 14.283 puntos.
n 1 49
Estadstica Aplicada a la Educacin - 149 -
Para los dos mtodos abreviados, la desviacin estndar, se obtiene simple-
mente sacando la raz cuadrada de la varianza, es decir: S = S2 .
P-4. Si cada valor de las observaciones x1, x2,..,xn, se multiplica por una cons-
tante a, la desviacin estndar del nuevo conjunto de valores Y 1,
Y2,..,Yn, donde Yi = axi, i = 1,2,..,n, es igual a la desviacin estndar del
conjunto original multiplicado por el valor positivo (valor absoluto) de
dicha constante.
SY = SaX = a S X
P-5. La desviacin estndar para el total, se puede estimar con:
STotal = NS, Donde: N = Nmero de elementos de la poblacin.
S
SX = , Donde: S = Desviacin estndar.
n
n = Tamao muestral.
S X , se le conoce E.S. de la media de una muestra tomada al azar de una
poblacin N( , ) , su valor indica la desviacin promedio de las medias (en una
poblacin de muestras) con respecto al valor de la poblacin original muestreada.
La desviacin estndar de los promedios o error estndar ( S X ), puede dedu-
cirse de la desviacin estndar de la poblacin original con la frmula siguiente:
S Nn
SX = , sta frmula, se usa para poblaciones finitas relativa-
n N 1
mente pequeas.
n
Si N , es decir si N es muy grande entonces N 0 , es decir
n
es una
N
cantidad que se acerca al valor cero, a medida que aumenta N.
Nn Nn
Entonces el factor de correccin , se convierte en uno, es decir 1,
N 1 N
S
quedando la frmula S X = (1) , entonces la frmula se convierte en:
n
S
SX =
n
EJEMPLO:
Calcular el Error Estndar (E.S.) con los datos de pesos (kg) de los pacientes
del HRMNB - Puno.
SOLUCIN:
6.34
S = 6.34 kg, n = 20, entonces SX = = 1.418 , S X =1.42 kg.
20
USOS:
c2
V( X) corregida = V( X) (varianza correccin Sheppard).
12
Donde: c = Es la amplitud del intervalo de clase.
EJEMPLO:
Con los datos calculados para los pacientes. Calcular la Varianza por la Co-
rreccin de Sheppard.
(4.4) 2
V( X) corregida = 29.499 = 27.88566 27.89 kg.
12
SOLUCIN:
47.0
C. A. = = 188
. kg 2.0 kg
25.0
R X mx . X mn .
R . R. = =
X X
EJEMPLO:
Para los datos de pesos de los pacientes, encontrar R.R.
SOLUCIN:
47 25 22
R. R. = = = 0.69 kg
3185
. 3185
.
SOLUCIN:
20 + 1 21
1) Ubicar la posicin del cuartil Q1: = = 5.25
4 4
2) Como no es un entero, entonces realizar por la interpolacin lineal, y esta
comprendido entre los valores de: X(5)= 27 y X(6) = 27, entonces:
Q1 = 27 + (27 - 27)(0.25) = 27
Q3 = ?
3( n + 1) 3(21)
1) Ubicar la posicin del cuartil Q3: Si = = 1575
. , no es un nmero
4 4
entero, entonces realizar la interpolacin lineal.
Q3 = 37 + (38-37)(0.75) = 37.75
n = 20 FG 6.34 IJ x100
X = 31.85
CV . =
H 31.85 K
S = 6.34 CV. = 19.91%
Interpretacin:
El CV. de los pacientes presentan una variabilidad alta (CV. = 19.91%), esto
nos indica que existe bastante variabilidad entre unidades experimentales, es decir
los pesos (kg) entre pacientes.
- 154 - V. Ibaez Q.
Caractersticas del Coeficiente de Variabilidad.
En los experimentos en ganadera, el CV. por lo general es alto, por los dife-
rentes factores medio ambientales que se presentan en el lugar de la experimenta-
cin, es decir la variabilidad del experimento, se debe a los factores como: edad,
talla, peso, raza del animal, lugar clima, droga utilizada, diseo, salud del animal,
prdida de unidad experimental, entre otros. Considerando estos factores la escala
siguiente puede ser usado para calificar la precisin de los experimentos que se rea-
lizan en el campo (esto no es absoluto ms bien es una pauta para sugerir la preci-
sin).
Entre 5 a 10% = Excelente
Entre 11 a 20% = Muy buena
Entre 21 a 25% = Buena
Entre 26 a 35% = Deficiente.
Entre 36 a 45% = Muy mala.
Mayor a 45%.
Sin embargo, podemos comparar con otros autores la precisin del CV. para
juzgar y diferenciar en los lugares en que ellos han trabajado:
Sin embargo, Reyes, C.P. (1980), en Mxico indica que el CV, para tres po-
blaciones de igual , pero diferente de .
CV. = 20% muy variable.
CV. = 10% variable
CV. = 5% relativamente uniforme.
En diferentes trabajos es necesario calcular una medida que muestre las di-
recciones de la dispersin de los datos con respecto a su centro y que completan la
descripcin de las distribuciones de frecuencias. Estas caractersticas se llaman ASI-
METRA (no tener simetra) y curtosis o apuntamiento, es decir las medidas de
dispersin solo indican la magnitud de las variaciones, pero no dan informacin
acerca de la direccin de las variaciones.
ni + Sesgada a la derecha
Fig. A
ni - Sesgada a la
izquierda Fig. B
X = Me = Md Y' i
EJEMPLO:
Con los datos de la distribucin de frecuencias. Calcular CAs.
Intervalo 32 - 34 34 - 36 36 - 38 38 - 40 40 - 42
Frecuencia 4 5 8 1 2
a) Calcular los coeficientes de Asimetra de Pearson.
b) Calcular el coeficiente de Asimetra por la frmula de los momentos.
c) Calcular los coeficientes por el mtodo de los cuantiles.
SOLUCIN:
2 3 4
[Y'i-1 - Y'i> ni Ni Yi niYi ui = (Yi - 37)/2 uini u ini u ini u ini
32 - 34 4 4 33 132 -2 -8 16 -32 64
34 - 36 5 9 35 175 -1 -5 5 -5 5
36 - 38 8 17 37
37 296 0 -13 5 0 0 0
38 - 40 1 18 39 39 1 1 1 1 1
40 - 42 2 20 41 82 2 4 8 16 32
5 5 5 5 5
Totales n =20 nY =724
i=1
i i un = -8 u n = 30 u n = -20 u n = 102
i=1
i i
i=1
2
i i
i=1
3
i i
i=1
4
i i
3 2
Estadstica Aplicada a la Educacin - 159 -
3. Clculo de la moda (Md) de la distribucin:
3 2 3 4
L F I
c M n u G n u J
5 5 2
OP
M H K PQ = 4 30 (8)
2 2
n
= N
i i i i 2
i =1 i =1 20
S2 = 5.64 kg.
n 1 19
Y Mo 36.2 36.6
CAs = = = 0168
.
S 2.375
3( Y Me) 3(36.2 36.25)
CAs = = = 0.063
S 2.375
Interpretacin:
MN N N
j j 1
Q
- 160 - V. Ibaez Q.
n 20
i) Ubicar la posicin del Q1: = = 5, ste valor est comprendido entre los
4 4
valores de 4 y 9, entonces j = 2, j-1 = 1, entonces Y1 - Y2 = 34 - 36.
n 20
ii) Como = = 5 >N =4, es cierto, entonces reemplazamos a la Q1:
4 4 1
Interpretacin:
La conclusin sera de que la asimetra de CAs<0, es decir es sesgada a la
izquierda.
LM 10 n N OP
+ c M 100 PP
j 1
i) P10 = Y '
j 1 j
MN N N j j 1
Q
Estadstica Aplicada a la Educacin - 161 -
10n 10(20)
- Ubicar la posicin del P10: = = 2, ste valor est comprendido entre
100 100
los valores de 0 y 4, entonces j = 1, j-1 = 0, entonces Y0 - Y1 = 32 - 34.
LM 2 0 OP = 33 kg.
P10 = 32 + 2
N4 0Q
LM 50n N OP
+ c M 100
MN N N PPQ
j1
ii) P50 = Yj'1 j
j j1
50 n 50( 20)
- Ubicar la posicin del P10: = = 10 , ste valor est comprendido entre
100 100
los valores de 9 y 17, entonces j = 3, j-1 = 2, entonces Y2 - Y3 = 36 - 38.
50 n 50(20)
- Como = = 10 >N =9, es cierto, entonces reemplazamos a la P50:
100 100 2
LM90n
N j 1
OP
iii) MM
P90 = Yj'1 + c j 100
N j N j 1
PP
N Q
90 n 90( 20)
- Ubicar la posicin del P90: = = 18 , ste valor est comprendido entre
100 100
los valores de 18 y 20, entonces j = 5, j-1 = 4, y es Y4 - Y5 = 40 - 42.
90 n 90( 20)
- Como = = 18 =N =18, son iguales entonces el P90 = Yj-1 =Y4 =40.
100 100 4
6.17.1 KURTOSIS.
Es el grado de apuntamiento de una curva de distribucin; es decir es
la deformacin vertical de una curva de frecuencias. La curtosis se determina compa-
rando la curva resultante de frecuencias con la forma de una curva normal o SIM-
TRICA, sta curva tiene la media aritmtica y la desviacin estndar igual a la distri-
bucin que se estudia. La kurtosis puede ser: Leptokrtica, Platikrtica y Mesokrtica.
A. LEPTOKRTICA.
Es cuando la curva presenta una elevacin de forma pico o apunta-
miento relativamente alta. Esta forma de distribucin muestra una gran concentra-
cin de las observaciones o datos en el centro, tal como se observa en la siguiente
figura:
Leptokrtica
B. MESOKRTICA.
Es cuando la curva no es muy alta o apuntada ni achatada, esta
forma de curva es intermedia entre una leptokrtica y Platikrtica, a este curva se le
considera como una distribucin normal. La kurtosis de una curva normal debe
cumplir que: K = 0.263.
Mesokrtica
Estadstica Aplicada a la Educacin - 163 -
C. PLATIKRTICA.
Es cuando la curva tiene muy poco altura o apuntamiento pico,
es decir la curva es achatada, esta curva representa a una distribucin de frecuencias
opuesto a la leptokrtica, y est representada en la siguiente figura:
Platikrtica
Interpretacin:
EJEMPLO:
Con la informacin siguiente. Calcular el coeficiente de kurtosis por momen-
tos y percentlico?.
2 3 4
[Y'i-1 - Y'i> ni Ni Yi niYi ui = (Yi - 37)/2 uini u ini u ini u ini
32 - 34 4 4 33 132 -2 -8 16 -32 64
34 - 36 5 9 35 175 -1 -5 5 -5 5
36 - 38 8 17 37
37 296 0 -13 5 0 0 0
38 - 40 1 18 39 39 1 1 1 1 1
40 - 42 2 20 41 82 2 4 8 16 32
5 5 5 5 5
Totales n =20 nY =724
i=1
i i u n = -8 u n = 30 u n = -20 u n =102
i=1
i i
i=1
2
i i
i=1
3
i i
i=1
4
i i
SOLUCIN:
a) Calcular el coeficiente de Kurtosis Percentlico.
En el ejemplo anterior, ya se ha calculado los cuartiles y percentiles:
EJERCICIOS 6.1.
1. Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguien-
tes:
27.8 43.0 28.7 19.1 45.7 33.5 16.9 43.6 24.7 9.7
35.0 35.0 13.4 11.8 17.0 48.8 40.6 38.6 32.0 16.4
28.4 27.2 19.8 21.0 39.5 44.6 25.5 34.1 0.6 15.4
19.2 11.8 3.9 33.4 27.9 32.5 0.2 13.5 3.5 31.0
Agrupar en una tabla de distribucin de frecuencias y calcule: Recorrido o Rango,
Recorrido Intercuartlico, Recorrido Interdecil, Rango Semi Intercuartil, Desviacin
Media, Desviacin Media Absoluta, Varianza, Varianza por mtodo (abreviado y
codificado), Desviacin estndar, Error estndar, Correccin Sheppard, Medidas de
dispersin relativa: (CA, RR, RIR), Coeficiente de Variacin, Coeficiente de asime-
tra en funcin de los cuartiles, Kurtosis: Kurtosis en funcin de cuantiles.
7
PROBABILIDADES
Ejemplo:
l q
1 : 1 = cara, sello l
3 : 3 = Gana, Empata, Pierde q
- 168 - V. Ibaez Q.
l
2 : 2 = P1 , P2 , P3 ,L , P50 q 4 : l q
4 = Sobresaliente, bueno, regular, malo
Ejemplo:
1 : A = lcaraq 3 : l
C= Empate q
m
2 : B = x 15 x 50
+
r 4 : D = {Sobresaliente}, E = {bueno},
F = {Regular}, G = {Malo}
Pclw qh = 1 , l q Pclw qh
k r <n
i A = w1 , w2 , w3 ,L , wr , r < n , P( A ) = i
i =1 i =1
Ejemplo:
S se lanza una moneda tres veces.
a) Calcular la probabilidad de que ocurran 2 caras.
b) Calcular la probabilidad de que ocurran al menos 2 caras.
c) Calcular la probabilidad de que ocurran a lo ms 2 caras.
SOLUCIN:
C = CCC
C
S = CCS
C
C = CSC
S
S = CSS
C = SCC
C
S = SCS
S
C = SSC
S
S = SSS
l
= CCC ,CCS , CSC , CSS , SCC , SCS , SSC , SSS , N ( ) = n = q
a) Sea el evento A: Ocurren dos caras. Entonces A = {CCS,CSC,SCC}, n A = 3
nA 3
P( A ) =
= = 0.375
n 8
b) Sea el evento B: Ocurran al menos dos caras.
Entonces B = {CCC,CCS,CSC,SCC}, por lo tanto se tiene que nB = 4 .
nB 4
P( B ) =
= = 0 .5
n 8
c) Sea el evento C: Ocurran a lo ms dos caras.
Entonces C = {CCS,CSC,CSS,SCC,SCS,SSC,SSS}, entonces nC = 7 .
nC 7
P( C ) = = = 0.875
n 8
- 170 - V. Ibaez Q.
Ejemplo: En una seccin de primer grado asisten 20 alumnos con chompa y 30
sin chompa, se selecciona por sorteo un alumno de dicha seccin. Hallar la probabi-
lidad de que dicho alumno est con chompa.
Solucin:
l
= 1 ,2 ,3 , L ,5 0 q , entonces sea el evento D: Se seleccione un alumno con
chompa. nD = 20 , P ( D ) =
nD 20
= = 0 .4 0 40%. La probabilidad de seleccio-
n 50
nar un alumno con chompa es 40%.
EJEMPLO:
En una muetra aleatoria de 120 pacientes, se encontr que 30 de ellos tienen
cncer. Cul es la probabilidad de que un paciente elegido al azar?:
a) Tenga cncer?
b) No tenga cncer?
SOLUCIN:
de a) = 120, entonces el evento F: Paciente con cncer, nF = 30 , n = 120
nF 30 1
P( F ) = = = = 0.25 25%. La probabilidad de que un paciente tenga
n 120 4
cncer es de 25%.
EJEMPLO:
Consideremos el experimento de lanzamiento de dos dados. Calcular la probabi-
lidad de:
a) Obtener suma 7; b) Obtener suma 6; c) Obtener suma mayor que 5; d) Que el
resultado del primer dado sea mayor que el resultado del segundo.
Estadstica Aplicada a la Educacin - 171 -
SOLUCIN:
Dado 2
1 2 3 4 5 6 Dado 1
= {(1,1),(1,2),(1,3),.....,(6,6)}= n = 36 = 62= 36
a) Sea el evento G: Obtener suma 7. Entonces
G= mb D , D g D + D = 7r, n
1 2 1 2 G = 6 , P(G) =
nG 6 1
= = = 0167
n 36 6
.
H= mb D , D g D + D = 6r, n
1 2 1 2 H = 5 , P( H ) =
nH 5
= = 0139
n 36
.
I= mb D , D g D + D > 5r, n
1 2
n 26 13
1 = = 0722
n 36 18
. 2 I = 26 , P(I ) = I =
d) Sea el evento J: El primer dado sea mayor que el segundo dado. Entonces
J = mb D , D g
1 2 r
D1 > D2 , n J = 15 , P(J ) = J = = = 0417
.
n 15 5
n 36 12
nA
P(A) = Lm con n A n , donde n es suficientemente grande.
n n
Nmero de veces que ocurri el evento A
P(A) =
Nmero total de veces que se repiti el experimento
Observaciones:
a) 0 P ( A ) 1 0% P(A) 100%
b) n A n = 0 , n A = 0 , P(A) = 0, el evento A no ocurre, es nulo imposible.
c) n A n = 1 , n A = 1 , P(A) = 1, el evento A es cierto o seguro.
EJEMPLO:
La distribucin de nmero de alumnos, segn sexo y por colegio es como sigue:
Colegio
Sexo A B C TOTAL
Hombres 30 15 23 68
Mujeres 19 10 10 39
TOTAL 49 25 33 107
SOLUCIN:
n() =n =107 total
nA 39
a) Sea el evento A: Sea una mujer, entonces n A = 39, P( A ) = = = 0.3645
n 107
36.45%
b) Sea el evento B: Pertenece al colegio A, entonces n B = 49,
nB 49
P( B ) = = = 0.4579 45.79%
n 107
EJEMPLO:
1) La probabilidad de que el hombre llegue a habitar la luna en los prximos 20
aos.
2) La probabilidad de que encuentre una cura para el SIDA en los prximos 5
aos.
3) La probabilidad de que una persona cuente el nmero de peces que existe en el
Lago titicaca, etc.
D. AXIOMAS DE PROBABILIDAD.
1) La probabilidad de un evento cualquiera, es siempre positiva P( A ) 0
2) La probabilidad de un evento siempre es positiva y debe estar:
0 P( A ) 1
3) La probabilidad de un evento cierto o seguro, es la probabilidad del espacio
bg
muestral P = 1 .
4) La probabilidad de un evento nulo o imposible, es cero P(A) = 0, entonces
A= .
FG U A IJ = P( A ), siempre que
k K
5) A1 , A2 , A3 ,L , Ak , P
H Ki =1
i
i =1
i
b g
Ai A j = , i j , es decir P A1 A2 L Ak = P( A1 ) + P( A2 )+L+ P( Ak )
6) Los eventos A y A son mutuamente excluyentes, y se debe cumplir:
P( A A ) = P( A ) + P( A ) = 1
- 174 - V. Ibaez Q.
7) Si los eventos A y B son mutuamente excluyentes, la probabilidad de ocu-
rrencia de A de B es: P( A B ) = P( A ) + P( B )
Cul es la probabilidad de extraer una carta espada un trbol de un
juego de casinos bien barajados?. Como una carta no puede ser al mismo
tiempo espada y trbol, estos dos sucesos son mutuamente exclusivos. Por
lo tanto el resultado es:
13 13 26 1
p( A B ) = + = = = 0 .5
52 52 52 2
Hay problemas de este tipo son poblaciones dicotmicas (con dos partes
definidas), es decir poblaciones si-no, o poblaciones de dos categoras en
las que los sucesos no solo son mutuamente exclusivos sino que tambin
son exahustivos
EJEMPLO:
SOLUCIN:
Sea el evento A: El nio compra caramelos es 0.7.
Sea el evento B: El nio compra galletas es 0.5
A B : El nio compra caramelos y galletas es 0.3.
P( A B ) = P( A ) + P( B ) P( A B ) = 0.7 + 0.5 0.3 = 0.9 90%. La probabili-
dad de que el nio compre caramelos o galletas o ambos es 0.9.
EJEMPLO:
b g b g b g b g b g
c) P A1, A2 , A2 ,L, An B = P A1 B + P A2 B + P A3 B +L+P An B
F
= PG U A
n
I
BJ = Pb A B g
n
H i =1
i
K i =1
i
EJEMPLO:
En un Colegio X, se tiene 35 alumnos en tratamiento por causas diversas; de los
cuales 12 son masculinos, 23 son femeninos. Del total de alumnos 23 sufren enfer-
medad y 12 no presentan enfermedad. Si el Auxiliar del Colegio selecciona un alum-
no al azar de las que estn enfermos. Cul es la probabilidad de que el alumno
encontrada sea femenino?
- 176 - V. Ibaez Q.
SOLUCIN:
Sea el evento A: El alumno seleccionada presenta enfermedad.
B: El alumno encontrada es femenina.
Con Sin
Sexo Enfermedad enfermedad TOTA L
M as cu lino 8 4 12
Femenino 15 8 23
TOTA L 23 12 35
e j
P AB =
P( A B ) 15
P( B )
=
23
= 0.6522 65.22%
e j , Para que suceda A, tiene que haber sucedido u ocurrido primero B vice-
p AB
versa.
EJEMPLO:
De los pacientes de un hospital, el 40% son varones y el 5% son varones que
tienen enfermedad leve. Si se elige un paciente al azar. Cul es la probabilidad de
que tenga enfermedad leve, dado que es varn?.
SOLUCIN:
Sea el evento A: son los pacientes varones. P(A) = 0.40
B: Pacientes que presentan enfermedad leve.
A B : Pacientes varones con enfermedad leve. P( A B ) = 0.05.
e j
P BA =
P( A B ) 0.05
P( A )
=
0.4
= 0125
. 12.5%. La probabilidad de que tenga
enfermedad leve, dado que es varn, es de 12.5%.
b g
P A B =
P( A B )
P( B )
, b g
P( A B ) = P( B ) P A B
b g
P B A =
P( B A )
P( A )
, b g
P( A B ) = P( A ) P B A
Estadstica Aplicada a la Educacin - 177 -
EJEMPLO:
La promocin de sexto grado de primaria de C.E. Enciniano est conformado
por 80 alumnos, 10 nios son provincianos y 20 son varones naciado en Puno. El
total de nios es 30. En ambos sexos hay tantos nacidos en Puno como en provincias.
Se sortear un pasaje como regalo de promocin Cul es la probabilidad de que
gene:
a) Un nio provinciano
b) Un nio nacido en Puno.
c) Una nia provinciana.
d) Una nia nacida en Puno.
SOLUCIN:
Sexo
Proceden cia N i o (N ) N o n i o (N ') TOTAL
Provin cian o (P) 30 10 40
N o Provin cian o (P') 20 20 40
TOTAL 50 30 80
El espacio muestral es n( ) = 80
Tenemos cuatro sucesos que ocurren en forma conjunta con su respectivo valor o
frecuencia, las probabilidades son:
n( N P ) 30 3
a) P( N P ) = = = = 0.375
n( ) 80 8
n( N P' ) 20 1
b) P( N P' ) = = = = 0.25
n( ) 80 4
n( N ' P ) 10 1
c) P( N ' P ) = = = = 0.125
n( ) 80 8
En el mismo ejemplo tenemos los sucesos nio (N), nia (N), provinciano (P),
no provinciano (P) a estos sucesos los conocemos como marginales y sus probabili-
dades son:
50 5 30 3
P( N ) = = = 0.625 P( N ' ) = = = 0.375
80 8 80 8
40 1 40 1
P( P ) = = = 0.5 P( P' ) = = = 0.5
80 2 80 2
- 178 - V. Ibaez Q.
La probabilidad condicional para nuestro ejemplo es:
n( P N ) 3 8 3
P( P N ) = = = = 0.6
n( N ) 58 5
Encontremos el mismo resultado, teniendo en cuenta la reduccin del espacio
muestral.:
30 3
P( P N ) = = = 0.6
50 5
n( P N' ) 1 8 1
En forma anloga para: P( P N' ) = = = = 0.33
n( N' ) 38 3
38 3 18 1 18 1
P( N P) = = = 075
. ; P( N' P) = = = 025
. ; P( P' N ) = = = 020
.
12 4 12 4 58 5
EJEMPLO:
Una urna contiene 5 bolas blancas y 6 negras; se extraen al azar sucesivamente y
sin reposicin 2 bolas. Cul es la probabilidad de que dos resulten blancas?.
SOLUCIN:
Sea el evento A1: La primera bola result blanca.
Sea el evento A2: La segunda bola result blanca.
A1 A2 : Ambas bolas sean blancas.
P( A1 A2 ) = P( A1 ) P A2 A1 = b g 5 4
=
20
11 10 110
= 0.1818 18.18%
5 4 3
P(A1 )=
11
P(A2 A1)=
10 P(A3 A2 )= L
9
Ai A j = , i j y U A = ,
i =1
i
P( Ai ) > 0 , para i = 1,2,3,...,k. Entonces para
b gb g
k
P( B ) = P Ai P B Ai
i =1
A1 A2 A3 Ak
B
B A1 B A2 B A3 B Ak
b
B = B A1 A2 A3 L Ak g
b g
k
B = ( B A1 ) ( B A2 ) ( B A3 )L( B Ak ) = U B Ai
i =1
Ahora probabilidad conjunta, sabemos que cada sumando puede expresarse como:
b g
P( A Ai ) = P B Ai P( Ai ) = P( Ai ) P B Ai . Luego b g
b g b g
P( B ) = P B A1 P( A1 ) + P B A2 P( A2 )+L+ P B Ak P( Ak ) b g
EJEMPLO:
Supongamos que el JAE tiene 40 estudiantes, 20 estn en la especialidad de
electricidad, 15 estn en la especialidad de computacin y 5 estn en la especialidad
Agropecuaria, se sabe que 10 son de electricidad, 5 de computacin y 1 de
agropecuaria, que son hinchas del equipo de JAE. Se elige un estudiante al azar
Cul es la probabilidad de que sea del equipo de JAE?.
- 180 - V. Ibaez Q.
SOLUCIN:
A 1= 2 0 A 2= 1 5 A 3= 5
= 40
B
B A2
B A1 B A3
10 5 1
b g b g
P(B) = P( A1 )P B A1 + P( A2 )P B A2 + P( A3 )P B A3 = b g 20 10 15 5 5 1
+ + = 040
40 20 40 15 40 5
.
b
P Br A = g k
P( Br ) P( A Br )
de otra forma:
P( B ) P( A B )i i
i =1
b g
k k
P( Ar )P(B Ar )
P Ar B = k
, P( Ai )P(B Ai ) = P( Ai B)
P( A )P(B A )
i=1
i i
i=1 i=1
Estadstica Aplicada a la Educacin - 181 -
EJEMPLO:
Los docentes de la UNA-Puno, se clasifican de la siguiente manera: 15% tienen
doctorado, 60% son ingenieros y 25% son licenciados, el 60% de los doctores, 80%
de los ingenieros y el 40% de los licenciados son varones. Se elige al azar a un
profesor y resulta ser mujer. Cul es la probabilidad de que sea doctor?
SOLUCIN:
Sean los eventos:
A1: Doctores, P(A1) = 015
. , P(A1)P(B A1) = 0.15x0.6 = 0.09
A2: Ingenieros, P(A2 ) = 060
. , P(A2 )P(B A2 ) = 0.6x0.8 = 0.48
A3: Licenciados, P(A3 ) = 025
. , P(A3)P(B A3) =0.25x0.4 =0.10
B: La persona elegida sea una mujer.
P( B A1 ) = 0.60
n
V ar
P(A1) = 0.15
Mujer P( B' A1 ) = 040
. = B'
res
cto P( B A2 ) = 0.80
Do n
P(A2) = 0.60 Var
Ingenieros
Muje
Lic
enc r P( B' A2 ) = 020
. = B'
iad
os
Varn P( B A3 ) = 0.40
P(A3) = 0.25
Muj
er
P( B' A3 ) = 0.60 = B'
b
Entonces P( A1 ) P B' A1 = 0.15x0.4 = 0.06 g
3
i=1
b g
P( Ai )P B' Ai = P( A1 )P(B' A1 )+ P( A2 )P(B' A2 )+ P( A3 )P(B' A3 )
= 015
. x0.4+0.60x0.20+0.25x0.6=0.33
SOLUCIN:
Sea el evento A1 : El queso fue elaborado por el tcnico A.
A2 : El queso fue elaborado por el tcnico B.
B: El peso del queso tenga inferior a 1 kg.
P( A1 B ): P(elaborado por el tcnico A/el peso del queso debe ser inferior a 1kg).
P ( A 1 ) = 0.45 (Probabilidad de elaborar queso por el tcnico A).
P ( A 2 ) = 0.55 (Probabilidad de elaborar queso por el tcnico B)
P( B A1 ) = 0.03 (Probabilidad de elaborar un queso, con peso menor a 1 kg por
el tcnico A)
P( B A2 ) = 0.05 (Probabilidad de elaborar un queso, con peso menor a 1 kg por
el tcnico B).
b g
P B A1 =
P( A1 ) P( B A1 )
=
0.45x0.03
P( A1 ) P( B A1 ) + P( A2 ) P( B A2 ) 0.45x0.03 + 0.55x0.05
= 0. 33%
De otra forma:
P( B A1 ) = 0.03
P ( A 1 ) = 0.45
P( B A2 ) = 0.05
P ( A 2 ) = 0.55
P( B' A2 ) = 095
. = B'
P( A1 ) P( B A1 ) = 0.45x0.03 = 0.0135
2
i =1
P( Ai )P( B Ai ) =P( A1 )P( B A1 ) + P( A2 )P( B A2 ) = 045x0.03+0.55x0.05=
. 0.041
SOLUCIN:
Sea el evento A1 : El alumno asisti a centro privados.
A2 : El alumno asisti a centro estatales.
B: El alumno obtuvo nota mxima de 18.
P ( A 1 ) = 0.40; P ( A 2 ) = 0.60, adems se conoce que:
P( B A1 ) = 0.30; P( B A2 ) = 0.2
a) La probabilidad que el alumno haya alcanzado una nota mxima de 18 puntos
es:
P( B ) = P( A1 ) P( B A1 ) + P( A2 ) P( B A2 ) = 0.4x0.3 + 0.6x0.2 = 0.2 24%
b) Si el alumno alcanz la nota mxima de 18 puntos, entonces la probabilidad de
que provenga de un centro estatal es:
b g
P B A2 =
P( A2 ) P( B A2 )
P( B )
=
P( A2 ) P( B A2 )
P( A1 ) P( B A1 ) + P( A2 ) P( B A2 )
=
0.6x0.2
0.24
= 50%
De otra forma:
P( B A1 ) = 0.3 = B
P ( A 1 ) = 0.4
P( B A2 ) = 0.2 = B
P ( A 2 ) = 0.6
P( B' A2 ) = 0.8 = B'
- 184 - V. Ibaez Q.
EJERCICIOS 7.1.
1.- Un joven profesor egresado del Programa de Educacin a distancia presenta su
documentacin a las UGELs 3 y 4. La probabilidad de que lo contraten en la
UGEL 3 es 1/3 y la probabilidad de que lo contraten en la UGEL 4 es 1/2. Supo-
niendo que si lo contratan en una UGEL ya no lo contratan en la otra, Cul es la
probabilidad de que lo contraten en la UGEL 3 o en la UGEL 4?.
4.- De los estudiantes del Programa de Educacin a distancia 40% son varones y el
4% son varones que estudian Educacin Inicial. Si se selecciona un estudiante
por sorteo y este resulta ser varn, cul es la probabilidad de que estudie Educa-
cin Inicial?.
7.- Basndose en el enunciado del ejercicio 6), calcule la probabilidad de que XYZ
haya estudiado, dado que aprob su examen final de Estadstica.
Estadstica Aplicada a la Educacin - 185 -
8
LA DISTRIBUCIN DE PROBABILIDAD
VARIABLE ALEATORIA. Una variable aleatoria X de un espacio muestral
discreto S, es una funcin de S en el conjunto de los nmeros reales . Una variable
cualquiera es toda caracterstica que est sujeta a medicin o conteo y representan
con las letras maysculas como X, Y, Z y pueden adoptar un conjunto de valores que
recibe el nombre de dominio de la variable.
Si una variable aleatoria puede asumir valores que se obtiene por conteo, toma el
nombre de variable discreta. Por ejemplo, si se arroja un dado en la cara superior
puede obtenerse cualquiera de los valores siguientes: 1,2,3,4,5,6. Si una variable
puede asumir cualquier valor real dado entre ciertos lmites, recibe el nombre de
variable continua. Por ejemplo, las estaturas de los estudiantes de un aula de primer
semestre, el peso de un nio al nacer, el peso vivo de los corderos al nacimiento, en
las medidas biomtricas: altura a la cruz, largo de cuello, permetro del torax todas
estas medidas estn dados en centmetros.
Rx
i E 1 = X i (Exito)
F 2 = X i (Fracaso)
EJEMPLOS:
- En un nacimiento de un ser humano, el sexo es masculino o femenino.
- Una droga cura o no cura la enfermedad.
- Un estudiante asiste a clases o no asiste.
- Lanzar una moneda una sola vez para observar si resulta cara o sello.
- Una insecticida elimina o no elimina al insecto.
- Ejecutar un solo tiro para ver si da en el blanco o no.
- Un vendedor vende o no vende sus productos.
- Lanzar una sola vez un dado para ver la puntuacin obtenida no es un ensayo de
Bernoull, ya que tiene 6 posibles resultados y no 2.
- Una anestesia: anestecia o no anestecia al paciente.
Estadstica Aplicada a la Educacin - 187 -
TEOREMA. La variable aleatoria X es Bernoull con parmetros n = 1 y p. X =
B(1,p). Sea A evento de existe P(A) = p y P(Ac) = q q = 1 - p con p+q = 1
y se define X como el nmero de veces que ocurre A en un experimento.
Densidad discreta de Bernoull (forma puntual o individual), cuya frmula es:
R|FG1IJ p q
P(X = x)= f(x)= SH xK
x 1-x
, si x = 0,1
|T 0 c.o.c.
y para la Densidad discreta de Bernoull (forma acumulativa), est definida por:
P(X x) = F(x)=
FG 1IJ p q
H xK
x 1-x
, con x = 0,1
x 1
R| FG nIJ p q ,
S| H xK
x n-x
si x = 0,1,2,...,n
P(X = x)= f(x) =
T0 c.o.c. cualquier otro caso
FG nIJ p q
H xK
x n-x
Si X es una variable aleatoria discreta y X = B(n,p), entonces f(x) = ,
si x = 0,1,2,3,...,n y
P(X x) = F(x) =
n
FG nIJ p q
H xK
x n-x
, si x = 0,1,2,...,n
x n
EJEMPLOS:
- Lanzar una moneda dos o ms veces para observar el nmero de caras o sellos
que resulten.
- Ejecutar dos o ms tiros para ver cuntos dan en el blanco o cuntos no dan.
OBSERVACIN:
1) Si p = 1/2, la distribucin binomial B(x;n,p) es simtrica.
2) Si p 1, la distribucin tiene asimetra negativa (cola a la izquierda).
3) Si p 0, la distribucin tiene asimetra positiva (cola a la derecha).
EJEMPLO:
De una seccin de Educacin Inicial, con 10 nias y 30 nios, se selecciona por
sorteo a 6 estudiantes Cul es la probabilidad de que exactamente 4 sean nias?
SOLUCIN:
Sea la variable:
X = El estudiante seleccionado es nia
10
p= 40 = 0.25 (probabilidad de seleccionar una nia)
q = 0.75 (probabilidad de seleccionar un nio).
n = 6 (nmero de estudiantes seleccionados)
x = 4 (nmero de nias seleccionadas)
Estadstica Aplicada a la Educacin - 189 -
Luego, reemplazando a la frmula binomial se tiene:
6! 1 FG IJ FG 3IJ
4 2
P( X = 4 ) =
2!4! 4 H K H 4K = 15x0.00391x0.5625 = 0.03299
EJEMPLO:
La probabilidad de un estudiante que ingresa a la universidad y logre graduarse
es 0.4. Cul es la probabilidad que de 5 estudiantes nuevos, se graduen 3 estudian-
tes?.
SOLUCIN:
n = 5; X = 3 graduados; p = 0.4; q = 1 - p = 1 - 0.4 = 0.6, entonces:
FG 5IJ p q 5!
H 3K
53
P( X = 3) = 3
= (0.4) 3 (0.6 ) 2 = 10 (0.4) 3 (0.6 ) 2 = 0.2304
3! 2 !
Usando la Tabla Estadstica (Trminos individuales), se tiene:
n=5
X=3
p = 0.4, buscamos en la tabla estadstica y encontramos para P(X = 3) = 0.2304
EJEMPLO:
Cul es la probabilidad de obtener al menos 4 caras al lanzar 6 veces una mone-
da?.
SOLUCIN:
al menos 4 caras, significa encontrar 4, 5 6 caras:
n = 6; p = 1/2; q = 1 - p = 1/2; X 4, entonces se realiza la siguiente operacin:
P ( X 4) =
6
FG 6IJ p q
H xK
x n x
x =4
- 190 - V. Ibaez Q.
EJEMPLO:
Se determina que un 25% de los nios expuestos a un determinado agente infec-
cioso contraern la enfermedad producida por dicho agente. Entre un grupo de 4
nios igualmente expuetos al agente infeccioso, Cul es la probabilidad de:
a) Que exactamente 2 nios se enfermen.
b) Que por lo menos un nio se enferme.
SOLUCIN:
Sea el evento A: Nios expuestos al agente infeccioso que contraen la enferme-
dad.
P ( A) = 41 = p; q = 1- 41 = 3
4
F4IF 1I F 3I
a) P( X = 2) = G J G J G J
2 2
FG IJFG IJ
4 3 1 9 54
H2KH 4K H 4K =
H KH K
=
2 16 16 256
= 0.2109375
b) P ( X 1) =
F 4I
GH xJK p q
4
x n x
, pero P ( X 1) = 1 P ( X < 1)
x =1
R| e x
e x
P( X x) = F ( x) = , si x = 0,1,2,3,...
x y x!
Donde:
e = La base de los logartmos naturales, e = 2.718281828
= np promedio de xitos que se presentan en unidad de medida.
x = Es cualquier nmero entero positivo.
La funcin de probabilidad debe cumplir f(x).
i) f(x) 0
ii) f ( x) = 1
- 192 - V. Ibaez Q.
EJEMPLOS:
- Nmero de errores por pgina de un diario.
- Nmero de remaches defectuosos en un avin.
- El nmero de bacterias en un centmetro cbico de agua.
- Nmero de llamadas que recibe una Central telefnica en el periodo de un
minuto.
- Nmero de fallas de un sistema en un da dado.
- Nmero de accidentes de trabajo que ocurren en una fbrica durante una sema-
na.
- La frecuencia de terremotos que ocurren en el Per en un intervalo de tiempo de
un ao.
- La distribucin de partculas sobre una placa reticular o sobre un espacio tri-
dimensional. El nmero de partculas de polvo encontrados en 1 m3 de aire.
- La distribucin del nmero de errores tipogrficos por pgina en textos gran-
des.
- La distribucin del nmero de partculas ALFA emitidas por una sustancia
radioactiva.
TEOREMA. Si X ~ P( ), entonces:
a) = E(X) =
b) 2 =V(X) =
EJEMPLO:
El nmero promedio de muertes por accidente es 2 por da. Determine la proba-
bilidad de que un da dado haya:
a) No ms de 3 muertos.
b) No menos de 3 muertos.
SOLUCIN:
X = Nmero de personas muertas.
= 2 ( promedio de muertes de personas por da).
x = 3 (Nmero de muertos de personas en un da).
De a)
P( X 3) =
3
FG e 2 IJ = e 2
2 x 2 0
e2 21 e2 22 e2 23
x =0 H x! K 0 ! +
1!
+
2!
+
3!
= 0.8571
EJEMPLO:
Suponga que el manuscrito de un texto de estudio tiene un total de 50 errores
enlas 500 pginas del material. Los errores estn distribuidos aleatoriamente a lo
largo del texto. Cul es la probabilidad de que:
a) Un captulo de 30 pginas tenga dos o ms errores.
b) Un captulo de 50 pginas tenga dos o ms errores.
c) Una (01) pgina seleccionada aleatoriamente no tenga errores.
SOLUCIN:
50 1 1
Sea el evento A: Cometer error de manuscrito, entonces P( A) = p = = , p =
500 10 10
entonces = np = n b g , entonces
1
10
n
= 10 .
a) n = 30, entonces
30
= 10 =3, y se quiere calcular P(X 2)= ?
P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1
RSe 3 UV = 1RSe 3 + e 3 UV
1 3 x 3 0 3 1
T x! W T 0! 1! W
x=0
m r m
= 1 e3 +3e3 = 1 e3 (1+ 3) = 1 4e3 = 0800851726
. r
b) Un captulo de 50 pginas tenga 2 o ms errores.
se quiere calcular P(X 2)= ?
50 1
n = 50, entonces = 10 =5, y p=
10
P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1
RSe 5 UV = 1RSe 5 + e 5 UV = 1(e
1 5 x 5 0 5 1
5
+ 5e5 ) = 16e5
T x! W T 0! 1! W
x=0
= 1 6 (0.006737946 ) = 0.959572318
n = 1, p=
1
10
entonces b g =0.1; =0.1 y se quiere calcular P(X=0) = ?
=1 1
10
0
e 0 .1 0 .10
P( X = 0) = = e 0 .1 = 0 .904837
x =0 0!
Usando la tabla, se tiene: n = 1, =0.1, x = 0, entonces P(X=0) = 0.9048
EJEMPLO:
Los alumnos de un Colegio, ingresan en las maanas a razn de 30 alumnos por
minuto. Determinar la probabilidad de que ingresen:
a) Por lo menos 2 alumnos en un segundo.
b) A lo ms 3 alumnos en 2 segundos.
SOLUCIN:
Sea la variable: X = Nmero de alumnos que ingresan por las maanas.
= 0.5 (Promedio de alumnos que ingresan en un segundo).
x = 2 (Nmero de alumnos que ingresan en un segundo).
MANEJO DE TABLAS
1) Usando la tabla de probabilidaes de Poisson, calcular:
a) P(X=0) con = 0.1 Rpta: 0.9048
b) P(X 2) con =5 Rpta: 0.95957
c) P(X>7) con = 20 Rpta: 0.9992
NOTA:
1) P( X a ) = 1 P( X a 1). Ejm: P(X 9) = 1- P(X < 9)= 1- P(X 8)
2) P( X > a ) = 1 P( X a ). Ejm: P(X > 9) = 1- P(X 9)
3) P(a X b) = P( X b) P( X a 1), Ejm: P(2 X 3)= P( X 3) P( X 1)
4) P ( X < a ) = P ( X a 1) . Ejm: P(X < 9) = (X 8 )
Estadstica Aplicada a la Educacin - 195 -
1 G
F
1 x IJ
2
f ( x) = e 2H K , < x < +
2
Donde:
= Desviacin estndar.
= Promedio de la poblacin.
= 3.1416
x = Cualquier valor directo de la variable de inters.
e = 2.7183.
34.13% 34.13%
13.59% 13.59%
2.15% 2.15%
0
3 2 1 +1 +2 +3
68.26%
95.44%
99.74%
0.5 0.5
1.0
c h
N , 2 , se lee la v.a. est distribuido normalmente con media y varianza
2 .
- 196 - V. Ibaez Q.
En cualquier distribucin normal aproximadamente:
1) 68.26% del rea bajo la curva, se halla a una 1 de la media hacia cualquier direccin
( 1 ).
2) 95.44% del rea bajo la curva, se halla a dos (2 ) de la media ( 2 ).
3) 99.74% del rea bajo la curva, se halla a tres (3 ) de la media ( 3 ).
1) z
f ( x)dx = 1 ; 2) f ( x ) 0 , x ; 3) Lm
x
f ( x ) = 0 y Lm f ( x ) = 0
x
IMPORTANCIA:
- Muchas distribuciones tienden a la normal como binomial, Poisson, t-Student, etc.
- Ciertas variables que son bsicas en estadstica inferencial, se distribuye
normalmente: , t-Student, F, etc.
2
x-
Z= , esto es la estandarizacin de la variable x, donde el recorrido es:
< z < + . Para definir la funcin de densidad de Z, se tiene:
x-
Z= , entonces Z = x - , x = Z + x, dx = dz , luego reemplazando:
1 1
1 Z2 1 Z2
f ( z) = e 2 ,
/ f ( z) = e 2 < Z < +
/ 2 2
Resulta la Funcin de Densidad de la variable Estandarizada.
f(Z)
1
= = 04
.
2
-1 0.2 +1
-1 0 +1 Z
CARACTERSTICAS:
1) Z se distribuye en forma Normal estndar (0,1), E(Z) = 0, V(Z) = 1.
2) Los puntos de inflexin estn entre (1).
3) La media, moda y la mediana coinciden y son iguales a cero.
4) La forma es acampanada, simtrica con respecto al eje Y; asinttica al eje Z y
continua en todos los nmeros reales (R).
5) P(Z 0) = P(Z 0) =0.5
f(x)
34.13% 34.13%
2.15%
13.59%
13.59% 2.15%
3 2 1 0 + 1 +2 +3
0 X
f(Z)
0.4 = 1 2
-3 -2 -1 0 1 2 3 Z
68.26%
95.44%
99.74%
- 198 - V. Ibaez Q.
Resumiendo.
1. La distribucin normal estndar tiene una media igual a cero ( = 0), una
desviacin estndar igual a 1 ( = 1), y un rea total debajo de la curva igual
a 1 hay una proporcin fija de cosas entre una lnea vertical u ordinaria en
cualquier punto y otra ordenada levantada en cualquier otro punto.
2. En est distribucin hay 2 parmetros independientes: y 2 , puede ser
algn nmero real y 2 puede ser algn nmero real no negativo, siempre
positivo. Para alguna densidad funcin normal, y 2 son fijados, as hay
una distribucin normal diferente para cada par de y 2 .
3. Ya se dijo anteriormente que la variable al azar normal estndar es por lo
general representado por Z, para diferenciarlo de otras variables.
4. Cuando el valor deseado esta normalmente distribuido con un promedio ( )
y una variancia ( 2 ), entonces el valor deseado puede ser estandarizado por
x y
la frmula: z = z= , donde que Z es el nmero de la desviacin
estndar, X y es proveniente del promedio, entonces Z es llamado algunas
veces como la desviacin estndar.
EJEMPLO:
Los calificativos del examen de ingreso a la Escuela Profesional X, estn
distribuidos normalmente con una media de 79 y una desviacin estndar de 9. Si
en total se presentaron 15 postulantes al examen. Calcular el nmero de casos y
el porcentaje de estos que corresponden a los siguientes puntajes.
a) Mayor que 90; b) Menor que 75; c) Entre 69 y 81.
SOLUCIN:
= x= 79; = s = 9; X = 90.
a) Mayor que 90: Se debe estandarizar stos estadsticos, ya que los valores no
existen en la tabla Z.
Estandarizamos
0.5 P ( 0 Z 1.22 )
0.11123
644744
8
79 90 X 0 1.22 Z
Estadstica Aplicada a la Educacin - 199 -
b) Menor que 75, de igual forma se estandariza, porque con los valores grandes
no se puede encontrar en la tabla Z.
F X -79 < 75 -79 I = P(Z < - 4 ) = P(Z < -0.44)
P GH 9 9 K
J 9
Estandarizamos
0.32997
75 79 X -0.44 0 Z
P(Z < -0.44) = 0.5 - P(0 Z 0.44 ) = 0.5 - 0.17003 = 0.32997 ~ 0.33
69 79 81 X -1.11 0 0.22 Z
por simetra.
P(-1.11 0 )+ P(0 0.22 )
P(0 111
. )+ P(0 0.22 ) = 0.36650 + 0.08706 = 0.45356
El porcentaje que le corresponde a 0.45356x100 = 45.36% ~ 45%. Para conocer
el nmero de casos que corresponde a 45%, se resuelve usando la regla de tres
directa:
15 (postulantes) 100%
45%
X 45%, entonces X = 15100% = 6.75 7 casos (el nmero de casos)
EJEMPLO:
Los puntajes obtenidos en un test psicotcnico estn distribuidos normalmente
con una media de 60 y una desviacin estndar de 10.
a) si el puntaje minimo para aprobar es 48. Cul es el porcentaje de fracasos?.
b) Si han de aprobar el 80% de los estudiantes, Cules debe ser el puntaje mnimo
aprobatorio?.
SOLUCIN:
a) Sea X la variable normal que expresa los puntajes obtenidos, cuya media y
desviacin estndar son respectivamente:
= x= 60; = s = 10;
Como X = 48 es el puntaje mnimo aprobatorio, la probabilidad de no aprobar
es:
Estadstica Aplicada a la Educacin - 201 -
EJEMPLO:
Cul es la probabilidad de encontrar una muestra promedio igual o mayor a 12.5
kg. en un Jardn con 20 nios de 3 aos de edad, con un promedio general de 11
kg. y varianza de 5?.
SOLUCIN:
Estandarizamos
0.00135
11 12.5 X 0 3.0 Z
2x = 5
20
= 0.25 = 0.5
F X -11 12.5-11I = PeZ 30. j = 05. P(0 Z 3.0)=0.5-0.49865=0.00135
P GH 0.5 0.5 JK
- 202 - V. Ibaez Q.
Rpta: La probabilidad de encontrar una muestra de promedio igual o mayor a
12.5 es 0.00135 0.135%.
EJEMPLO:
Qu porcentaje de nios tienen un largo de cara comprendido entre 7.4 cm. y 7.8
cm. con un promedio de 7.0 cm. y desviacin estndar de 0.8 cm?.
SOLUCIN:
= x=7.0 cm.; = 0.8
F7.4-7 X -7 7.8-7I = P(0.5 Z 10. )= P(0 Z 0.5)+P(0 Z 1.0)
P GH 0.8 0.8 0.8 JK
Estandarizamos
0.4672
= 0.5 P(0 0.5 ) + 0.5 P(0 1.0 ) = (0.5 - 0.19146)+ (0.5 - 0.34134)
Rpta: El porcentaje de nios que tienen un largo de cara comprendido entre 7.4
y 7.8 cm. es 0.30854 - 0.15866 = 0.14988 ~ 14.98%
EJEMPLO:
En un hato de vacas lecheras de la raza Brown Swiss, se encontr el promedio
general de produccin de 8 litros y su desviacin estndar es 2.2. Cul es la
proporcin de vacas lecheras que tengan una produccin entre 4.2 y 9.5 litros?.
SOLUCIN:
= x= 8 litros; = s = 2.2
FG 42. 8 x 8 95. 8IJ = P(-1.73 Z 0.68)= P(-1.73 Z 0)+P(0 Z 0.68)
P
H 22. 22. 22. K
por simetra se tiene:
P(0 Z 1.73)+ P(0 Z 068
. )=0.45818+0.2517 =0.70993
Estadstica Aplicada a la Educacin - 203 -
Estandarizamos
0.25175
0.45818
Pero:
P(0 Z 1.73)+ P(0 Z 068
. )=(0.5-0.45818)+(0.5-0.2517)=0.04182+0.24825=0.29007
1 - 0.29007 = 0.70993, entonces 1 - 0.70993 = 0.29007
Rpta: La proporcin de vacas lecheras, cuya produccin oscila entre 4.2 y 9.5
litros es 0.2901 29.01%, es decir hay 29.01% de vacas, cuya produccin
de leche estn comprendidos entre 4.2 y 9.5 litros.
=1
=3
=4
=5
ch
=6
f 2
=2
0 1 2 3 4 5 6 7 8 9 2
DEFINICIN.
Sea la variable aleatoria X que se distribuye como una distribucin de Ji-cuadra-
da, con v grados de libertad, y se denota como: X ~ 2v , si su funcin de densidad de
probabilidad est dado por:
- 204 - V. Ibaez Q.
R| 1
x v
1
f ( x ) = S FG v IJ 2
v
e 2 X2 , x>0
|| H 20K
2
T c. o . c.
CARACTERSTICAS:
- La distribucin Ji-cuadrada es un caso particular de la distribucin gamma,
cuando = v 2 y = 1 2 .
- La variable Ji-cuadraa no puede ser negativa, porque es la suma de valores
positivos.
- La distribucin es de tipo contnuo, su forma y posicin depende del nmero de
grados de libertad (g.l.).
- Cuando los grados de libertad (g.l.) son pequeos, la distribucin es asimtrica
hacia la derecha. A medida que aumentan los grados de libertad tiende a la
distribucin normal.
- Existe una distribucin para cada grado de libertad.
- La funcin de densidad f( 2 ) para 2 depende solamente de un parmetro
llamado grados de libertad.
- El grfico de f( ), no es simtrico, ms bien es oblicuo o aplanado (sesgado),
2
MANEJO DE TABLAS.
EJEMPLO:
S 20 .975 ,4 entonces quiere decir la distribucin de Ji-cuadrada con = 0.975 y 4
grados de libertad.
20.975,4 = 0.484 . Para graficar se levanta una lnea vertical en 2 = 0.484 , la misma
que divide a la curva de la distribucin de chi cuadrado en dos partes: una a la
Estadstica Aplicada a la Educacin - 205 -
derecha de 0.484 que corresponde al
97.5% del rea de la curva y la otra a la =09
. 75
izquierda de 0.484 que corresponde al
2.5% del rea. El valor 0.484 se
denomina valor crtico. Los valores 0.025
crticos son usados para determinar la regin
de rechazo de la Ho. Aqu la probabilidad
El valor crtico es identificado por dos valores: el primero por el rea bajo la
curva a la derecha del valor crtico y el segundo por los grados de libertad.
2 , = L 20 .975 ,4 = 0.484 El valor a dado es el que se usa para calcular en la
tabla.
Ejemplo Encontrar 0.05,4 = 3141
2
.
0.95
Aqu 5 % del rea est a la
derecha de la lnea vertical en 31.41 =0975
.
y 95 % del rea est a la izquierda
de sta lnea. Esta distribucin tiene
un promedio de 20 y una variancia
de 40, y la grfica tiene un valor . , = 3141
200520 .
mximo en 18 ( - 2 = 18).
Ejemplo: Encontrar:
a. 20.95,15 = 7.261 =095
.
c. El promedio = x = = 15 0.05
d. La variancia =
c h
2 = S 2 = 2 = 2( 15 ) = 30
e. El valor mximo de
c h
f 2 = 2 = 15 2 = 13 209515
. , =7261
.
EJEMPLO:
Dada una distribucin con 15 grados de libertad, hallar el valor que separe
2 2
a) 1% superior c) El 5% inferior e) e
P 12 152 2 = 095
2
.
2
j
b) 90% superior d) El 1% inferior
SOLUCIN:
a) P( 15 2 ) = 0.01 entonces P( 15 30.60 ) = 0.01 = 30.60
2 2 2
P( 15
2
2 ) = 1 P( 15
2
7.26 ) = 0.95 2 = 7.26
d) P( 15 2 ) = 0.01 entonces P( 15 ) = 1 P( 15 ) = 0.99
2 2 2 2 2
P ( 125 2 ) = 1 P ( 125 5 .2 3 ) = 0 .9 9 2 = 5 .2 3
e) e
P 12 15
2
2
2
j
2 = 0.95
Para el lmite Superior:
P( 15
2
2 ) = 0.05 entonces P( 15
2
25 ) = 0 .05 2 = 25.0
DEFINICIN:
Una variable aleatoria X tiene una distribucin t de Student con "n" grados de
libertad, y se escribe x ~ t n , si su funcin de densidad de probabilidad esta dado
por:
f(x)
FG 1 n + 1IJ
H 2 2 K FG1 + X IJ
1
2 ( n +1 )
2
f(x) =
F 1 I
G nJ n
H nK , < x < +
H2 K 0 X
Estadstica Aplicada a la Educacin - 207 -
DEFINICIN:
Sea Z una variable aleatoria con distribucin N(0,1) y u una variable aleatoria
con distribucin 2n ( u ~ 2n ) donde Z y u son independientes, entonces la distribu-
cin de la variable aleatoria es:
Z
t= ~ t ( n ) ; se denomina distribucin t con n grados de libertad.
u
n
a) El promedio o media es E(t) = 0
n
b) La varianza es: V(t) =
n-2
CARACTERSTICAS:
- La variable t toma valores positivos negativos, ya que la variable normal Z
puede tomar tanto valores positivos como negativos.
- La distribucin t es continua y simtrica alrededor de su valor esperado
(t = 0), E(t) = 0.
- Tiene como nico parmetro a los grados de libertad n, asociados con la
variable en el denominador de la razn de t.
2
(X) n 1
~ t n 1
cX h
n
1 n 2
i X
i =1
2
t2 = ; donde 2 ~ 12 y u ~ 2n
un
Por lo tanto t 2n y F1,n , se expresa como t 2n = F1 ,n
- 208 - V. Ibaez Q.
MANEJO DE TABLAS:
1. Encontrar lo siguiente:
a) t0.01,10 = 2.764
b) t0.99,10 = -t1-0.99 =-t0.01,10 = -2.764
c) t0.025,7 = 2.365
d) t0.97,7 = -t1-0.075,7 =-t0.025,7 = -2.365
e) t0.005,23 = 2.807
f) t0.995,23 =-t1-0.995,23 =-t0.005,23 =-2.807
DEFINICIN:
R| FG 1 n + 1 n IJ n 1 1 1
n1 1
| H2 2 K
n1 n2
2
1 2 1 n22 X 2
f( x ) = S F 1 I F 1 I
, x>0
|| GH 2 n JK GH 2 n JK bn g
1 1
n1 + n2
1 2 2 + n1 X 2 2
T 0 c. o . c.
b g
f X F (2,10) F (10,10)
F (10,2)
0 X
DEFINICIN:
Si u1 y u2 dos variables aleatorias independientes, cada uno con distribucin
u1 ~ 2n1 U|V u1 n1
u2 ~ 2n2 |W F=
u2 n2
~ F( v1 ,v2 )
IJ FG n2 2
K,n 2n22 1 +
H n1
>4
bn 2g bn 4g
b) La varianza de la distribucin es: V(F)= 2 2
2 2
- 210 - V. Ibaez Q.
CARACTERSTICAS:
- La variable F solamente toma valores no negativos (de cero a infinito), tanto
el numerador como denominador son valores elevados al cuadrado.
- Los nicos parmetros de la distribucin son v1 y v2 .
- Para los valores pequeos de v1 y v2 la distribucin es asimtrica hacia la
derecha; pero a medida que ellos aumentan sta tiende a la distribucin normal.
- R.A. Fisher elabor primeramente la distribucin de Z, que ms tarde se trans-
form en la distribucin de F. La relacin entre las distribuciones F y Z es:
F = e 2 z , done: e = es la base de los logaritmos naturales, cuyo valor es 2.71828;
luego por ejemplo si Z = 2, entonces F vale F=(2.1783)2(2) = F =(2.1783)4 =
54.598 ~54.6. Aqu tanto F como Z dependen de los grados de libertad. Ejem-
plo de algunos valores de Z con = 0.05 a la derecha de la curva:
1
2 1 2 3 4 1 y 2 = son los grados de
1 2.5421 2.6479 ... ... del numerador y denominad
2 1.4592 1.4722 ... ... con 1 = 1 y 2 = 1, enton
3 .. .. Z = 2.5421
4 .. ..
F ,1 ,2
G.L. del denominador 2do.
G.L. del numerador 1.
V a l o r d e para determinar el valor crtico
3. Encontrar y graficar:
F0.05,2,6 = 5.143
5%
F0.01,2,6 = 10.925
1%
4. Encontrar y graficar:
F0.05,10,15 = 2.544 0 5.143 10.925
F0.01,10,15 = 3.805
0 1 2 2.544 3 3.805 4
5. Encontrar y graficar: 5%
1%
F0.05,10,7 = 3.637
F0.01,10,7 = 6.620
0 3.637 6.620
Expresado en probabilidades:
p(0 < F < 3.637; si 1 = 10 y 2 = 7) = 0.05
p(0 < F < 6.62; si 1 = 10 y 2 = 7) = 0.01
p(3.637< F < 6.62; si 1 =10 y 2 = 7) = 0.04 4%.
99%
1. Encontrar y graficar:
F0.99,10,15 = Aqu no hay en la tabla para
= 0.99, por consiguiente se har uso
de la propiedad 4 de F (1 - 0.99 =
1%
1 1
F0.99 ,10 ,15 = = = 0.219
F0.01,15,10 4.558
2. Encontrar:
1 1 5% 5%
a) F0 .95 ,10 ,7 = = = 0.319
F0 .05,7 ,10 3135
.
1%
1%
1 1
b) F0 .99 ,10 ,7 = = = 0.192
F0 .01,7 ,10 5.20 0.192 0.319 3.637 6.620
Estadstica Aplicada a la Educacin - 213 -
Luego el procedimiento para hallar los puntos crticos del extremo izquierdo es:
F0991012
. , , F0.01,12,10 1
2 1
1 2 F0.011210
, ,
1 - 0.99 = 0.01
b) Una vez obtenido el valor de F del rea bajo la curva de la derecha se toma el
valor recproco de dicho nmero, y se tiene el rea bajo la curva del lado
izquierdo, a alfa deseada
0.393 2.278
- 214 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 215 -
9
INFERENCIA ESTADSTICA
9.1. ESTIMACION
Inferencia
Estadstica
Tanto las estiamciones como las pruebas de hiptesis, requieren de muestras. Para
encontrar los estimados de parmetros desconocidos dos tipos de estimados hay:
- 216 - V. Ibaez Q.
A. Estimacin Puntual.
Procedimiento:
Sea un parmetro desconocido de una distribucin de variables aleatorias X:
1. De la distribucin de X, seleccionamos una muestra aleatoria de tamao n,
con valores x1 , x 2 , L , x n .
2. En base a los valores muestrales seleccionados, calculamos mediante algn
mtodo pre concebido un nmero como $ , el cual es un punto en la escala de
los nmeros reales (estimacin puntual).
3. $ se acepta como un estimador de .
Puede ocurrir que el estimador para muestras pequeas sea sesgado, pero para
muestras grandes se convierte en insesgado. Esto es:
Sea E($ ) = b, entonces, si n , E($ ) = .
Estos estimadores se denominan Asintticamente Insesgados. Por lo general,
se desea que el sesgo desaparezca en las muestras grandes. Si existe an un sesgo con
muestras grandes, se acostumbra eliminar el sesgo con un factor de correccin.
P($ 1 $ 2 ) = 1 -
Donde $ 1 y $ 2 son funciones de las variables aleatorias X1, X2, ..., Xn, cuyos valores
son $ 1 y $ 2 que resulta al reemplazar en la funcin los valores x1, x2, ..., xn
Los extremos del intervalo < $ 1 , $ 2 > $1 $ 2 son variables aleatorias, por lo
que se llaman, intervalos aleatorios. Los extremos del intervalo < $ 1 , $ 2 > se llaman
lmites inferior y superior de confianza del 100(1 - )% para .
El nmero (1 - ) se llama el nivel de confianza, su eleccin depende del
investigador y sus valores ms utilizados son:
Si = 0.10 entonces 1 - 0.10 = 0.90
= 0.05 entonces 1 - 0.05 = 0.95
= 0.01 entonces 1 - 0.01 = 0.99
= 0.02 entonces 1 - 0.02 = 0.98
< $ 1 , $ 2 > = 0.95, es un intervalo de confianza del 95% de confianza para ; es
decir de las muestras que podemos obtener cerca del 95% producirn intervalos que
incluyan el valor ; mientras que el 5% no se encuentra.
X -
Z = , es exactamente (o aproximadamente)
n
normal N(0,1), entonces Z es una cantidad pivotal
P(X - Z n X + Z n ) = 1 -
14 422
443 14422 44 3
LI LS
2 2
1
Z 0 Z Z
2 2
- 220 - V. Ibaez Q.
En el caso de poblacin finita (Muestreo sin reemplazo)
X -
Z =
n
Donde: x = n se sustituye por el error estndar estimado $ x = s n .
Estadstica Aplicada a la Educacin - 221 -
X-
Z=
$ x = s n
Para encontrar el Intervalo Confidencial (IC), estandarizamos:
s s
P(X - Z . X + Z ) = 1 -
14243
2
n 144244
2
3n
LI LS
F s Nn s Nn I
GH
P X- Z .
2
n N 1
X + Z
2
n N 1
=1- JK
2) Muestras pequeas cuando (n 30) y la varianza poblacional es
desconocida.
X X
2
i i X 2
i i=1
n
X= i=1
, s =
2 i=1
= i=1
n n 1 n 1
El intervalo de confianza, se obtiene reemplazando en la frmula anterior Z por
2
el valor t
2
de la distribucin t-Student con (n -1) grados de libertad y por la
desviacin estndar de la muestra S. f (t )
X - 2 2
t =
S n 1
t 0 t t
,( n 1 ) ,( n1 )
2 2
- 222 - V. Ibaez Q.
El intervalo confidencial es el siguiente:
P(X- t ,( n1 ) S n X + t ,( n1) S n ) = 1 -
144 2
2443 144 4 2
2444 3
LI LS
[LI, LS] es un intervalo aleatorio que debe contener con 100(1- )% de nivel de
confianza; cuando la muestra es pequea, varianza desconocida y poblacin normal.
Muestras grandes darn intervalos de confianza de longitud ms cortas, por lo tanto
ms precisos.
X -
Z 2 Z 2 , -Z X - Z
n 2
n 2
n
X - Z
123 2
n E = X- denominamos Error de Estimacin y
E= X -
E 0 = Z 2 es mximo Error de estimacin.
n
Con esta notacin, un IC para la media resulta: P(X - E 0 X + E 0 ) = 1 -
S
Donde: E0 = Z 2 E0 = t 2
n n
Tamao de Muestra.
FG IJ FG Z IJ 2
H K
2
E Z 2
n
n Z 2
E
n
H E K
F Z IJ
n=G
2
2
Z 2 2 2
H E K =
E2
Si el muestreo es con o sin reemplazamiento en una poblacin infinita (con
sustitucin en una poblacin finita de tamao N), la media poblacional de una
distribucin normal de varianza desconocida cuando las muestras son pequeas es:
F Nn Nn I
GH
P X - t ,( n 1) .
2
s
n N 1
X + t ,( n 1)
2
s
n N 1 JK = 1 -
Estadstica Aplicada a la Educacin - 223 -
EJEMPLO
Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguientes:
SOLUCION:
40
X i
27.8 + 43.0 + L + 3.53 + 31.0 1014.33
X= i=1
= = = 25.358
n 40 40
FG X IJ
40 2
40
X 2
i
H K
i=1
i
32390.8409
( 1014.33 )2
n 40
S2 = i=1
= = 1710053123
.
n 1 39
S = 13.0769 S = 13.0769
n = 40
1- = 1 - 0.05 = 0.95
FG 130769
. 130769
. IJ =0.95
H
P 25.358-(1.96)
40
25.358 + (1.96)
40 K
Pb21.305 29.41g = 0.95 (21.305,29.41)
ESTIMACION INTERVALICA:
Nivel de Confianza 0.0027 0.01 0.02 0.04 0.0455 0.05 0.1 0.2
1 99.73% 99% 98% 96% 95.45% 95% 90% 80%
Z 2 3.000 2.575 2.327 2.054 2.000 1.960 1.645 1.280
0.025 0.025
0 .95
P Z Z 2 = 0.95 + 0.025
Z = 1.96 0 Z = 1.96 Z
= 0.975 Z 2 = 1.96
2 2
Error de Estimacin.
13.0769
X - Z X - (1.96) , X - 4.0
n 2
40
Con una probabilidad de 0.95 de confianza, el error de estimacin no exceder a
4.0526, el mximo error de estimacin ser de 4.0526 el error de estimacin ser
menor o igual que 4.0526.
EJEMPLO
Un grupo escogido al azar de 50 estudiantes mujeres de un CENECAPE para
secretarias, aprenden taquigrafa por un mtodo nuevo. Al finalizar el ciclo se les
someti a una prueba de dictado y se encontr que en promedio escriban 120 palabras
por minuto con un desviacin tpica de 11 palabras. Cul es el intervalo de confianza
al 95% para el promedio de palabras por minuto que se obtendra si se aplicar este
nuevo mtodo a todas las alumnas del CENECAPE?.
SOLUCION:
FG IJ
n = 50, X = 120, S = 11, entonces el IC es.
H
P X Z 2
n
X + Z 2
nK= 1
FG 11 11 IJ
Como S entonces P 120 ( 196
. )
H 50
120 + ( 196
. )
50 K
= 0.95
Estadstica Aplicada a la Educacin - 225 -
EJEMPLO.
Una muestra aleatoria de 25 calificaciones arroj una media de 15 puntos con una
desviacin tpica de 3 puntos. Cul es el intervalo de confianza al 95% para estimar
la media de las calificaciones si se supone que la poblacin esta normalmente
distribuda?.
FG S S IJ
H
P X t 2 ,( n1 )
n
X + t 2 ,( n1 )
n K
= 1
FG 3 3 IJ
H
P 15 ( 2.064 )
25
15 ( 2.064 )
25 K
= 0.95
b g
P 13.76 16.24 = 0.95
Esto quiere decir que hay 95% de confinza, de que la media de la poblacin ( )
de calificaciones, est en un punto cualquiera dentro de los valores 13.76 puntos y
16.24 puntos y que si se hiciera un nuevo muestreo, el 95 % de todos los intervalos
que se podran lograr en la forma descrita, incluiran a la media de la poblacin ( ).
- 226 - V. Ibaez Q.
9.4. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS
MEDIAS ( 1 2 ), CONOCIDA AMBAS VARIANZAS
Poblacin 1 ( N1 ) Poblacin 2 ( N2 )
n1 n2
Parmetros Parmetros
x1 y1
1 2
X1 x2 X2 y2
2
1 S12 M 22 S22 M
xn1 yn2
n1 n2
Xi Y i
El estimador de: 1 es X1 = i=1 , 2 es X2 = i=1
n1 n2
( Xi ) 2 ( Yi ) 2
X2i n1
Yi2 n2
El estimador de. 12 es S12 = , 22 es S22 =
n1 1 n2 1
F I
GPG X X -Z + X X +Z + JJ = 1 -
2
1
2
2
2
1
2
2 es el
GH 144442444 n n J
1 2 1 2 1 2
n n
K
2 2
43 1 2
1444 424444 3 1 2
LI LS
EJEMPLO.
Un grupo de 50 estudiantes de la UNA realizan un trabajo y obtuvieron los
siguientes resultados: X1 = 89, desviacin estndar de 7. Otro grupo de 60
estudiantes de la UANCV realizan el mismo trabajo y obtuvieron un promedio de
X2 = 87 y desviacin estndar de 5.
SOLUCION:
Datos:
X1 = 89 X2 = 87 1- = 1 - 0.05 = 0.95
F I = 0.95
GH
P 89 87 - (1.96)
49 25
+
50 60
1 2 89 87 + (1.96)
49 25
+
50 60 JK
b
P -0.316340792 1 2 4.31634 = 0.95 g
Hay 95% de confianza que la diferencia verdadera de ( 1 2 ) , est en algn
punto comprendido entre -0.316, 4.316 mediciones, y que al repetir el experimento,
el 95% de los intervalos construdos, incluirn a la diferencia verdadera de las medias
de poblacin.
EJEMPLO.
Un pedagogo investigador opina que la cantidad de informacin que requiere un
Director de Escuela depende del tipo de escuela y zona donde opera. Suponga que en
un muestra de n1 = 35 escuelas de la zona 14, cuyos Directores fueron entrevistados
el nmero promedio de informes recibidos durante un trimestre fue de 6 con una
desviacin estndar de 1.8, mientras que en otra muestra de n2 = 36 escuelas de otra
zona el promedio de informes recibidos en el trimestre fue de 4 con una desviacin
estndar o tpica de 1.4. Sugiere estos datos que el nmero promedio de informes
recibidos por los Directores de estas dos zonas es diferente?. Use = 5%.
SOLUCION.
X1 = 6 X2 = 4 1- = 1 - 0.05 = 0.95
F I
GH
P 6 - 4 - (1.96)
. 2 14
18
35
+
. 2
36
1 2 6 - 4 + (1.96)
. 2 14
18
35
+
. 2
36 JK = 0.95
b
P 1.2484808 1 2 2.75151592 = 0.95 g
b g
P 1 1 2 3 = 0.95
Xi Y i
1 es X1 = i=1 , 2 es X2 = i=1
n1 n2
( Xi ) 2 ( Yi ) 2
X 2
i
n1
Y i
2
n2
12 es S12 = , 22 es S 22 =
n1 1 n2 1
En este caso, cuando las medias y varianzas son desconocidas se pueden
presentarse tres casos, muy importantes a saber.
12 = 22 =
2
poblacionales desconocidas, pero iguales
comn
2
desconocida. Para desarrollar el Intervalo confidencial (IC) para
( 1 2 ) , ntese que la distribucin de la estadstica es:
X1 X2 ( 1 2 )
t=
F1 1I
S G + J
~ t (n1 + n2 2 )g.l.
Hn n K
2
P
1 2
Por tanto, un intervalo de confianza de dos lados del 100(1- )% relativo a las
diferencias en las medias ( 1 2 ) es:
F I
GH
P X1 X2 -t,n1+n22 SP
2
1 1 1 1
+ 1 2 X1 X2 + t,n1+n22SP +
n1 n2 2
n1 n2
=1- JK
Un intervalo confidencial inferior de un lado del 100(1- )% en ( 1 2 ) es:
1 1
X1 X2 - t ,n1 +n2 2 S P + 1 2
2
n1 n 2
1 1
1 2 X1 X2 + t ,n1 +n2 2 S P +
2
n1 n 2
f (t )
2 2
1
t 0 t t
,( n1 + n2 2 ) ,( n1 + n2 2 )
2 2
Estadstica Aplicada a la Educacin - 231 -
EJEMPLO.
X i
80 X2i nX2 = 1618 4( 20)2 = 18 = 6
= 20 , SA =
2
Para la Marca A. XA = i=1
=
4 4 n-1 3 3
5
Y i
105 Yi2 nY2 = 22255(21)2 = 20 = 50. ,
Para la Marca B XB = = = 21, SB =
i=1 2
5 5 n-1 4 4
F FG IJ
3(6)+(4)(5) 1 1 3(6)+(4)(5) 1 1 FG IJIJ =0.95
GH
P (20-21)-(2.365)
7 H K
+ A B (20-21)+(2.365)
4 5 7
+
4 5 H KK
b
P -2.69641037 A B 4.69641037 = 0.95 g
Comprobando, si las varianzas son homogneas o no.
- 232 - V. Ibaez Q.
F = F0.025,(4,3) = 15101
. F0.95,(3,4) = 6.591
,( n2 1,n1 1 )
2
1 1 1
F = = = 0066
. ; F0.05,(4,3) = = 01097
.
1 ,( n2 1,n1 1 ) F0.025,(4,3) 15101
. 9.117
2
LM 6 . 1 2
6
.
1
= 0.95
OP
N 5 6.591 Q
1
P 2
2 5 0.1097
LM
P 0 .182
12 OP
10 .939 = 0 .95 , entonces el intervalo cubre a 1, por
N 22 Q
12 = 22 =
2
consiguiente se cumple que
poblacionales desconocidas y 12 22 .
En muchas situaciones no es razonable suponer que 12 = 22 . Cuando esta
suposicin es injustificada, an sera posible encontrar un intervalo de confianza de
100(1- )% en ( 1 2 ) empleando el hecho de que la estadstica es:
FG S + S IJ2 2 2
Hn n K
1 2
X1 X 2 ( 1 2 )
t* = , donde v = 2
FG S IJ FG S IJ
2 2
~ t (v) 1 2
2 2
2
S S 2
+
H n K Hn K
1 2
1 2
n1 n 2
1
+ 2
n1 + 1 n2 + 1
Entonces: P(-t t * t ) = 1 -
,v ,v 2 2
Estadstica Aplicada a la Educacin - 233 -
F I
GH
P X1 X2 t,v
2
S12 S22 S2 S2
+ 1 2 X1 X2 +t,v 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
f (t )
2 2
1
t 0 t t
,v ,v
2 2
EJEMPLO.
Un fabricante de radio est desarrollando un nuevo modelo de radio y para este fin
se pueden utilizar dos tipos de esquemas transistorizados. El fabricante selecciona
una muestra de esquemas transistorizados del primer tipo de tamao 13 y otra del
segundo tipo de tamao 15. Los datos muestrales respecto a la vida de cada esquema
son los siguientes:
X1 = 1400 h, S1 = 30 h, n1 =13
X2 = 1500 h, S2 = 17 h, n2 =15
SOLUCION:
Primeramente vamos a probar si las varianzas son homogneas o no.
n1 + n2 30 , entonces 13 + 15 30, 28 30 .
1- = 1 - 0.10 = 0.90, /2 = 0.10/2 = 0.05, n1 - 1 =13 -1 =12, n2 - 1 =15 -1 =14
F = F0.05,(14,12 = 2.637
,( n2 1,n1 1 )
2
1 1 1
F = = = = 0394632991
.
1 ,( n2 1,n1 1) F0.05,(n11,n2 1) F0.05,(12,14) .
2534
2
- 234 - V. Ibaez Q.
F I
GH
P X1 X 2 t ,v
2
S12 S 22
+
n1 n 2
S2 S2
1 2 X1 X2 + t ,v 1 + 2
2
n1 n 2 JK = 1 -
FG S + S IJ
2 2
2
FG 900 + 289 IJ 2
Pero v = H n n K H 13 15 K
1 2
783179616
.
2= 2 = 2 = 19.42 ~ 19
FG S IJ FG S IJ FG 900IJ FG 289 IJ
1 2
2 2 2 2
2 2 365.5502355
Hn K Hn K
1
1
+
2
2
H 13 K + H 15 K
n1 + 1 n2 + 1 14 16
FG 2
normal, esto es X1 X2 ~ N 1 2 , S1 + S2 , entonces el estadstico es:
2
IJ
H n1 n2 K
X1 X2 ( 1 2 )
Z= ~ N(0,1)
S12 S22
+
n1 n 2
P(-Z Z Z ) = 1 -
2 2
Estadstica Aplicada a la Educacin - 235 -
F I
GH
P X1 X2 -Z
2
S12 S22 S2 S2
+ 1 2 X1 X2 +Z 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
es el intervalo de confianza del 100(1- )% para ( 1 2 )
D = E ( D ) = E ( X Y ) = E ( X ) E ( Y ) = 1 2 , D ~ N
Cov(X,Y)
2D = V ( D ) = 12 + 22 21 2 , = 0
1 2
La media y la varianza de la muestra de n diferencias D1,D2, ...., Dn esta dada
por:
Di
n
D2i
d D i i
cD
n
i D h 2
n
D= i=1
, S2D = i=1
= i =1
n n 1 n 1
- 236 - V. Ibaez Q.
D - D
La estadstica de prueba es: t= ~ t (n-1)
SD n
P -t ,( n 1 ) t t ,( n 1 ) = 1 -
2 2
LM
P D t ,( n1)
SD S
D D + t ,( n1) D = 1 -
OP
N 2
n 2
n Q
CASO II: TAMAO MUESTRAL GRANDE ( n > 30 ).
D- D
Z= ~ N(0,1)
SD n
LM SD
D D - Z
SD OP = 1 -
N
P D + Z
2
n 2
n Q
LM SD S
D D + Z D
OP = 1 -
N
P D - Z
2
n 2
n Q
Estadstica Aplicada a la Educacin - 237 -
EJEMPLO.
Veinte estudiantes de Educacin fueron divididas en 10 parejas, teniendo cada
miembro de la pareja aproximadamente el mismo cociente de inteligencia. Uno de
cada pareja se selecciona al azar y se asigna a una seccin que utiliza videos. El otro
miembro se asigna a una seccin que cuenta con profesor. Al finalizar el ciclo ambos
grupos se presentan al mismo examen, obtenindose los resultados siguientes:
2
Pareja Con video (V) Con profesor (P) D = V- P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
Total 141 146 -5 23
SOLUCION:
2
Pareja Co n v id eo (V) Co n p ro fes o r (P) D = V-P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
To tal V= 141 P = 146 D =i -5 D 2
i = 23
10 10
V i
141
P i
146
XV = i=1
= = 14.1 , XP = i=1
= = 14.6 ,
n 10 n 10
D = XV XP = 141
. 146
. = 05
.
n
D i
( 1 ) + ( 2 )+L+( 1 ) + ( 1 ) 5
Otra forma: D= i=1
= = = 0.5
n 10 10
n
D 2
i
d Di i 23
(-5 ) 2
S 2D = i=1 n
= 1 0 = 2 0 .5 = 2 .2 7 8
n 1 9 9
SD = 1.509230856
t 2 ,( n1 ) = t 0.05 2 ,( 101 ) = t 0.025,9 = 2.262 (Se obtiene de la tabla de t-Student).
D0 0.5
tD = = = 104764
.
SD n 150923085
. 10
(n -1)S2
=
2
~ (n-1)
2
, es Ji-cuadrada con (n-1) grados de libertad (g.l).
2
Estadstica Aplicada a la Educacin - 239 -
(n -1)
(X i X) 2
X 2
( X i ) 2
i
= n -1 n =
2
2
Para desarrollar el intervalo de confianza (IC), partimos de la siguiente forma:
P 2
LM 2 2
OP = 1
N
1 ,( n 1 )
2 2
,( n 1 )
Q
El intervalo de confianza de dos lados del 100(1- )% en 2 es:
LM (n -1)S OP
PM PP
2
(n -1)S 2
22
= 1 (mtodo de dos colas)
MN
2
1 ,( n 1 )
2 2
,( n 1 )
Q
Si el grado de libertad n de una distribucin es mayor que 30, esto es n>30, se
usar las siguientes aproximaciones para calcular:
2 y 2
,( n 1 ) 1 ,( n 1 )
2 2
2 1 LM
= Z + 2n 1 ,
OP 2
2 1 LM
= -Z + 2n 1
OP 2
2
,( n 1 ) 2 2 N Q
1 ,( n 1 )
2 2 N
2 Q
Donde Z 2 es la abscisa de una distribucin N(0,1) que deja a su derecha un rea
que representa una probabilidad igual a 2 .
( Yi ) 2
Y i
2
n2
22 es estimador por S22 =
n2 1
LMS 12 S12
OP
PM PP = 1
2
1 1
1
. 2 2
MNS 2 S2 F
2
Q
2 F
1 ,( n1 1,n2 1 ) ,( n1 1,n2 1 )
2 2
1
F =
Pero: ,( n 1 1 , n 2 1 ) F
2
,( n 2 1 ,n 1 1 )
2
LMS 2
2 S2
OP
PM PP = 1
1 1
1
. 12 12
MNS 2 S2 F
2
Q
2 F
1 ,( n1 1,n2 1 ) ,( n1 1,n2 1 )
2 2
EJEMPLO.
Se dividi en dos grupos una clase de Estadstica Inferencial II de 40 alumnos.
Cada grupo utiliz durante un ciclo un mtodo de enseanza diferente. Al final del
ciclo los alumnos se sometieron a una misma prueba de rendimiento obtenindose los
siguientes resultados: n1 =19, S12 =280, n2 =21, S22 =200. Suponer que los datos
Estadstica Aplicada a la Educacin - 241 -
constituyen muestras aleatorias independientes extradas de poblaciones
normalmente distribuidas. Puede afirmarse que las varianzas poblacionales son
iguales?. Use = 0.10.
SOLUCION.
1 - =1 - 0.10 = 0.90, =0.10, 2 = 0.10/2 = 0.05.
n1 - 1 =19 - 1 = 18
n2 - 1 =21 - 1 = 20 entonces: F ,( n 1,n 1 ) = F0.05,(18,20) = 2.15 F0.90,(18,20) = 1811
.
2 1 2
1 1
F1 ,( n 2 1,n1 1 ) = = = 0.456621004; F0.10,(20,18) = 0.55208
2
F0.05,(20,18) 2.19
LM
P 0.773
12 OP
2.535 = 0.90
N 22 Q
(0.773, 2.535), como el intervalo cubre el punto uno, esto es, 1 (0.773, 2.535),
entonces podemos afirmar de que presumiblemente las varianzas sean iguales.
EJEMPLO.
Dos secciones de una clase de matemticas de una Universidad con 25 estudiantes
cada una, hicieron el mismo examen. La seccin N 1, obtuvo una calificacin media
de 7.2 con una desviacin tpica de 0.9; en la seccin N 2, la media fue de 8.2, con
una desviacin tpica de 0.5. Encuentre el Intervalo de confianza al 95% para la
calificacin promedio de notas?.
SOLUCION:
X1 = 7.2 S1 = 0.9 n1 =25,
X 2 = 8.2 S2 = 0.5 n2 =25
- 242 - V. Ibaez Q.
F I
GH
P (-1) - (2.014)
2(0.53)
25
1 2 (-1) + (2.014)
2(0.53)
25 JK = 0.95
b
P -1.4147 1 2 0.585292 = 0.95 g
9.9. INTERVALO DE CONFIANZA PARA UNA PROPORCION
POBLACIONAL
X i
X Nmero de casos favorables
Parmetro: P = i =1
= =
N N N
n
x i
x Nmero de xitos en la muestra
Estimador: p$ = i =1
= =
n n n
Donde p$ es el estimador puntual de la proporcin de la poblacin que pertenece
LM PQ OP
a esta clase, p$ ~ N P, n .
N Q
a) El intervalo de confianza para P en el caso de muestras grandes (n > 30).
Cuando n es suficientemente grande, la distribucin es:
p$ - P
Z= ~ N ( 0,1 ) es aproximadamente normal estndar.
$ p)
p(1- $
n
Para construir el intervalo de confianza en P, se tiene:
P(-Z Z Z ) = 1 -
2 2
Estadstica Aplicada a la Educacin - 243 -
LM $ $ O
$ P
PMp-Z P =1-
p(1- p) $ p)
p(1-
$ P p+Z
$
MN144244 n 3P
n3 144244
Q
2 2
LI LS
LM
P p$ Z
$ p)
p(1- $ OP
N 2
n Q
OBSERVACION: Cuando el muestreo es sin reemplazamiento en una poblacin
finita de tamao N y el tamao de la muestra constituye ms de 5% del tamao de la
poblacin, resulta adecuado usar el factor de correccin por poblacin finita.
Entonces el intervalo de confianza 100(1- )% para el parmetro P, esta dado por:
LM $ $ N-n
p(1-p) FG IJ $ $ N-n
p(1-p) FG IJ OP = 1 -
$
MN
P p-Z
2
n N-1 H K
P p+
$ Z
2
n N-1 H K PQ
OBSERVACION: Si se utiliza p$ como estimador de P, se puede tener una
confianza de (1- ) de que el error de estimacin sea menor que una cantidad
especificada e, cuando el tamao de la muestra es dado por:
$$
Z 2 2 pq
n= , q$ = 1- p$
e2
Cuando la poblacin es finita de tamao N, se puede tener una confianza de (1- )
de que el error de estimacin sea menor que una cantidad especificada e.
$ p)N
Z2 2 p(1- $
n= 2
$ $ + e (N -1)
Z 2 pq 2
LM
P p$ -
Z
P p$ +
Z OP = 1 -
MN 4n PQ
2 2
4n
- 244 - V. Ibaez Q.
Z 2 2 F Z I 0.25
n=G
2
SOLUCION:
280
1- = 1 - 0.05 = 0.95, p$ =
400
= 0.7 , q$ = 1- p$ = 1- 0.7 = 0.3
Muestra: n = 400.
0.7 0.044909241
RS L = 0.7 0.044909241 = 0.6550
I
EJEMPLO.
Hay una poblacin que consiste de los 5 profesores del departamento de Lengua y
Literatura de la UNA. El estado civil de cada uno de ellos se da a continuacin:
Profesor Estado Civil
A Casado
B Soltera
C Casado
D Soltero
E Soltero
Estadstica Aplicada a la Educacin - 245 -
a) Determinar la proporcin de miembros casados de esta poblacin.
b) Seleccionar todas las muestras de 2 elementos de esta poblacin y calclese la
proporcin de miembros casados en cada muestra (Use la seleccin sin
reemplazamiento).
$ y la desviacin estndar
c) Calclese la Media E(p) p$ de las 10 proporciones
muestrales calculadas en b).
FG
$$ N n
pq IJ
d) Muestrse que: p$ =
H
n N 1 K
SOLUCION:
a) La proporcin de miembros casados de esta poblacin es: P = 2 = 0.40 . Es decir
5
el 40% de los profesores se casado.
FG IJ
b) El total de muestras de n = 2 miembros ser: 5 = C52 = 5! = 10 , tendremos 10
H 2K 2 ! 3!
muestras de tamao 2. Dichas muestras se presentan a continuacin:
$ es:
c) La media E(p)
$ = P 0.40 = 0.40 .
E(p)
Ahora hallemos la desviacin estndar de la proporcin p$ es:
- 246 - V. Ibaez Q.
p$ =
p$ 2
d p$ i 2
n
=
c p$ - E p$ h
2
=
( 0.5 0.4 )2 +L+( 0.0 0.4 )2
n n 10
=
2 .5 4 bg 2
10
=
0.9
= 0.3
10 10
d) Este resultado debe coincidir con la frmula siguiente: Datos P = 0.4, Q = 0.6
n = 2, N = 5
PQ N n FG IJ
(0.40)(0.60) 5 2 FG IJ
p$ =
n N 1
=
H 2 51 K= 0.09 = 0.3
H K
9.10. INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS
PROPORCIONES POBLACIONALES.
muestra 1 muestra 2
Parmetro x1 Parmetro y1
P1 P2
p$ 1 x2 p$ 2 y2
M M
xn yn
n1
x
n2
x y
Entonces la diferencia es: p$ 1 p$ 2 = , as tenemos la estimacin puntual de
n1 n2
b g
(P1 - P2) es p$ 1 p$ 2 . Conceptualizamos de la siguiente manera:
Sean X1,X2,.....,Xn1 una muestra aleatoria extrada de una poblacin Binomial
B(n1, p1) y Y1,Y2,.....,Yn2 una muestra aleatoria extrada de una poblacin Binomial
Estadstica Aplicada a la Educacin - 247 -
B(n2, p2). Supomgamos que ambas poblaciones son independientes.
x i
x Nmero de xitos de la muestra 1
p$ 1 = i =1
= =
n1 n1 n1
n1
y
j =1
j
y Nmero de xitos de la muestra 2
p$ 2 = = =
n2 n2 n2
x y
Entonces p$ 1 = y p$ 2 = son estimadores independientes de P1 y P2,
n1 n2
respectivamente. Adems, bajo la suposicin de que se aplica la aproximacin normal
a la Binomial, la estadstica es:
Z=
p$ 1 p$ 2 P1 P2 b g ~ N(0,1), se distribuye aproximadamente
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
LMb g
P p$1 p$ 2 -Z
p$1q$1 p$ 2q$ 2
+ b g b g p$ q$ p$ q$
P1 P2 p$ 1 p$ 2 + Z 1 1 + 2 2
OP = 1 -
N 2
n1 n2 2
n1 n2 Q
Por tanto, el intervalo de confianza del (1- )100% para la diferencia de
proporciones (P1 - P2) esta dado aproximadamente por:
P1 P2
LMbp$ p$ g Z p$ 1q$ 1 p$ 2 q$ 2
+
OP
N 1 2
2
n1 n2 Q
EJEMPLO.
En la Facultad de Ciencias de la Educacin de la UNA, se desea determinar la
opinin de los estudiantes y profesores en relacin al calendario acadmico propuesto
para el ao siguiente. Una muestra aleatoria de 100 estudiantes y 50 profesores di los
siguientes resultados:
- 248 - V. Ibaez Q.
SOLUCION:
63 30
p$ 1 = = 0.63 y p$ 2 = = 0.6 , q$1 =10.63=0.37 y q$2 =1-06
. = 04
.
100 50
37 20
1- = 1 - 0.05 = 0.95 q$ 1 = =0.37 y q$ 2 = = 04
. ,
100 50
Z 2 = Z0.05 2 = Z0 .025 = 196
. (Se obtiene de la Tabla Z)
. 0165512687
P 003 . P1 P2 003
. +0165512687
. = 0.95 -0.1355 P1 P2 01955
.
n0 =
dZ i S
2
2
2
donde:
2
n0 = Tamao de la muestra deseada.
Z 2 = Nivel de confianza que se desea tener (90%, 95% 99%).
S = Desviacin estndar de la muestra.
= Error admisible con respecto al promedio real de la poblacin.
Mientras mayor sea la variancia de la poblacin ( 2 ), mayor es el tamao de
la muestra, siempre que Z y permanezcan fijas. Si el muestreo se realiza en
poblaciones altamente variables, las muestras debern ser ms grandes, si es que se
quiere tener alta confianza en sus resultados estimativos, lo cual significa invertir ms
dinero, tiempo y ms esfuerzo. Intervalos estrechos de confianza (valores pequeos de
) necesitan muestras ms grandes; en la mayora de los casos prcticos, no se conoce
la variancia de la poblacin, por lo que es necesario hacer una estimacin de S2, el
mismo que es un buen estimador de 2 . Si se desconoce la variancia se puede estimar
por:
a. Tomando una muestra piloto o sondeo. Para sto se selecciona una muestra
piloto (sondeo) de la poblacin en estudio y as estimar S2.
b. Referencia de estudios previos. En estudios previos de temas similares se
puede encontrar alguna referencia de la S2. En estos casos es factible
utilizar variancias de las muestras de estudios previos o investigaciones
realizadas anteriormente para estimar 2 .
c. Revisin de literatura. En stas revisiones se puede descubrir que otros
investigadores reportan estudios similares al que se propone hacer y se
puede proporcionar estimaciones satisfactorios de la 2 .
d. Experiencia de investigadores. A veces se recurre a investigadores con
experiencia que puede sugerir variancias refentes al tema que se piensa
investigar.
EJEMPLO.
Se desea encontrar un tamao de muestra necesaria para estimar el peso promedio
de una poblacin de 1540 recin nacidos, con margen de confianza del 99% y un
error admisible de 90 gramos en relacin al promedio real de la poblacin.Un
estudio similar en recin nacidos encontraron una desviacin estndar de 500
gramos.
- 250 - V. Ibaez Q.
SOLUCION:
N = 1540 (poblacin finita)
n=?
S = 500 gramos
Z 2 = Z0.99 2 = Z0.495 Z = 2.58 (Este valor se encuentra en la Tabla Z)
= 90 gramos
n .
2054444
. )2 ( 500 )2
( 258 n= 0 = =1812636
.
n0 = = 2054444
. n
1+ 0 1+
.
2054444
902 N 1540
n = 182 nios.
10
PRUEBAS DE HIPOTESIS
Muchos problemas requieren decidir si se acepta o rechaza un enunciado acerca
de algn parmetro. El enunciado suele llamarse hiptesis, y el procedimiento de
toma de decisiones en torno a la hiptesis recibe el nombre de prueba de hiptesis.
Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos
tipos de problemas de decisin pueden formularse como problemas de prueba de
hiptesis.
EJEMPLOS:
- Un agricultor de la sierra puede establecer la hiptesis de que la duracin
promedio de las lluvias es de 90 das.
- Un mdico puede conjeturar que la incidencia de diabetes en pacientes
femeninos es de 3%.
- Una enfermera puede hipotetizar de que un programa de educacin pre-
operatoria hace que el paciente entre en cierta confianza al quirfano.
- La proporcin de objetos defectuosos producidos por cierto proceso nunca es
superior al 8%.
- 252 - V. Ibaez Q.
EJEMPLO:
- El ingreso mensual promedio de los empleados de cierta ciudad es =S/. 500,
suponiendo que los ingresos mensuales se distribuyen segn la normal con =S/.
30.0 (ES UNA HIPTESIS SIMPLE). Si una hiptesis no especifica completamente
la distribucin de la poblacin, entonces es una HIPTESIS COMPUESTA.
EJEMPLO:
El ingreso promedio mensual es 500 <500 >500, con una =S/.
30 que se supone que se distribuye segn la normal, entonces la hiptesis referente a
la media es una hiptesis COMPUESTA.
EJEMPLO:
El rendimiento acadmico de estudiantes del grupo control (GC) y los
rendimientos de estudiantes del grupo experimental (GE) son similares:
H0: GC = GE (no hay diferencia en el rendimiento)
EJEMPLO:
Ha: GC GE (Si hay diferencia en el rendimiento de los estudiantes)
Si se asume que 0 es un valor del parmetro desconocido de una poblacin
cuya distribucin se supone conocida, entonces son hiptesis nulas y alternativas,
Estadstica Aplicada a la Educacin - 253 -
respectivamente las siguientes afirmaciones:
1) H 0 : = 0 vs. H a : 0 (Prueba bilateral de dos colas)
2) H 0 : 0 vs. H a : > 0 (Prueba unilateral de cola a la derecha)
3) H 0 : 0 vs. H a : < 0 (Prueba unilateral de cola a la izquierda)
1. Formular la hiptesis:
H 0 : = 0 vs. H a : 0 (Prueba bilateral de dos colas)
H 0 : 0 vs. H a : > 0 (Prueba unilateral de cola a la derecha)
H 0 : 0 vs. H a : < 0 (Prueba unilateral de cola a la izquierda)
Estadstica Aplicada a la Educacin - 257 -
2. Seleccionar el nivel de significacin ( ). Se puede usar un valor pequeo
para , como 10%, 5%, u 1%. Con frecuencia a se le llama nivel de
significancia. Si el valor calculado a travs de los datos disponibles es igual o
mayor a y se rechaza la hiptesis planteada,se dice que los resultados de la
muestra son significativos (P 0.05).
3. Seleccin del estadstico deseado. Depende del parmetro que est probndose
en la hiptesis. As, una hiptesis sobre el promedio de la poblacin, entonces
el estadstico pertinente es el x . En suma se desea saberse si se utilizar una
medida de tendencia central, una medida de dispersin, u otra medida.
8. Conclusin. Si se rechaza la H0, se concluye que los datos son compatibles con
la Ha, y sino, se rechaza la H0, quiere decir que los datos son compatibles con
la H0, y decimos que la media de la poblacin puede ser igual a , si es que
se prob H0: = 0 . El investigador puede dar por finalizado su investigacin
o bien tomar otra decisin como reunir ms datos e informacin para tomar
una decisin ms concluyente. La desicin estadstica no debe interpretarse
como definitiva, sino que junto a las dems informaciones forman un grupo
importante para el investigador.
a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha
X -
Z =
n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Zo Z 2 b ) RA H0 : Z 0 Z c ) RA H0 : Z0 Z
a) RR Ho : Zo < -Z 2 Zo > Z 2 b ) RR H0 : Z 0 < Z c ) RR H0: Z0 > Z
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de
paso 3).
X- 0
Z0 = x : media muestral,
n
0 : es la media supuesta de la poblacin;
: desviacin estndar poblacional.
6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
SOLUCION:
1. Hiptesis estadstica: H0: = 500 versus Ha: < 500.
2. Nivel de significancia: = 0.05.
5. Valor Experimental:
X - 0 485 500
Z0 = = = 15
.
n 40 16
6. Como Z0 = -1.5 pertenece a RA H 0 : , entonces rechazamos la Ha:
7. Conclusin: Las calificaciones de los estudiantes del Colegio A, no pueden
considerarse significativamente menores que la calificacin del promedio
total.
EJEMPLO.
Se calcula que los estudiantes de una Universidad Estatal gasta en promedio 1,500
mensuales con una desviacin estndar de 300. Se toma una muestra aleatoria de 36
estudiantes de la Facultad X y sus gastos fueron 1,600. Estos datos apoyan la idea de
que los estudiantes de la Facultad X gastan ms que el estudiante promedio?. Use
= 0.05.
SOLUCION:
1. Hiptesis estadstica: H0: = 1500 versus Ha: > 1500.
2. Nivel de significancia: = 0.05.
b) RR H 0 : Z0 > Z = 164
. 0 Z=1.64
5. Valor Experimental:
X - 0 1600 1500
Z0 = = = 2 .0
n 300 36
6. Como Z0 = 2.0 pertenece a RR H 0 : , entonces rechazamos la H0:
7. Conclusin: Los estudiantes de la Facultad X gastan significativamente ms
que el estudiante promedio.
X X
2
i i X i
2
i=1
n
X= i=1
, s2 = i=1
= i=1
n n 1 n 1
A1) Para muestras grandes (n>30).
1. Hiptesis Estadstica
a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha
X -
Z =
S n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Zo Z 2 b ) RA H0 : Z 0 Z c ) RA H0 : Z 0 Z
RR Ho : Zo < -Z 2 Zo > Z 2 RR H 0 : Z 0 < Z RR H0 : Z 0 > Z
X- 0
Z0 =
S n
6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
X -
t= , cuya distribucin es t-Student con n - 1 grados de libertad.
S n
1. Hiptesis Estadstica
a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha
X -
t = ~ t ( n 1)
S n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
X - 0
tc =
S n
6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
EJEMPLO.
Se hizo un estudio de una muestra de 25 expedientes de enfermos crnicos
atendidos como pacientes externos. El nmero medio de consultas por paciente
fue de 4.8 y la desviacin estndar de la muestra fue de 2. Es posible concluir a
partir de stos datos que la media de la poblacin es mayor que 4 visitas por
paciente?. Suponer que la probabilidad de cometer un error de tipo I es de 0.05
Cules son los supuestos que se deben cumplir?.
SOLUCION: n = 25 x = 4.8 s = 2
1. Hiptesis: H0: 4 versus Ha: > 4
2. Nivel de Significacin: = 0.05
t0.05,24= 1.71 (una cola)
3. Estadgrafo de Contraste: Como n = 25, es decir es (n 30), entonces se usar:
X - 0
t=
S n 1
= 005
.
0.95
4. Regin de Rechazo y aceptacin:
RA H0 : t c t0.05,( 24 ) = 171
. 0 t 0.05,24 = 171
.
b g
P 3.97 5.63 = 0.95
Estadstica Aplicada a la Educacin - 265 -
Hay un 95% de confianza de que la media de la poblacin este comprendido
entre (3.97, 5.63) y un 5% est fuera de este intervalo. Otra forma de interpretar es que
de 100 intervalos aleatorios en 95% de stos contienen a , en tanto que 5% est
fuera de este intervalo confidencial.
EJEMPLO.
Una muestra de 25 estudiantes de Enfermera de primer ao tuvo una calificacin
media de 77 en una prueba para medir su actitud hacia el paciente moribundo. La
desviacin estndar de la muestra fue de 10. Proporcionan estos datos evidencia
suficiente como para indicar, a un nivel de significacin de 0.05 que la media de
la poblacin es menor que 80? Qu supuestos se deben cumplir?.
SOLUCION: n = 25 x = 77 s = 10
1. Hiptesis: H0: 80 versus Ha: < 80
2. Nivel de Significacin: = 0.05
3. Estadgrafo de Contraste: Como n = 25, es decir es (n 30), entonces se usar:
X - 0
t = ~ t n 1
S n
4. Regin de Rechazo y aceptacin:
RA H0 : t c t0.05,( 24 ) = 171
.
RR H0: tc < t0.05,( 24 ) = 171
.
5. Clculo del Valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
x 0 77 80 3
tc = = = = 15
.
s n 10 25 2
6. Decisin: Como tc =-1.5 t0.05, 24 =-1.71 cae en la regin de aceptacin,
entonces se rechaza la Ha. y se acepta la H0.
7. Conclusin: Las calificaciones de los estudiantes de enfermera no pueden
considerarse significativamente menores que la calificacin del promedio
total.
Intervalo de Confianza: t 2 ,( n1 ) = t 0 .025,24 = 2.064
FG 10 10IJ
H
P 77 ( 2.064 )
25
77 ( 2.064 )
25K= 0.95
b
P 72.87 8113
. = 0.95 g
- 266 - V. Ibaez Q.
EJEMPLO.
La longitud de 14 nios varones recin nacidos son: 51, 55, 56, 59, 61, 71, 53, 52,
60, 63, 68, 53, 50.5, 59. Es posible concluir con base en estos datos que la media
de la poblacin no es de 50 cm.?. Sea la probabilidad de cometer un error tipo I
igual a 0.10 y encuentre el intervalo confidencial del 95%. Interprete los
resultados encontrados.
SOLUCION:
1. Hiptesis: H0: = 50 cm. versus Ha: 50 cm.
2. Nivel de Significacin: = 0.01
3. Estadgrafo de contraste: Funcin pivotal con n =14, es decir es (n 30),
entonces se usar:
X - 0
t = ~ t n 1 =5% =5%
S n 2 2
FG S S IJ
H
P X t 2 ,( n 1 )
n
X + t 2 ,( n 1 )
n K
= 1
b
P 57.96 ( 2.16 )( 1679
. ) 57.96 + ( 2.16 )( 1679
. g
) = 0.95
b
P 54 .33 61.587 = 0 .95g
Estadstica Aplicada a la Educacin - 267 -
VALORES DE P.
p > no rechazar la H : o
EJEMPLO:
1) Zo = -2.28 (Ejemplo anterior)
c h
P = 21 Z0 = 21 228 c h
. = 21(05
. +048870
. ) = 00226
. < = 005
.
(Tabla Z sin acumular)
0 z
c h .c
P = 2 1 Z0 = 2 1 228 h
= 2 1 (098870
. ) = 00226
. < = 005
.
(Tabla Z acumulado)
0 z
- 268 - V. Ibaez Q.
2) Zo = 2.72 (Ejemplo anterior)
c h
P = 21 Z0 = 21 272
. = 21(05 c h
. +049674
. ) = 000652
. < = 001
.
(Tabla Z sin acumular)
c h
P = 2 1 Z0 = 2 1 272
. c h
= 2 1 099674
. = 000652
. < = 001
.
(Tabla Z acumulado)
X X
2
X 2
i=1
i i i
n ,
X= i=1
, s =
2 i=1
= i=1
n n 1 n 1
Entonces para resolver este tipo de problemas, se usa la ecuacin de Ji-cuadrada
con (n-1) grados de libertad.
( n 1)S 2
2 = 2 = Ji-cuadrada calculada
20
n = Tamao de la muestra S2= Variancia de la muestra
20 = Variancia hipottica de la poblacin. g.l. = Grados de libertad.
a) H0: 2 = 20 b) H 0: 2 20 c) H 0 : 2 20
Ha : 2 20 H a : 2 < 20 H : 2 > 2
14244 3 14243 1a42430
Unilateral a la izquierda Unilateral a la derecha
Bilaterales
20
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
b) c)
a)
R.C.
R.C.
R.C.
R.C.
2 2 1 1
1
0 2
1 ,( n 1)
2
2
2
,( n1)
X
0 12,(n1) X
0 2,( n1)
X
R.C. R.C.
R.C. R.C.
2 2 2 2
1 1
0 2 2 0 2 2
2
,( n1) 1 ,(n1)
2
X 1 ,(n1) ,( n1) X
2 2
144444
4244444
43Se cambia
144444
42444444
3
Seusala Tabla 2 ACUMULATIVAS Se usa la Tabla P 2>2c =p, noacumulativa
EJEMPLO:
Una muestra de 25 administradores de hospitales grandes particip en un estudio
para investigar la naturaleza y el grado de frustracin y tensin emocional asociado
con el trabajo. A cada participante se le hizo una prueba con el fin de estimar el grado
de tensin emocional que experimentaba como resultado de los deberes y
responsabilidades asociados a su trabajo. La variancia de los resultados obtenidos fue
de 30. Es posible concluir a partir de estos datos que la variancia de la poblacin es
mayor que 25?. Sea = 0.05.
SOLUCIN:
1. Hiptesis. H0: 250 Ha: >250
2 2
. 2 1829
P( 5806 . ) = 095
.
a) H0: 2 = 20 b) H 0 : 2 20 c) H 0 : 2 20
Ha : 2 20 H : 2 < 2 H : 2 > 2
14244 3 1a42430 1a42430
Unilateral a la izquierda Unilateral a la derecha
Bilaterales
a ) RA H o : - Z 2 Z c Z 2
RR Ho : Zc < Z 2 Zc > Z 2
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
S 0
Zc =
0 2n
- 272 - V. Ibaez Q.
EJEMPLO
Se registraron los valores de la capacidad vital de una muestra de 10 pacientes con
obstruccin crnica severa de las vas respiratorias. La varianza de las 10
observaciones fue de 0.75. Probar la hiptesis nula que indica que la varianza de
la poblacin es de 1.0. = 0.05
RR Ho: < 2 2
c2 > 2 2,(n-1)
c 1 2,(n-1)
: 144424443 1442443
20 .975 , 9 = 2 .70 20.025,9 = 19.0
MN 2 Z + 2n 1
1
2
2 1
2
Z 2 + 2n 1
2
Q
1 2
Donde: 2 2 ,( n 1) = Z 2 + 2 n 1
2
1 2
12 2,( n1) = Z 2 + 2n 1
2
S12 12
F= 2 2 , tiene distribucin de probabilidad F con grados de libertad
S2 2
(n1 - 1) y (n2 - 1). Esto es F~F(n1 -1)(n2 -1). Si se supone verdadera la hiptesis nula
Ho: 1 = 2 12 22 = 1, la estadstica de prueba es:
2 2
S12 12
F= ~ F(n1 1, n 2 1) ,
S22 22
- 274 - V. Ibaez Q.
1. Hiptesis Estadstica
n1
( Xi )2
cX Xh
n1 n1 n1
Xi X
2
i
2
i i=1
n1
X1 = i=1
, s12 = i=1
= i=1
n1 n1 1 n1 1
n2
( Yi ) 2
dY Y i
n2 n2 n2
Y Y
2
j j
2
j j=1
n2
s22 = =
j=1 j=1 j=1
X2 = ,
n2 n2 1 n2 1
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
b) c)
a)
R.C.
R.C. R.C.
R.C.
2 2 1 1
1
a ) RA H o : F1 2,(n1 -1)( n 2 1) Fc F 2,( n1 1) (n2 -1) b) RA H0: Fc F1,( n11)(n2 1) c) RAH0: Fc F,(n11)(n21)
RR H o : Fc < F1 2,(n1 -1)(n2 -1) Fc > F 2,(n1 -1)(n2 -1) RR H0: Fc < F1,(n1 1)( n2 1) RRH0: Fc >F,(n11)(n21)
1
F = F1 ,( n 1)( n 1) =
Recuerde que: 1 2 2 1 2
F ,( n 2 1)( n1 1)
2
Estadstica Aplicada a la Educacin - 275 -
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
S12
Fc =
S22
6. Si Fc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Fc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.
EJEMPLO.
Se compar la eficacia de dos analgsicos con base en el tiempo transcurrido desde
su administracin hasta el momento del cese del dolor. 30 pacientes recibieron el
medicamento 1 y otros 13 el medicamente 2. Las varianzas de las muestras son s12 =
64 y s22 = 16. Probar la hiptesis nula que indica que las varianzas de las dos
poblaciones representadas son iguales. Use = 0.05 y encuentre el IC al 95%.
SOLUCION:
RA H o : 0.41 Fc 2.97
RR H o : Fc < 0.41 Fc > 2.97
- 276 - V. Ibaez Q.
1 1
F1 = F1 ,( n1 1 )( n 2 1 ) = = = 0.41
2 2
F0.025,12 ,29 2.43
F0.025,29,12= 2.97 (lmite superior)
1 1
F0 .025 ,29 ,12 = = = 0.41 (lmite inferior)
F0 .975 ,12 ,29 2.43
5. Clculo del valor experimental:
S12 64
Fc = = =4
S22 16
6. Decisin: Como Fc=4.0 > Ft=2.97, cae en la regin de rechazo, entonces se
rechaza la Ho: y se acepta la Ha:
7. Conclusin: Se puede concluir que existe evidencia suficiente para afirmar que
los dos analgsicos acta en forma diferente en los dos poblaciones.
EJEMPLO:
Se analizaron los valores de ndice cardaco (litros/minuto/M2) en dos grupos de
pacientes despus de una operacin de reemplazo de vlvula. Los tamaos de las
muestras y las varianzas fueron las siguientes: n1 = 16, s12 =3.75, n2 = 10, s22 =1.8.
Proporcionan stos datos la evidencia suficiente para indicar que existe una
diferencia en las varianzas de las poblaciones?. Use = 0.05 y encuentre el IC al 95%.
SOLUCION:
S12 12
3. Estadgrafo de Contraste: F = ~ F( n1 1 ),( n 2 1 )
S22 22
4. Regin de rechazo y aceptacin de la H0:
RA H o : 0.32 Fc 3.77
RR H o : Fc < 0.32 Fc > 3.77
1 1
F1 = F1 0 . 05 ,15 ,9 = = = 0 .32
2 2
F0 .025 ,9 ,15 3.123
Estadstica Aplicada a la Educacin - 277 -
F0.025,15,9= 3.769
LM
P 2.08x0.32
12
2.08x3.769 = 0.95
OP
N 22 Q
P(0.67, 7.84)
poblacin Nc , h donde
2
2
2
2
1
y 22 conocidas. Suponiendo que las poblaciones son
independeintes.
- 278 - V. Ibaez Q.
1. HIPTESIS ESTADSTICA:
Z =
c X - X h - b g ~ N (0,1)
1 2 1 2
12 22
+
n1 n 2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho : Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
Z0 =
cX 1 - X2 h
2
2
+ 2
1
n1 n2
0 1 -2 = d0
a) H: b) H:0 1 2 d0 c) H0: 1 2 d0
H: 1 2 d0 H:a 1 2 <d0
1442443 H: 1 2 >d0
1a44 2443 1a44 2443
Bilaterales Unilateral alaizquierda Unilateral a la derecha
EJEMPLO:
Un estudio sobre peso de quesos de la zona de Melgar-Ayaviri, se muestreo en el
establo A a 35 quesos obtenindose un promedio de 0.984 kg y en el segundo
establo B, se encontr una muestra de 40 quesos con un promedio de 1.060 kg. Los
pesos de los quesos se supone que estn aproximadamente distribuidos con
2A = 0.44 y 2B = 072
. . Se puede concluir que la media de la poblacin en peso de
quesos del Establo A es inferior al Establo B. Use =0.05.
SOLUCION:
1. HIPTESIS: H 0: A B
Ha: A < B
2. Nivel de significacin: = 0.05
3. Estadgrafo de contraste:
Z =
c X - X h - b g
1 2 1 2
2 2
+ 1 2
n1 n 2
- 280 - V. Ibaez Q.
4. Establecer la Regin de rechazo y aceptacin:
RA H 0 : Z0 Z 2 = 0 .0 5
1 - 0 .0 5
RR H 0 : Z 0 < Z 2
Z = Z0.05 = 1645
. 0 z
Z0 =
cX A - XA h = 0.984 1.060 = 0.4347
2 2
0.44 0.72
+
+ 1 2
n1 n 2 35 40
6. Estadstica de decisin:
Si Z0 = -0.4347 > Z0.05 = -1.645, cae en la regin de aceptacin ( RA H 0 : ),
entonces aceptamos H0: y rechazamos la Ha:
7. Conclusin. Se puede concluir que el peso promedio de queso de ambos establos
no difieren o es uniformente en la produccin de quesos.
n1
( Xi ) 2
cX h
n1 n1 n1
X X
2
i i X 2
i i=1
n1
X1 = i=1
, s =
2 i=1
= i=1
n1 1 n1 1
1
n1
n2
( Yi ) 2
dY Y i
n2 n2 n2
Y Y
2
j j
2
j j=1
n2
s22 = =
j=1 j=1 j=1
X2 = ,
n2 n2 1 n2 1
1. HIPTESIS ESTADSTICA:
a) H 0: 1 = 2 b) H0: 1 2 c) H0: 1 2
H : 1 2 Ha: 1 < 2 Ha : 1 > 2
1a42 43 14243 14243
Bilaterales Unilateral a la izquierda Unilateral a la derecha
Z =
c X - X h - b g ~ N(0,1)
1 2 1 2
2 2
S S
+ 1 2
n1 n 2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Z o Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
- 282 - V. Ibaez Q.
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal de paso 3).
Z0 =
cX 1 - X2 h
2 2
S S
1
+ 2
n1 n 2
SOLUCIN:
1. Hiptesis estadstica: Ho: A = B versus Ha: A B
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste: La funcin pivotal o funcin estandarizada es:
Z =
cX A h b
- X B - A B g ~ N( 0,1)
2 2
S S
A
+ B
nA n B
Estadstica Aplicada a la Educacin - 283 -
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
RA H 0 : - 1.96 Z C 1.96 2 2
RR H 0 : Z C < 1.96 Z C > 1.96 1 -
5. Clculo del valor experimental. Z 2 = 1.96
0 Z 2 = 1.96 Z
Zc =
cX A - XB h= 15 - 24
=
9
= 11.91
2
S S2 8 12
+
20
A
+ B
nA nB 35 35 35
CASO II: A) n1+n2 30 (n1 30, n2 30) y Varianzas desconocidas, pero iguales
12 = 22 = 2
1. HIPTESIS ESTADSTICA:
a) H 0: 1 = 2 b) H 0 : 1 2 c) H 0: 1 2
H : 1 2 H a : 1 < 2 H : >
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha
c X - X h - b g ~ t
1 2 1 2
( n 1)S + ( n 1)S F 1 1 I
t = ( n1 + n2 2 )
GH n + n JK
2 2
1 1 2 2
,
n +n 2
1 2 1 2
a) 2 2 b) c)
1- 1- 1-
LMc h
Pr X1 X2 t
1 1
+ 12 X1X2 +t c h 1 1
Sc + =1
OP
N Q
Sc
,(n1+n22) n1 n2 ,(n1+n22) n1 n2
2 2
EJEMPLO:
Se realizaron los valores medios de la velocidad de conduccin de un nervio motor
en 10 personas internadas en el Centro de Control de envenenamientos en el Hospital
Regional Manuel Nuez Butrn - Puno, con diagnstico de envenenamiento con
metilmercurio. Se hicieron tambin determinaciones similares en 15 personas
aparentemente sanas. Las medias y desviacin estndar son las siguientes: Individuos
Estadstica Aplicada a la Educacin - 285 -
SOLUCIN:
Primeramente se debe probar si la varianzas es: 12 = 22 = 2 12 22 .
RA H o : F Fc F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2
RR H o : Fc < F Fc > F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2
1 1
F0.975,9 ,14 = = = 0.26 ; F0.025,9,14= 3.209
F0.025,14 ,9 3.798
R.C.
R.C.
5. Clculo del valor experimental:
2 2
1
S2 36
Fc = 2E = = 144
.
S N 25 0 0.26 3.209 F
6. Decisin: Como Fc=1.44 cae en la regin aceptacin, entonces se acepta la Ho:
y se rechaza la Ha:
PROCEDIMIENTO:
1. Hiptesis estadstica: Ho: E = N Versus Ha: E N
2. Elegir el nivel de significacin: = 0.05
- 286 - V. Ibaez Q.
3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:
cX - X h - b g ~ t
1 2 1 2
( n 1)S + ( n 1)S F 1 1 I
t = ( n1 + n2 2 )
GH n + n JK
2 2
1 1 2 2
,
n +n 2
1 2 1 2
n1 + n2 2
+
H
n1 n2 K 2930
.
H10 15K
( nE 1)S2E + ( nN 1)S2N 9x36 + 14x25
S2c = = = 29.30
nE + nN 2 23
6. Decisin: tc = -3.62 cae en la regin de rechazo, entonces se rechaza la Ho: y
se acepta Ha:
7. Conclusin. Existe evidencia suficiente para afirmar que las poblaciones son
diferentes, es decir existe diferencia entre las personas internadas en el centro
de control de envenenamiento frente a las personas aparentemente sanos.
1. HIPTESIS ESTADSTICA:
a) H 0: 1 = 2 b) H 0 : 1 2 c) H 0: 1 2
H : 1 2 H a : 1 < 2 H : >
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha
c X - X h - b g ~ t
1 2 1 2
FG S + S IJ
t = (g)
2 2 ,
Hn n K
1 2
1 2
FG S + S IJ 2 2 2
Hn n K
1 2
g= 2,
FG S IJ FG S IJ
1 2
2 2 2 2
Hn K Hn K
1 2
1
+ 2
n1 1 n2 1
a) 2 2 b) c)
1- 1- 1-
1 n2
F I
GH
P X1 X2 t ,g
2
S12 S22 S2 S2
+ 1 2 X1 X2 + t ,g 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
OBSERVACIN: Cuando las hiptesis de contraste son de la forma:
X1 - X2 d 0
FG S + S IJ
i) Z0 = (caso de muestras grandes)
2 2
Hn n K
1 2
1 2
X1 - X2 d 0
FG IJ
ii) t = ,
( n1 1)S + ( n 2 1)S22 1 1
2
+
H K
1
n1 + n 2 2 n1 n 2
caso de muestras pequeas y varianzas desconocidas, pero iguales.
Estadstica Aplicada a la Educacin - 289 -
X1 - X 2 d 0
iii) t = , para el caso de muestras pequeas y varianzas
2 2
S S
+ 1 2
n1 n 2
desconocidas, pero distintas.
EJEMPLO.
Un investigador esta interesado en saber si los nios nacidos prematuramente
con acidosis metablica tarda y los nios prematuros que no tienen dicha enfermedad
difieren en lo que respecta a las concentraciones en la orina de cierta sustancia
qumica. Las concentraciones medias, desviacin estndar y el tamao de la muestra
para ambos grupos son las siguientes:
Muestra n X s
Con la condicin 15 8.50 5.5
Sin la condicin 14 4.80 2.9
Qu puede concluir el investigador con base en estos resultados?. Sea =0.05
y encuentre el intervalo confidencial al 95%.
SOLUCIN:
Primeramente se debe probar si la varianzas es: 12 = 22 = 2 12 22 .
S 12
3. Estadgrafo de Contraste: F = ~ F( n 1 1 ),( n 2 1 )
S 22
4. Regin de rechazo y aceptacin de la H0:
RA H o : F Fc F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2
RR H o : Fc < F Fc > F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2
1 1
F0.975,14 ,13 = = = 0.332 ; F0.025,14,13=3.082
F0.025,13,14 .
3012
- 290 - V. Ibaez Q.
PROCEDIMIENTO:
1. Hiptesis estadstica: Ho: 1 = 2 Versus Ha: 1 2
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:
c X - X h - b g ~ t
2 2
1-
1 2 1 2
FG S + S IJ
t = (g) t
2 2 -2.079 0 2.079
,
Hn n K
1 2 RR/Ho: RR/Ho:
RA/Ha:
1 2 t 2 ,21 t 2 ,21
FG S + S IJ
2 2
FG 30.25 + 8.41IJ
2
2
H n K H 15 14 K
1 2
n 6.85068
g= = = = 215
FG S IJ FG S IJ FG 30.25IJ FG 8.41IJ
1 2
2 2 2 2 . ~ 21 ,
2 2 0.31825
Hn K +Hn K H n K +H n K
1 2
1 2 1 2
n1 1 n2 1 14 13
Estadstica Aplicada a la Educacin - 291 -
X1 - X 2 8.5-4.8 .
37
= = = 2.287
. I
FG S + S IJ FG 30.25 + 841
tc =
H n n K 15 14 JK
2 2 .
16178
1
1
2
2
H
6. Decisin: Como tc = 2.29 cae en la regin de rechazo, entonces se rechaza la
H0: y se acepta la Ha:
7. Conclusin. Existe evidencia suficiente para afirmar que hay diferencia entre
los nios nacidos prematuramente tarda y los nios prematuros que no tienen
dicha enfermedad.
D = E ( D ) = E ( X Y ) = E ( X ) E ( Y ) = 1 2 , D ~ N
Cov(X,Y)
2D = V ( D ) = 12 + 22 21 2 , = 0
1 2
La media y la varianza de la muestra de n diferencias D1,D2, ...., Dn esta dada
por:
- 292 - V. Ibaez Q.
D i
n
D i
2
d D i i
2
cD D h
n
i
2
n
D= i=1
, S D2 = i=1
= i =1
n n 1 n 1
D ~ N( D , 2
D n) , cuando hallamos un estimador de la diferencia entre
dos medias poblacionales ( D = 1 2 ) se pueden presentarse dos casos:
1. Hiptesis Estadstica
a) H 0 : D = 0 b) H 0: D 0 c) H 0: D 0
Ha: D 0 Ha: D < 0 H : >0
14243 14243 1a42D43
Bilaterales Unilateral a la izquierda Unilateral a la derecha
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Z o Z 2 b ) RA H 0 : Z0 Z c ) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
D
Z0 =
SD n
6. Estadstica de Decisin: Si Z0 pertenece a RA H 0 : , aceptamos H0: y
rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.
LM SD S
D D + Z D
OP = 1 -
N
P D - Z
2
n 2
n Q
CASO II: Tamao de muestra pequeo (n 30).
1. Hiptesis Estadstica
a) H 0 : D = 0 b) H 0: D 0 c) H 0: D 0
Ha: D 0 Ha: D < 0 H : >0
14243 14243 1a42D43
Bilaterales Unilateral a la izquierda Unilateral a la derecha
a) 2 2 b) c)
1- 1- 1-
D
tc =
SD n
6. Estadstica de Decisin: Si tc pertenece a RA H 0 : , aceptamos H0: y
rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.
El intervalo de confianza del 100(1- )% en ( D = 1 2 ) es:
LM
P D t ,( n1)
SD S OP
D D+ t ,( n1) D = 1 -
N 2
n 2
n Q
EJEMPLO.
Veinte estudiantes de matemtica I de la Facultad de Ingeniera Estadstica e
Informtica de la UNA fueron divididas en 10 parejas, teniendo cada miembro de la
pareja aproximadamente el mismo cociente de inteligencia. Uno de cada pareja se
selecciona al azar y se asigna a una seccin que utiliza videos. El otro miembro se
asigna a una seccin que cuenta con profesor. Al finalizar el ciclo ambos grupos se
presentan al mismo examen, obtenindose los resultados siguientes:
2
Pareja Con video (V) Con profesor (P) D = V- P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
Total 141 146 -5 23
Estadstica Aplicada a la Educacin - 295 -
Suponiendo que la caracterstica en estudio es normal, obtener el intervalo de
confianza del 95% para la diferencia real en el promedio de calificaciones de los dos
procedimientos de enseanza.
SOLUCION:
2
Pa re ja Co n v id e o (V) Co n p ro fe s o r (P) D=V-P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
T o tal V= 141 P = 146 D = i -5 D 2
i = 23
-t 0.025,9 = - 2 . 2 6 2 0 -t 0.025,9 = 2 . 2 6 2 t
0
RR/Ho: RR/Ho:
RA/Ha:
t 2,(n1) t 2,( n1)
Vi 141 Pi
146
XV = i=1
= = 141
. XP =
, i=1
= = 14.6 ,
n 10 n 10
D = XV XP = 141
. 146
. = 05
.
- 296 - V. Ibaez Q.
D i
( 1 ) + ( 2 )+L+( 1 ) + ( 1 ) 5
Otra forma: D= i=1
= = = 0.5
n 10 10
D
d D i 2
i
i
2
cD Dh
n
i
2
23
(-5) 2
S2D = i=1 n
= i =1
= 10 = 205
.
= 2.27777778
n 1 n 1 9 9
SD = 1.509230856
t 2 ,( n1 ) = t 0.05 2 ,( 101 ) = t 0.025,9 = 2.262
D -0.5
tc = = = 1047
.
SD n 1.50923085 10
6. Estadstica de Decisin: Si tc = 1.047 cae en la regin de aceptacin, entonces
se acepta la H0: y rechazamos la Ha:
7. Conclusin. Se puede concluir que los estudiantes tienen el mismo cociente de
inteligencia.
Calculando el intervalo de confianza de 95% se tiene:
LM
P -0.5 (2.262)
1.509230856
D 0.5 + (2.262)
1.509230856 OP = 0.95
N 10 10 Q
P -1.5795637 D 0.579563708 = 0.95
X i
X Nmero de casos favorables
Parmetro: P = i =1
= =
N N N
n
x i
x Nmero de xitos en la muestra
Estimador: p$ = i =1
= =
n n n
Donde p$ es el estimador puntual de la proporcin de la poblacin que pertenece
Estadstica Aplicada a la Educacin - 297 -
LM PQ OP
a esta clase, p$ ~ N P,
N n
.
Q
LM PQ OP
CASO I: Tamao de muestra grande (n > 30), p$ ~ N P,
N n
.
Q
1. HIPTESIS ESTADSTICA:
a) H 0 : p = p 0 b) H 0: p p 0 c) H 0: p p0
H a : p p0 H a : p < p0 H : p>p
14243 14243 1a42430
Bilaterales Unilateral a la izquierda Unilateral a la derecha
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
LI LS
LM
P p$ Z
$ p)
p(1- $ OP
N 2
n Q
OBSERVACION: Cuando el muestreo es sin reemplazamiento en una poblacin
finita de tamao N y el tamao de la muestra constituye ms de 5% del tamao de la
poblacin, resulta adecuado usar el factor de correccin por poblacin finita.
Entonces el intervalo de confianza 100(1- )% para el parmetro P, esta dado por:
LM $ $ N-n
p(1-p) FG IJ $ $ N-n
p(1-p) FG IJ OP = 1 -
$
MN
P p-Z
2
n N-1 H K
P p+
$ Z
2
n N-1 H K PQ
OBSERVACION: Como 0 < p$ < 1 y 0 < 1- p
$ < 1 , entonces se tiene:
LPMp$ - Z
P p$ +
Z OP = 1 -
MN 4n 4n PQ
2 2
P = P X x p = p0 =
k
FG nIJ p (1 p )
H xK
x nx
o 0
x=0
Estadstica Aplicada a la Educacin - 299 -
P = P X x p = p0 =
k
FG nIJ p (1 p )
H xK
x nx
o 0
x=0
P = P X x p = p0 =
n
FG nIJ p (1 p )
H kK
k nk
o 0 ,
k=x
P = P X x p = p0 =
x
FG nIJ p (1 p )
H kK
k nk
o 0
k=0
SOLUCION:
4
1. HIPTESIS ESTADSTICA: H0 : P 0.92 versus Ha : P < 0.92
p0
4
p0
= 0.01
1-
RA H o : Z C Z 0 .01 = 2 .327 Z0.01 = 2327
. 0 z
RR H o : Z C < Z 0 .01 = 2 .327 Zc = -3.16
128
p$ = = 0.85 q$ = 1 - 0.92 = 0.08
150
6. DECISION: Dado que Zc=-3.16 < -Z0.01= -2.327 cae en la regin de rechazo,
entonces rechazamos la H0: y se acepta la Ha:
7. Conclusin. Se puede afirmar que es evidente que los pacientes admitidos a un
hospital de urgencias que presentaron vmitos es inferior al 92%.
EJEMPLO:
Antes del inicio de un programa de inmunizacin contra la rubeola en una rea
metropolitana, una encuesta revel que 150 integrantes de una muestra de 500 nios
de primaria habian sido inmunizados contra esta enfermedad. son compatibles estos
datos desde el punto de vista el 50% de los nios de primaria de dicha rea habian sido
inmunizados contra rubeola?. Use = 0.05
SOLUCION:
1. Hiptesis: H 0 : p = 0.50 versus H a : p 0.50
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste, elegida para este caso, es la distribucin normal con
funcin pivotal.
Estadstica Aplicada a la Educacin - 301 -
p$ - p 0 x - np0
Z0 = Z0 =
p 0 (1 p 0 ) np0 q 0
n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
2 2
1-
RA H o : - Z 2 Zo Z 2 Z 2 = 196
.
0 Z 2 = 196
. z
0
RR H o : Z 0 < Z 2 Z 0 > Z 2 RR/Ho:
RA/Ha:
RR/Ho:
Valor Valor
crtico crtico
Usos de la prueba.
- Se usa cuando los tamaos de muestras (n1 y n2) son relativamente grandes, por lo que el
procedimiento basado en la aproximacin normal a la binomial se emplea ampliamente
en la prctica.
- En caso de muestras pequeas la prueba de Z es inapropiado en este caso se usar el
procedimiento que se basa en la aproximacin Hipergeomtrica.
- Se usa esta prueba en los estudios mdicos y biolgicos para comparar dos proporciones
(p1 y p2).
RESTRICCION:
- La prueba de hiptesis para la diferencia de dos proporciones, solo se puede
trabajar con datos contadas (cuantitativo discreto), ms no as con datos
cuantitativos contnuos.
- 302 - V. Ibaez Q.
Sean X1, X2, ..., Xn1 una muestra aleatoria tomada de una poblacin Bernoull
B(1,p1) y Y1, Y2, .., Yn2 una muestra aleatoria tomada de una poblacin Bernoull
B(1,p2) donde los parmetros desconocidos p1 y p2 son las proporciones de xitos
poblacionales respectivos. Supongamos que las poblaciones son independientes
yseanlas proporciones de xito muestrales:
n1
X i
X1 Nmero de xitos de la muestra 1
p$ 1 = i =1
= =
n1 n1 n1
n2
y
j=1
j
X 2 Nmero de xitos de la muestra 2
p$ 2 = = =
n2 n2 n2
La estadstica de prueba en la cual se basan los criterios de decisin es la variable
$ 1 p$ 2 que tiene una aproximacin normal cuando las muestras son
aleatoria p
grandes. Para n1 y n2 suficientemente grandes, la variable aleatoria:
Z=
p$ 1 p$ 2 p1 p 2b g ~ N(0,1), se distribuye aproximadamente
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
1. HIPTESIS ESTADSTICA:
a) H0: p1 =p2 = p b) H 0 : p1 p 2 c) H 0 : p1 p 2
H : p1 p2 H a : p1 < p 2 H : p >p
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha
Z =
b p$ - p$ g - bp p g ~ N( 0,1)
1 2 1 2
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
a) 2 2 b) c)
1- 1- 1-
Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico
a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c ) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal de paso 3).
p$ 1 - p$ 2 p$ 1 =
X1 U|
Z0 =
FG 1 + 1 IJ ,
n1
X2
p$ = 1 V|
X + X 2 n1 p$ 1 + n 2 p$ 2
n1 + n 2
=
n1 + n 2
$$
pq
Hn n K
1 2
p$ 2 =
n1 |W
- 304 - V. Ibaez Q.
Z0 =
bp$ - p$ g - p
1 2 0
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
INTERVALO CONFIDENCIAL (IC):
LMb g
P p$1 p$2 -Z
$1$1 pq
pq $$
b gb g $ $ pq
pq $$
+ 2 2 P1 P2 p$1 p$2 + Z 1 1 + 2 2 = 1 -
OP
N 2
n1 n2 2
n1 n2 Q
Por tanto, el intervalo de confianza del (1- )100% para la diferencia de
proporciones (P1 - P2) esta dado aproximadamente por:
P1 P2
LMbp$ p$ g Z p$ 1q$ 1 p$ 2 q$ 2
+
OP
N 1 2
2
n1 n2 Q
EJEMPLO.
Un alumno que realiza su tesis de grado en Veterinaria, cree que los cerdos
criollos de la regin de Puno estn infestados con Cisticercosis en un 15% ms que los
cerdos de la regin del Cusco. Para comprobar la suposicin el alumno hace un
seguimiento al azar de 98 cerdos sacrificados en la regin de Puno y 118 en la regin
del Cusco, encontrando 64 cerdos con est enfermedad en Puno, y 60 en el Cusco.
Con los datos disponibles se podr corroborar la sospecha del alumno?
SOLUCION:
1. Hiptesis: H0: PP - PC 0.15
H0: PP - PC > 0.15
Estadstica Aplicada a la Educacin - 305 -
Z0 =
bp$ - p$ g - p
1 2 0
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
Z0 =
bp$ -p$ g - p
P C 0
=
(065306
. 050847
. ) 015
.
=
000541
.
=008128
.
p$ Pq$ P p$Cq$C .
00023119 +0002118
. .
0066558
+
nP nC
Z= -0.08
11
ANLISIS DE REGRESIN
Los mtodos de regresin, se utiliza para analizar datos que provienen de experi-
mentos que no fueron diseados, este es el caso del estudio de fenmenos no contro-
lados o de registros histricos. Los mtodos de regresion se usan para determinar la
mejor relacin funcional entre las variables, mientras que la correlacin se utili-
zan para medir el grado de asociacin de las distintas variables. En pocas palabras,
regresin es la CANTIDAD DE CAMBIO de una variable asociado a un cambio
nico de otra variable. El principal objetivo del anlisis de la regresin es el de
realizar predicciones. La regresin permite determinar si existe relacin entre las
variables en estudio (X e Y), para lo cual se utiliza el comportamiento de una varia-
ble (X = independiente), para predecir el comportamiento de otra variable (Y = de-
pendiente). Las dos caractersticas son medibles.
Usos de la Regresin:
- Para conocer el rendimiento de matemticas de un estudiante, en base en el
puntaje obtenido en una prueba de aptitud en dicha materia.
- Para ver si la variable (Y) depende de otra (X), estimando por consiguiente la
medida de dicha relacin o asociacin.
- Para determinar la forma de la curva de la regresin.
- Para conocer el error real implicado en un experimento, despus que haya sido
descontado el efecto de una variable relacionada.
- Sirve de base para el anlisis estadstico.
Como se manifest el objeto principal de la regresin es el de realizar prediccio-
nes como:
- Predecir el tiempo meteorolgico basado en los datos del pasado.
- 308 - V. Ibaez Q.
- Predecir la estimacin de la matrcula escolar en los prximos aos.
- Predecir los recursos financieros.
- Predecir la produccin de lana/ao, basado en los aos anteriores.
- Predecir la infraesctructura educativa (aulas, mobiliario, material didctico,
etc).
Donde:
Yi = Variable dependiente.
Xi = Variable independiente.
0 = Parmetro desconocido que indica la ordenada donde la lnea de
regresin lo intersecta.
1 = Parmetro desconocido que indica la pendiente de la lnea de mejor
ajuste, llamada tambin coeficiente de regresin poblacional.
i = Error de perturbacin que puede tomar valores positivos o negativos.
Yi
E(Y) = 0 + 1Xi
Yj
UV
W j
UV
.
W i
Yi
X1 X2 X3 X4 Xi
Suposiciones en regresin
Diagrama de dispersin.
Una vez recolectada la serie de n observaciones bidimensionales, cada par
de valores (X,Y) en el plano cartesiano o rectngular est representado por un punto,
y habra tantos puntos como parejas de observaciones que tenga. Esta representacin
da origen a una nube de puntos que se denomina DIAGRAMA DE DISPERSION
ESPARCIMIENTO; este diagrama puede tener diferentes formas; esta es la forma
ms usual para detectar si la funcin es lineal, exponencial, potencial, cuadrtica,
etc. al cual el experimentador ajustar su informacin recopilada, de tal forma que
describa adecuadamente la relacin entre las variables en estudio.
Eje Y
Eje Y
Eje Y
Eje Y
= bY g
n n
1 X i
2 2
i i 0 aplicando sumatoria.
i =1 i =1
Para encontrar las Ecuaciones Normales se usan las derivadas parciales con
respecto a los parmetros desconocidos 0 y 1 , entonces tenemos:
n n
2i 2i
a) i=1
=0 y b) i=1
=0
0 1
En resumen de a) y b) se tiene las Ecuaciones Normales:
n n
n$ 0 + $ 1 X i = Yi
i =1 i =1
n n n
$ 0 X i +$ 1 X i2 = X i Yi
i =1 i =1 i =1
$ 0 = Y $ 1X
Estadstica Aplicada a la Educacin - 311 -
c hc h
n n
X i X Yi Y X Y nXY
i i
$ 1 = i =1
= i =1
cX h
n n
X
2
i X 2
i nX 2
i =1 i =1
$ = ( Y $ X) + $ X = Y + $ X $ X = Y + $ ( X X)
Yi 1 1 i 1 i 1 1 i
$ Y = $ (X X)
Yi 1 i
Yi
i = Yi Y$ i
Y (X,Y)
U|
U|
V| U| $ = $ + $ X
E(Y) 0 1 i
U| ||
W
i
U| V| U| $ tg ( ) =
$ 1
= $ 1
W
11
V| V|
1
W
|| |V Y
9
UV W
1
W S c X, Y h
R
U| Y$ i Y = $ 1 X i
8
Y
UV UV T 1 42 43
10
W UV W
V| Y$ || ||
5
7 i
W
1
Y2 UV 6
V| Y
i
|| ||
UV UV W 4
Y1 W
||
1
W 2
R
$ S
T0
W W W
X1 X2 X3 X4 X X5 X Xi
$ M XY H KH K P =$ x y i i
n n
SCR CMR
MM PP
i=1 i=1
Regresin 1 1 i i 1 i i
ni=1 i=1 1 CME
N Q
LM F Y I OP L F XIF YI O
M GH JK PP$ MMXY GH JKGH JK PP =y $ xy
n 2 n n
n i n i i n n SCE
n - 2 MY
PP MMN PP
2 i=1 i=1 i=1 2
Error
MM n2
i 1 i i i 1 i i
i=1 n n i=1 i=1 i=1
N Q Q
FGY IJ n 2
Total n- 1 H K n
Y i
2 i=1
i
= y2i
n
i=1 n i=1
Estadstica Aplicada a la Educacin - 313 -
11.3. PRUEBA DE HIPTESIS.
1. Hiptesis Estadstica: H 0 : 1 = 0
H a : 1 0
2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).
3. Estadgrafo de Contraste, elegida para este caso, la prueba t-Student y cuya
funcin pivotal.
$ 1 1
t= ~ t ( n2)
s. e($ ) 1
2 2
1-
t 2 ,( n 2 ) 0 t 2 ,( n 2 ) t
RR/Ho: 1 RR/Ho:
RA/Ha:
Valor Valor
crtico crtico
RA H o : - t 2 ,( n 2 ) t c t 2,(n-2)
RR H o : t c < -t 2,(n-2) t c > t 2,(n-2)
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal.
$ 1 1 s.e.($ ) = s2
tc =
s. e($ )
, 1
FGX IJ n 2
1
n
X
H K
2
i
i=1
i
i=1 n
6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
- 314 - V. Ibaez Q.
7. Conclusin. Realizar la interpretacin en base al paso 4) y concluir de acuerdo
al tenor del problema.
INTERVALO CONFIDENCIAL (IC) PARA ( 1 ).
Pr $1 t ,(n2)s.e.($1) 1 $1 + t ,(n2)s.e.($1) = 1 ;
2 2
EJEMPLO:
Se llev a cabo un experimento para estudiar el efecto de cierto medicamento
para disminuir la frecuencia cardiaca en adultos. La variable independiente es la
dosis en miligramos del medicamento, y la variable dependiente es la diferencia
entre la frecuencia cardiaca ms baja despus de la administracin del medica-
mento y un control antes de administrarlo. Se reunieron los siguientes datos:
Dosis (mg) "X" 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50
Reduccin del ritmo cardiaco (latido/min.) 10 8 12 12 14 12 16 18 17 20 18 20 21
D IA G R A M A D E D IS P ER S I N P A R A L A FR EC U EN C IA C A R D IA C A
23
21
LATIDOS/MINUTO (Y)
19
17
15
13
11
5
0 0 .2 0 .4 0 .6 0 .8 1 1 .2 1 .4 1 .6 1 .8 2 2 .2 2 .4 2 .6 2 .8 3 3 .2 3 .4 3 .6 3 .8 4
D O S IS (mg ) (X )
13
XY nXY
i i
. 13(2)(1523076923
4225 . )
$1 = i=131 = = 4087912088
.
. 13(4)
X
63375
i
2
nX2
i=1
$ 0 = Y $ 1 X = 1523
. 4.087912088x2 = 7.054945054
Entonces, el modelo de regresin estimado es: $ = $ + $ X , reemplazando
Yi 0 1 i
18
16
14
12
10
8
6
4
2
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00
DOSIS (mg)
d X Y X Y n i
n
SSRm = $ 1 xi yi = $ 1 i i i i
i =1
= 4.087912088(442.5-(26)(198)/13)
= 190.087912
n =13
( Yi )2
n
1982
SSTm = Yi 2 i =1
= 3226 = 210.3076923
i =1 n 13
SSE = SSTm SSRm = 2103076923
. 190087912
. = 2021978022
.
1. Hiptesis Estadstica: H 0 : 1 = 0
H a : 1 0
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de Contraste, elegida para este caso, la prueba t-Student y cuya
funcin pivotal.
$ 1 1
t= ~ t ( n2)
s. e($ ) 1
4. Establecer la Regin de 2 2
decisin, determinando la re- 1-
gin crtica de la prueba.
t002511
. , =2201
. 0 t0.025,11 = 2201
. t
RR/Ho: 1 RR/Ho:
RA Ho : - 2.201 t c 2.201 Valor
RA/Ha:
Valor
crtico crtico
RR Ho : t c < -2.201 t c > 2.201
Estadstica Aplicada a la Educacin - 317 -
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal.
$ 1 1 4.087912088 0
tc = = = 10169
. ,
s. e( $ 1 ) 0.40199085
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t| 95% Confidence Limits
Intercept 1 7.05495 0.88757 7.95 <.0001 5.10141 9.00848
X 1 4.08791 0.40199 10.17 <.0001 3.20314 4.97269
Covariance of Estimates
Variable Intercept X
Intercept 0.7877836449 -0.32319329
X -0.32319329 0.1615966451
- 318 - V. Ibaez Q.
EJERCICIOS:
Para cada uno de los siguientes ejercicios: a) trazar el diagrama de dispersin, b)
Estimar la ecuacin de regresin, c) graficarla en el diagrama de dispersin la ecua-
cin estimada, d) anlisis de varianza (ANVA) y e) los intervalos confidenciales.
1.- Las calificaciones de un grupo de estdiantes en su reporte de medio aos (X) y en
los exmenes finales (Y) fueron los siguientes:
X 77 50 71 72 81 94 96 99 67
Y 82.00 66.00 78.00 34.00 47.00 85.00 99.00 99.00 68.00
3.- Los datos siguientes hacen referencia al nmero de horas invertidas para preparar
un examen (X) y la calificacin recibida en este ltimo (Y) (esta ltima expresa
en decenas).
X 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
Y 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
N de nios en la familia 1 2 3 4 5 6 7 8 9 10
Inteligencia de todos los nios de la familia 105 102 104 100 97 101 95 93 97 88
Estadstica Aplicada a la Educacin - 319 -
11.4. CORRELACIN.
Coeficiente de correlacin de Pearson.
La correlacin viene del latn cum: con y relatus: relacionado, la correlacin
lineal permite medir si hay asociacin entre dos variables o medir la intensidad de
dicha asociacin. Para ello es importante que la muestra bivariado sea tomada al
azar, tanto para la variable X como para la variable Y.
El coeficiente de correlacin de Pearson, se ajusta al tipo de informacin cuanti-
tativa, esto con la finalidad de detectar y medir la asociacin entre variables o de
razn. Los valores del coeficiente de correlacin oscilan entre +1 y -1, y se explica de
la siguiente manera:
a) El valor de r = +1, indica una correlacin positiva perfecta o correlacin direc-
ta, cuando al aumentar disminuir el valor de la variable independiente, au-
menta disminuye tambin el valor de la variable dependiente (pendiente po-
sitiva).
b) El valor de r = -1, exprsa una correlacin inversa o relacin negativa perfecta:
cuando al aumentar disminuir el valor de la variable independiente, disminu-
ye aumenta el valor de la variable dependiente (pendiente negativa).
c) El valor de r = 0, indica la ausencia absoluta de correlacin, es decir las dos
variables no estn correlacionadas o relacionadas.
El coeficiente de correlacin queda definido por.
X Y nXYi i
rxy = i =1
LM X
n
nX 2
OP LM Y
n
nY 2
OP
N QN Q
2 2
i i
i =1 i =1
1. Hiptesis Estadstica: H 0: = 0
Ha: > 0
(ausencia de correlacin entre las variables)
(existencia de correlacin entre las variables en forma directa).
2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).
3. Estadgrafo de Contraste.
r - r n -2 1- r 2
t= = , Sr =
Sr 1- r 2 n-2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
2 2
1-
t 2 ,( n 2 ) 0 t 2 ,( n 2 ) t
RR/Ho: 1 RR/Ho:
RA/Ha:
Valor Valor
crtico crtico
RA H o : - t 2 ,( n 2 ) t c t 2,(n-2)
RR H o : t c < -t 2,(n-2) t c > t 2,(n-2)
1 1+ r
Zr = ln
2 1 r
Donde ln es el logaritmo natural. Es posible demostrar que Z , sigue una distri-
r
bucin aproximadamente normal, con:
FG
1 1+ IJ 1
E ( Z r ) = = Z = ln
2 1 H,
K V(Z r ) =
n3
Para probar la hiptesis nula (Ho:) que indica que es igual a un valor diferen-
te de cero, la estadstica de prueba es.
Z r Z
Zc =
1 n3
Pr tanh( Z r E 0 ) tanh( Z r + E 0 ) = 1
Donde:
1 1+ rFG IJ Z 2
Z r = ln
2 1 r H K
, E0 =
n3
eX e X
tanh( x) = , tanh: Tangente hiperblica
eX + e X
- 322 - V. Ibaez Q.
11.5. COEFICIENTE DE DETERMINACIN: R2 r2
El coeficiente de determinacin, R2, es el valor cuadrado del coeficiente r de
Pearson, y representa la proporcin de la varianza explicada por una variable respec-
to a la varianza total. Se conoce con el nombre de determinacin porque se suele
considerar como medida del grado de influencia de una variable frente a otra varia-
ble. El coeficiente de determinacin mide la proporcin de la variacin que se expli-
ca por la variable independiente en el modelo de regresin, y est definido por:
~ MSE
R2 = 1
MSTm
EJEMPLO:
Calcular el coeficiente de correlacin de Pearson r y coeficiente de determina-
cin R2 con el ejemplo anterior que corresponde al estudio del efecto de cierto medi-
camento para disminuir la frecuencia cardaca en adultos.
rxy =
XY (X )(Y ) n
i i i i
=
. (26)(198) 13
4425
=09507
.
X (X ) n Y (Y )
2
i i
2
i
2
i
2
n . (26)2 13)(3226(198)2 13)
(63375
= 0.9507
Se ha encontrado una correlacin positiva y alta, es decir existe una directa
asociacin entre la variable dosis (mg) y reduccin del rtmo cardaco (lati-
dos/minutos) en personas adultas.
Calculamos el Coeficiente de Determinacin R2.
Estadstica Aplicada a la Educacin - 323 -
SSRm 190.08791
R2 = = x100 = 90.39%
SSTm 210.30769
~ MSE 183816
.
R2 = 1 = 1 = 89.51%
MSTm 17.525641
r n-2
t= ,
1- r 2
4. Establecer la Regin de rechazo y aceptacin.
RA Ho : - 2.201 t c 2.201
RR Ho : t c < -2.201 t c > 2.201
5. Clculo del valor experimental.
r n-2 3153
.
t= = = 10.167
1- r 2 0.310112
6. Decisin:
Como tc =10.167 > t0.025,11 =2.201, cae en la regin de rechazo, entonces se
acepta la Ha: y se rechaza la H0:.
- 324 - V. Ibaez Q.
7. Conclusin:
Se puede concluir que existe diferencia significativa entre la variable do-
sis (mg) y reduccin del rtmo cardaco (latidos/minutos) en personas adul-
tas.
Calcular el intervalo confidencial para .
1 1+ r FG IJ Z 2 196
. 196
.
Zr = ln
2 1 r H K
= 18390097
. , E0 = = =
n 3 10 316227766
.
= 0619806
.
Pr tanh( Zr E0 ) tanh( Zr + E0 ) = 1
Pr tanh( 18390097
. 0.619806 ) tanh( 18390097
. + 0.619806 ) = 0.95
Estudiante 1 2 3 4 5 6 7 8 9 10 TOTAL
Horas de estudio (X) 10 6 15 11 7 19 17 3 13 17 118
Calificacin en el examen (Y) 51 36 67 63 44 89 80 26 50 85 591
4. Una muestra aleatoria simple de 15 nios aparentemente sanos, con edades entre
6 meses y 15 aos, proporcion los siguientes datos sobre la edad, X, y el volu-
men del hgado por unidad de peso corporal (ml/kg), Y.
X 0.5 0.7 2.5 4.1 5.9 6.1 7.0 8.2 10.0 10.1 10.9 11.5 12.1 14.1 15.
Y 41 55 41 39 50 32 41 42 26 35 25 31 31 29 23
- 326 - V. Ibaez Q.
Y = 0 + 1 X 1 + 2 X 2 +
Donde:
Y = Representa la variable dependiente.
X1 y X2 = Son las variables independiente o regresoras.
0 ,1 , 2 = Son los parmetros desconocidos que ser estimado.
= Es el error residual o perturbacin.
Este es un modelo de regresin lineal mltiple con dos regresores. El trmino
"lineal" se emplea debido a que la ecuacin anterior es la funcin lineal de los
parmetros desconocidos 0 ,1 , 2 . Ntese que el modelo describe un plano en el
espacio bidimensional X1 y X2. El parmetro 0 define la ordenada al origen del
plano. Algunas veces llamamos a 1 y 2 coeficientes de regresin parciales, porque
1 mide el cambio esperado en Y por cambio unitario en X1 cuando X2 se mantiene
constante, y 2 mide el cambio esperado en Y por cambio unitario en X2 cuando X1
se mantiene constante.
Estimacin de parmetros.
El mtodo de Mnimos Cuadrados puede utilizarse para estimar los coeficientes
de regresin. Supngase que se dispone n>k observaciones, y djese que Xij denote la
observacin isima o el niel de la variable Xj.
Podemos escribir el modelo, en trminos de las observaciones como:
Yi = 0 + 1 X i 1 + 2 X i 2 + L + k X ik + i
k
= 0 +
j =1
j X ij + i i = 1 ,2 , . . . . , N
Ntese que hay p = k+1 ecuaciones normales, una para cada uno de los
coeficientes de regresin desconocidos. La solucin para las ecuaciones normales
sern los estimadores de mnimos cuadrados ordinarios de los coeficientes de regresin,
- 328 - V. Ibaez Q.
$ 0 , $ 1 ,K , $ k .
NY Q N Nx1 NX N0
M M
XN1 XN2
M
P MM
L X Q N1Nk
M M
XN1 XN2 L X Q
P
Nk N( k+1)
LM OP 0 LM OP 1
=M P =M P
MM M PP MM M PP
1 2
y
, adems se sabe que: Y = X +
N Q k ( k +1 ) x 1 N Q N Nx 1
Propiedades:
a) E( ) = 0, E( Y ) = X, Y = E( Y ) + , = Y E( Y )
i =1
2
i =' = Y E ( Y ) ' Y E ( Y )
= ( Y X )' ( Y X )
= ( Y' ' X ' )( Y X )
= ( Y' Y Y1
'2
X3 ' X ' Y + ' X ' X
( Y ' X )' = ' X ' Y
LM N OP L Y O
PPLM$$ OP MM PP
N N N N
Xi1 Xi2 L Xik
MM i=1 i=1 i=1
i
L X X M P MX YP
0 i=1
N N N N N
PPMMN$ PPQ MM M PP
i1 i1 i1 i2 i1 ik 1 i1 i
i=1 i=1 i=1 i=1 i=1
MM M M M M
PQ MMNX YPPQ
N N N N N
MNX X X X X L X 2 k
ik ik i1 ik i2 ik ik i
i=1 i=1 i=1 i=1 i=1
LM X N N
X X X X
N
OX X P
N
LMX YOP L O
N
MM PP MM Y. PP
2
L
MM P
i0 i0 i1 i0 i2 i0 ik i0 i
L X X P
i =1 i =1 i =1 i=1 i=1
X' Y = MX Y P = MX Y P
N N N N N
X' X = M X X X P,
2 N
MM M PP MM PP
X X
MM M M P
i0 i1 i1 i1 i 2 i1 ik
i=1 i=1 i=1 i=1
y i1 i
i1 i
i=1
M M
P i =1
i=1N i 0 ik X X X X
i=1
ik i1
i=1
ik i2
PQ i=1
2
ik
N Q i =1
ik i i=1
ik i
LM N X X L X OP LM N X L O
X X PP
i1 i2 ik
X .1 .2 X.k
MX X X X 2
L P M
X X X X X X 2
L
X' X = MX P M X X PP
i1 i1 i1 i2 i1 ik .1 i1 i1 i2 i1 ik
MM M X X X L P M = L
2 2
i2 i1 i2 i2 X X i2 ik
X X X X .2 i1 i2 i2 i2 ik
MNX
M M M PP M M M M M PP
ik Xi1Xik Xi2 Xik L Xik2 Q MNX .k i1Xik
X i2 Xik L
X Xik2 Q
El modelo de regresin ajustado es: Y$ = X$ . En notacin escalar, el modelo ajustado es:
k
y$i = $ 0 + $ j xij , i = 1,2 ,.., N
j =1
SSRm
SSRm = b$ ' X ' Y NY 2
M SRm
Regresin r-1 = MSR m
r 1 M SE
SSE
Error resid. N - r SSE = Y ' Y b$ ' X ' Y rN
= MSE
SOLUCIN:
a) Estimar la ecuacin de regresin mltiple.
N
X i1 X i2 10 42 23
X ' X = X i1 X 2
i1 X Xi1 i 2 = 42 218 114
X i 2 X X X 2 23 114 65
i1 i2 i2
10 42 23
Yi 26402 42 218 114
X ' Y = X i1Yi = 93361 det( X ' X ) = 23 114 65 = 2006
,
X i 2Yi 51354 10 42 23
42 218 114
A11 = a22 a33 a32 a23 = 1174 A21 = a12 a 32 a 32 a13 = 108
A12 = a 21 a33 a31 a 23 = 108 A22 = a11a33 a31a13 = 121
A13 = a21a32 a31a22 = 226 A23 = a11a23 a21a13 = 174
b) Tabla de ANOVA
Grados de libertad (GL.)
GLreg = p - 1 = 3 - 1 = 2
GLerror = N - p = 10 - 3 = 7
GLtotal = N - 1 = 10 - 1 = 9
2
26402
SSTm = Y 'Y NY 2 = 78536258 10 = 8829697.6
10
SSE = 8829697.6 - 8247389.51 = 582308.09
Estadstica Aplicada a la Educacin - 333 -
~2 )
COEFICIENTE DE DETERMINACIN AJUSTADO ( R
~ MSE 83186.87
R2 = 1 = 1 = 9152
. %
MSTm 981077.51
LM OP
Pr $ i t ,( Nr ) V($ i ) i $ i + t ,( Nr ) V($ i ) = 1
N 2 2 Q
V ( $ i ) = ( X ' X )1 MSE
Variable Intercept X1 X2 Y
Intercept 10 42 23 26402
X1 42 218 114 93361
X2 23 114 65 51354
Y 26402 93361 51354 78536258
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 8247390 4123695 49.57 <.0001
Error 7 582308 83187
Corrected Total 9 8829698
- 334 - V. Ibaez Q.
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t| 95% Confidence Limits
Intercept 1 4639.55932 220.64596 21.03 <.0001 4117.81454 5161.30411
X1 1 -244.43220 70.83610 -3.45 0.0107 -411.93295 -76.93145
X2 1 -422.93220 131.34350 -3.22 0.0147 -733.51024 -112.35417
Covariance of Estimates
Variable Intercept X1 X2
Intercept 48684.639043 -4478.65504 -9372.000361
X1 -4478.65504 5017.7524056 -7215.610897
X2 -9372.000361 -7215.610897 17251.115709
EJERCICIOS:
Obtener la ecuacin de regresin para cada uno de los siguientes conjuntos de
datos.
1. Un investigador reuni los siguientes datos sobre 15 nios.
12
DISEOS EXPERIMENTALES
CARACTERISTICAS:
VENTAJAS:
a) Es simple de planificar.
b) El nmero de repeticiones puede variar de tratamiento a tratamiento.
c) Existe ms grados de libertad para estimar el error experimental.
d) Es flexible en cuanto al nmero de repeticiones y tratamientos.
e) Es til cuando las unidades experimentales tienen una variablidad uniforme
repartida.
Estadstica Aplicada a la Educacin - 337 -
f) Cuando se pierde alguna parcela experimental se puede considerar que se
tena diferente nmero de repeticiones por tratamiento.
g) El Error Experimental puede obtenerse separadamente para cada tratamiento
para comprobar la suposicin de Homogeneidad del Error.
DESVENTAJAS:
a) Es ms apropiado para pequeo nmero de tratamientos y para un material
experimental homogneo y uniformemente distribudo.
b) No se puede controlar el Error Experimental, por lo tanto, no es un Diseo
muy preciso.
c) Cuando se tiene diferente nmero de repeticiones por tratamiento, es necesario
calcular un Error estndar por cada pareja de medias si se quiere comparar sus
diferencias.
ANALISIS DE VARIANZA.
Es una tcnica matemtica que nos permite descomponer una Fuente de Varia-
cin Total en sus Componentes atribuibles a Fuentes de Variacin conocida.
t
Y i .2 Y2 SC trat . t
i2
Tratamientos t-1 .. 2 + r 2 + r 2
i=1 ri N t 1 i =1 t 1
ri
t t
Yi .2
Error Experimental N - t Y r 2
ij
S C erro r
2 2
i =1 j =1 i =1 i N t
ri
t
Y ..2
Total N-1 Y
i =1 j =1
ij
2
N
CM error Y..2
CV = .100 , TC = , Y.. = Gran Total
Y.. N
- 338 - V. Ibaez Q.
OBSERVACION:
a) MODELO I: Llamado modelo de anlisis de variancia o de efectos fijos. Este
modelo supone que los ti de una determinada subpoblacin son una cantidad fija,
una variable no aleatoria.
b) MODELO II:Llamado modelo de componentes de variancia o de efectos al azar.
Los tratamientos considerados dentro de un experimento se asumen como una
muestra al azar extrada desde una poblacin de tratamientos.
PROCEDIMIENTO DE HIPOTESIS:
i) La Hiptesis a probarse es:
Ho: i = 0
Ha: no todos los i = 0
ii) Nivel de Significancia: = 005
. = 001
.
CM trat .
iii) Estadstica de Prueba: Fc =
CM error
iv) Regla de Decisin:
a) Si Fc Fnn21, , entonces se acepta la Ho:
b) Si Fc > Fnn21,0.05 , se rechaza la Ho, representndose por un asterisco (*), lo
cual significa que la prueba es significativa.
c) Si Fc > Fnn21,0.01 , se rechaza la Ho, representndose por dos asteriscos
(**); lo cual significa que la prueba es altamente significativa.
EJEMPLO:
Se someti a cuatro gurpos de estudiantes a diferentes tcnicas de enseanza y se
les examin al final de un periodo especfico. Debido a las deserciones de los
grupos experimentales (por enfermedad, transferencias, etc.) el nmero de estu-
diantes vari de grupo a grupo. Presentan los datos mostrados en la siguiente
tabla la evidencia suficiente para indicar una diferencia en el rendimiento medio
para las cuatro tcnicas de enseanza?.
Estadstica Aplicada a la Educacin - 339 -
1 65 87 73 79 81 69 454
Grupos
2 75 69 83 81 72 79 90 549
3 59 78 67 62 83 76 425
4 94 89 80 88 351
a) Determinar los grados de libertad de cada una de las fuentes; b) determinar las
sumas de cuadrados de cada fuente de variacin; c) Hllar los cuadrados medios
respectivos; d) Hallar el valor del estadstico de la prue ba F; e) Calcular el valor
crtico para F basado en grados de libertad de las fuentes de variacin del trata-
miento y del error, y calcule el coeficiente de variacin del experimento. Use =
0.05.
PROCEDIMIENTO DE CLCULO:
a) Grados de Libertad:
GLtrat. = t -1 = 4 - 1 = 3
GLerror = N - t = 23 - 4 = 19
GLtotal = N - 1 = 23 - 1= 22
b) Suma de Cuadrados:
Y..2 17792
TC = = =1376017826
.
N 23
4
Y2 4542 5492 4252 3512
i) SCTrat. = r TC = 6 + 7 + 6 + 4 TC =138314369
. 1376017826 = 71258644
i.
. .
i=1 i
4 ri
CM Error 62.980576
CV = ( 100 ) = ( 100 ) = 10.26%
Y .. 77.3478
La prueba F de la tabla de ANOVA nos muestra que la Fc = 3.77>F3,19,0.05=3.13,
entonces se acepta la hiptesis alterna (Ha:), es decir existe diferencia estadstica en
el el rendimiento medio entre los cuatro procedimientos de enseanza.
3.- 26 nios con la misma aptitud de lectura fueron divididos en tres grupos para
comparar la efectividad de tres mtodos de enseanza de lectura. A cada grupo se
le ense durante un tiempo determinado, utilizando uno de los tres mtodos.
Todos los alumnos fueron examinados al trmino del periodo de instruccin. Los
resultados del examen se tienen en la tabla siguiente. Es suficiente la evidencia
para rechazar la hiptesis de igualdad en efectividad de lso tres mtodos de ins-
truccin?. Utilice nivel de significacin de 0.05 y calcule el ANOVA.
MTODOS
I II III
45 45 44
51 44 50
Puntajes 48 46 45
en el 50 44 55
examen 46 41 51
48 43 51
45 46 45
48 49 47
47 44
TOTAL 428.00 402.00 388.00
TCNICA
1 2 3 4
65 75 59 94
87 69 78 89
73 83 67 80
79 81 62 88
81 72 83
69 79 76
90
6. Se realiz un estudio para conocer cunto tiempo, en segundos, tardan los estu-
diantes avanzados de arte, msica y educacin fsica en terminar cierta tarea que
requiere habilidades motoras bsicas. De cada de las disciplinas se escogieron al
azar siete personas. Los resultados son los siguientes:
PRO GRA M A S
N r o a lu m n o A rt e M s ic a E d u c . F s ic a
1 17 24 25
2 21 18 24
3 25 19 25
4 16 22 21
5 19 23 22
6 22 20 28
7 18 21 19
CARACTERISTICAS:
Este diseo es uno de los ms ampliamente conocidos y difundidos de los diseos
experimentales, tambin se conoce como Diseo Bloque Completamente Aleatorizado,
y se caracteriza porque los tratamientos se distribuyen en forma aleatoria, a un grupo
de unidades experimentales denominado bloque, la finalidad es que las unidades
experimentales dentro de un bloque sean lo ms homogneas posibles, es decir el
nmero de unidades experimentales en cada bloque debe ser igual al nmero de
tratamientos que se quiere estudiar.
Los bloques pueden estar formados por reas homogneas de un terreno, grupo
de animales que puedan manipularse en forma uniforme (misma raza, misma edad,
mismo peso, etc.)
En resumen, en este diseo de bloques completos al azar los tratamientos son
aleatoriamente asignados a las unidades experimentales (homogneos) dentro de cada
estrato o subgrupo o bloque. De esta forma, el proceso de aleatorizacin de los
tratamientos ha sido restringido a las unidades dentro de cada bloque. Desde el punto
de vista de la variabilidad de los datos, se han introducido una variabilidad artificial
por estudiar distintos tratamientos.
La variabilidad natural existente entre las unidades experimentales puede ser
subdividida por el hecho de haber agrupado las unidades experimentales en grupos
heterogneos (bloques) pero conformados por unidades homogneas. As, parte de lo
que es la variabilidad natural de las unidades puede ser atribuda a algo ahora conocido
(bloques) y otra parte seguir siendo variabilidad natural de las unidades
experimentales.
Los bloques o repeticiones puede ser das, observadores, animales, corrales,
pacientes, colegios, clones, laboratorios, estufas, cmaras de crecimiento, etc. As
este diseo podra ser usado para controlar una fuente de variacin en el material
experimental y no solamente la variacin entre bloques en un campo.
VENTAJAS:
1) Precisin: este diseo ha resultado ms preciso que el diseo completamente al
azar, para la mayora de los tratamientos experimentales. La eliminacin de la
suma de cuadrados de bloques desde la suma de cuadrados del error usualmente
resulta en un decrecimiento en el cuadro medio del error a pesar de la prdida de
grados libres para estimar este error. Permite ganar mayor precisin en el
experimento, principalmente cuando existe diferencias significativas entre bloques.
Flexibilidad: no existe una restriccin en relacin al nmero de tratamientos y
de repeticiones, sin embargo, el aumento en el nmero de tratamientos conlleva a
- 344 - V. Ibaez Q.
la prdida de la homogeneidad dentro de bloques.
2) Es un diseo bastante usado por su adaptabilidad, recomendndose generalmente
ms de tres bloques y por lo menos dos tratamientos por bloque.
3) Es factible realizar el anlisis experimental, cuando por alguna causa se hubiera
perdido algn bloque. Adems si el resultado de una unidad experimental no se
llegara a registrar (prdida de la unidad experimental), existen tcnicas estadsticas
simples para poder estimar el resultado.
DESVENTAJAS:
1) La desventaja de este diseo es que no es adecuado a gran nmero de tratamientos
y para los casos en que el bloque contenga considerable variabilidad.
2) Cuando existe prdida de muchas unidades experimentales, el anlisis estadstico
se complica seriamente y muchas veces no es posible analizarlo.
3) No es recomendable utilizar este diseo cuando se verifica que existe interaccin
entre bloques y tratamientos.
Yij = + i + j + ij ; i = 12
, ,L, t (t = tratamientos)
j = 12
, ,L, r (r = bloques)
Donde :
Yij = Variable de respuesta observada en la unidad experimental ubicada en el j-
simo bloque que recibe el tratamiento "i".
= Constante para toda observacin, es la media de la poblacin.
i = Es el efecto del tratamiento i, el cual es igual a ( i ), es decir, a la
diferencia entre el promedio poblacional del tratamiento y la media poblacional
.
j = Es el efecto del bloque j, el cual es igual a ( j ), es decir a la diferencia
entre el promedio poblacional del bloque y la media poblacional .
ij = Trmino que representa el error de su respectiva Yij se considera variable
aleatoria distribuida en forma normal e independiente con media cero y
variancia constante, es es: ij ~ D N I (0, 2
e ).
Estadstica Aplicada a la Educacin - 345 -
t b
H0: i = 0 H0:2 = 0
Respecto a tratamientos:
Ha: i 0 Ha:2 0
H0: j = 0 H0: 2 = 0
Respecto a bloques:
Ha : j 0 Ha : 2 0
ANALISIS DE VARIANZA
r Y . j2 Y ..2
SC bloque CM bloque
Bloques r-1 2e + t 2
j =1 t tr r 1 CM error
t
Yi .2 Y..2
SC tratam . CM trat .
Tratamientos t-1 2e + r 2
i =1 r rt t 1 CM error
dY i
t r
2 SCerror
Error experimental (t-1)(r-1) Yi . Y. j + Y.. 2e
(t 1)(r 1)
ij
i =1 j =1
t r
Y ..2
Total tr - 1
i=1 j=1
Y ij2
tr
Y..2 CMerror
TC = , SCerror = SCtotal (SCtrat. + SCbloque ), CV.= x100
tr Y..
- 346 - V. Ibaez Q.
EJEMPLO
Supongamos que, en el mbito de la psicologa educativa, realizamos una investigacin
para examinar la influencia que ejerce la metodologa de trabajo empleada en el aula
(tratamientos) sobre el rendimiento presentado por un grupo de nios en la asignatura
de Ciencias Naturales. No obstante, se considera que una posible variable extraa,
capaz de contaminar los resultados del estudio, es el nivel de motivacin de los
sujetos (grupos o bloques). Con el objeto de controlar dicha variable se utiliza un
diseo bloque completo al azar. Se dividen los nios en cuatro bloques, de tres sujetos
cada uno, en funcin de las puntuaciones que obtienen en una prueba destinada a
medir su nivel de motivacin con respecto al aprendizaje, a saber: I (nivel de
motivacin bajo, II (nivel de motivacin medio-bajo), III (nivel de motivacin medio-
alto y IV (nivel de motivacin alto). A continuacin, a cada uno de los sujetos que
configuran cada bloque se le somete a una de las tres siguientes metodologas de
trabajo A: metodologa basada en medios audiovisuales, B: metodologa basada en el
contacto directo con la naturaleza y C: metodologa tradicional. La informacin se
presenta a continuacin:
PROCEDIMIENTO DE CLCULO:
a) Grados de Libertad:
GLbloque = r - 1 = 4 - 1 = 3
GLtrat. = t -1 = 3 - 1 = 2
GLerror = (r-1)(t-1) = 6
GLtotal = tr - 1 = 12 - 1= 11
b) Suma de Cuadrados:
Y..2 1072
TC = = = 954.08333
tr 12
4 Y2 202 + 232 + 282 + 362
i) SCBloque = t TC = TC = 1003 95408333 = 4891667
.j
. .
i =1 3
Estadstica Aplicada a la Educacin - 347 -
3
Y2 312 + 602 +162
ii) SCTrat . = r TC = TC = 120425
. 954083333 = 25016667
i.
. .
i=1 4
3 4
CM Error 2.63889
CV = ( 100 ) = ( 100 ) = 18.21%
Y .. 8.92
EJERCICIOS:
01. La siguiente tabla indica las calificaciones obtenidas por nueve estudiantes de
tcnico agropecuario seleccionadas al azar en los exmenes finales de tres mate-
rias distintas. Probar la hiptesis nula segn la cual los estudiantes de enfermera
que constituyen la poblacin de la cual se extrajo la muestra tienen un aprovecha-
miento igual en las tres materias, contra la hiptesis alternativa de que su aprove-
chamiento es mejor por lo menos en una de las materias. Sea = 0.05.
- 348 - V. Ibaez Q.
MATERIA
Estudiante Fundamentos Fisiologa Anatoma
1 98 95 77
2 95 71 79
3 76 80 91
4 95 81 84
5 83 77 80
6 99 70 93
7 82 80 87
8 75 72 81
9 88 81 83
02. Diecisis individuos con sobrepeso participaron en un anlisis para comparar cuatro dietas para reduccin
de peso. Los individuos formaron grupos de acuerdo con el peso inicial y a cada uno de los cuatro sujetos
de cada grupo se le asign, al azar, una de las cuatro dietas de reduccin de peso. Al terminar el perodo
experimental se consider la prdida de peso en libras como sigue:
Pes o RGIM EN
in icial (lib ras ) A B C D
150 a 174 12 26 24 23
175 a 199 15 29 23 25
200 a 225 15 27 25 24
M s d e 225 18 38 33 31
Despus de eliminar las diferencias debidas al peso inicial, estos datos proporcionan suficiente evidencia
para indicar una diferencia en los efectos de la dieta? Sea = 0.05. Realice el ANVA para DBCA.
03. Un equipo de remotivacin en un hospital psiquitrico efectu un experimento para comparar cinco
mtodos para remotivar a los pacientes. Estos ltimos se agruparon de acuerdo con el nivel inicial de
motivacin. A cada paciente de los cinco grupos se le asign, al azar, uno de los cinco mtodos. Al final del
periodo experimental, un equipo, formado con un psiquiatra, un psiclogo, una enfermera y un trabajador
social, evalu a los pacientes. Ningn miembro del equipo supo el mtodo asignado a cada paciente. El
equipo asign a cada paciente una calificacin como medida de su nivel de motivacin. Los resultados son
los siguientes:
13
EXPERIMENTOS FACTORIALES
Los Experimentos Factoriales son arreglos de tratamientos que permiten aplicar
de una sola vez una serie de estmulos o tratamientos que consideramos que inter-
vengan en la respuesta dada por una unidad experimental.
Los arreglos factoriales son de importancia prctica, ya que permiten el estudio
de un estmulo como tal y su respuesta combinatoria respecto de otras condiciones
generadas por la interaccin con otros factores, dando as informacin ms comple-
ta, aun cuando los efectos interaccionales no sean significativos. En las ciencias
agropecuarias normalmente se usan combinaciones hasta de tres factores debido prin-
cipalmente a la interpretacin fisiolgica de las interacciones. Los arreglos de trata-
mientos pueden ser estudiados en el contexto de los diseos bsicos, considerando
las caractersticas de las unidades experimentales con las que se trabaje.
Los Experimentos Factoriales no constituyen un diseo en s, sino que debe
arreglarse a cualesquiera de los diseos conocidos como: diseo completamente al
azar, diseo bloques completos, cuadrados latino, etc.
Su utilidad radica en que es posible estudiar simultneamente ms de un factor.
Ejemplo estudiar varias razas de los animales y el sexo de los mismos para determi-
nar sus incrementos de pesos; estudiar diversas variedades y su respuesta a las dife-
rentes formas de abonamiento, etc. Adems es importante porque nos permite com-
parar los niveles de cada factor entre s y adems las interacciones que puedan resul-
tar como consecuencia de las combinaciones de los niveles de cada factor.
FACTOR.
Es una clase de tratamiento que interviene en el experimento, es as que en los
Experimentos Factoriales, todo factor proporciona varios tratamientos; ejemplo de
factores: Razas de animales, variedades de alfalfa, dosis de nitrgeno, profundidad
de labranza, raciones alimenticias, dosis de una hormona, etc. A los Factores se les
simboliza generalmente por las primeras letras maysculas del alfabeto (A, B, C, D,
etc).
NIVELES DE UN FACTOR.
Son los diversos tratamientos que pertenecen a un determinado factor; y se acos-
tumbra a simbolizar un nivel cualquiera por la letra que representa el factor y el valor
del respectivo sub ndice. Ejemplo: el factor dosis de la hormona estilbestrol simbo-
lizado por A tiene 4 niveles en el experimento: a1 = 2cc, a2 = 3cc, a3 = 4cc, a4 = 5cc.
TIPOS DE FACTORES.
Los factores que se estudian en los experimentos se clasifican en:
Factor fijo:
Los niveles o tratamientos son fijados por el experimentador de acuerdo a su
inters. Son muy usuales en la experimentacin. Ejemplos:
- Factor Nitrgeno: 50, 70, 90 kg de N/ha.
- Factor temperatura: 10, 15, 18, 20 grados centgrados.
- Alimento: con ingrediente nuevo, sin ingrediente.
- Tres variedades de trigo: V1, V2, V3, etc.
Estadstica Aplicada a la Educacin - 351 -
Factor al azar:
Los niveles o tratamientos son seleccionados al azar de la poblacin de niveles,
constituyendo una muestra los que estn en el experimento. Ejemplo:
- Los aos en los que se cultivan ciertas variedades de papa, trigo, etc. son con-
siderados como una muestra de aos antes y aos despus de lo establecido.
Factores Cualitativos.
Factores Cuantitativos.
Los modelos estadsticos lineal aditivo en los experimentos factoriales en los dife-
rentes diseos es el siguiente:
Los modelos estadsticos lineal aditivo en los experimentos factoriales en los dife-
rentes diseos es el siguiente:
- 352 - V. Ibaez Q.
a b Yij2. Y...2
SC tratam . CM tratam.
Tratamientos t-1
i =1 j =1 r abr t 1 CM error
t
Yi ..2 Y...2
SC CM ( A)
A a-1 ( A )
i =1 br abr a 1 C M error
b Y. 2j . Y...2
SC CM (B)
B b-1 ( B )
j =1 ar abr b 1 C M error
SC ( AB ) C M ( AB )
AB (a-1)(b-1) SCtratam. SC( A) SC( B)
( a 1)(b 1) C M error
a b r a b Yij2. SC error
Error experim. ab(r-1) Y r
i =1 j =1 k =1
2
ijk
i =1 j =1 ab ( r 1)
a b r
Y...2
(abr - 1) Y
2
Total ijk
abr
i =1 j =1 k =1
Y ...2 CM
TC = , CV .= erro r
x1 0 0
abr Y ...
Estadstica Aplicada a la Educacin - 353 -
MODELO ESTADISTICO LINEAL EN EL DISEO BLOQUE AL AZAR.
t
Y i ..2 Y2
S C b lo q u e s CM
Bloques r-1 ... b lo q .
i =1 br abr r 1 CM erro r
t
Y i ..2 Y 2
S C CM
A a-1 ... ( A ) (A)
b Y . 2j . Y ...2 CM (B)
SC
B b-1 ( B )
Yij2. a
X i2.. b X .2j. X ...2 S C ( AB ) C M ( AB )
AB (a-1)(b-1) r + br ar
i, j i =1 j =1
+
abr g l( AB ) C M error
SCerror
Error experimental (ab-1)(r-1) por diferencia (ab1)(r 1)
a b r
Y...2
Total (abr - 1) Yijk2 abr
i =1 j =1 k =1
Y...2 C M error
TC = , CV = x 100
abr Y...
- 354 - V. Ibaez Q.
EJEMPLO
De una poblacin de 2500, se escogieron al azar 48 clases de psicologa de cuarto
de secundaria para un experimento en el cual se buscaba determinar la eficiencia de
dos mtodos y dos tipos de ayudas diferentes, as como de sus interacciones. Estas
clases se dividieron aleatoriamente en cuatro combinaciones segn el mtodo y el
tipo de ayudas. Transcurrido un semestre, a todas las clases se les administr la
misma prueba de rendimiento en psicologa. Siendo la unidad de muestreo la cla-
se, como unidad de anlisis se toma la media de la clase, segn el criterio de la
puntuacin obtenida en la prueba de rendimiento. Los resultados se presentan a con-
tinuacin:
SOLUCIN:
a) GRADOS DE LIBERTAD.
GLMTODO =a-1=2-1 = 1
GLAYUDA =b-1=2-1 = 1
GLMxA = (a-1)(b-1) = (2-1)(2-1) = 1
GLERROR EXP = ab(r-1) = 2x2x(12-1) = 44
GLTOTAL = abr - 1 = 2x2x12 -1 = 47
Estadstica Aplicada a la Educacin - 355 -
b) SUMA DE CUADRADOS:
2
Y ( 735 )2
TC = = = 11254.6875
abr 2 x 2 x12
a Yi2 229 2 + 5062
SC Mtodo = TC = TC = 1598.520833
i =1 br 2 x12
b=2 Y2j 2352 + 5002
SC Ayuda = TC = TC = 1463.020833
j =1 ar 2 x12
a=2 b=2 Y 2
722 +1572 +1632 + 3432
SCcomb( MxA ) = TC = TC = 32495625
ij
.
i =1 j =1 r 12
CM error 10.56250
CV . = x100 = x100 = 2122
. %
Y 735 48
INTERPRETACIN:
Mtodos
m0 m1 Y.j.
a0 72 163 235
Ayudas
a1 157 343 500
Yi.. 229 506 735 = Y...
CONCLUSIONES:
M dentro a0: Existe diferencia significativa entre los niveles de m0 y m1 bajo los
niveles de a0, es decir hay diferencia significativa en los mtodos de
enseanza con la ayuda de conferencia de clase.
M dentro a1: Existe diferencia significativa entre los niveles de m0 y m1 bajo los
niveles de a1, es decir hay diferencia significativa en los mtodos de
enseanza con la ayuda de instruccin programada.
A dentro m0: Existe diferencia significativa entre los niveles de a0 y a1 bajo los niveles
de m0, es decir hay diferencia significativa con las Ayudas de clase con
el mtodo tradicional.
A dentro m1: Existe diferencia significativa entre los niveles de a0 y a1 bajo los niveles
de m1, es decir hay diferencia significativa con las Ayudas de clase con
los mtodos modernos
Otra forma de observar la interaccin de los dos factores (Mtodo con Ayudas), es
graficando con los promedios de la siguiente forma:
33.0
28.58
30.0
27.0
Puntuacin obtenida (Rdto
24.0
21.0
Mtodos 18.0
m0 m1 15.0 m1
12.0
13.58
a0 6.00 13.58 9.0
13.08
Ayudas m0
a1 13.08 28.58 6.0
6.00
3.0
0.0
a0 a1
AYUDAS
- 358 - V. Ibaez Q.
Claramente se puede observar que los dos factores en estudio interactan entre s,
esto ratifica que los factores son dependientes unos del otro, es decir los segmentos
no son paralelos en el plano cartesiano que se muestra en la grfica precedente.
ijkl = Efecto del error experimental, que esta distribudo como ijkl ~ D N I ( 0 , e2 )
a b c Yijk2 . Y....2
r
SC tratam . CM tratam.
Tratamientos t-1
i=1 j=1 k =1 abcr t 1 CM error
Yi ...2
a
Y....2
SC CM ( A)
A a-1 ( A )
2e + rbck2
i =1 bcr abcr a 1 C M error
b Y. 2j .. Y....2
acr abcr
SC CM (B)
2e + rack2
( B )
B b-1
j =1 b 1 C M error
Y..2k .
c
Y....2
SC C M (C )
C c-1 (C )
2e +rabk2
k =1 abr abcr c 1 C M error
a b Yij2.. Y....2 SC ( AB ) C M ( AB )
AB (a-1)(b-1) cr abcr SC
i=1 j =1
( A) SC( B)
( a 1)(b 1) C M error
2e + rck2
a c
Yi.2k. Y....2 SC ( AC ) C M ( AC )
AC (a-1)(c-1) br abcr SC ( A) SC(C)
( a 1)( c 1) C M error
2e + rbk2
i=1 k=1
b c Y. 2jk. Y....2 SC ( BC ) C M ( BC )
BC (b-1)(c-1) ar abcr SC
j=1 k =1
( B) SC(C)
( b 1)( c 1) C M error
2e + rak2
a b c r
Y....2
Total (abcr - 1) Y 2
ijkl
abcr
i =1 j =1 k =1 l =1
- 360 - V. Ibaez Q.
Y....2 C M error
TC = , CV = x 100
abcr Y....
Donde:
Tratamientos abc - 1 r
abcr
.... SCtratam. CM tr
i =1 j=1 k =1
abc 1 CM e
t
Y i ...2 Y ....2
Factor A a-1 bcr
abcr
SC( A ) CM (
a 1
i=1 CM er
b
Y . 2j .. Y ....2 S C( B )
CM (
Factor B b-1
j=1 acr abcr b1 CM er
c
Y ..2k . Y ....2 S C( C )
CM (
Factor C c-1
k =1 abr abcr c1 CM er
F Y Y I bSC + SC g SC
2
GH cr abcr JK
a b 2 CM(
ij .. .... ( AB )
Interaccin AxB (a - 1)(b - 1)
FG Y Y IJ bSC + SC g SC
a c 2 2 CM ( A
H br abcr K
i .k . .... ( AC)
Interaccin AxC (a - 1)(c - 1)
i =1 k =1
(a 1)(c 1) A C CM e
F Y Y I bSC + SC g SC
2
GH ar abcr JK
b c 2 CM ( B
. jk . .... ( BC)
Interaccin BxC (b - 1)(c - 1)
j =1 k =1 (b1)(c1) B C CM e
GHr abcrJK
ijk.
2
..
SC(ABC) CM ( A
Interaccin AxBxC (a - 1)(b - 1)(c - 1)
i=1 j=1k=1
A B C AB AC BC
(a1)(b1)(c1) CM e
SCerror
Error Experimental SC Total - SC tratamientos - SC bloques
( abc 1)( r 1)
(abc - 1)(r -1)
a b c r
Y ....2
Y ijk2 l
- 361 -
Total abcr - 1
i=1 j=1 k =1 l=1 abcr
- 362 - V. Ibaez Q.
Y ....2 CM
TC = CV .=
error
, x1 0 0
abcr Y ....
EJEMPLO
Factor A a1 a2
Factor B b1 b2 b3 b1 b2 b3
Factor C c1 c2 c1 c2 c1 c2 c1 c2 c1 c2 c1 c2 Y...j
I 10 10 5 6 40 32 15 12 8 27 27 25 217
II 16 13 7 10 41 43 15 21 13 28 41 41 289
III 20 15 7 13 46 47 15 26 22 38 47 57 353
IV 20 19 7 17 51 52 17 31 27 38 52 60 391
V 25 25 15 21 60 70 18 32 30 43 62 71 472
Yijk. 91 82 41 67 238 244 80 122 100 174 229 254 Y.... =1722
Yij.. 173 108 482 202 274 483
Yi.k. a1c1= 370 a1c2= 393 a2c1= 409 a2c2= 550
Y.jk. b1c1= 171 b1c2= 204 b2c1= 141 b2c2= 241 b3c1= 467 b3c2= 498
Yi... a1 = 763 a2 = 959
Y.j.. b1 =375 b2 =382 b3 =965
Y..k. c1 =779 c2 =943
Estadstica Aplicada a la Educacin - 363 -
a) GRADOS DE LIBERTAD.
GLBLOQUE = r - 1 = 5 - 1 = 4
GLtratamientos: abc - 1 = 2x3x2-1 = 11
GLA = a - 1 = 2 - 1 = 1
GLB = b - 1 = 3 - 1 = 2
GLC = b - 1 = 2 - 1 = 1
GLAxB = (a-1)(b-1) = (2-1)(3-1) = 2
GLAxC = (a-1)(c -1) = (2-1)(2-1) = 1
GLBxC = (b -1)(c - 1) = (3-1)(2-1) = 2
GLAxBxC = (a-1)(b-1)(c-1) = (2 - 1)(3 - 1)(2 - 1) = 2
GLERROR EXP = (r-1)(abc-1) = (4)(2x3x2-1) = 44
GLTOTAL = abcr - 1 = 2x3x2x5 - 1 = 59
b) SUMA DE CUADRADOS:
2
Y ( 1722 )2
TC = = = 4942140
.
abcr 2x3x2x5
r Y2
2172 +2892 + 3532 + 3912 + 4722
SCBloque = TC = TC = 3152266666
l
.
l=1 abc 2x3x2
a b c
Yijk2 912 +822 + 412 +672 + 2382 +2442 +802 +1222 +1002 +1742 + 2292 + 2542
SCtratam. = TC = TC =13753
i=1 j=1 k =1 r 5
7632 + 959 2
2
a Yi
SC A = TC = TC = 640.266666
i =1 bcr 3x 2 x 5
b
3752 + 3822 + 9652
Y2j
SCB = TC = TC = 11467.30
j =1 acr 2x2x5
c Y2 k 779 2 + 9432
SCC = TC = TC = 448.266666
k =1 abr 2 x 3x5
- 364 - V. Ibaez Q.
SUMA DE CUADRADOS DE INTERACCIONES.
a b
Yij2.. 1732 +1082 + 4822 + 2022 + 2742 + 4832
SCComb.( AxB) = TC = TC = 1288720
.
i =1 j =1 cr 2x5
a c
Y2 3702 + 3932 + 4092 +5502
SCComb.( AxC) = i.k . TC = TC = 132060
.
i=1 k =1 br 3x5
b r
Y. 2jk . 1712 + 2042 +1412 + 2412 + 4672 + 4982
SCComb.( BxC ) = TC = TC = 1206980
.
j =1 l =1 ar 2x5
CM error 25.984849
CV . =
Y....
x100 =
b1722 60g X 100 = 17.76%
INTERPRETACION.
14
PRUEBAS NO PARAMTRICAS
14.1 EL CASO DE UNA MUESTRA SIMPLE
A. PRUEBA BINOMIAL.
Los fenmenos que se distribuyen segn esta ley son dicotmicas, entonces ca-
ben nicamente DOS valores posibles (variable discreta). Este es el caso del
lanzamiento de una moneda, cuyo resultado slo puede ser cara o sello. En
general, se aplica a todas aquellas variables que presenten dos valores, uno de
los cuales suele catalogarse como XITO y el otro como FRACASO. La ley
binomial suministra la probabilidad de que se den X xitos en N observaciones.
La funcin de distribucin suministra la probabilidad de que se observen X o
menos xitos de una serie de N mediciones u observaciones, la probabilidad
deseada es:
P Y k = i=k
FG NIJ p q P X x = i =0
FG NIJ p q
HiK H xK
N i N i x x N x
o
MTODO: Los pasos para usar la prueba binomial con Ho: p = 1/2.
1. Determinar el nmero (N) total de casos observados.
2. Determinar las frecuencias de las ocurrencias observadas en cada una de las
dos categoras.
3. El mtodo para encontrar la probabilidad de ocurrencia de los valores obser-
vados segn Ho:, o valores an ms extremos, depende del tamao de la
muestra:
Muestra pequea:
Si N 35 , la Tabla de probabilidad asociadas con valores tan pequeos (o ms
pequeos) que los valores observados k en la prueba binomial.
Muestra Grande:
- 368 - V. Ibaez Q.
Si N > 35 , entonces la informacin tiende a una distribucin normal distribui-
da con media cero (0) y desviacin estndar uno (1), en este caso, se debe
probar Ho: usando la ecuacin:
(Y 0.5) - Np
z=
Npq
Donde:
Y + 0.5, se usa cuando Y < Np
Y - 0.5, se usa cuando Y > Np
4. Si la probabilidad asociada con el valor observado de Y o valores an ms
extremos es igual o menor que , rechazar Ho:, de otro modo, no se rechaza
la Ho.
EJEMPLO:
En un proyecto de innovacin de la enseanza en la primaria con nuevos mto-
dos didcticos se evalo a 20 estudiantes que se les enseo una materia con el
mtodo tradicional y luego se implement un mtodo nuevo. La suposicin es
de que los alumnos respondan mejor con el mtodo antiguo.
M TODO
Tradicional Nuevo Total
Frecuencia 15 5 20
SOLUCIN:
1. Hiptesis Estadstica: Ho: p = q = 1/2
Ho: La proporcin de alumnos que se les enseo un tpico especfico con el
mtodo tradicional y luego con el mtodo nuevo respondieron a la eva-
luacin en forma igual a la proporcin de alumnos con ambos mtodos.
Ha: La proporcin de alumnos que se enseo un tpico especfico con el m-
todo tradicional y mtodo nuevo, respondieron a la evaluacin con el
mtodo tradicional que es mayor que la proporcin de alumnos a la eva-
luacin con el mtodo nuevo. (Ha: p > q).
2. Prueba estadstica. Se elige la prueba binomial debido a que los datos estn
en dos categoras discretas y el tamao de muestra es pequeo, adems:
x : Es la variable aleatoria que se distribuye como B(20, 1/2), que representa
el nmero de alumnos que responden a la evaluacin con el mtodo nevo.
p: Proporcin de casos favorables con el mtodo nuevo (xitos)
q. Proporcin de casos desfavorables con el mtodo tradicional (fracasos)
3. Nivel de significacin: Sea = 0.05, y N = 20
Estadstica Aplicada a la Educacin - 369 -
4. Distribucin muestral. La distribucin muestral est proporcionada por la
siguiente frmula:
P X x = i = 0
FG N IJ p q
H xK
x x N x
P X 5 =
5
FG 20IJ p q
H xK
N x
x
= 0.021
x=0
2
c =
b e g
k
i i
2
~ (2k 1 )
i =1 ei
Donde:
i = el nmero observado de casos en la categora isima.
e i = el nmero esperado de casos en la categora isima cuando Ho: es
verdadera.
k = el nmero de categoras
PROCEDIMIENTO:
1. Prueba estadstica (Planteamiento de la hiptesis respectiva).
2. Nivel de significacin:
3. Prueba Estadstica: Cuando los datos en frecuencias en categoras discretas
(nominales o categricos y, en ocasiones, ordinales), se puede utilizar la prueba
Ji-cuadrada para evaluar la significacin de las diferencias entre los grupos
independientes.
4. Distribucin muestral. Esta dada con la frmula siguiente:
k
2c =
b e g
i i
2
~ (2k 1 )
i =1 ei
5. Regin de rechazo y aceptacin:
Si 2c 2tabla se acepta la Hiptesis Nula (Ho).
Si 2c > 2tabla se rechaza la Hiptesis Nula y se acepta la Ha.
6. Clculo de la prueba estadstica, segn la frmula arriba indicada.
7. Decisin. Es la parte crtica de un investigador, en el cual se tiene que interpre-
tar y sacar las conclusiones del problema en estudio.
EJEMPLO:
Un profesor de Educacin, analiza el aprendizaje de sus alumnos en una seccin
y los clasifica en cuatro categoras de acuerdo a las calificaciones obtenidas en un
semestre. Tal como se presenta a continuacin:
Nmero de Estudiantes
Muy buenos Buenos Regulares Malos Total
9 12 19 10 50
SOLUCIN:
1. Hiptesis Nula (Ho:). La proporcin de alumnos en cada uno de las categoras
es indiferente.
Hiptesis alterna (Ha:). La proporcin de alumnos es diferente en cada uno de
las categoras en estudio.
2. Nivel de significacin: = 0.05 = 0.01
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrado, ya que los
datos estn dados por lo menos en escala ordinaria, adems presenta catego-
ras k = 4.
4. Distribucin muestral.
2
c =
k
b e g
i i
2
~ (2k 1 )
i =1 ei
- 372 - V. Ibaez Q.
5. Clculo de Prueba Estadstica: Por informacin se tiene que:
n = 50 alumnos, k = 4 categoras
n 50
ei = = = 12.5
k 4
(9 -12.5) 2 (12 -12.5) 2 (19 -12.5) 2 (10 -12.5) 2
2c = + + +
12.5 12.5 12.5 12.5
= 4.88
6. Regin de rechazo y aceptacin:
Si 2c = 4.88 23 ,0 ,05 = 7 .82 , se acepta la Hiptesis Nula (Ho).
PROCEDIMIENTO:
2c =
d
f c
ij eij i 2
~ (2 f 1)(c1) , ....... a)
i =1 j =1 eij
i . . j
eij =
..
f c ij2
=
2
c N ~ (2 f 1 )( c1 ) ................... b)
i =1 j =1 eij
Donde:
i. =Es el total observado por la i-sima fila.
EJEMPLO:
1. Quinientos nios de escuela primara fueron clasificados en forma cruzada de
acuerdo con el grupo socioeconmico al que pertenecen y la presencia o ausen-
cia de cierto defecto en el lenguaje. Los resultados fueron los siguientes:
SOLUCIN:
1. Hiptesis Nula (Ho:). El defecto del lenguaje no est relacionado con el grupo
socio-econmico al que pertenecen.
Hiptesis alterna (Ha:). El defecto del lenguaje est relacionado con el grupo
socio-econmico al que pertenecen.
2. Nivel de significacin: = 0.05
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrada, ya que los
datos estn dados por lo menos en escala ordinaria
4. Distribucin muestral.
2
c =
df c
ij eij i 2
~ (2 f 1)( c 1)
i =1 j =1 eij
gl. = (2-1)(4-1) = 3
=
2
c
c
N AD BC N 2 h 2
, gl = 1
(A + B)(C + D)(A + C)(B + D)
Esta ecuacin es ms fcil de aplicar, en vista de que slo se requiere una divisin
en todo el clculo. Adems tiene la ventaja adicional de incorporar una correc-
cin para la continuidad, la cual mejora notablemente la aproximacin de la
distribucin muestra de la calculada a la distribucin de la Ji-cuadrada.
2
EJEMPLO:
Se quiere determinar si la proporcin de alumnos aprobados en el sexto grado en
un colegio particular es el mismo que en el colegio nacional. La informacin se
presenta a continuacin:
ALUMNOS
COLEGIO Aprobados Desaprobados TOTAL
Particular 2 8 10
Nacional 7 1 8
TOTAL 9 9 18
SOLUCIN:
1. Hiptesis Estadstica:
Ho: El nmero de alumnos desaprobados en un colegio nacional es igual al
nmero de alumnos aprobados en un colegio particular.
Ha: El nmero de alumnos en un colegio particular es mayor que al nmero de
alumnos en un colegio nacional.
- 376 - V. Ibaez Q.
2. Nivel de significacin: = 0.05.
3. Prueba Estadstica: Se usar la prueba Ji-cuadrada con correccin por
continuidad, y adems la informacin se encuentra en una tabla de contingencia
de 2x2.
4. Distribucin Muestral: Se utiliza la siguiente ecuacin:
=
2
c
c
N AD BC N 2 h 2
, gl = 1
(A + B)(C + D)(A + C)(B + D)
5. Clculo de la prueba estadstica:
=
2
c
c
N AD BC N 2 h
2
=
c
18 2x1-8x7 18 / 2 h = 5625
2
.
(A+B)(C+D)(A+C)(B+D) 9x9x10x8
6. Regin de rechazo y aceptacin: Luego gl. = (2-1)(2-1) = 1, luego
. , luego si c es mayor que a t = 3.841 entonces, se rechaza la
2
20.05,1 = 3841
2
H0.
C. PRUEBA DE LA MEDIANA
CONDICIONES:
- Es un procedimiento para evaluar si dos grupos independientes difieren en
sus tendencias culturales.
- Proporciona informacin acerca de qu tan probable es que dos grupos inde-
pendientes (no ncesariamente del mismo tamao) hayan sido extrados de la
misma poblacin con la misma mediana.
- La hiptesis nula plantea que los dos grupos son de la misma poblacin y
tienen la misma mediana.
- La hiptesis alterna puede plantear que la mediana de una poblacin es dife-
rente de la otra poblacin (si es prueba bidireccional) o que la mediana de una
poblacin es superior que la de la otra poblacin (si es prueba unidireccional).
- La prueba puede utilizarse cuando las puntuaciones de los dos grupos se mi-
den en al menos una escala ordinal.
- Puede no existir una prueba alterna a la prueba de la mediana, an para datos
en escala de intervalo. Esto ocurre cuando una o ms de las observaciones
estn fuera de la escala y truncadas hacia el mximo (o mnimo) de las
observaciones previamente asignadas.
Estadstica Aplicada a la Educacin - 377 -
MTODO:
- Determinar primero las puntuaciones de la mediana para el grupo combinado
(es decir, la mediana para todas las puntuaciones en ambas muestras).
- Dicotomizar (dividir) ambos conjuntos de puntuaciones a partir de la media-
na combinada y presentar estos datos en una tabla de 2x2, de la siguiente
manera:
Prueba de la mediana: Formato para los datos.
GRUPO
I II Combinados
Nmero de puntuaciones combinadas por debajo de la mediana A B A+B
Nmero de puntuaciones combinadas por arriba de la mediana C D C+D
TOTAL m n N= m+ n
- Los grupos I y II son muestras de poblaciones cuyas medianas son las mismas,
esperaramos que alrededor de la mitad de las puntuaciones de cada grupo
estuviera por arriba de la mediana combinada y que la otra mitad estuviera
por debajo, es decir tanto las frecuencias A y C como B y D fueran iguales.
- Si el nmero total de casos en ambos grupos (m = n) es pequeo, se puede
utilizar la prueba exacta de Fisher para probar la Ho:
- Si el nmero total de casos es suficientemente grande, se puede utilizar la
prueba Ji-cuadrada con gl = 1 para evaluar la Ho:
- Para analizar datos divididos por la mediana, el investigador debe guiarse por
las siguientes consideraciones, a fin de realizar una buena eleccin entre la
prueba exacta de Fisher y la Ji-cuadrada para tablas de 2x2.
i) Cuando N = m + n es mayor que 20, utilice la corregida para la conti-
2
=
2
c
c
N AD BC N 2 h 2
EJEMPLO:
Existe una diferencia entre el nivel de salud mental de los alumnos de secunda-
ria de una rea rural y los de una rea urbana?. La informacin se presenta a
continuacin:
Calificaciones del nivel de salud mental de estudiantes de secundaria
Urbana 35 26 27 21 27 38 23 25 25 27 45 46 33 26 46 41
Rural 29 50 43 22 42 47 42 32 50 37 34 31
SOLUCIN:
1. Hiptesis estadstica: H 0 : MU = M R versus H a : MU M R
2. Nivel de significacion: = 0.05
3. Estadstica de prueba: Como se muestra en el siguiente anlisis, la estadstica
de prueba es , y se calcula con la frmula anterior para una tabla de contin-
2
gencia de 2x2.
4. Distribucin de la prueba estadstica: Cuando Ho: es verdadera y las suposicio-
nes se cumplen, sigue una distribucin semejante a la de Ji-cuadrada con
2
1 grado de libertad.
5. Regin de Aceptacin y Rechazo: Se rechaza Ho: si el valor de 3.841.
2
=
2
c
c
N AD BC N 2 h
2
=
c
28 6x48x10 28 2 h =13125
2
.
(A+B)(C+D)(A+C)(B+D) (14)(14)(16)(12)
7. Decisin: Puesto que c = 1.3125 < 3.841, el valor crtico de Ji-cuadrada con
2
MTODO:
1. Se ordena los datos de menor a mayor, sin que pierdan su identidad, es decir al
que muestra pertenencia.
2. Se fijan los valores de: n1: Es el tamao de muestra ms pequea, y n2: Tamao de
muestra ms grande.
3. Si en caso se presentar valores con el mismo rango, se halla el rango ligado o
promedio de rangos.
4. Se determina el valor U, segn sea el caso en las dos formas siguientes:
- Contando el nmero de veces que un puntaje experimental precede a un puntaje
control. Si el valor de U es muy grande, tal que no se encontrar en la tabla
- 380 - V. Ibaez Q.
correspondiente su probabilidad asociada, entonces U, se transforma en U =
n1n2 - U
- Cuando no existe el valor U en la tabla, entonces se transforma; o bien se
puede intercambiar los grupos de tal manera que un puntaje control preceda a
un puntaje experimental.
n1 ( n1 + 1 ) n ( n + 1)
- Calculando: U = n1n2 + R1 U = n1n2 + 2 2 R2
2 2
Donde:
R1 : Es la suma de rangos de la muestra n1.
R2 : Es la suma de rangos de la muestra n2.
FG n n IJ
U
H2K
1 2
Z= ~ N ( 0 ,1 )
n1n2 ( n1 + n2 + 1 )
12
Esta Z, se distribuye en forma normal aproximadamente con N(0,1), para la
prueba de dos colas se suplica la probabilidad asociada: 2xp(Zcalculada). Cuando la
proporcin de rangos promedio o rangos ligados es muy alta si la probabilidad p
obtenida, se aproxima cercano a o tiende hacia , entonces se corrigen los
puntajes que tienen rango promedio mediante la siguiente frmula Z.
FG n n IJ
U
H2K
1 2
Z=
FG n n IJ FG N N T IJ
~ N ( 0,1 )
3
H N ( N + 1)K H 12 K
1 2
i
Donde:
t3 t t 3
ti
T=
12
, Ti = i
12
, N = n1 + n2
t : Nmero de puntajes correspondiente a un rango promedio.
Estadstica Aplicada a la Educacin - 381 -
DECISIN:
P(Ucalculada) , se rechaza la Ho:
Cuando 9 n2 20, se busca el valor crtico en la tabla y se compara
Ucalculada Ucrtico, entonces se rechaza la Ho:
EJEMPLO:
Un cientfico social piensa que los profesores universitarios de Teologa tienen
una orientacin poltica ms conservadora que sus colegas de Psicologa. Una mues-
tra aleatoria de 11 maestros del departamento de Teologa y 14 del departamento de
Psicologa de una universidad local reciben un cuestionario de 50 puntos, que mide
el grado de conservadurismo poltico. Se obtuvieron los siguientes datos. Los puntajes
mayores indican un mayor conservadurismo. Use = 0.05.
Profesores: 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Teologa 36 42 22 48 31 35 47 38 40 43 32
Psicologa 13 25 40 29 10 26 43 17 12 32 27 32 42 35
SOLUCIN:
1. Hiptesis Estadstica:
Ho: Los profesores Universitarios de Teologa tienen la misma orientacin
que los profesores de Psicologa sobre el grado de conservadurismo polti-
co.
Ha: Los profesores Universitarios de Teologa tienen una orientacin poltica
diferente que los profesores de Psicologa sobre el grado de conservaduris-
mo poltico.
2. Nivel de significacin: = 0.05, n1 = 11, n2 = 14; N = n1 + n2 = 11 + 14 = 25
3. Prueba Estadstica: Los dos grupos de profesores constituyen dos grupos in-
dependientes, y los puntajes constituyen una medicin de escala ordinal. Por
estas razones la prueba de U de Mann - Whitney es la apropiada para analizar
los datos.
4. Distribucin Muestral: Como n1 > 10 n2 >10, entonces se usa la siguiente
ecuacin:
n1n2
U
Z= 2
n1n2 ( n1 + n2 + 1 )
12
La probabilidad asociada con la ocurrencia de Ho: de valores tan extremos
como una Z observada, puede determinarse utilizando la tabla de valores
- 382 - V. Ibaez Q.
crticos de la distribucin normal (Tabla Z).
5. Regin de rechazo: Si el valor observado de U tiene una probabilidad asocia-
da igual o menor que , entonces rechace la Ho: y se acepta la Ha: (p ).
6. Clculo de la prueba estadstica:
i) Se ordenan los datos de menor a mayor (ascendente).
ii) Se asignan los rangos de 1 hasta N = n1 + n2 = 11 + 14 = 25. En caso de
empate, asignar el rango promedio.
N V IX I VIII 3 II VI XI IV 5 11 X XII 6 XIV 1 8 9 III 2 XIII 10 VII 7 4
Teologa 10 12 13 17 22 25 26 27 29 31 32 32 32 35 35 36 38 40 40 42 42 43 43 47 48
Rango_Pre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Rango_Prom 1 2 3 4 5 6 7 8 9 10 12 12 12 14.5 14.5 16 17 18.5 18.5 20.5 20.5 22.5 22.5 24 25
Rango
Agrupacin Valor tj (t3j t j ) 12
Promedio
1 32 12 3 2
2 35 14.5 2 0.5
3 40 18.5 2 0.5
4 42 20.5 2 0.5
5 43 22.5 2 0.5
5
t3j t j
j=1 12
=4
U nn
1 2 2 42
Z= = = 23028
FG n n IJFG N N t t IJ LM OP
.
3 5 3
11x14 253 25
H N( N 1)KH 12 12 K N 4
Q
1 2 j j
j=1
25x24 12
CONDICIONES:
- Se usa para la significacin de los cambios y se aplica a los diseos antes-
despus y se estudia al mismo sujeto.
- Cada pareja de datos (X,Y) es el sujeto antes y despus del tratamiento.
- Las mediciones se realizan, ya sea en escala nominal u ordinal.
- 384 - V. Ibaez Q.
MTODO:
1. Se ordenan los datos en una tabla de frecuencias de 2x2, de la siguiente
manera:
DESPUS
- +
ANTES
+ A B
- C D
Donde:
2
=
c A D 1h 2
, con gl = 1
A+ D
c
Estadstica Aplicada a la Educacin - 385 -
5. Regin de rechazo y aceptacin:
R.A./H 0 : P( 2 12 ) > , entonces aceptamos la Ho:
R. R./H 0 : P( 2 > 12 ) , entonces rechazamos la Ho:
Otra forma de rechazar o aceptar es:
H 0: 12 < 1,2 , entonces se acepta la Ho:
H 0: 12 1,2 , entonces se rechaza la Ho:
6. Clculo de la Ji-cuadrado
7. Decisin:
EJEMPLO:
Supongamos que un psiclogo infantil est interesado en la iniciacin de los
nios en los contactos sociales. Ha observado que los nios recin llegados a una
guardera suelen inicar sus contactos personales con adultos, antes que con otros
nios. Predice que, con creciente familiaridad y experiencia, los nios iniciarn
cada vez ms contactos sociales con otros nios y no con adultos. Para probar esta
hiptesis, observa 25 nios en su primer da en la guardera, y clasifica su inicia-
cin en los contactos sociales de acuerdo con que haya sido con un adulto o con
un nio. Observa a cada uno de los 25 nios despus de un mes, haciendo la
misma clasificacin. De este modo, sus datos estn clasificados en la tabla si-
guiente. Sigue la prueba de su hiptesis. Forma de la tabla de cuatro entradas
para mostrar los cambios en los objetos de la iniciacin de los nios.
2
=
c A D 1h 2
, con gl = 1
A+ D
(1)
H 0 : 2(1) 1,0.05
2
= 3841
. , entonces se rechaza la Ho:
6. Clculo de la Ji-cuadrado
Se ordenan los datos en una tabla de frecuencias de 2x2, de la siguiente
manera: (Objetos de la iniciacin de los nios en el primero y trigsimo das
en la guardera).
2
=
c A D 1h = c 14 4 1h
2 2
=
92
= 4.5
A+ D 14 + 4
(1)
18
Estadstica Aplicada a la Educacin - 387 -
7. Decisin: Los datos de este estudio aparecen en en la tabla anterior, en el cual
muestra A = 14, es el nmero de nios que cambiaron de adulto a nio y D =
4, es el nmero de nios cuyos objetos cambiaron de nio a adulto. B = 4 y C
= 3 representan a los nios cuyos objetos estuvieron en la misma categora en
ambas ocasiones. Estamos interesados en los nios que mostraron cambio:
aqullos representados en las celdillas A y d.
Como 2(1) 45
. , y gl = 1, la probabilidad de ocurrencia conforme a Ho: es p <
0.025 (el valor de probabilidad dado en la tabla de valores crticos - Anexo es
dividido en dos porque se requiere una prueba de una cola y la tabla da valores
de dos colas). En vista de que la probabilidad confore a Ho: asociada con la
ocurrencia observada es p < 0.025, menor que = 0.05, el valor
observado 2 est en la regin de rechazo y se rechaza la Ho: para aceptar Ha:.
Con estos datos concluimo que los nios muestran una tendencia significati-
va a cambiar su objeto de iniciacin de adultos a nios despus de 30 das de
experiencia en la guardera.
CONDICIONES:
- La prueba t de Wilcoxon, es la alternativa ms potente a la prueba paramtrica
t-Student Fisher para grupos relacionados o apareados, al utilizar no solo los
signos, sino tambin las cuantias ordinales de las diferencias.
- El mtodo de anlisis que sigue Wilcoxon es similar a la prueba de signos.
- La prueba de rangos asignados de Wilcoxon adjudica mayor peso a los pares
que muestran mayores diferencias entre las dos condiciones, ms que a los
pares cuy diferencia es pequea.
- La prueba de Wilcoxon, se aplica con bastante xito en las ciencias de la conducta.
- Cada par (Xi, Yi) corresponden a dos condiciones diferentes.
- Los puntajes deben ser medidos en forma cuantitativamente.
- Se encuentra la distribucin de las diferencias: d i = X i Yi
- Se debe utilizar para probar la hiptesis la mediana de las diferencias es igual
a una cierta cantidad.
MTODO:
- Calcular las diferencias entre las puntuaciones del par en los tratamientos (X,
Y) como di = Xi Yi .
- Asignar un rango sin tomar en cuenta el signo a las diferencias di, adjudicando
el rango 1 a la di ms pequea, el rango 2 a la siguiente, etc.
- 388 - V. Ibaez Q.
- Cuando se presentan el caso de los valores absolutos de las diferencias son
iguales al valor absoluto de cualquier otra diferencia.
X i Yi = X j Yj =L = X k Yk , di = d j =L = d k
El rango promedio se obtiene de la siguiente forma:
Rango(d i ) + Rango(d j )+L+Rango(d k )
Rango Promedio =
Nmero de rangos tomados
- Se asigna el valor de rango promedio a los rangos de la diferencia di al rango
de la diferencia dj:
di = d j =L = d k
Se asigna el signo de la diferencia di a cada uno de los rangos que se separa los
rangos positivos de los negativos.
- Cuando se presenta d i = 0 , se excluye este par del anlisis.
- Se suman todos los rangos positivos T+ y rangos negativos T-
T + = Suma de los rangos de las diferencias positivas "+".
T = Suma de los rangos de las diferencias negativas "".
De lo anterior, la suma de todo los rangos es N ( N + 1 ) 2 , T = N ( N + 1 ) 2 T + .,
luego se asigna a T+, la suma ms pequea de rango (T+ = suma pequea de
rangos).
- Se determina N como el total de las diferencias con signo.
EMPATES:
S X i Yi = d i = 0 , entonces queda excludo del anlisis y el tamao de N se
reduce, respectivamente.
MUESTRAS PEQUEAS:
Si N 15, se trabaja con la prueba de Wilcoxon que nos proporciona la proba-
bilidad asociada a los valores de T+. Si la probabilidad es menor o igual que en
nivel de significacin seleccionado, rechace la Ho:
MUESTRAS GRANDES:
Si N > 15, entonces se aproxima a la distribucin normal, T+: la suma de los
rangos, se distribuye aproximadamente en forma normal.
FG N ( N + 1)IJ
Z=
T+
H 4 K
N ( N + 1 )( 2 N + 1 )
24
Estadstica Aplicada a la Educacin - 389 -
RANGOS EMPATADOS Y MUESTRAS GRANDES:
- Si existieran rangos con empates, es necesario ajustar la prueba estadstica
para considerar el decremento en la variabilidad de T. La correccin requiere
contar los empates y reducir la varianza, respectivamente. En caso de existir
rangos empatados, entonces:
=2N( N + 1)( 2 N + 1) 1 g
T+
24
t j t j 1 t j + 1
2 j =1
d id i
Donde: g = Nmero de agrupamiento de diferentes rangos empatados.
tj = Nmero de rangos empatados agrupados en j.
- Se puede plantear la hiptesis, realizando de la siguiente forma:
Ho: Mediana(X) - Mediana(Y) = C versus Ha: Mediana(X) - Mediana(Y)<C
DECISIN:
- Si T+ > Ttabla, entonces aceptar la Ho:
- T+ Ttabla, entonces rechazar la Ho:
- En trminos de probabilidad p , entonces rechace la Ho:
EJEMPLO:
A un grupo de 10 estudiantes del curso de Lenguaje ensean dos profesores uno
despus de otro, durante un semestre, en este caso asumimos que el segundo
profesor tena mejor mtodo de enseanza y por consiguiente los estudiantes han
mejorado en el rendimiento. Las calificaciones de los estudiantes con los dos
profesores fueron los siguientes:
Nota-1 Nota-2
Estudiante Prof. 1 (Xi) Prof. 2 (Yi) di = Xi - Yi Rango Rango (+) Rango (-)
1 15 14 1 3 2
2 11 17 -6 9 -9.5
3 8 13 -5 8 -8
4 9 10 -1 1 -2
5 17 13 4 7 6.5
6 11 13 -2 4 -4
7 11 17 -6 10 -9.5
8 18 19 -1 2 -2
9 14 18 -4 6 -6.5
10 12 9 3 5 5
+ -
TOTAL T =13.5 T =41.5
- 390 - V. Ibaez Q.
SOLUCIN:
1. Hiptesis Estadstica:
Ho: La mediana de las calificaciones de los estudiantes obtenidas por el primer
profesor es igual a la mediana de calificaciones obtenidos por el segundo
profesor.
Ha: La mediana de las calificaciones de los estudiantes obtenidas por el primer
profesor es menor a la mediana de calificaciones obtenidas por el segundo
profesor.
2. Prueba Estadstica: Se seleccion la prueba de Wilcoxon puesto que los datos
representan diferencias entre las puntuaciones de dos muestras relacionadas.
3. Nivel de Significacin: = 0.01 y N = 10
4. Distribucin muestral: Cuando Ho: es verdadera, los valores calculados de
Wilcoxon, se encuentran en el Anexo.
5. Clculo de la prueba estadstica:
Encontrando los rangos promedios:
1+ 2 + 3
- Rango de: -1, -1, +1, su rango promedio ser: Rango Promedio = =2
3
6+7
- Rango de: -4, 4, su rango promedio ser: Rango Promedio = = 6.5
2
9 +10
- Rango de: -6, +6, su rango promedio ser: Rango Promedio = = 9.5
2
6. Regin de Rechazo:
La tabla de Wilcoxon proporciona el valor tabular de T10, 0.01 = 5.1 con N = 10
y = 0.01, entonces podemos comparar que 13.5 >5.1, aceptar la hiptesis
Ho: , o tambin p = 0.01
F 12 I
GH Nk ( k + 1) R JK 3N ( k + 1)
k
Fr = 2
j
j =1
Donde:
N = Nmero de renglones (sujetos)
k = Nmero de columnas (variables o condiciones)
(R ) = Suma de los rangos en la j-sima columna (suma de los rangos para varia-
j
ble j-sima)
k
o
Fc > FglNumerador
error ,
, entonces se rechaza la Ho:
Fc FglNumerador
error ,
, entonces se acepta la Ho:
EJEMPLO:
Tinker lleva a cabo un experimento para investigar la resistencia al parpadeo en
la lectura. Se registraron datos en 6 perodos sucesivos de lectura de 5 minutos cada
uno. Los datos se presentan a continuacin:
PERIODOS
Individuo 1 2 3 4 5 6
A 24 23 28 30 30 41
B 18 17 17 19 19 18
C 41 41 49 39 19 27
D 46 69 74 58 54 50
Estadstica Aplicada a la Educacin - 393 -
SOLUCIN:
1. Hiptesis:
Ho: El nmero de parpadeo en la lectura es el mismo en los diferentes perio-
dos.
Ha: En el perodo tres el nmero de parpadeo es mayor que los dems cuatro
inidividuos.
2. Nivel de significancia: = 0.05 = 0.01
3. Estadstica de prueba: Se elige el anlisis no paramtrico de la varianza de dos
clasificaciones en lugar del paramtrico.
4. Distribucin Muestral:
k
12
Fr = R2j 3N( k + 1) ,
Nk ( k + 1) j =1 con gl. = k - 1
o
Fc > FglNumerador
error ,
, entonces se rechaza la Ho:
Fc FglNumerador
error ,
, entonces se acepta la Ho:
6. Clculo de la estadstica de prueba: Mediante el uso de datos de la tabla ante-
rior, se obtiene:
PERIODOS
Individuo 1 2 3 4 5 6
A 24 23 28 30 30 41
Rango 2 1 3 4 5 6
B 18 17 17 19 19 18
Rango 3 1 2 6 5 4
C 41 41 49 39 19 27
Rango 4 5 6 3 1 2
D 46 69 74 58 54 50
Rango 1 5 6 4 3 2
Rj R1 = 10 R2 = 12 R3 = 17 R4 = 17 R5 = 14 R6 = 14
Fr =
12 k=6 2
Nk( k +1) j=1
12
c h
Rj 3N(k +1) = 4x6(6+1) 102 +122 +172 +172 +142 +142 3x4(6+1) =2.71
- 394 - V. Ibaez Q.
MTODO:
- Para aplicar la prueba Ji-cuadrada, primero debemos presentar los datos (fre-
cuencias) en una tabla rxk, donde los datos en cada columna corresponden a las
frecuencias en cada una de las r categoras de respuesta para cada uno de los
k grupos o muestras diferentes.
- Determine la frecuencia esperada segn Ho: para cada celdilla encontrando el
producto de los totales marginales comunes a la celdilla y dividiendo este pro-
ducto entre N. Es decir, encuentre las frecuencias esperadas eij = i j N (N es
la sumatoria de cada uno de los totales marginales y representa el nmero total
de observaciones independientes. Cuando se inflan los valores de N debido a
mltiples observaciones de cada sujeto, esto invalida la prueba). Si las frecuen-
cias esperadas son pequeas, combine categoras.
- Calcule 2c , utilizando las siguientes ecuaciones.
r
2c =
k
d
ij eij i
2
~ (2r1)( k 1) , eij =
i j
i =1 j =1 eij N
Estadstica Aplicada a la Educacin - 395 -
r k ij2
=
2
c N ~ (2r 1 )( k 1 )
i =1 j =1 eij
Donde:
i. =Es el total observado por la i-sima fila.
EJEMPLO:
Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la
severidad de una afeccin en la poblacin, reuni los datos de 1500 personas, los
cuales se presentan en la tabla de contingencia. Los investigadores desean saber
si estos datos son compatibles con la hiptesis de que el grado de la afeccin y el
tipo sanguneo son independientes. La informacin se presenta a continuacin:
1500 individuos clasificados segn la severidad de su condicin y tipo de sangre
Severidad TIPO DE SANGRE
de la condicin A B AB O TOTAL
AUSENTE 543 211 90 476 1320
MODERADA 44 22 8 31 105
SEVERA 28 9 7 31 75
TOTAL 615 242 105 538 1500
SOLUCIN:
1. Hiptesis Esadstica (Planteamiento de la hiptesis).
Ho: El tipo sanguneo y la severidad de la afeccin son independientes.
Ha: Las dos variables no son independientes.
2. Nivel de significacin = 0.05.
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrada de r filas por
k categoras, adems los datos estn expresados al menos en una escala ordinal,
por consiguiente se aplicar la Ji-cuadrada.
4. Distribucin muestral: Se utiliz la siguiente ecuacin:
Estadstica Aplicada a la Educacin - 397 -
2c
r
=
d k
ij eij i 2
~ (2r 1 )( k 1 )
i =1 j =1 eij
5. Clculo de la prueba estadstica:
(543- 541.2) 2 (211- 212.96) 2 (31- 26.90) 2
2c = + + L+
5412. 212.96 26.90
= 0.005987+0.018039+ .........+0.624907
= 5.12
6. Regin de rechazo y aceptacin:
Si 2c = 5.12 26 ,0 ,05 = 12.592 , se acepta la Hiptesis Nula (Ho).
G RUP O
1 2 3 .... k
Y 11 Y 12 Y 13 .... Y 1K
Y 21 Y 22 Y 23 .... Y 2K
Y 31 Y 32 Y 33 .... Y 3K
.... .... .... .... ....
.... .... .... .... ....
.... .... .... .... ....
Y n1 Y n2 Y n3 .... Y nk
n j Rj R d i2 LM
12 k OP
KW = = nj Rj2 3( N +1)
N Q
KW
N( N + 1) j =1 o
N( N +1) j=1
Donde:
k = Nmero de muetras o grupos.
n = Nmero de casos en la j-sima muestra
j
N = Nmero de casos en la muestra combinada (suma de n)
R = Sumatoria de los rangos en la j-sima muestra o grupo.
j
L 12 n R OP 3( N + 1) R = n R
KW = M
k k 2 k
,
N N ( N + 1) Q
2 j 2
j j j j
j =1 n j =1 j j =1
Fc FglNumerador
error ,
, entonces se acepta la Ho:
EJEMPLO:
Se estudi el efecto de dos medicamentos en el tiempo de reaccin ante cierto
estmulo de 3 grupos de animales experimentales. El grupo III sirvi de control,
mientras que a los animales del grupo I se les aplic el medicamente A y a los del
grupo II el medicamento B antes de la aplicacin del estmulo. La informacin que
se presenta a continuacin muestra el tiempo de reaccin, en segundos de los 13
animales.
- 400 - V. Ibaez Q.
GRUPO GRUPO(Rangos)
I II III I II III
17 8 2 9 6.5 1
20 7 5 10 5 4
40 9 4 13 8 3
31 8 3 11 6.5 2
35 12
nj 5 4 4 Rj R1 =55 R2 =26 R3 = 10
nj 5 4 4 N= 13
SOLUCIN:
1: Hiptesis: Ho: Las distribuciones de las poblaciones son idnticas.
Ha: Al menos una de las poblaciones tiende a mostrar valores ma-
yores que, cuando menos, una de las otras poblaciones.
2. Nivel de significancia: = 0.05
3. Estadstica de prueba (La escala de medicin a utilizarse es, al menos ordinal).
Las muestras son aleatorias e independientes, y fueron extradas de sus res-
pectivas poblaciones.
4. Distribucin Muestral:
LM 12 n R OP 3( N +1) = 12 L55 + 26 + 10 O 3(14 )
13(14 ) MN 5 4 PQ
k 2 2 2
N N ( N + 1) Q
KW = j
2
j ,
j =1 4
= 10.68131868
5. Regin de rechazo: Si KW = 10.68 > 22 ,0.05 = 7.7604 , entonces rechazamos
la hiptesis nula y se acepta la Ha:.
6. CONCLUSIN: Como KW = 10.68 > 22 ,0.05 = 7.7604 , entonces al menos
una de las poblaciones tiende a mostrar valores mayores que, cuando menos,
una de las otras poblaciones.
(t i
3
ti )
1 i =1
N3 N
Estadstica Aplicada a la Educacin - 401 -
En nuestro ejemplo, se tiene un grupo (Grupo II) y existen dos puntuaciones con
6.5 y 6.5, entonces g = 1.
23 2 6
1 = 1 = 0.9972527
13 13
3
2184
KW 10.68
KWcorr . = = = 10.709 ~ 10.71
6 0.9972527
1
2184
es significativo al nivel de 0.01. Como es significativo al nivel dado, entonces no
es necesario ajustarla.
k 2
12 Rj
= KW =
2
c 3( N + 1)
N ( N + 1 ) j =1 n j
123
k
nj Rj
2
j =1
EJERCICIO:
P R O GR A M A S
A B C D
13 11 12 22
24 13 19 26
19 20 9 22
18 14 14 22
9 11 21 26
21 21 7 19
17 14 6
22 8
24
A. EL COEFICIENTE DE C DE Cramr
FUNCIN:
- El coeficiente C de Cramr es una medida del grado de asociacin o relacin
entre dos series de atributos o variables.
- Se usa nicamente cuando tenemos slo informacin categrica (escala nomi-
nal) acerca de uno o de ambos conjuntos de atributos o variables.
- Se emplea cuando la informacin acerca de los atributos consiste en una serie
no ordenada de categoras.
- Para el uso del coeficiente de Cramr, no es necesario suponer continuidad
subyacente para las diferentes categoras usadas al medir uno o ambos conjun-
tos de atributos.
- No se necesita siquiera ser capaces de ordenar las categoras en alguna forma
particular.
- El coeficiente de Cramr, al ser calculado de una tabla de contingencia, propor-
ciona los mismos valores sin considerar cmo fueron ordenadas las categoras
en las filas y columnas.
MTODO:
- Arregle las frecuencias observadas en una tabla de contingencia de rxh, donde
r es el nmero de categoras en las cuales se clasifica una variable y k es el
nmero de categoras en las cuales se clasifica la otra variable.
- Determine la frecuencia esperada segn Ho: para cada celda, al multiplicar los
Estadstica Aplicada a la Educacin - 403 -
datos totales marginales comunes a esa celda y dividiendo despus este produc-
to por el nmero total de casos N. Es decir, para cada celda en la tabla de
contingencia calcule: eij = i j N . Si ms de cerca del 20% de las celdas
tienen frecuencias esperadas menores que cinco o si cualquiera de las celdas
tiene una frecuencia esperada menor que uno combine las categoras (ya sea
filas o columnas) para incrementar las frecuencias esperadas que sean deficien-
tes.
- Mediante la siguiente ecuacin, calcule el valor de 2c para los datos.
2c =
d
r k
ij eij i 2
i =1 j =1 eij
r k ij2
=
2
c N ~ (2r 1 )( k 1 ) - Use este valor de 2c para calcu-
i =1 j =1 eij
lar el valor de C mediante la siguiente ecuacin:
2c
C=
N (L - 1)
Donde: L : Es el mnimo del nmero de filas o columnas en la tabla de contin-
gencia.
El grado de asociacin entre dos conjuntos de atributos al medirse por medio
del coeficiente de Cramr, aunque sean o no ordenables e independientemen-
te de la naturaleza de la variable (puede ser continua o discreta) y de la distri-
bucin subyacente del atributo (la distribucin poblacional pueder ser normal
o de cualquier forma), puede encontrarse en una tabla de contingencia de
observaciones.
Debe notarse que, como la correlacin producto-momento de Pearson, el co-
eficiente de Cramr tiene un valor mximo de uno y C ser igual a cero cuan-
do las variables o los atributos sean independientes. A diferencia de la corre-
lacin producto-momento de Pearson, el coeficiente de Cramr no puede ser
negativo. Esto es de esperar, ya que el estadstico mide la relacin entre varia-
bles categricas que no poseen ningn orden inherente.
- Para probar si el valor observado de C indica que existe una asociacin signifi-
cativa entre las dos variables en la poblacin muestreada, determine la probabi-
- 404 - V. Ibaez Q.
lidad asociada segn Ho: de un valor tan grande como el observado 2c con gl
= (r - 1)(k - 1), consultando la tabla de valores crticos de la Ji-cuadrada (Anexo).
Si esa probabilidad es igual o menor que (p ), la hiptesis nula (Ho.) es
rechazada en ese nivel de significacin, aceptndose la Ha:
Ejemplo:
Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la
severidad de una afeccin en la poblacin, reuni los datos de 1500 personas, los
cuales se presentan en la tabla de contingencia. Los investigadores desean saber
si estos datos son compatibles con la hiptesis de que el grado de la afeccin y el
tipo sanguneo son independientes. La informacin se presenta a continuacin:
1500 individuos clasificados segn la severidad de su condicin y tipo de sangre
Severidad TIPO DE SANGRE
de la condicin A B AB O TOTAL
AUSENTE 543 211 90 476 1320
MODERADA 44 22 8 31 105
SEVERA 28 9 7 31 75
TOTAL 615 242 105 538 1500
SOLUCIN:
1. Hiptesis Esadstica:
Ho: El tipo sanguneo y la severidad de la afeccin son independientes.
Ha: El tipo sanguneo y la severidad no son independientes.
2. Nivel de significacin = 0.05.
3. Prueba Estadstica: Se elige el coeficiente de Cramr (C), con r filas por k
categoras, adems los datos estn expresados al menos en una escala ordinal,
por consiguiente se aplicar C.
4. Distribucin muestral: Se utiliz el coeficiente de Cramr:
2c
C=
N (L - 1)
5. Clculo de la prueba estadstica: Primeramente se debe calcular 2c , de la
siguiente manera:
(543- 541.2) 2 (211- 212.96) 2 (31- 26.90) 2
2c = + + L+ = 5.12
5412
. 212.96 26.90
2c .
512
C= = = 0.041
N (L - 1) 1500( 3 1 )
6. Regin de rechazo y aceptacin:
Si 2c = 5.12 26 ,0 ,05 = 12.592 , se acepta la Hiptesis Nula (Ho).
FUNCIN:
- Es una medida de asociacin entre dos variables que requiere que ambas estn
medidas en al menos en una escala ordinal, de manera tal que los objetos o
individuos en estudio puedan ser colocados en rangos en dos series ordenadas.
- Al calcular un coeficiente de correlacin podra haber problemas o inconvenientes
para usar directamente las d i. Una dificultad es que las di negativas podran cancelar
a las positivas cuando tratamos de determinar la magnitud total de la discrepancia
entre los rangos, aun pensando que es la magnitud, ms que el signo de la
discrepancia, la que representa un ndice de la disparidad de los rangos. Sin
embargo si se emplea d i2 en lugar de d i esta dificultad se elimina. Queda claro
que mientras ms grandes sean las diferencias d i , ms grande ser el valor de
d i
2
, que es la suma del cuadrado de las diferencias para N pares de datos.
- La derivacin de la frmula calculada para rs es bastante sencilla. Se hace
simplificando la frmula del coeficiente de correlacin producto-momento r de
Pearson cuando los datos estn compuestos por rangos. Proporcionaremos dos
expresiones alternativas para rs . Una de estas formas alternativas es til en el
clculo del coeficiente y la otra se usar posteriormente cuando encontremos
necesario corregir el coeficiente, cuando se presenten puntuaciones empatadas en
los datos. Si x = X X , donde X es la media de las puntuaciones en la variable
- 406 - V. Ibaez Q.
x 2 + y 2 di2
simplificacin de la ecuacin rs = a la forma proporcionada
2 x2 y2
n
6 d i2
en la ecuacin rs = 1
i =1
es posible notando que cuando los datos estn en
N3 N
rangos y no existen empates en los datos, x2 = y2 = (N3 - N) 12 . Debe notarse
que si existen empates, el uso de las ecuaciones anteriores proporcionar el valor
correcto de rs; mas tarde se proporcionar una correccin para los empates para la
ecuacin rs. Este coeficiente se usa para medir el grado de relacin entre dos
variables medidas a nivel ordinal preferentemente (ordenar) y en algunos casos
para datos medidos a nivel de intervalo o de razn.
EJEMPLO:
Suponga que un dictaminador ha clasificado a ocho maestros de ciencias
elementales segn su habilidad docente y que todos presentaron un examen
Estadstica Aplicada a la Educacin - 407 -
nacional para maestros. Los datos se dan en la tabla siguiente. Sugieren los
datos si existe una correlacin entre rangos y calificaciones?
SOLUCIN:
1. Hiptesis estadstica:
Ho: No existe asociacin entre el docente dictaminador con la calificacin del
examen.
Ha: Existe asociacin entre el docente dictaminador con la calificacin del
examen.
2. Nivel de significacin: = 0.05
3. Prueba Estadstica: Se elige el coeficiente de correlacin de Spearman de
rangos ordenados, ya que la escala de medicin a utilizarse es, al menos ordinal.
4. Distribucin Muestral: Se calcular con la siguiente ecuacin:
n
6 d i2
rs = 1 i =1
N3 N
5. Clculo de la prueba estadstica:
BIBLIOGRAFA CONSULTADA