You are on page 1of 40

DISTRIBUCION CHI-CUADRADO (  2 )

Si s es la varianza de una muestra aleatoria de tamaño “n”, obtenida de una población normal con varianza σ 2,
2

y suponiendo que las “n” observaciones son independientes, la variable aleatoria:


n * s 2  x1  x) 2  ( x 2  x) 2  ........  ( x n  x) 2
: 2  
2 2
donde  es la letra griega Ji, poseerá una distribución Ji cuadrado con gl = n – 1. Esta distribución es continua y
asimetría.

Si consideramos muestras de tamaño tomadas de una población normal con desviación típica  , y si para
cada muestra calculamos  2 se obtiene para Ji-cuadrado una distribución de muestreo llamado distribución Ji-
cuadrado que viene expresada por:
1

y  y0(  2 )
1 / 2*(  2 )
.e 2
2
; donde   n  1  gl

Las pruebas Ji cuadrado son útiles al analizar más de dos poblaciones; permitiendo determinar si un grupo de
datos que a nuestro juicio, podrían ser descritos por una distribución determinada (Binomial, Poisson, Normal) se ajusta
en realidad a ese patrón.
La distribución Ji cuadrado tiene dos funciones relevantes:
1) En tablas de contingencia:
a) cumple como decisor en la dependencia o independencia de variables que se desean relacionar.
b) es utilizada como prueba de homogeneidad cuando el experimentador controla una de las variables.
2) Como bondad de ajuste de una distribución de probabilidad teórica, es decir, puede utilizarse para decidir si una
distribución de probabilidad en particular sigue una distribución de probabilidad teórica (binomial, Poisson o normal).
Si deseamos ir más allá de las meras intuiciones respecto a las frecuencias observadas y esperadas (son
aquellas que según las leyes de probabilidad, se espera que sucedan) emplearemos el estadístico Ji cuadrado; definido
como una medida de discrepancia existente entre las frecuencias observadas y esperadas.

( fo  fe) 2
2  ; donde fe  frecuencia esperada
fe
fo  frecuencia observada
Para calcular el número de grados de libertad en una tabla de contingencia (tabla de doble entrada con “f” filas
y “c” columnas), se establece el producto del número de filas menos una por el número de columnas menos una.
gl = (f -1)*(c -1)
NOTA: Para evitar incurrir en inferencias incorrectas de las pruebas de hipótesis Ji cuadrado se establece que
una frecuencia esperada menor de cinco en una celda de una tabla de contingencia es demasiado pequeña para
utilizarse.

ESTADÍSTICA II 1
LCDO. JUAN FRANCISCO GÓMEZ
INFERENCIA SOBRE UNA VARIANZA DE LA POBLACIÓN.

Para el cálculo de intervalo de confianza así como para el contraste de hipótesis de la varianza poblacional se
(n  1) * s 2
emplea el estadístico  2 . Si la varianza de la población es  2 , entonces el estadístico 2  tiene
2
una distribución Ji cuadrado con (n-1) grados de libertad.

INTERVALO DE CONFIANZA PARA LA VARIANZA DE LA POBLACIÓN

Dada una muestra aleatoria de tamaño “n” de una población normal se puede obtener un intervalo de confianza
(n  1) * s 2
con coeficiente de confianza de 1-  para   2
que es una variable aleatoria con distribución Ji
2
cuadrado de n-1 grados de libertad.

 2 (n  1) * s 2 

 1     2 
 2  2
2
1 2 1
  2
  (n  1) * s
2 2
 
1
2 2

(n  1) * s 2 (n  1) * s 2
  2

 2 2
1
2 2

CONTRASTE DE HIPOTESIS PARA LA VARIANZA POBLACIONAL

Similar a los procesos estudiados para la media poblacional se establece para la varianza poblacional

ESTADÍSTICA II 2
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN BINOMIAL

La tabla ofrece la distribución del número de


aceptaciones de 100 estudiantes en tres (3) facultades.
Contraste, con un nivel de significancia del 5%, que la
distribución de las aceptaciones es aproximadamente
binomial si la probabilidad de que un estudiante sea
aceptado en la facultad es de 0,4.
Número de Aceptaciones Número de Estudiantes
0 25
1 34
2 31
3 10

ESTADÍSTICA II 3
LCDO. JUAN FRANCISCO GÓMEZ
1) H0: La distribución del número de aceptaciones sigue una distribución binomial con p=0,4 y n = 3
2) H1: La distribución del número de aceptaciones no sigue una distribución binomial con p=0,4 y n =3

Para calcular el estadístico de prueba es necesario determinar las frecuencias esperadas por medio de la probabilidad
binomial

fe
P(r=0)= nCr*pr*qn-r 3C0*0,40*0,63 0,216 0,216*100=21,6
P(r=1)= nCr*pr*qn-r 1
3C1*0,4 *0,6
2
0,432 0,432*100=43,2
P(r=2)= nCr*pr*qn-r 2
3C2*0,4 *0,6
1
0,288 0,288*100=28,8
P(r=3)= nCr*pr*qn-r 3
3C3*0,4 *0,6
0
0,064 0,064*100=6,4

( f 0  f e ) 2 ( 25  21,6) 2 (34  43,2) 2 (31  28,8) 2 (10  6,4) 2


 c2        4,6875
fe 21,6 43,2 28,8 6,4

Número de renglones

gl = n – k - 1 = 4 – 0 - 1 = 3
Número de parámetros
estimados

 t2  7,815

Se acepta la hipótesis nula por lo tanto la distribución del número de aceptaciones sigue una distribución binomial con
p = 0,4 y n = 3

ESTADÍSTICA II 4
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN DE POISSON

Se supone que el número de defectos en las tarjetas


de circuito impreso sigue una distribución Poisson. Se Número de defectos Frecuencia observada
reúne una muestra aleatoria de 60 tarjetas de circuito 0 32
impreso y se observa el número de defectos. Los 1 15
resultados obtenidos son los siguientes: 2 9
3 4
Pruebe las hipótesis apropiadas con un   0,05
Como no tenemos lambda (  ) hay que estimarla. Recuerde que lambda es un promedio, así que:
0 * 32  1*15  2 * 9  3 * 4
 f 
f *x
 0,75
 60
H0: La distribución de los defectos de las tarjetas sigue una distribución de Poisson con   0,75
H1: La distribución de los defectos de las tarjetas no sigue una distribución de Poisson con   0,75
APLICACIÓN FORMULA
PROBABILIDAD fe

 *e
x
P(r=0)= 0,750 * e 0 , 75
x! 0,472366552 0,472366552*60= 28,342
0!
x * e  
P(r=1)= 0,751 * e 0, 75
x! 0,354274914 0,354274914*60=21,256
1!
x * e  
P(r=2)= 0,752 * e 0, 75
x! 0,132853093 0,132853093*60=7,971
2!
P(r  3)= 1-P(X<3)
1-0,959494559 0,040505439 0,040505439*60=2,43

Observe que existe un valor esperado menor que 5; lo que amerita hacer un ajuste agrupando renglones:

Número de defectos Frecuencia observada Frecuencia esperada


0 32 28,342
1 15 21,256
2 13 10,401

( f 0  f e ) 2 (32  28,342) 2 (15  21,256) 2 (13  10,401) 2


 
2
c     2,963
fe 28,342 21,256 10,401
Número de renglones
gl = n – K – 1 = 3 – 1 – 1 = 1

Número de parámetros
estimados
 t2  3,841

Se acepta H0 por lo que la distribución del número de defectos de las tarjetas sigue una distribución de Poisson con
  0,75

ESTADÍSTICA II 5
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN NORMAL

Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías dadas en la siguiente tabla, se
puede aproximar mediante una distribución normal con media µ= 3,5 y desviación estándar σ=0,7. Utilice un α = 0.05.

Frecuencias
Límites de clase
observadas

1.45 – 1.95 2

1.95 – 2.45 1

2.45 – 2.95 4

2.95 – 3.45 15

3.45 – 3.95 10

3.95 – 4.45 5

4.45 – 4.95 3

Solución

H0; La distribución de la duración de las baterías sigue una distribución normal con µ = 3,5 y σ = 0,7

H1; La distribución de la duración de las baterías no sigue una distribución normal con µ = 3,5 y σ = 0,7

En este ejercicio en particular se cuenta con la media y desviación estándar de la población, por lo que no se tiene que
estimar. En caso de que no se tuviera, se estimarían a partir de los datos agrupados con las fórmulas que se vieron en el
curso de Estadística I, tomando en cuenta que para los grados de libertad el valor de “k” sería 2, ya que se estimaría la
media y la desviación estándar.

Se procederá a calcular los valores de z para encontrar las probabilidades en la tabla.

x
Recordando que z  , se sustituye el valor de x por los límites de clase comenzando con el límite de 1.95

ESTADÍSTICA II 6
LCDO. JUAN FRANCISCO GÓMEZ
Límite real

1,95 -2,21

2,45 -1,50

2,95 -0,79

3,45 -0,07

3,95 0,64

4,45 1,36

La razón por la cual se comienza con el límite de 1,95 y se termina con el límite de 4,45, es porque la suma de
todas las probabilidades debe ser 1, bajo la curva normal.

P( z  2,21 ) = 0,01355

P(-2,21 Z -1,5) =0,06681 – 0,01355 = 0,05326

P(-1,5 Z -0,79) = 0,21476 – 0,06681= 0,14795


Resuelto por excel
P(-0,79 Z -0,07) = 0,47210 – 0,21476 = 0,25734

P(-0,07 Z 0,64) = 0,73891 - 0,47210 = 0,26681

P(0,64 Z 1,36) = 0,91309 - 0,73891 = 0,17418

P( Z>1,36) = = 1- 0,91309 = 0,08691

ESTADÍSTICA II 7
LCDO. JUAN FRANCISCO GÓMEZ
Con estas probabilidades se calcularán los valores esperados, multiplicando cada
probabilidad por 40.

Frecuencias Frecuencia
Límites de clase Probabilidad*fo
observadas esperada

0,01355*40
 1.95 2 0,542

1.95 – 2.45 1 0,05326*40 2,1304

2.45 – 2.95 4 0,14795*40 5,918

2.95 – 3.45 15 0,25734*40 10,2936

3.45 – 3.95 10 0,26681*40 10,6724

3.95 – 4.45 5 0,17418*40 6,9672

 4.45 3 0,08691*40 3,4764

Como existen frecuencias esperadas menores que cinco hay que agrupar renglones
(intervalos) hasta lograr que sean mayores o iguales a cinco.

Frecuencias Frecuencia
Límites de clase Probabilidad
observadas esperada

 2.95 7 8,5904

2.95 – 3.45 15 0,255766 10,2936

3.45 – 3.95 10 0,26818 10,6724

 3.95 8 10,4436

ESTADÍSTICA II 8
LCDO. JUAN FRANCISCO GÓMEZ
ESTADÍSTICA II 9
LCDO. JUAN FRANCISCO GÓMEZ
( fo  fe ) 2 (7  8,5904) 2 (15  10,2936) 2 (10  10,6724) 2 (8  10,4436) 2
 c2        3,0604
fe 8,5904 10,2936 10,6724 10,4436

Grados de libertad: n – K - 1 = 4 – 0 - 1 = 3

Como el 3,139 no es mayor de 7,815, se acepta H 0 y se concluye con un α= 0.05 que el ajuste de los datos a una
distribución normal con µ = 3,5 y σ= 0,7 es bueno.

ESTADÍSTICA II 10
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA UNA DISTRIBUCIÓN DEFINIDA
Una organización no gubernamental (ONG’s) solicita donativos por teléfono, resultando que un 60% de las llamadas ha
negado el donativo, un 30% ha contestado que necesita más información a través del correo para tomar una decisión
sobre la donación y un 10% ha contestado afirmativamente, realizando la donación en el momento. Durante esta
semana, se han realizado un total de 100 llamadas, 65 negaron el donativo, 31 pidieron más información y cuatro
donaron inmediatamente alguna cantidad. Contrastar, a un nivel de significancia de 10%, que esta semana los resultados
han sido similares a los que se venían obteniendo.

H0: Los resultados obtenidos de las cien llamadas realizadas esta semana han sido similares a los que se venían
obteniendo anteriormente
H1: Los resultados obtenidos de las cien llamadas realizadas esta semana no han sido similares a los que se venían
obteniendo

Llamada para donativo Probabilidad fo fe


Niega el donativo 0,6 65 60
Necesita más información 0,3 31 30
Da el donativo inmediatamente 0,1 4 10

Para encontrar las frecuencias esperadas se multiplica el total de las frecuentas observadas por la probabilidad
suministrada por el problema.

( f 0  f e ) 2 (65  60) 2 (31  30) 2 (4  10) 2


 c2       4,05
fe 60 30 10

gl = n – 1 = 3 – 1 = 2

  0,1

 t2  4,605

ESTADÍSTICA II 11
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE PARA DEPENDENCIA E INDEPENDENCIA
TABLAS DE CONTINGENCIA

Se encuestó a varios directores generales de empresas y se les pidió que valoraran entre bajo, medio y alto el
rendimiento financiero de su empresa y también se les pidió que valoraran de la misma manera, la estrategia de su
empresa. Contrastar a nivel de significancia del 1% la hipótesis de no asociación entre los dos tipos de valoraciones

Rendimiento Financiero
Estrategia TOTAL
Bajo Medio Alto
Bajo
15 25 20
60
15 24 21
Medio 35 50 25
110
27,5 44 38,5
Alto 25 45 60
130
32,5 52 45,5

TOTAL 75 120 105 300

Ho: La valoración del rendimiento financiero de la empresa es independiente de la valoración de la estrategia seguida por
la empresa

H1: La valoración del rendimiento financiero de la empresa es dependiente de la valoración de la estrategia seguida por
la empresa

Calculamos los valores esperados aplicando la fórmula: f e 


 fila *  columna donde total es el tamaño de
 total
la muestra, 300.

Por ejemplo para el primer valor de la tabla se obtiene de la siguiente manera 60*75/300 = 15; y así para todas y cada
una de los valores de las celdas

( f 0  f e ) 2 (15  15) 2 ( 25  24) 2 (60  45,5) 2


 c2      .......... ....   14,981
fe 15 24 45,5

ESTADÍSTICA II 12
LCDO. JUAN FRANCISCO GÓMEZ
gl = (f – 1)*(c – 1) = (3 – 1)*(3 – 1) = 4

  0,01
13,277

El consejo de administración de Telefónica desea conocer si la opinión de sus accionistas respecto a una posible fusión
es independiente del número de acciones que poseen. Una muestra de 500 accionistas proporciona la siguiente tabla:

Opinión
A favor En contra Indecisos Total
Nº de acciones

Menos de 200 25 18 21 64

200-1000 93 62 67 222

Más de 1000 82 70 62 214

Total 200 150 150 500

Contrastar a un nivel de confianza del 99,5% la independencia de las variables

Ho: El número de acciones que posee un accionista es independientes de su opinión respecto a una posible fusión

ESTADÍSTICA II 13
LCDO. JUAN FRANCISCO GÓMEZ
H1: El número de acciones que posee un accionista es dependiente de su opinión respecto a una posible fusión

Calculamos los valores esperados e ij bajo la hipótesis nula (independencia de X e Y) aplicando la fórmula:

fe   fila *  columna donde total es el tamaño de la muestra, 500.


 total
Por ejemplo: e11=64.200/500=25,6 e12=64.150/500=19,2

La tabla de los valores esperados sería:

A favor En contra Indecisos Total

Menos de 200 25,6 19,2 19,2 64

200-1000 88,8 66,6 66,6 222

Más de 1000 85,6 64,2 64,2 214

Total 200 150 150 500

( f 0  f e ) 2 (25  25,6) 2 (62  64,2) 2


 c2     ......   1,53
fe 25,6 64,2

gl = (f – 1)*(c – 1) = (3 – 1)*(3 – 1) = 4

0,995
  0,005
 t2  14,86

ESTADÍSTICA II 14
LCDO. JUAN FRANCISCO GÓMEZ
Se acepta la hipótesis nula por lo cual el número de acciones que posee un accionista es independiente de su
opinión respecto a una posible fusión

ESTADÍSTICA II 15
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE PARA HOMOGENEIDAD
TABLAS DE CONTINGENCIA

Se han aplicado tres métodos de empaquetado de dispositivos electrónicos durante un periodo de 4 meses; al final de
cada mes se realiza un recuento del número de paquetes estropeados, obteniéndose los siguientes datos:

Meses
1 2 3 4 Total
Método

6 8 8 8 30
A
6,098 7,561 7,317 9,024

10 12 9 14 45
B
9,146 11,341 10,978 13,537

9 11 13 15 48
C
9,756 12,098 11,707 14,439

25 31 30 37 123
Total

Comprobar con un nivel de confianza del 95% si los tres métodos de envasado son igualmente buenos (homogéneos) o
existen diferencias significativas entre ellos.

H0: 1   2   3 (P1=P2=P3)
H1: Al menos dos de las medias son diferentes (Al menos dos de las proporciones son diferentes)

( f 0  f e ) 2 (6  6,098) 2 (15  14,439) 2


 
2
c   ......   1,02
fe 6,098 14,439

gl = (f – 1 )*(c – 1) = (3 – 1)*(4 – 1) = 6

0,95
α = 0,05

 t2  12,592

ESTADÍSTICA II 16
LCDO. JUAN FRANCISCO GÓMEZ
INTERVALO DE CONFIANZA Y CONTRASTE DE HIPOTESIS PARA UNA VARIANZA POBLACIONAL

La varianza de cantidad de llenado de vasos de refresco en una llenadora automática es de


mucha importancia para el propietario de una fuente de sodas. Si la varianza es demasiado
grande habrá sobrellenado y llenado escaso, lo que provocará la insatisfacción de los
clientes. Una varianza aceptable de cantidades de llenado es como máximo 0,25. en una
prueba de llenado con determinada máquina, con una muestra de 18 vasos se obtuvo una
varianza de 0,4. a) ¿Indican los resultados de la muestra que se debe ajustar el mecanismo
de llenado de la máquina porque hay una gran varianza de cantidades de llenado? Emplee
un nivel de significancia igual a 0,05. b) Determine un estimado de intervalo de confianza
de 90% para la varianza de cantidades de llenado de la máquina

a) Para contrastar la hipótesis se sigue los pasos conocidos:


1) H0:  2  0,25

2) H1:  2  0,25

(n  1) * s 2 (18  1) * 0,4
3)  c    27,2
2

2 0,25
4) Zona de aceptación y de rechazo

gl = n – 1 = 18-1 = 17

α = 0,05

27,587

Como  c  27,2   t  27,587  Se acepta la hipótesis nula, por lo tanto no debe ajustarse la máquina
2 2

ESTADÍSTICA II 17
LCDO. JUAN FRANCISCO GÓMEZ
b) Para calcular intervalo de confianza,

( n  1).s 2 ( n  1).s 2
  2

 2 2 
1
2 2

(18  1).0,4 (18  1).0,4


2 
 0.1
2
 2 0.1
1
2 2

17 * 0,4 17 * 0,4
 2 
27,587 8,672

0,2465   2  0,7841

La varianza real del llenado cantidades de llenado de la máquina oscila entre 0,2465 y 0,7841 con un 90% de
confianza.

ESTADÍSTICA II 18
LCDO. JUAN FRANCISCO GÓMEZ
DISTRIBUCIÓN F DE FISHER

Se le dio este nombre en honor a Sir Ronald Fisher, uno de los fundadores de la estadística moderna. Esta
distribución de probabilidad se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas
iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se
aplica cuando se trata de comparar simultáneamente varias medias poblacionales. Las poblaciones deben ser normales
y los datos tener al menos la escala de intervalos.

S 12
La distribución F está asociada al cociente de dos variables Ji cuadrados independientes; F= donde S 12 y
S 22
S 22 son las varianzas de las muestras de tamaño n 1 y n 2 , con distribución  2 con grados de libertad(n - 1).

12
(n1  1)
Entonces podemos decir que: F
 22
(n2  1)

s 12 * (n1  1)
 12 s 12
 1
2

s 2 * (n  1) (n1  1) (n1  1) 1 2

como  2  entonces F   
2  22 s 22 * (n2  1) s 22
(n2  1)
 22  22
(n2  1)

Características de la distribución F

1. Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los
grados de libertad en el numerador y en el denominador.

ESTADÍSTICA II 19
LCDO. JUAN FRANCISCO GÓMEZ
F(gln;gld;α)

gln = Grados de libertad del numerador


gld = Grados de libertad del denominador

2. La distribución F es una distribución continua.

3. F no puede ser negativa

4. La distribución F es asimétrica; está sesgada a la derecha, es decir, tiene un sesgo positivo

5. A medida que aumentan los valores, la curva se aproxima al eje x, pero nunc a lo toca

6. Las tablas de valores críticos de F sólo presentan los del lado derecho. En caso de necesitar el valor crítico en
la cola de la izquierda, éste se obtiene calculando el recíproco del valor crítico relacionado que resulta de la tabla

1
F( gl n ; gl d ;1   ) 
F( gl d ; gl n ;  )

ESTADÍSTICA II 20
LCDO. JUAN FRANCISCO GÓMEZ
INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS
s12
 2 s2 * 2
F  12  12 22
s2 s2 *  1
 22

s2 * 2 1 s2 * 2 1
F  12 22  F  22 12 
1

s2 *  1 F s1 *  2 F 
2 2 1
2 2

1 1
F F  1 s12  12 1 s2
1 2 1 * 2  2  * 12
2
 12  2 2 F s2  2 F  s2
s 2
2 2 s2 2
1
2
2
s 1 s12
.
Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran el la tabla:
Método 1 Método 2
n1= 31 n2 = 25 Construya un intervalo de confianza del 90%
= 50 = 24

El contenido de nicotina de dos marcas de cigarrillos se muestra en la siguiente tabla.

Marca A Marca B

Tamaño de la muestra 10 8

Media muestral 3,1 2,7

Desviación estándar muestral 0,5 0,7

Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas
desconocidas, construya un intervalo de confianza del 98% para la relación de las dos varianzas de los contenidos de
nicotina de las dos marcas de cigarrillos.

El intervalo de confianza del 98% para la relación de la varianza de la marca B (la mayor) a la varianza de la marca A
está dado por

Si se hubiera construido la relación de la varianza de la marca A a la marca B el intervalo de confianza estaría dado por:

ESTADÍSTICA II 21
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE DE HIPÓTESIS PARA DOS VARIANZAS POBLACIONALES

11-53. La compañía POLAR está preocupada por la variabilidad en el número de bacterias producidas por diferentes
cultivos. Si los cultivos tienen una variabilidad significativamente diferente en el número de bacterias producidas,
entonces los experimentos no son correctos y se obtendrá algún resultado extraño (La administración de la compañía
esta comprensiblemente ansiosa cuando los científicos producen cosas extrañas). Se han recolectados los datos
siguientes:

Nº de bacterias (en miles)


Cultivo A 91 89 83 101 93 98 144 118 108 125 138
Cultivo B 62 76 90 75 88 99 110 140 145 130 110

Pruebe a nivel de significancia de 0,02.

s A2  423,4

sB2  755,8 1

1) H0:  A2   B2

2) H1:  A2   B2

3) Se aplica el estadístico F

s B2 755,8 1
Fc = 2   1,785
sA 423,4
4)

ESTADÍSTICA II 22
LCDO. JUAN FRANCISCO GÓMEZ
F(10;10;0,99)= F(10;10;0,01)= 4,85

1 1
Como F c = 1,785 se encuentra entre F t(10;10;0,99) =  = 0,206 y F t(10;10;0,01) = 4,85; se acepta
F(10;10; 0 , 01) 4,85
la hipótesis nula, por lo tanto los cultivos no tienen una variabilidad significativamente diferente en el número de bacterias
producidas.

El gerente de producción de una compañía afirma que existe igual variabilidad en el rendimiento del segundo turno de
trabajo que la variabilidad en el rendimiento del primer turno de trabajo. El jefe de producción cree que la del segundo
turno es mayor que la del primero, por lo cual toma una muestra del rendimiento de 21 obreros del segundo turno cuya
varianza es 4.8 y toma una muestra del rendimiento de 16 obreros del primer turno cuya varianza es 2.9. Se pide probar
la hipótesis con un nivel de significación del 5%.

ESTADÍSTICA II 23
LCDO. JUAN FRANCISCO GÓMEZ
ANALISIS DE VARIANZA

A menudo resulta importante comparar diferencias en los resultados entre varios grupos para tal fin se crea
estudio de análisis de varianza, el cual nos permite estudiar la igualdad de medias o desigualdad de por lo menos dos de
ellas; siempre en tres o más poblaciones.

Los experimentos diseñados de un factor, en los cuales los sujetos o unidades experimentales son asignados
aleatoriamente a grupos o niveles de un solo factor se conocen como modelos de diseños de un sentido o
completamente aleatorizados.

Cuando las mediciones resultantes de los “k” grupos son continuas y se cumplen ciertas suposiciones, se
puede emplear una metodología conocida como análisis de varianza o ANOVA (ANalysis Of Variante) para comparar las
medias de los grupos o de varias poblaciones.

Supuestos para el análisis de varianza.


1.- Para cada población, la variable de respuesta está normalmente distribuida.
2.- La varianza de la variable de respuesta, representada por  2 , es la misma para todas las poblaciones.
3.- Las observaciones deben ser independientes.

ANOVA DE UN SOLO FACTOR


(Prueba de la igualdad de K medias de población).

Los resultados de un procedimiento de ANOVA por lo general se presentan en una tabla cuyo formato es el
siguiente:

SUMA DE GRADOS DE CUADRADOS


FUENTES CUADRADOS LIBERTAD (gl) MEDIOS F
TRATAMIENTO SCT k–1 CMT
ERROR SCE n–k CME
Fc
TOTAL SCTotal n–1

SUMA DE CUADRADOS TOTAL (SCTotal):

   X 
2

SCTotal   X T  2

n
T

SCTotal  SCT  SCE

SUMA DE CUADRADOS DEL TRATAMIENTO (SCT)


Mide la variabilidad entre los niveles del factor estudiado.

Ti 2   x 
2

SCT   
ni n

ESTADÍSTICA II 24
LCDO. JUAN FRANCISCO GÓMEZ
Donde: Ti  Sumatoria del factor en cada grupo.

N i  Tamaño de cada grupo.

SUMA DE CUADRADO DEL ERROR (DENTRO DEL GRUPO) (SCE)


Mide la variabilidad dentro de los grupos.

 
SCE   X 2  
Ti 2
n1

CUADRADO MEDIO DEL TRATAMIENTO (CMT)


Es el cociente de dividir la suma de cuadrados del tratamiento y los grados de libertad entre grupos.
SCT
CMT 
k 1

Donde: k = número de grupos.


CUADRADO MEDIO DEL ERROR (CME)
Es la razón entre la suma de cuadrados del error y los grados de libertad dentro de los grupos.
SCE
CME 
nk

Es de hacer notar que los grados de libertad totales es la suma de los grados de libertad del tratamiento y los
grados de libertad del error:
G1 T   G1 E   G1 Total 

Además el estadístico utilizado para el contrate de la hipótesis es F, el cual viene expresado por:
CMT
F 
CME

Para el contraste de hipótesis se utiliza:


H o : 1  2  3

H1  Por lo menos dos de las medias difieren o no todas las medias son iguales.

ESTADÍSTICA II 25
LCDO. JUAN FRANCISCO GÓMEZ
DIFERENCIA MENOS SIGNIFICATIVA o DIFERENCIA MINIMA SIGNIFICATIVA
Cuando empleamos el análisis de varianza para probar si son iguales las medias de “k” poblaciones, y el
rechazo de la hipótesis nula sólo nos permite concluir que las medias de población no son todas iguales, es necesario
aplicar un procedimiento que nos permita determinar dónde hay diferencia entre las medias. Este procedimiento es
conocido como la diferencia menos significativa de Fisher (LSD: least-significant difference) y se aplica a través de la
fórmula:

1 1 
LSD  t / 2. CME *   
 n1 n2 
Donde CME = cuadrado medio del error y t / 2. pertenece a una distribución t de student con n – k grados de libertad

1 1 
LSD  F(1; gld ; ) * CME * .  
 n1 n2 
Dos medias son diferentes, a nivel poblacional, siempre que:
x i  x j  LSD

PROBLEMA

Un inversionista está interesado en ver si existen diferencias significativas en las tasas de recuperación de acciones,
bonos y fondos mutualistas. Ha tomado muestras aleatorias de cada tipo de inversión y ha registrado los siguientes
datos:
Tasa de reembolso (%)
Acciones 2.0 6.0 2.0 2.1 6.2 2.9
Bonos 4.0 3.1 2.2 5.3 5.9
Fondos Mutuos 3.5 3.1 2.9 6.0
a) Establezca las hipótesis nula y alternativa.
b) Pruebe sus hipótesis al nivel de significancia de 0,05
c) Establezca una conclusión explícita.

1) H0: 1   2  3

2) H1: Al menos dos de las medias de las tasas de reembolso (%) son diferentes

3) Para calcular la estadística de prueba, la F de Fisher, se aplica la siguiente tabla:


SC Gl CM Fc
Tratamiento .0,8965 3-1=2 0,44825 0,150

ESTADÍSTICA II 26
LCDO. JUAN FRANCISCO GÓMEZ
Error 35,860833333333 15-3=12 2,988402778
Total 36,757333333333 15-1 =14

2

  Xt 
2
 57,2 2 
SCTotal = X t
= 254,88 -  36,757 3
n 15

 Ti2    X t  2  21,2 2 20,5 2 15,5 2   57,2  2


 
SCT =
 n  n
= 
 6

5

4
 
 15
= 0,8965
 i 

Ti2  21,2 2 20,5 2 15,5 2 


 Xt  
2
SCE = = 254,88      = 35,86083333333333
ni  6 5 4 

SCE = SCTotal – SCT = 36,757 3 - 0,8965 = 35,86083333

F(2;12;0,05)=3,89

Como Fc = 0,15 < Ft ( 2;12;0 , 05 )  3,89 , se acepta la hipótesis nula; por lo tanto, no existen diferencias
significativas en las tasas de recuperación de acciones, bonos y fondos mutualistas

Si consideramos tres grupos de estudiantes, a dos de los cuales se les aplicó dos métodos especiales de enseñanza,
manteniendo al tercer grupo con el régimen normal de estudios. Se quiere comprobar si existen diferencias significativas
entre las calificaciones promedio obtenidas por los grupos y determinar entre qué grupos está la diferencia, con un error
tipo I del 5%. Los datos obtenidos para el análisis son los siguientes:

∑x Media

Método I 13 12 10 8 6 11 60 10
Método II 15 14 11 12 10 13 75 12,5
Régimen Normal 16 20 13 14 18 15 96 16

ESTADÍSTICA II 27
LCDO. JUAN FRANCISCO GÓMEZ
1) H0: 1   2  3

2) H1: Al menos dos de las medias son diferentes

3) Para calcular la estadística de prueba, la F de Fisher, se aplica la siguiente tabla:


Fuentes de SC gl CM Fc
variación
Entre grupos 109 3-1=2 54,5
Dentro de los 85,5 18-3=15 5,7 9,561
grupos
Total 194,5 18-1 =17

2

  Xt 
2
 231 2
SCTotal = X t
= 3159 -  194,5
n 18

 Ti2    X t  2  60 2 75 2 96 2   231 2
SCT =   
 n  =      = 109
 i  n  6 6 6  18

Ti2  60 2 75 2 96 2 
SCE =  X  
2
= 3159      = 85,5
t
ni  6 6 6 

SCE = SCTotal – SCT = 194,5 - 109 = 85,5

F(2;15;0,05)=3,68

Como Fc = 9,561 > Ft ( 2;15; 0, 05)  3,68 , se rechaza la hipótesis nula; por lo tanto, existe diferencias significativas
en los promedios de los grupos estudiados

ESTADÍSTICA II 28
LCDO. JUAN FRANCISCO GÓMEZ
Ahora a fin de determinar cuáles de los grupos son diferentes se procede a aplicar la formula de la diferencia menos

1 1  1 1 
significativa: LSD  F(1; gld ; ) * CME *     F(1;15;0, 05) * CME *   
 n1 n2   n1 n2 

1 1
= 4,543077 * 5,7 *     2,938000391
6 6
Como el número de datos es igual para los tres grupos LSD es constante así que podemos comparar con los valores
absolutos de las diferencias de las medias

xi  x j  10  12,5  2,5  LSD. Las medias del grupo 1 y 2 son iguales


xi  x j  10  16  6  LSD. Las medias del grupo 1 y 3 son diferentes
xi  x j  12,5  16  3,5  LSD. Las medias del grupo 2 y 3 son diferentes

En caso de que el número de datos sean diferentes deben calcularse LSD para cada par de datos y comparar con sus
respectivas medias

 1 1  1 1
LSD  t  * CME * 
n  n   2,131* 5,7 *     2,937380789
2
 1 2  6 6
xi  x j  10  12,5  2,5  LSD. Las medias del grupo 1 y 2 son iguales
xi  x j  10  16  6  LSD. Las medias del grupo 1 y 3 son diferentes
xi  x j  12,5  16  3,5  LSD. Las medias del grupo 2 y 3 son diferentes

EJERCICIOS PROPUESTOS

1. Una empresa empaca determinado producto de latas de tres tamaños distintos, cada uno en distinta línea de
producción. La mayor parte de las latas se apegan a las especificaciones, pero un ingeniero de control de calidad ha
identificado los siguientes defectos:
 Mancha en la lata.
 Grieta en la lata.
 Ubicación incorrecta del anillo de apertura.
 Falta del anillo de apertura.
 Otras.
Se selecciona una muestra de unidades defectuosas de cada una de las tres líneas , y cada unidad se clasifica según el
defecto, la siguiente tabla de contingencia incluye esos datos:

DEFECTO
MANCHA GRIETA UBICACION FALTA OTROS
LINEA DE 1 34 65 17 21 13
PRODUCCION 2 23 52 25 19 6
3 32 28 16 14 10

¿Los datos sugieren desigualdad en las proporciones que caen en las distintas categorías de las tres líneas? Nivel de
confianza de 95%

2. Se obtuvo una muestra aleatoria de individuos que viajan solos en automóvil al trabajo, en una gran zona
metropolitana, y cada individuo fue clasificado de acuerdo con el tamaño de su automóvil y la distancia de recorrido

ESTADÍSTICA II 29
LCDO. JUAN FRANCISCO GÓMEZ
citadino. ¿La siguiente información sugiere que dicha distancia y el tamaño del automóvil están relacionados en la
población a la cual se hizo el muestreo? Exprese las hipótesis pertinentes y utilice una prueba Chi-cuadrado con un nivel
0.05.
DISTANCIA DE RECORRIDO
[0,10) [10,20) [20,∞)
SUBCOMPACTO 6 27 19
TAMAÑO DE COMPACTO 8 36 17
AUTOMOVIL MEDIANO 21 45 33
GRANDE 14 18 6

3. De cada una de tres comunidades se sacó una muestra de jóvenes casados. A cada pareja se le pidió que
especificara la cantidad mínima de educación que esperaba que sus hijos recibieran. La siguiente tabla muestra los
resultados que se observaron en la muestra:

COMUNIDAD
NIVEL MINIMO A B C
PRIMARIA 30 28 24
SECUNDARIA 30 19 46
UNIVERSITARIO 90 78 130

¿Qué se puede concluir respecto a la homogeneidad de las aspiraciones en la educación de los hijos? Nivel de
confianza de 95%

4. Un investigador desea saber si es posible concluir que hay relación entre el grado de liberalismo y la posición en la
universidad en una población de estudiantes universitarios. Para estos efectos se seleccionó una muestra de 500
estudiantes. La tabla siguiente muestra la clasificación de los datos según sus respuestas:

GRADO DE LIBERALISMO
CLASE LIGERO MODERADO ALTO
1ER. AÑO 30 83 37
2DO. AÑO 19 56 50
3ER. AÑO 16 46 63
4TO, AÑO 10 38 52
¿Qué se puede concluir respecto al problema del investigador?

5. Una compañía que produce una parte maquinada para un motor, afirma que tiene una varianza de diámetro no mayor
a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone
que las medidas del diámetro se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor?
Use α = 0.05.

6. En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente distribución en función de sus edades y
de su intención de voto:

RANGO DE EDAD
Partido [18, 35) [35, 50) [50 o mas
A 10 40 60
B 15 70 90
C 45 60 35
D 30 30 15

A un nivel de confianza del 90% ¿Puede afirmarse que la intención de voto es independiente de la edad?

7. En la encuesta telefónica realizada el pasado curso por los alumnos los resultados fueron muy dispares, mientras
algunos realizaron las cuatro entrevistas programadas otros no consiguieron completar ninguna de ellas. La distribución
del número de entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la siguiente:

ESTADÍSTICA II 30
LCDO. JUAN FRANCISCO GÓMEZ
N° de entrevistas N° de alumnos
0 6
1 16
2 24
3 9
4 2

A un nivel de confianza del 90% ¿Puede afirmarse que estas diferencias han sido debidas al azar? O por el contrario
están motivadas por alguna otra causa.
Nota: Para calcular el valor del estadístico necesitamos las probabilidades de los valores, para ello es preciso estimar
previamente el valor de P a partir de los datos de la muestra.
El total de llamadas ha sido 57·4 = 228.
Las llamadas con éxito han sido 1·16 + 2·24 + 3·9 + 4·2 = 99.
La proporción de éxito es 99/228 = 0,4342.

8. Se sabe por experiencia que el tiempo que tarda el servicio de caja de una empresa prestadora del servicio de agua
de una región para atender a los clientes que llegan a efectuar el pago mensual del servicio se distribuye normalmente.
Se pide estimar el intervalo de confianza para la desviación estándar poblacional del tiempo requerido para atender los
pagos que efectúan los clientes, con un nivel de confianza del 95%, si para el efecto se tomó una muestra aleatoria de
25 clientes que arrojó una desviación estándar de 1.8 minutos.

9. Una muestra aleatoria de 41 paquetes de cierta semilla presenta una desviación estándar de en su peso de 1.6 onzas
Construir un intervalo de confianza del 95% para el verdadero valor de la desviación estándar poblacional. Se sabe que
los pesos de los paquetes se distribuyen normalmente.

10. El tiempo que transcurre para los obreros de una gran compañía entre el momento del ingreso a la planta y el
momento en que están listos para recibir las orientaciones de su jefe inmediato, se distribuye normalmente. Una muestra
de 20 obreros arroja una desviación estándar de 3.5 minutos. Se pide calcular el intervalo de confianza del 99% para la
desviación estándar del tiempo transcurrido para todos los obreros de la compañía.

11. Una muestra aleatoria de 8 pedidos que le hacen a una compañía, nos muestra que los mismos demoraron en ser
atendidos así: 10, 12, 19, 14, 15, 18, 11 y 13 días. Construir el intervalo de confianza del 99% para la desviación
estándar del tiempo que tarda la compañía en atender la orden:

12. Las pruebas efectuadas a una muestra aleatoria de 40 motores mostraron que tenían una desviación estándar de la
eficiencia térmica del 1.6%. Calcule el intervalo de confianza para grandes muestras del 95% para la desviación
estándar.

13. La gerencia de una empresa avícola considera que la variabilidad que se presenta en el peso de los pollos de 3
meses es aceptable, puesto que cree que la desviación estándar de los pesos es de 250 gramos. Un grupo de socios de
la empresa pone en duda lo manifestado por la gerencia y considera que la variabilidad es superior; por lo cual 6 meses
después la gerencia ordena tomar una muestra de 30 pollos de 3 meses seleccionados aleatoriamente y encuentra que
la desviación estándar de la misma es de S=225 gramos. Con un nivel de significación del 5%, compruebe quien tiene la
razón.

14. Se quiere comprobar si la variabilidad en la duración de unas lámparas marca A es igualmente variable que la
duración de otra marca B de la competencia. Para tal fin, se toma una muestra aleatoria de 13 lámparas tipo A y se
encuentra que la desviación estándar muestral es S=8, mientras que en otra muestra aleatoria de 13 lámparas tipo B se
encuentra que la desviación estándar muestral es de S=4. Se pide probar la hipótesis nula de que la variabilidad es igual
en ambas poblaciones con un nivel de significación del 5%.

15. Dos muestras aleatorias de tamaños 10 y 16 se han tomado respectivamente de dos poblaciones normalmente
distribuidas y las varianzas correspondientes fueron de 23 y 20. Determinar si la primera muestra tiene una varianza
significativamente mayor que la segunda. Nivel de significación del 1%.

ESTADÍSTICA II 31
LCDO. JUAN FRANCISCO GÓMEZ
16. El gerente de producción de una compañía afirma que existe igual variabilidad en el rendimiento del segundo turno
de trabajo que la variabilidad en el rendimiento del primer turno de trabajo. El jefe de producción cree que la del segundo
turno es mayor que la del primero, por lo cual toma una muestra del rendimiento de 21 obreros del segundo turno cuya
varianza es 4.8 y toma una muestra del rendimiento de 16 obreros del primer turno cuya varianza es 2.9. Se pide probar
la hipótesis con un nivel de significación del 5%.

19. Se quiere comparar el grado de variabilidad en el rendimiento de los obreros de dos compañía A y B y se encuentra
que en una muestra aleatoria de n 1=16 obreros de la compañía A la desviación estándar es S 1=14.07 unidades/hora,
mientras que en otra muestra aleatoria de n 2= 24 obreros de la compañía B el valor de la desviación estándar es
S2=20.86 unidades/hora. ¿Se puede concluir que la variabilidad en el rendimiento es menor en la compañía A que en la
B? Utilice un nivel de significación del 10%. El rendimiento de los obreros se distribuye normalmente en ambas
compañías.

20. Desde hace algún tiempo la desviación estándar del contenido de jugo de unos envase llenados por una máquina es
de 0.22 onzas. Se sospecha que dicha variabilidad en el contenido ha aumentado, por lo cual se toma una muestra
aleatoria de 20 envases los cuales arrojan una desviación estándar de 0.32 onzas. ¿Considera usted que el aumento de
la variabilidad es real? Nivel de significación del 5%

21. Dos máquinas diferentes A y B se utilizan para producir pernos idénticos que deben tener 2 pulgadas de longitud . Se
toma una muestra aleatoria de 25 pernos de la producción de la máquina A y otra muestra aleatoria de 25 pernos de la
máquina B, las cuales arrojan varianzas de 0.03 y 0.04 pulgadas 2 respectivamente. ¿Evidencian los anteriores datos que
la varianza de B es mayor que la de A? Utilice un nivel de significación del 5%. Respuesta: Según tablas F=1.98. Como
el valor calculado de F=1.33 se encuentra en la zona de aceptación, entonces, existe igual variabilidad para ambas
máquinas.

22. Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene una distribución de
Poisson. A continuación se presentan los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la
creencia de que el número de accidentes por dia tiene una distribución de Poisson?

Numero de accidentes Frecuencia observada (días)


0 34
1 25
2 11
3 7
4 3

23. El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tienen una distribución de
Poisson. Use de α = 0,1 y los datos siguientes para probar este suposición.

Número de llamadas Frecuencia observado


telefónicas que llegan
por minuto
0 15
1 31
2 20
3 15
4 13
5 4
6 2

24. Siete por ciento de quienes invierten en fondos mutualistas consideran que las acciones corporativas son “muy
seguras”, 58% las considera “relativamente seguras”, 24% las considera “no muy seguras”, 4% las considera “”nada
segura” y 7% “no están seguros”. Business/week/Harris pregunto a 529 inversionistas de fondos mutualistas como
calificarían ellos bonos corporativos respecto de su seguridad. Las respuestas fueron las siguientes

ESTADÍSTICA II 32
LCDO. JUAN FRANCISCO GÓMEZ
Seguridad Frecuencia ¿La actitud de los inversionistas en
Muy seguros 48 fondos mutualistas difiere respecto a
Relativamente seguros 323 los bonos corporativos de su actitud
NO muy seguros 79 frente a las acciones corporativas?
Nada seguros 16 Apoye su conclusión dando una
No están seguros 63 prueba estadística. Use α = 0,01

25. De una muestra de piezas se obtiene la tabla de contingencia siguiente sobre la calidad, de acuerdo con el
turno de producción
turno Numero de piezas Numero de defectuosos Use α = 0,05 para probar la hipótesis
Primero 368 32 de que la calidad es independiente
Segundo 285 15 del turno de producción. ¿Cuál es la
Tercero 176 24 conclusión?

26. The Wall Street Journal hizo un estudio sobre el tipo de empleo de sus suscriptores. Los siguientes datos muestrales
corresponden a las ediciones del este y del oeste.
Región Use α = 0,05 para
Tipo de empleo Edición del este Edición del oeste probar la hipótesis de
Tiempo completo 1105 574 que el tipo de empleo
Medio tiempo 31 15 es independiente de la
Autoempleo/consultor 229 186 región. ¿Cuál es la
No empleado 485 344 conclusión?

27. Un vendedor hace cuatro llamadas por dia. En una muestra de 100 días los
volúmenes de venta son los siguientes.
Numero de ventas Frecuencia (días) Por experiencia se sabe que 30% de las
0 30 llamadas llevan a una venta. Si las
1 32 llamadas de ventas son independientes,
2 25 el número de ventas por días deberá
3 10 seguir una distribución binomial. Use un
4 3 nivel de significancia de 0,05

28. En una auditoria, los auditores tienen que dar opiniones acerca de diversos aspectos con base en sus propias
experiencias directas, indirectas o en una combinación de ambas. En un estudio se pidió a auditores que dieran su
opinión acerca de la frecuencia con que se presentan errores en una auditoria. Suponga que se obtuvieron los resultados
que se presentan a continuación; valores bajos indican opiniones mas acertadas.
Directa Indirecta combinado
17 16,6 25,2
18,5 22,2 24 Use α = 0,05 para determinar si el tipo de
15,8 20,5 21,5 experiencia en que se basa la opinión afecta la
18,2 18,3 26,8 calidad de la misma
20,2 24,2 27,5
16 19,8 25,8
13,3 21,2 24,2

29. En un experimento diseñado para investigar la percepción de los valores éticos


corporativos entre personas especializadas en marketing se obtuvieron los datos
siguientes (puntuaciones mas altas indican valores éticos mas elevados)
Gerentes de Investigación en Publicidad
marketing marketing
6 5 6 Use α = 0,05 para probar si
5 5 7 existe una diferencia
4 4 6

ESTADÍSTICA II 33
LCDO. JUAN FRANCISCO GÓMEZ
5 4 5 significativa de percepción
6 5 6 entre los tres grupos.
4 4 6

30. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran el la tabla:
Método 1 Método 2 Construya un intervalo de confianza del 90%
n1= 31 n2 = 25
= 50 = 24

31. En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas. Robo-fill se
usa para llenar 16 tarros y da una desviación estándar de 1.9 onzas en el llenado. Con Automat-fill se llenan 21 frascos
que dan una desviación estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en función de la
uniformidad de llenado. ¿Cuál deberá seleccionar? Use un a = 0.10.

32. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos
medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el
torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco
registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con a = 0.05 si existe
diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales.
Medicamento A Medicamento B
nA = 12 nB = 12
= 26,8 = 32,6

= 15,57 17,54

33. La Asociación Nacional de Comerciantes en Automóviles (ANCA) quiere comparar el comportamiento del gasto de gasolina de distintas
marcas de autos, para ello obtuvo una muestra aleatoria del consumo de gasolina en litros de dichos automóviles en 40 de sus distintos modelos.
Utilice un Alfa de 0.051. ¿El consumo de gasolina tienen un comportamiento similar?2. ¿Qué automóvil gasta menos gasolina?
(miles)

Honda-Civic Honda- Accord Nissan -Sentra Nissan TIIDA


50 35 40 37
30 32 36 40
39 33 38 42
47 38 42 30
35 48 65 33
53 35 38 38
48 43 46 40
42 40 45 46
40 50 50 49
55 49 50 50

34. Un productor de pinturas para viviendas desea comparar el factor brillo de su pintura utilizando cuatro emulsiones
diferentes. Se pintan cinco tablas con cada tipo de emulsión y la clasificación que se dio a casa una aparece aquí

1 79 82 57 79 83 Al nivel del 1% , existe


2 69 52 62 61 60 alguna diferencia en la
Emulsión
3 83 79 85 78 75 clasificación promedio?
4 75 78 78 73 71

35. Muchas leyes estatales antiusura, promulgadas para regular los tipos de interés que los prestamistas pueden cargar,
establecen limitaciones a la variación de dichos tipos. Para evitar la discriminación contra los prestatarios, una ley

ESTADÍSTICA II 34
LCDO. JUAN FRANCISCO GÓMEZ
establece que la desviación típica de los tipos no puede ser superior al 0,50% durante un período de seis meses. La
comisión bancaria estatal elige al azar ocho préstamos concedidos por un prestigioso banco y halla los tipos de interés
siguientes: 6,2 8,9 7,3 6,8 7,9 8,1 7,5 y 6,9%. Al nivel del 5%, ¿infringe el banco las leyes estatales antiusura?

36. La cadena de comida rápida, afirman que la desviación típica es en realidad de 24000 dólares, y que su muestra de
20 concesionarios, que dio una desviación típica de 31300 dólares. El intervalo de confianza del 90% para la varianza de
los ingresos confirma la afirmación dada?

37. En un estudio para determinar si la opinión de la población es homogénea respecto al programa de privatización de
empresas públicas, se tomaron muestras aleatorias de tamaño 325, 164, 255 y 56 ciudadanos, de los departamento de
Lima, Cuzco, Arequipa y Piura respectivamente. Los resultados se muestran en el siguiente cuadro:

Opinión
Departamento Favorable Desfavorable No Opina Total
Cuzco 23 56 164
Lima 128
Arequipa 128 26 255
Piura 34 7 15
Total 400 300 800
Realice la prueba respectiva. Use =0.01

40. Una teoría fundamental en análisis financiero es que cuento menor sea la desviación de los rendimientos de un
activo menor es el riesgo asociado a dicho activo. Una desviación más pequeña garantizará que el rendimiento real sea
más cercano al esperado. Un intermediario financiero busca una inversión de poco riesgo para uno de sus clientes. La
selección ha sido ya limitada a dos valores, de cuyos rendimientos se extrae una muestra. El primer valor tiene unos
rendimientos de: 5,2; 7,3; 6,9; 6,5; 7,9; 4,1; 4,5 y 7,7%. El segundo valor rinde el 6,3; 6,9; 5,7; 6,2; 6,4; 6,8; 5,8; 6,5 y
6,1%. ¿Qué valor debe ser el elegido al nivel del 10%.

41. Desde que los intermediarios financieros trabajan a comisión en casi todas las
operaciones, están interesados en la actividad transaccional del mercado bursátil. Se hace
un estudio para determinar si existe diferencia en las comisiones medias pagadas según el
día de la semana y se recopilan los datos que aquí se muestran, en centenares de dólares. Al
nivel del 1%, ¿parece que todos días de la semana son igualmente rentables?
Lunes Martes Miércoles Jueves Viernes
21 28 11 15 25
26 21 14 14 23
24 19 12 12 26
32 15 10 12 28
25 12 10 16 24
26 10 12 13 25
24 13 15 18 29

42. El gerente de una planta industrial pretende determinar si el número de empleados que asisten al consultorio médico
de la planta se encuentran distribuidos en forma equitativa durante los 5 días de trabajo de la semana. Con base en una
muestra aleatoria de 4 semanas completas de trabajo, se observaron doscientas cuatro consultas:

Lunes Martes Miércoles Jueves Viernes


x

Con α = 0,05, ¿existe alguna razón para creer que el número de empleados que asisten al consultorio médico, no se
encuentra distribuido de forma equitativa durante los días de la semana?

ESTADÍSTICA II 35
LCDO. JUAN FRANCISCO GÓMEZ
43. Para probar si hay alguna diferencia significativa entre la cantidad de horas entre las descomposturas respectivas de
cuatro máquinas se obtuvieron los siguientes datos:

Maquinas
1 2 3 4
6,4 8,7 11,1 11,5
7,8 7,4 10,3 11,3
5,3 10,1 9,7 12,8
7,4 9,2 10,3 9,9
8,4 9,2
7,3
Al nivel de significancia del 5%, ¿hay alguna diferencia entre las medias poblaciones de los tiempos de las cuatro
maquinas?

44. Considere que la demanda semanal de un producto tiene una distribución normal y
pruebe esta aseveración con un error tipo I del 10%
18 20 22 27 22 25 22 27 25 24
26 23 20 24 26 27 25 19 21 25
26 25 31 29 25 25 28 26 28 24

45. A continuación vemos una muestra de estimados de rendimientos por acción, para 2008

Empresa AT&T Caterpillar Kodak Exxon HP IBM McDonald’s Wal-Mart


Rendimiento 2,92 4,65 4,27 3,09 3,57 7,04 2,64 1,74
¿Cuál es el intervalo de confianza de 95% para la desviación estándar poblacional?. Si asesor anuncia que el
rendimiento de las acciones de las empresa es superior a 5, ¿considera usted que tal aseveración es cierta?. Pruebe con
un error tipo I del 1%

46. Los datos de 3 proveedores en relación a partes defectuosas es como sigue: Probar a un 5% de significancia si los
defectos dependen del tipo de proveedor.

Proveedor Buenos Con Def menores Con def graves


A 90 3 7
B 170 18 7
C 135 6 9

47. Una empresa está considerando un cambio organizacional. Para evaluar las actitudes de los empleados hacia este
cambio, se selecciona una muestra de 400 empleados y se les preguntó acerca de sus actitudes hacia la implantación de
una política por la que un empleado podría tomar un día de vacaciones adicional al mes sin paga. Los resultados
clasificados por tipo de empleo son como sigue:
ACTITUD HACIA LAS VACACIONES SIN PAGA
TIPO DE TRABAJO A favor Neutral En contra
Trabajador por horas 135 23 67
Supervisor 39 7 14
Administrador de nivel medio 47 6 22
Administrador de nivel superior 26 6 8
Con un nivel de significancia de 2,5%, ¿hay evidencia de una relación entre la actitud hacia el tiempo de vacaciones sin
paga y el tipo de empleo? (Webster)

48. La directora de la sucursal bancaria del Provincial piensa que en su sucursal los cheques sin fondo siguen una
distribución de Poisson. Sabe que el número medio de estos cheques en su sistema bancario es de 3,6 diarios. Toma
una muestra en un periodo de 95 días y halla los datos que aparecen a continuación:
# de cheques sin fondos diarios 0 1 2 3 4 5 6 o más
días 12 14 13 15 14 15 12

ESTADÍSTICA II 36
LCDO. JUAN FRANCISCO GÓMEZ
Prueba la afirmación un nivel del confianza del 99,5% (Webster)

49. El director de producción de una textilera, tiene que garantizar que la combinación de sus productos cumplen un
determinado sistema de cuotas. También tiene instrucciones para ajustarla a un esquema que produzca el 30% de
productos de seda, el 20% de lana, el 10% de algodón y el 40% de cuero. De las 200 últimas unidades producidas, 65
fueron de seda, 5 de lana, 25 de algodón y 65 de cuero. Al nivel del 5%, ¿debe ajustar el esquema de producción actual?
(Webster)

50. Los tiempos necesarios en minutos para ejecutar un trabajo fueron 4,2; 7,1; 5,5; 4,6; 4,8; 6,8; 6,9; 6,2; 6,4 y 5,9. El
jefe del sindicato afirma que la varianza de la población de tiempos de ejecución es inferior a los 0,9 minutos 2 acordados
en el convenio colectivo. Contrastar la hipótesis al nivel de confianza de 99%, ¿tiene razón el jefe del sindicato?. Calcule
e interprete el intervalo de confianza con un error 5% para la desviación típica poblacional? (Webster)

51. Desde siempre, un objetivo primario de los sindicatos ha sido la nivelación de salarios (reducción de las diferencias
salariales entre los trabajadores en general). Un estudio reciente indicaba que diez sectores muy sindicalizados
presentaban una desviación típica de los índices salariales (redondeada al dólar más próximo) de 17 dólares, mientras
que ocho sectores en que los sindicatos eran débiles o apenas existían deban una desviación típica de 19 dólares.
¿Parecen estar los sindicatos en el camino de lograr su objetivo? Poner α = 0,025 (Webster)

52. El economista jefe del SENIAT Lara no esta de acuerdo con su supervisor, Pago fiscal Contribuyentes
el cual afirma que los pagos fiscales siguen una distribución normal. Los datos 0 a 15 248
de 2000 contribuyentes dieron los resultados que se ven aquí. Al nivel del 1%, 15 a 30 232
¿tiene razón el supervisor? (Webster) 30 a 45 489
45 a 60 512
60 a 75 263
75 a 90 256

53. Los ejecutivos calificaron la calidad del servicio Aerolíneas Ventas al Hotelería Automotriz
que ofrecen varios ramos comerciales. Suponga que
menudeo
se obtuvieron las siguientes calificaciones para los
59 63 70 49
ramos dados; los números mayores indican más
56 49 68 55
elevada calidad del servicio. Con nivel de significancia
47 60 62 48
de 0,05, pruebe si hay alguna diferencia significativa
46 54 69 49
entre las medias poblacionales de las calificaciones
55 56 59 50
de las cuatro industrias. ¿Cuál es su conclusión?
54 55
(Anderson)
48

54. Un estudio económico sobre niveles de renta en Barquisimeto reveló en 1999 que de todos los beneficiarios de
ayudas sociales, el 60% eran desempleados, el 22% trabajaban menos de 20 horas semanales, el 10% trabajaban entre
20 y 30 horas, y el resto más de 30 horas. Se implantó un programa de formación profesional para aumentar la
probabilidad de empleo de los beneficiarios de ayuda social. En 2006, una encuesta mostró que de 1100 personas
inscritas en ayuda social, 679 eran desempleados, 237 trabajaban menos de 20 horas, 121 trabajaban entre 20 y 30
horas, y el resto más de 30 horas. Si el programa de formación profesional se ideo para alterar la estructura observada
en 1999, ¿se puede mantener el programa? Poner un error tipo I de 0,01.

55. He aquí los resultados de un estudio efectuado por Datnálisis para determinar la relación
entre la importancia que los propietarios de tiendas conceden a la publicidad y el tamaño de
la tienda que poseen. ¿Parece dar que todos los tenderos dan la misma importancia a la
publicidad? Usar alfa de 10%
Tamaño
Publicidad Pequeño Mediano Grande
Importante 20 52 32
No importante 53 47 28
No opinan 67 32 25

ESTADÍSTICA II 37
LCDO. JUAN FRANCISCO GÓMEZ
56. Los grandes almacenes Makro de Venezuela hicieron hace poco un estudio para determinar si había alguna relación
entre el estado civil de un cliente y el volumen de dólares de sus compras. Los resultados se muestran en la tabla. ¿Cuál
es su conclusión al nivel de significancia del 5%?
Volumen en dólares
< 10 10 - 19 20 - 29 30 - 39 40 - 49
Casado 32 23 15 12 14
Divorciado 51 17 10 15 13
Estado civil
Soltero 21 19 29 35 39
Viudo 18 15 19 10 9
57. El encargado de compras de unos grandes almacenes inspecciona cinco camiones de mercancías cada hora. Cada
uno contienen siete lotes de mercancía. Tiene que decidir si se compra la carga de cada camión. Hay una probabilidad
del 20% de que un camión sea aceptado. Con los datos de la tabla, ¿parece ser binomiales los niveles de aceptación? (α
= 0,05)

# de aceptaciones / 5 camiones 0 1 2 3 4 5
# de aceptaciones observadas 96 123 63 15 1 2

58, La tabla de frecuencias siguiente refleja datos de las ventas diarias durante 200 días. Con α = 0,05; ¿parecen seguir
las ventas una distribución normal?

VENTAS FRECUENCIA
40 59,9 7
60 79,9 22
80 99,9 46
100 119,9 42
120 139,9 42
140 159,9 18
160 179,9 11
180 199,9 12

59. El capataz de muelle de Puerto Cabello registró los datos aquí indicados sobre la llegada de camiones. Al nivel del
1%, ¿parece existir una distribución de Poisson?

# de llegadas por hora 0 1 2 3 4 5 6 7


Frecuencia (días) 10 11 14 15 12 14 12 9

60. Desde que los intermediarios financieros trabajan a comisión en casi todas las
operaciones, están interesados en la actividad transaccional del mercado bursátil. Se hace
un estudio para determinar si existe diferencia en las comisiones medias pagadas según el
día de la semana y se recopilan los datos que aquí se muestran, en centenares de dólares. Al
nivel del 1%, ¿parece que todos días de la semana son igualmente rentables?
Lunes Martes Miércoles Jueves Viernes
21 28 11 15 25
26 21 14 14 23
24 19 12 12 26
32 15 10 12 28
25 12 10 16 24
26 10 12 13 25
24 13 15 18 29

61. Se registraron los siguientes datos, en minutos que tardan algunos hombres y mujeres en realizar cierta actividad en
una empresa, los cuales fueron seleccionados aleatoriamente. Suponga que los tiempos para los dos grupos se
distribuyen normalmente. Determine un intervalo del 90% de confianza para el cociente de las varianzas

ESTADÍSTICA II 38
LCDO. JUAN FRANCISCO GÓMEZ
HOMBRES MUJERES
n1=14 n2=25
Media=17 Media=19
Varianza=1,5 Varianza=1,8

62. Como gerente de producción de Sports Wear, Inc., Beverlee Hillsdebe garantizar que las tallas de su nueva línea de
ropa deportiva se produzcan de acuerdo con un patrón predeterminado. La investigación de mercado indica que los
clientes prefieren 20% extra grande, 30% grande, 25% mediana y el resto pequeña. Una muestra aleatoria de 145
prendas revela 32 extra grandes, 40 grandes, 41 medianas y 32 pequeñas. Al nivel del 5%, ¿parece que se están
manteniendo las proporciones deseadas de tamaño?

63. Una empresa manufacturera tiene un perdido de 15 mil playeras que debe entregar en 3 meses. Para el cliente es
muy importante que la cantidad de poliéster sea de 30 gramos y que la varianza no sea superior a 4 gramos 2, por lo que
cada 15 días hará una revisión en las playeras producidas. En la primera revisión se toma una muestra aleatoria de 300
playeras donde la varianza del contenido de poliéster resulta ser de 3,5. Determine, con un nivel de significancia de 0,05;
si se está cumpliendo con los requerimientos del pedido.

64. Una empresa de tecnología tiene establecida una inversión promedio de $ 1500000 con una varianza de $100000
por cada investigación. El área de diseño del producto ha propuesto una serie de proyectos de investigación para el
próximo periodo; una muestra aleatoria de estos 3 refleja que la inversión necesaria por cada uno seria
aproximadamente de $1700000 con una varianza de $150000. Con un nivel de significancia de 0,05; determinar si la
varianza ha cambiado y decida si es viable aceptar o no dichos proyectos.

65. Se realizó una encuesta para determinar si la edad está relacionada con la opinión de los ciudadanos sobre el tipo de
seguridad social para los trabajadores, y se obtuvieron los siguientes resultados:
Grupo de Edad Pruebe si estas dos variables son independientes
Tipo de seguridad social 18-30 31-60 Más de 60 con un nivel de significancia de 0,05
Garantizada por el Estado 92 137 72
Con fondos de pensiones 61 114 56
Sin opinión 19 73 3

66. El gerente de un banco desea saber si el monto de las transacciones que se realizan se ajusta a una distribución
normal con un nivel de significación de 0,025. Toma una muestra aleatoria de 5000 transacciones y obtiene los
siguientes resultados:
Monto de la transacción fo
0 a menos de 1500 1500
1500 a menos de 3000 1300
3000 a menos de 4500 470
4500 a menos de 6000 500
6000 a menos de 7500 300
7500 a menos de 9000 200
9000 a menos de 10500 220
10500 a menos de 12000 100
12000 a menos de 13500 80
13500 a menos de 15000 60
15000 en adelante 270

67. El director de una aseguradora desea saber si el tipo de seguros depende de los ingresos
del cliente. Para investigarlo, toma una muestra aleatoria de 250 personas e identifica los
tipos de seguros que prefieren y cuáles son sus ingresos. Pruebe la independencia de estas
2 variables con un nivel de significación de 0,1
Tipos de seguro
Ingresos($) Total
A B C

ESTADÍSTICA II 39
LCDO. JUAN FRANCISCO GÓMEZ
0-5000 15 10 11 36
5001-15000 20 29 19 68
15001-30000 15 38 10 63
30001-adelante 20 23 40 83
Total 70 100 80 250

68. Un inversionista se interesa en instalar un centro comercial en una ciudad que tiene últimamente un rápido
crecimiento; él localizo 3 regiones en las afueras de la ciudad y desea saber si los ingresos de los habitantes cercanos a
esas áreas son iguales. Para ello hizo un estudio socioeconómico de algunas familias seleccionadas al azar en la
cercanía de cada corrida. La información en miles de pesos mensuales se da a continuación.
Región A Región B Región C Analice si se debe rechazar o no la hipótesis nula
24000 22800 26100
23600 26400 23600
23000 23800 24300
23300 21200 28100
27600 24800 24100
23100 20100 26200

69. Se reconoce que las actitudes negativas son un método efectivo de persuasión en la publicidad. Un estudio
que apareció en El Nacional informó los resultados de un análisis de contenido de anuncios culposos en 24
revistas. La cantidad de anuncios con actitudes de culpa, que aparecieron en ellas, es la siguiente:

Tipo de revista Cantidad de


anuncios culposos Pruebe con un nivel de
Noticias y opinión 20 confianza de 99% si hay una
Editorial general 15 diferencia en la proporción
Orientadas hacia la familia 30 de anuncios con actitudes de
Negocios y financieras 22 culpa que se publican en las
Orientadas hacia la mujer 16 6 clases de revistas. (bondad
Salud y recreación 12 de ajuste definida)

70. La empresa Savoy, fabricante de los chocolates con leche patrocinó una encuesta nacional en la que más
de 4 millones de personas indicaron su preferencia para un color nuevo. El conteo de esta encuesta dio como
resultado el reemplazo del color chocolate por un nuevo color azul. En el folleto “Colores” que publicó el
departamento de asuntos del consumidor de Savoy, la distribución de colores de los chocolates es como sigue:
Café Amarillo Rojo Naranja Verde Azul
30% 20% 20% 10% 10% 10%
En un estudio que apareció en Opiniones se usaron muestras de bolsas de 250 gramos para determinar si eran
válidos los porcentajes publicados. Se obtuvieron los siguientes resultados con una muestra de 506
chocolates:
Café Amarillo Rojo Naranja Verde Azul
177 135 79 41 36 38
Use un nivel de significancia de 0,05 para determinar si estos datos respaldan los que publicó la empresa

ESTADÍSTICA II 40
LCDO. JUAN FRANCISCO GÓMEZ

You might also like