You are on page 1of 38

UNIVERSIDAD NACIONAL DE INGENIERIA

ESTADISTICA

CLASE 09:INTERVALOS DE CONFIANZA – PRUEBA DE


HIPOTESISIS PARA DOS POBLACIONES

Material de Clases © G:P.P 6/26/18


Diferencia entre muestras independientes y dependientes

 Dos muestras son independientes o dependientes entre sí, en


función de si las observaciones de las muestras se han obtenido
de los mismos individuos u objetos o no.

 Si ambas muestras se obtienen de distintos individuos,


máquinas, empresas, objetos, etc…no hay nada en común en
dichas muestras lo que hace que ambas sean “independientes”.

 Sin embargo, si las observaciones o valores de ambas muestras


se obtienen de los mismos individuos, empresas, agentes, etc.,
diremos que hay algo en común en dichas muestras por lo que
serán muestras “dependientes” o (relacionadas)

Material de Clases © G:P.P 6/26/18


Material de Clases © G:P.P 6/26/18
Material de Clases © G:P.P 6/26/18
Material de Clases © G:P.P 6/26/18
Prueba de Hipótesis e I.C. para la diferencia de medias

a) Caso de varianzas σ12 y σ22 , conocidas (poco frecuente)


Si son las medias de las muestras aleatorias independientes de tamaño con
varianzas conocidas , respectivamente y la distribución muestral de las
diferencias de las medias está dado por el estadístico de prueba Z .

Entonces el intervalo de confianza para para es:

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para la diferencia de medias
b) Desconociendo σ21 y σ22 pero asumiendo σ21 = σ22

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para la diferencia de medias
c) Desconociendo σ21 y σ22 pero asumiendo σ21 ≠ σ22

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para la diferencia de medias

Sin embargo en la práctica no tiene mucho sentido pensar que se


conocen las varianzas.

Primero para probar la igualdad de varianzas, realizamos la prueba


de Levene (F) sobre la homogeneidad e igualdad de varianzas.

Ho: σ21 = σ22


H1: σ21 ≠ σ22

Si p= Sig < α entonces rechazamos H0


Si p= Sig ≥ α, entonces, no rechazamos H0, luego podemos
suponer que las varianzas son iguales

Material de Clases © G:P.P 6/26/18


Ejemplo 1: El jefe de compras de una fábrica está considerando la posibilidad de
comprar un nuevo tipo de fresadora. Ha determinado comprar la nueva máquina
si confirma que las piezas producidas con ella tienen una mayor resistencia a la
rotura que las de la máquina antigua. La desviación estándar de la resistencia a la
rotura para la máquina antigua es 25 Kg y para la nueva 20 Kg. Una muestra de
100 piezas tomada de la máquina antigua arrojó una resistencia media de 65 Kg.
en tanto que una muestra similar de la nueva maquina señaló una resistencia
media de 75 Kg. ¿Con  = 0,01, el jefe de compras debe adquirir la nueva
máquina?.

Solución .- De los datos del problema tenemos:

1=Nueva n1=100 5
2=Antigua n2=100 65

Las hipótesis a plantear son:


H0: No comprar la nueva máquina H0 : 1 = 2
H1: Comprar la nueva máquina H1 : 1 > 2
10
Nivel de significación:  = 0,01
Estadística de Prueba

75 - 65
zc = = 3,12
2 2
20 25
+
100 100
Hallar el intervalo de confianza al 99%
Valor crítico:
z1- = 2,33

Regla de Decisión:
Si zc > z1- se rechaza H0
Decisión de la Prueba: Rechazar H0
11
Ejemplo2: Los siguientes datos representan, los tiempos de duración en años, de un tipo de
pintura, con y sin aditivo de secado.
1=Con aditivo 2.1 5.3 1.4 4.6 0.9
2=Sin aditivo 1.9 0.5 2.8 3.1
a) Calcule un intervalo de confianza del 95% para la diferencias entre los tiempos de
duración promedio de la pintura con y sin aditivo

1º Realizar un Test para ver la normalidad.


2º Aplicar el Test de Levene para la igualdad de
varianza utilizando la distribución F de Fisher
Prueba de Hipótesis
Ho: σ21 = σ22
H1: σ21 ≠ σ22 Entonces los grados de libertad será: 4-1=3

1
Estadistico de prueba F / 2(v1,v 2) =
2 2
F1- / 2(v 2,v1)
s 1.97
F= 1
2
= = 2.85
s
2 1.167 2
Como 2,85 cae dentro del intervalo
1 1
entonces no se rechaza Ho y se asume F0.025( 4,3) = = = 0.1002
que tienen igual varianza F0.975( 3, 4) 9.98
Material de Clases © G:P.P 6/26/18
Test para probar la normalidad

Ho: Los datos tienen distribución Normal (


H1: Los datos NO tienen distribución Normal

Gráfica de probabilidad de años


Normal - 95% de IC
99
trata
con
95 sin

90 Media Desv .Est. N AD P


2.86 1.971 5 0.354 0.294
80 2.075 1.167 4 0.271 0.448
70
Porcentaje

60
50
40
30
20

10

1
-5.0 -2.5 0.0 2.5 5.0 7.5 10.0 12.5
años

Como pα entonces los datos tienen distribución NORMAL


Material de Clases © G:P.P 6/26/18
a) Hallar un intervalo de confianza del 95% para las diferencias de medias

Interpretación: Como el intervalo contiene al cero, podemos concluir que existe no


existen diferencias entre las medias poblacionales de tiempo de duración de las
pinturas con y sin aditivo.
Material de Clases © G:P.P 6/26/18
b) ¿Se puede decir la pintura con aditivo tiene mayor duración. Con un nivel de
significación de ?
Prueba de Hipótesis
Ho: μc= μs
H1: μc> μs

Como p=0.254>0.05 Luego no rechazamos H0


Se concluye con un nivel de significancia del 0.05 que no existe suficiente
evidencia para decir que el la duración de pintura con aditivo es mayor .

Material de Clases © G:P.P 6/26/18


Ejemplo 03: Un fabricante de monitores prueba dos diseños de microcircuitos para
determinar si producen un flujo de corriente equivalente. El departamento de ingeniería ha
obtenido los datos siguientes Diseño 1
Asumir que las dos poblaciones son Diseño 2
normales y
¿Se desea determinar si existe alguna diferencia significativa en el flujo de corriente
promedio entre los dos diseños?

Prueba de Levene Entonces los grados de libertad será:


Ho: σ22 = σ21
H1: σ22 ≠ σ21
Estadistico de prueba 1
F / 2(v1,v 2) =
s22 40 F1- / 2(v 2,v1)
F= 2 = =4
s1 10

1 1
F0.025(9,15) = = = 0.265
F0.975(15,9) 3.77

Como 4 > 3.12 se rechaza Ho, luego se asumen


que tienen diferentes varianzas

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis = Diseño 1
Ho: μ1= μ2 Diseño 2
H1: μ1 μ2

Con grados de libertad

Luego no se rechaza Ho
Luego la prueba no es significativa

Este valor se redondea al próximo menor


que sería 11
Material de Clases © G:P.P 6/26/18
Material de Clases © G:P.P 6/26/18
Ejemplo4: En el campo de la informática, se hace un experimento en el que se miden las
velocidades de los procesadores de Intel frente a los correspondientes AMD. Los resultados
obtenidos son los tiempos en segundos en bajar de Internet un determinados programa

Intel 100 125 135 128 140 142 128 137 156 142
AMD 105 128 128 135 115 150 125 122
a) ¿Hallar el intervalo de confianza del 95% para la diferencia entre los tiempos medios de
estos dos procesadores?
b) ¿Podría decirse que el procesador Intel es mas veloz que el AMD si alfa es 5%?

Ejemplo5: Queremos estudiar la influencia que puede tener el tabaco con el peso de los niños
al nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un
paquete al día y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:
Población Muestra Medias DS
Madres fumadoras n1 =35 = 3.6 S1= 0.5 kg
Madre no fumadoras n2 =27 = 3.2 S2= 0.8 kg

a) Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo, si alfa es
0.05Rpta: 0,068 Kg y los 0,731 Kg.
b) ¿Podría decirse que los hijos de las madres fumadoras tienen menos pesos que las no
fumadoras si el nivel de significación es de 10% ?
Material de Clases © G:P.P 6/26/18
Ejemplo6: Una inspección de calidad efectuada sobre dos marcas de baterías para linterna,
reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de
vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra
muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con
una desviación estándar de 1,5 horas.
a) Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre
la vida útil de ambas marcas
b) Podría decirse quela batería de la marca A dura mas que la marca B

Ejemplo7: El test de evaluación de CAPECO, informa los resultados de pruebas de


laboratorios realizados para investigar la estabilidad y permeabilidad del concreto de
asfalto. En el experimento se prepararon 4 mezclas de concreto con un contenido de 3% de
asfalto del peso total de la mezcla y 4 mezclas con un 7% de asfalto respectivamente
Las mediciones de permeabilidad registradas en pulgadas por hora fueron:

a) ¿Hallar el intervalo de confianza del 95% para la diferencia entre la permeabilidad


media del concreto elaborado con un contenido de 3% y 7% de asfalto?
b) Podría decirse que el 3% de asfalto es mas permeable que un 75 de asfalto?
Material de Clases © G:P.P 6/26/18
Ejemplo08: Se realizó un experimento para comparar el tiempo promedio requerido por el
cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario
para que cada medicamento alcance un nivel específico en el torrente sanguíneo se
distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco
registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre.
Calcule con

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para observaciones pareadas µ D=µ1 - µ2

En este caso se trata de comparar dos métodos o tratamientos, pero se quiere


que las unidades experimentales donde se aplican los tratamientos sean las
mismas.
Un intervalo de confianza del 100(1-)% para la diferencia poblacional dada una
muestra de tamaño n es de la forma
Supuesto:
Sd S XA: antes y XB: después
d - t / 2   D  d + t / 2 d
n n Las diferencias deben tener una
distribución normal.
n
Donde:  d i
- ∼ (µA-µB ,σ2d) .
Promedio de diferencias d = i =1
que no es relevante si el tamaño
n
de la muestra n es grande.
Sd = desviación estándar de las diferencias Prueba de Hipótesis

La prueba estadística t se :
d - D :
distribuye con (n-1) gl t= :
sd / n
:
Material de Clases © G:P.P 6/26/18
Ejemplo 1: Para verificar la influencia de un cartel publicitario en las
ventas de una marca de cerveza se ha seleccionado al azar una
muestra de 7 bodegas en las que se registró el número de botellas
vendidas en la última semana antes de colocar el cartel y dos
semanas después de colocar el cartel publico
Los resultados se muestran a continuación:

a) Calcular un intervalo de confianza al 95% de confianza para la diferencia de las ventas


promedio semanales antes y después de colocar el cartel publicitario.

Material de Clases © G:P.P 6/26/18


b) ¿Se puede decir en el nivel de significancia del 0.05 que el cartel influye en las
ventas
Ho: μsc - μcc =μD = 0 ( No tiene efecto el cartel)
H1: μsc - μcc =μD < 0 (El cartel tienen efecto en las ventas de la cerveza).

Interpretación : El valor de P es 0,006, se rechaza la hipótesis nula y se acepta la


alternativa la cual indica que el cartel tiene efecto sobre la venta de la cerveza.

Material de Clases © G:P.P 6/26/18


Como el valor de H0 no se encuentra en el
intervalo de confianza de la diferencia de las
dos medias, se rechaza Ho y se acepta H 1
indicando

Material de Clases © G:P.P 6/26/18


Ejemplo2: Un médico desea investigar si una droga tiene el efecto de bajar la presión
sanguínea en los usuarios. El médico eligió al azar 15 pacientes mujeres y les tomó la
presión, luego les recetó la medicina por un periodo de 6 meses, y al final del mismo
nuevamente les tomó la presión. Los resultados son como siguen:

a) ¿Encuentre un intervalo de confianza del 95% para las diferencias de la reducción de


la presión sanguínea antes y después de usar la droga?
b) ¿ Se puede decir que la antes de usar la droga la presión era mayor que después de
usarla , si alfa es 0.05?

Material de Clases © G:P.P 6/26/18


Ho: μD = 0 (La droga no tiene ningún efecto)
H1: μD >0 (La droga tiene efecto, la presión antes de usar la droga
era mayor que después de usarla).

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para la diferencia de dos proporciones
poblacionales
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones.

 Condiciones: n1 ≥ 30 y n2 ≥30
( p1 - p2 ) - ( p1 - p2 )
Z=
La distribución muestral de p1 - p2 esta dada por p1q1 p2 q2
+
la estadística de prueba n1 n2

Intervalo de confianza de dos poblaciones

Prueba Estadística para dos poblaciones


( p1 - p2 ) - ( p1 - p2 )
x1 + x2 Z=
donde, p es estimado por p = pq p q
n1 + n2 +
n1 n2
Material de Clases © G:P.P 6/26/18
Ejemplo1: Un médico de una zona minera, ha sugerido que un ataque cardíaco es menos
probable que ocurra en hombres que practican alguna clase de deporte. Se elige una
muestra al azar de 300 hombres, de los cuales 100 practican alguna clase de deporte y de
ellos sólo 10 han sufrido un ataque cardíaco. De los 200 que no practican deportes, 25 han
sufrido ataques cardíacos.
a) Hallar un intervalo de confianza del 95% para la diferencia de las dos proporciones

Interpretación: Como el intervalo contiene al


cero, podemos concluir que no existen
diferencias entre las proporciones
poblacionales de los hombres que han
tendido ataque cardiaco con los que
practican deporte o no.
Material de Clases © G:P.P 6/26/18
Material de Clases © G:P.P 6/26/18
b) Probar si los resultados de las muestras apoyan lo sugerido por el médico. Si alfa es 0,05
1) Ho: p1 = p2 (las probabilidades de sufrir ataque cardíaco son iguales para ambos grupos)
Ha: p1 < p2 (la probabilidad de sufrir ataque cardíaco es menor en hombres deportistas).

2) Establecer el nivel de significación 0,05


3) Elección de la prueba estadística
( p1 - p2 ) - ( p1 - p2 ) x1 + x2 10 + 25
Z = p= = = 0.1167
pq
+
pq n1 + n2 100 + 200
n1 n2

(0.10 - 0.125) - (0 - 0)
Z= = -0.6357
(0.1167)(0.8833) (0.1167)(0.8833)
+
100 200

4) Calcular puntos críticos


5) Como -0,6281<-1,645
6) No rechazamos Ho

Material de Clases © G:P.P 6/26/18


Interpretación: Como p=0.262>0.05 se concluye que no hay evidencia
suficiente para afirmar que la probabilidad de sufrir un ataque cardiaco entre
los hombres deportistas es menor que de la de los hombres que no practican
deporte.
El intervalo de confianza contiene el cero, lo cual es otra razón para no
rechazar la hipótesis nula.
Material de Clases © G:P.P 6/26/18
Ejemplo3: Un profesor de Estadística desea comparar el porcentaje de aprobados de la
sección “A” contra el porcentaje de aprobados de la sección “B”. En la sección “A” se tomó
una muestra de 26 estudiantes, de los cuales 16 habían aprobado, de la sección “B” una
muestra de 28 estudiantes reveló 25 aprobados. Utilice un 99% de confiabilidad para
comprobar si el porcentaje de aprobados de la sección “B” es superior al de la sección “A”.

Ejemplo.4: Una semana antes de las elecciones municipales para Lima Metropolitana, dos
compañías encuestadoras publican los resultados las encuestas por encargo, realizadas de
forma independiente.
• Encuestadora Apoyo: para un n = 1800, los votos al partido ZYX =42 %.
• Encuestadora Datum: para un n = 6800, votos al partido ZYX = 36 %.
¿Estos resultados dispares, se puede atribuir al tamaño de la muestra respectiva?.
Razone su respuesta.

Material de Clases © G:P.P 6/26/18


Prueba de Hipótesis e I.C. para el Cociente de varianzas

Suponga que tenemos dos poblaciones independientes, la población 1 sigue una


distribución y sobre la población 2 sigue una distribución . Se toma una m.a. de cada
población de tamaños n1 y n2 respectivamente.
El intervalo de confianza, con nivel de confianza (1 − α)%, para el cociente de
varianzas que sigue una distribución F de Fisher con n1 − 1 y n2 − 1 grados de
libertad, es
:

Nota: Si el I.C. contiene el valor uno se concluye que las varianzas son iguales, en caso
contrario se dice que son diferentes.

El estadístico de prueba es

Material de Clases © G:P.P 6/26/18


Material de Clases © G:P.P 6/26/18
MINITAB

Material de Clases © G:P.P 6/26/18


b) Podría afirmar que la variabilidad de método 1 es mayor que el método 2, con
1) Ho: (la variabilidad del tiempo de ensamblaje en ambos métodos es lo mismo.
Ha: (la variabilidad del tiempo de ensamblaje en método 1 es mayor que el método 2)

2) Establecer el nivel de significación 0,10


3) Elección de la prueba estadística
Gráfica de distribución
F, df1=30, df2=24
1.2

1.0

0.8

4) Calcular puntos críticos

Densidad
2.083>1.672 0.6

5) Luego rechazamos Ho
0.4
6) Interpretación: la variabilidad
de los tiempos en método 1 es 0.2

mayor que el método 2 0.1


0.0
0 1.672
X

Material de Clases © G:P.P 6/26/18


Prueba e IC para dos varianzas
Relación = 1 vs. Relación > 1
IC de 90% para σ²(Muestra 1) / σ²(Muestra 2)

Prueba F
Valor p 0.034

1.0 1.5 2.0 2.5 3.0 3.5

ICs de chi-cuadrada de 90% para σ²

Muestra 1

Muestra 2

20 30 40 50 60 70 80

Material de Clases © G:P.P 6/26/18

You might also like