Professional Documents
Culture Documents
VARIANZA
UTILIZAMOS EL
ANALISIS DE VARIANZA
(ANOVA)
(ANOVA) 1
Es un tipo de prueba que puede
utilizarse para:
Verificar diferencias entre las medias de
dos o mas muestras
Verificar un relación entre una escala
nominal y una escala de intervalo
Verificar relación entre una escala de
intervalo o dos o mas escalas nominales
1
Medias?
Examen de varianzas
muestrales
ANOVA
1
TIPOS
Análisis en un sentido
Análisis en dos
sentidos
2. ANALISIS DE VARIANZA EN UN
SENTIDO O ANALISIS SIMPLE DE
VARIANZA
Dadas una variable dependiente
cuantitativa y una variable independiente
cualitativa, o factor, el análisis de la
varianza en un sentido consiste en analizar
el comportamiento de la variable
dependiente en las K subpoblaciones o
grupos establecidos por los valores de la
independiente.
2.
Ejemplo:
Supongamos que se emplean tres
métodos diferentes para enseñar
estadística a tres grandes grupos de
estudiantes (A,B,C) y se quiere
comprobar si estos diferentes métodos
tienen efectos diferentes entre las
notas, las cuales se miden sobre 10
puntos
2.
c: número de grupos, estratos o
conglomerados o subpoblaciones
k=3
• Supuestos 2.
Sobre la población: Las varianzas de
todas las poblaciones son idénticas
(hipótesis de homoscedasticidad), y cada
una de las poblaciones tiene una
distribución normal
Sobre el proceso de obtención de la
muestra: Se supone que se ha obtenido
una muestra aleatoria independiente de
cada una de las K poblaciones.
• Supuestos 2.
Hipotesis Nula:
i 1
k 1
Tamaño de la muestra i
xi Media de la muestra del
grupo i
Media de toda la
x muestra
k Número de grupos,
estratos o conglomerados
Varianza dentro los grupos
3
c ni
( xij xi ) 2
i 1 j 1
nk
xij J ésimo valor de la
variable en el grupo i
Media de la muestra
x i del grupo i
n Muestra total:
n1+n2+…+ni
Por lo tanto se tiene 3
c
( xi x ) ni 2
i 1
k 1
F c ni
( xij xi ) 2
i 1 j 1
nk
Con (k -1) ; (n-k) grados de libertad
Conclusiones de la 3
fórmula
• 1. Si todas las medias son iguales:
x x x
i j
•F = 0
• Si F es un valor relativamente
pequeño, no habrá diferencias
significativas entre las medias
Conclusiones de la 3
fórmula
• 2. A mayor diferencia entre las
medias:
x x
i j
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
2.
GRUPO A GRUPO B GRUPO C
X11 3 4 7
6 X22 7 6
5 7 7
X14 4 4 X34 7
7 8 8
n1 n2 n3
1. Planteamiento de hipótesis
= 0.05
3. Descripción de la población y
supuestos necesarios
k 1
F
(x x )
K ni
2
ij i
i 1 j 1
nk
Grados de libertad: 2,12
5. Especificación de las zonas
de rechazo y no rechazo
0.05
3,89
6. Recolección de datos y cálculo
de estadísticos necesarios
GRUPO A GRUPO B GRUPO C
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
x =5
1
x 2
=6 x
3
=7
Media general:
x 5 * 5 6 * 5 7 * 5 / 15
x 6
Para el numerador o varianza
entre grupos:
x 5 x 6 x 7
1 2 3
x 6 k 3
c
( xi x ) ni 2
i 1
k 1
(5 6) * 5 (6 6) * 5 (7 6) * 5
2 2 2
2
10 / 2
Para el denominador o varianza
dentro los grupos:
GRUPO A
x 5
1
n 15 k 3
K n i 3
( xij xi ) 2
6
i 1 j 1
nk 5
(3 5) (6 5) (5 5) (4 5) (7 5)
2 2 2 2 2
4
7
(4) (1) (0) (1) (4) 10
Para el denominador o varianza
dentro los grupos:
GRUPO B
x 6 1
(x x )
K ni
2 4
i 1 j 1
ij i
7
nk 7
(4 6) (7 6) (7 6) (4 6) (8 6)
2 2 2 2 2
4
8
(4) (1) (1) (4) (4) 14
Para el denominador o varianza
dentro los grupos:
GRUPO C
x 7 1
(x x )
K ni
2 6
i 1 j 1
ij i
6
nk 7
(7 7) (6 7) (7 7) (7 7) (8 7)
2 2 2 2 2
7
8
(0) (1) (0) (0) (1) 2
10
2
F 2 .3
26
12
7. Decisión
Estadística
Como 2,3 es menor que
el valor crítico de 3.89,
no se rechaza la
hipótesis nula, a un
nivel de significación
del 5%
9. Conclusiones
A un nivel de confianza
del 95%, No existen
diferencias significativas
entre las tres muestras,
por lo tanto, los tres
métodos no son
significativamente
diferentes
UTILIZANDO EXCEL
A B C
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
Poner DATOS
UTILIZANDO EXCEL
DATOS
ANALISIS DE DATOS
Análisis de varianza de
un factor
No olvidarse
Aceptar de alfa
Rango de datos
Aceptar
RESUMEN
Grupos Muestra Suma Promedio Varianza
Columna 1 5 25 5 2,5
Columna 2 5 30 6 3,5
Columna 3 5 35 7 0,5
ANÁLISIS DE
VARIANZA
Origen de
las Promedio Valor
variacione Suma de Grados de de los Probabilid crítico
s cuadrados libertad cuadrados F ad para F
Entre
grupos 10 2 52,31 0,14 3,89
Dentro de
los grupos 26 122,17
Total 36 14
4. Suma total de cuadrados 4
La variación total, depende de la
variación del tratamiento y de la
variación del error, cada una de
ellas produce una suma de
cuadrados:
STC = SCTr + SCE
(x x)
K ni
2
STC = i 1 j 1
ij
i 1 j 1
Variación en cada estrato, variación de
cada elemento en relación a su media
La media de un tratamiento, se resta de
cada observación en cada tratamiento.
Las diferencias se elevan al cuadrado y
se suman. Esto se hace para todos los
tratamientos y los resultados se suman.
Cuadrados medios 4
Para obtener la razón de varianza,
después de obtener la suma de
cuadrados, cada una se divide
entre sus grados de libertad.
C.M.Tr = SCTr/k-1
Cuadrado medio del error
C.M.E = SCE/n-k
4
Razón F para una
prueba de medias es:
CMTr
F
CME
5. TABLA DE ANALISIS DE 5
Fuente de
VARIANZA
Suma de Grados de Media de
variación cuadrados libertad cuadrados Valor F
Entre muestras CMTr/CME
(Tratamiento) SCTr c-1 SCTr/c-1