Analisis de Varianza 1-2010

ANALISIS DE
VARIANZA
Mgr. Sonia Urquidi B.

Objetivos
• a) Explicar el análisis de la
varianza
• b) Describir las características de
la distribución F
• c) Organizar datos en una tabla
ANOVA
Contenido
• 1. Introducción
• 2. Análisis de varianza en un sentido
• 3. Distribución F
• 4.Suma total de cuadrados
• 5. Tabla de análisis de varianza
1. Introducción
• En los temas anteriores:
• Contrastación de hipótesis de dos
medias poblacionales
• Y qué pasa si hay más de dos

poblaciones, como ocurre
normalmente?
1
• Ejemplo:
• ¿Existen diferencias significativas en
el rendimiento de tres grupos de
operarios de una empresa según el
método de adiestramiento empleado
en cada uno de esos tres grupos?
1
• Ejemplo:
Una cadena de electrodomésticos dispone
de las cifras de ventas clasificadas por tipo de
producto y establecimiento. Las preguntas
que nos formulamos son:
a) ¿Difieren las ventas por tipo de producto?

b) ¿Difieren según el establecimiento?
c) ¿Interaccionan el tipo y el establecimiento
sobre las ventas?
1
PARA RESPONDERNOS A ESTAS
INTERROGANTES:
UTILIZAMOS EL
ANALISIS DE VARIANZA
(ANOVA)
(ANOVA) 1
Es un tipo de prueba que puede
utilizarse para:
Verificar diferencias entre las medias de
dos o mas muestras
Verificar un relación entre una escala
nominal y una escala de intervalo
Verificar relación entre una escala de
intervalo o dos o mas escalas nominales
1
Medias?
Examen de varianzas
muestrales
ANOVA
1
TIPOS
Análisis en un sentido
Análisis en dos
sentidos
2. ANALISIS DE VARIANZA EN UN
SENTIDO O ANALISIS SIMPLE DE
VARIANZA
Dadas una variable dependiente
cuantitativa y una variable independiente
cualitativa, o factor, el análisis de la
varianza en un sentido consiste en analizar
el comportamiento de la variable
dependiente en las K subpoblaciones o
grupos establecidos por los valores de la
independiente.
2.
Ejemplo:
Supongamos que se emplean tres
métodos diferentes para enseñar
estadística a tres grandes grupos de
estudiantes (A,B,C) y se quiere
comprobar si estos diferentes métodos
tienen efectos diferentes entre las
notas, las cuales se miden sobre 10
puntos
2.
c: número de grupos, estratos o
conglomerados o subpoblaciones
k=3
• Supuestos 2.
Sobre la población: Las varianzas de
todas las poblaciones son idénticas
(hipótesis de homoscedasticidad), y cada
una de las poblaciones tiene una
distribución normal
Sobre el proceso de obtención de la
muestra: Se supone que se ha obtenido
una muestra aleatoria independiente de
cada una de las K poblaciones.
• Supuestos 2.
Hipotesis Nula:
 Las medias de las poblaciones

son iguales
Ho :   1 2
 ..   k
2.
El análisis consiste en establecer si existe
o no diferencias significativas entre las
medias.
Debe realizarse una comparación
entre la variación dentro las muestras y
la variación entre las muestras
2.
La variación dentro de las
muestras depende de:
 La habilidad innata de los
estudiantes al estudio
 La motivación personal
El esfuerzo individual
El factor suerte
Otros
La variación entre las
muestras depende de:
 Mismos factores que
producen variación dentro una
muestra :
La habilidad innata de los estudiantes
al estudio, La motivación personal, El
esfuerzo individual, El factor suerte,
Otros
Influencia adicional que
pueden tener los
tratamientos diferentes.
El análisis de varianza es una
relación de la variación entre muestras
con la variación dentro las muestras.
Para medir esta relación se utiliza la
distribución F
F es el cociente de la variación entre
grupos y la variación dentro esos
grupos
DISTRIBUCION F
Varianza entre grupos
k
 ( xi  x ) ni
2
i 1
k 1
Tamaño de la muestra i
xi Media de la muestra del
grupo i
Media de toda la
x muestra
k Número de grupos,
estratos o conglomerados
Varianza dentro los grupos
3
c ni
  ( xij  xi ) 2
i 1 j 1
nk
xij J ésimo valor de la
variable en el grupo i
Media de la muestra
x i del grupo i
n Muestra total:
n1+n2+…+ni
Por lo tanto se tiene 3
c
 ( xi  x ) ni 2
i 1
k 1
F c ni
  ( xij  xi ) 2
i 1 j 1
nk
Con (k -1) ; (n-k) grados de libertad
Conclusiones de la 3
fórmula
• 1. Si todas las medias son iguales:
x x x
i j
•F = 0
• Si F es un valor relativamente
pequeño, no habrá diferencias
significativas entre las medias
Conclusiones de la 3
fórmula
• 2. A mayor diferencia entre las
medias:
x x
i j
• Existirá mayor varianza entre

grupos, con relación a las
varianzas dentro los grupos
Por lo tanto F será mayor
Ejemplo: 5
Supongamos que se emplean tres
métodos diferentes para enseñar
estadística a tres grandes grupos de
estudiantes (A,B,C) y se quiere comprobar,
a un nivel de confianza del 95%, si estos
diferentes métodos tienen efectos
diferentes entre las notas, las cuales se
miden sobre 10 puntos. Se toman
muestras aleatorias de tamaño 5 de cada
grupo con los siguientes resultados:
5
GRUPO A GRUPO B GRUPO C
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
2.
X11 3 4 7
6 X22 7 6
5 7 7
X14 4 4 X34 7
7 8 8
n1 n2 n3
1. Planteamiento de hipótesis
H0 : Las medias de las poblaciones

son iguales
H1 : Las medias de las poblaciones

no son iguales
2. Elección del nivel de significación
 = 0.05
3. Descripción de la población y
supuestos necesarios
Muestras aleatorias independientes

Poblaciones normales ( las notas
en los grupos se distribuyen en
forma normal)
Las varianzas de las poblaciones son

iguales
4. Selección del estadístico
pertinente
 (x  x) n
K
2
i i
i 1
k 1
F
  (x  x )
K ni
2
ij i
i 1 j 1
nk
Grados de libertad: 2,12
5. Especificación de las zonas
de rechazo y no rechazo
0.05
3,89
6. Recolección de datos y cálculo
de estadísticos necesarios
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
x =5
1
x 2
=6 x
3
=7
Media general:
x 5 * 5  6 * 5  7 * 5 / 15
x 6
Para el numerador o varianza
entre grupos:
x 5 x 6 x 7
1 2 3
x 6 k 3
c
 ( xi  x ) ni 2
i 1
k 1
(5  6) * 5  (6  6) * 5  (7  6) * 5
2 2 2
2
10 / 2
Para el denominador o varianza
dentro los grupos:
GRUPO A
x 5
1
n  15 k 3
K n i 3
  ( xij  xi ) 2
6
i 1 j 1
nk 5
(3  5)  (6  5)  (5  5)  (4  5)  (7  5)
2 2 2 2 2
4
7
(4)  (1)  (0)  (1)  (4)  10
dentro los grupos:
GRUPO B
x 6 1
  (x  x )
K ni
2 4
i 1 j 1
ij i
7
nk 7
(4  6)  (7  6)  (7  6)  (4  6)  (8  6)
2 2 2 2 2
4
8
(4)  (1)  (1)  (4)  (4)  14
dentro los grupos:
GRUPO C
x 7 1
  (x  x )
K ni
2 6
i 1 j 1
ij i
6
nk 7
(7  7)  (6  7)  (7  7)  (7  7)  (8  7)
2 2 2 2 2
7
8
(0)  (1)  (0)  (0)  (1)  2
10
2
F  2 .3
26
12
7. Decisión
Estadística
Como 2,3 es menor que
el valor crítico de 3.89,
no se rechaza la
hipótesis nula, a un
nivel de significación
del 5%
9. Conclusiones
A un nivel de confianza
del 95%, No existen
diferencias significativas
entre las tres muestras,
por lo tanto, los tres
métodos no son
significativamente
diferentes
UTILIZANDO EXCEL
A B C
3 4 7
6 7 6
5 7 7
4 4 7
7 8 8
Poner DATOS
UTILIZANDO EXCEL
DATOS
ANALISIS DE DATOS
Análisis de varianza de
un factor
No olvidarse
Aceptar de alfa
Rango de datos
Aceptar
RESUMEN
Grupos Muestra Suma Promedio Varianza
Columna 1 5 25 5 2,5
Columna 2 5 30 6 3,5
Columna 3 5 35 7 0,5
ANÁLISIS DE
VARIANZA
Origen de
las Promedio Valor
variacione Suma de Grados de de los Probabilid crítico
s cuadrados libertad cuadrados F ad para F
Entre
grupos 10 2 52,31 0,14 3,89
Dentro de
los grupos 26 122,17
Total 36 14
4. Suma total de cuadrados 4
La variación total, depende de la
variación del tratamiento y de la
variación del error, cada una de
ellas produce una suma de
cuadrados:
STC = SCTr + SCE
  (x  x)
K ni
2
STC = i 1 j 1
ij
STC es la variación de las observaciones

alrededor de la media general
Suma de cuadrados de los 4
tratamientos
c
SCTr = i ( xi  x ) 2
ni
1
Variación de la media de cada
grupo en relación a la media
El número de observaciones de
general
cada tratamiento
Se multiplica por las diferencias al
cuadrado entre la media de cada
tratamiento o grupo y la media general
y luego se suman
Suma de cuadrados del 4
error
SCE =   ( xij  xi ) 2
c ni
i 1 j 1
Variación en cada estrato, variación de
cada elemento en relación a su media
La media de un tratamiento, se resta de
cada observación en cada tratamiento.
Las diferencias se elevan al cuadrado y
se suman. Esto se hace para todos los
tratamientos y los resultados se suman.
Cuadrados medios 4
Para obtener la razón de varianza,
después de obtener la suma de
cuadrados, cada una se divide
entre sus grados de libertad.
Una suma de cuadrados dividida

entre sus grados de libertad
produce un cuadrado medio
Cuadrado medio total 4
C.M.T = STC/n-1
Cuadrado medio de los
tratamientos
C.M.Tr = SCTr/k-1
Cuadrado medio del error
C.M.E = SCE/n-k
4
Razón F para una
prueba de medias es:
CMTr
F
CME
5. TABLA DE ANALISIS DE 5
Fuente de
VARIANZA
Suma de Grados de Media de
variación cuadrados libertad cuadrados Valor F
Entre muestras CMTr/CME
(Tratamiento) SCTr c-1 SCTr/c-1
Dentro muestras SCE/n-c

(error) SCE n-c
Variación total STC n-1

Analisis de Varianza 1-2010

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Analisis de Varianza 1-2010

Uploaded by

Copyright:

Available Formats

ANALISIS DE

Mgr. Sonia Urquidi B.

• Y qué pasa si hay más de dos

a) ¿Difieren las ventas por tipo de producto?

 Las medias de las poblaciones

• Existirá mayor varianza entre

GRUPO A GRUPO B GRUPO C

H0 : Las medias de las poblaciones

H1 : Las medias de las poblaciones

2. Elección del nivel de significación

Muestras aleatorias independientes

Las varianzas de las poblaciones son

STC es la variación de las observaciones

Una suma de cuadrados dividida

Dentro muestras SCE/n-c

You might also like