Professional Documents
Culture Documents
nincen.figueroa@mail.udp.cl
2015
DOS MUESTRAS
ANOVA:
ANLISIS DE VARIANZA
Los anlisis que podemos realizar con ANOVA refieren a situaciones en que
queremos:
Analizar las evaluaciones a figuras polticas segn nivel socioeconmico
Comparar la confianza (medida en escalas de 1 a 7) que tienen las personas
de diferentes religiones respecto de algunas instituciones.
Probar que el ingreso de los hogares en tres comunas distintas es igual:
Dar cuenta de diferencias en los aos de escolaridad segn identificacin
partidaria.
Cubos OLAP
P39.- Qu cree usted que es lo ms relevante para encontrar trabajo?
1.- La Educacin que usted tenga
P32- Utilizando una escala de 0 a 10, donde 0
2.- Su Apellido
representa ms de izquierda y 10 ms de derecha,
3.- Tener contactos o Pitutos
en qu posicin se ubicara Ud.?
Total
Media
4.99
Desv. tp.
2.105
Varianza
4.429
N
422
5.91
5.10
5.10
1.942
2.033
2.079
3.773
4.135
4.324
58
253
733
ANOVA:
ANLISIS DE VARIANZA
El anlisis de varianza (ANOVA) est basado en una comparacin de dos
estimadores diferentes de la varianza comn de las distintas poblaciones.
Estos estimadores especficamente son la varianza entre muestras y la
varianza dentro de las muestras.
La variacin entre grupos es la variacin entre las medias de los diferentes factores debidas
al azar (error de muestreo ) y al efecto de los factores, si es que existe.
La variacin dentro de los grupos es la variacin debida al azar (error de muestreo) entre
individuos a los que se ha dado el mismo factor o tratamiento.
ANOVA:
DISTRIBUCIN F
La inferencia respecto a la varianza se basa en la utilizacin de la
distribucin F de Snedecor, cuyas caractersticas son:
No tiene valores negativos, por lo que F es igual a 0 o positiva
Es asimtrica y se encuentra sesgada hacia la derecha
Existen muchas distribuciones F diferentes, la que ser diferente para cada par de
grados de libertad
gln = n1 1 gld = n2 1
t ( gl , ) Unilateral
t ( gl , ) Bilateral
2
ANOVA:
SUPUESTOS Y REQUISITOS
ANOVA:
ANLISIS DE VARIANZA
Para realizar el anlisis de varianza (ANOVA), debemos seguir el mismo
procedimiento realizado en las pruebas de hiptesis para muestras
pareadas y muestras independientes, los cuales son:
1.
2.
3.
4.
5.
Planteamiento de hiptesis
Calcular el valor de tabla en base al nivel de significacin
Dibujar regiones de aceptacin y rechazo
Clculo de estadstico de prueba
Decidir y concluir respecto de la prueba de hiptesis
ANOVA:
PLANTEAMIENTO
DE HIPTESIS
ANOVA:
EJEMPLO
Se desea saber si la tendencia poltica de las personas (medido en una escala de 0 a
10) se diferencia segn nivel socioeconmico. Segn datos de la Encuesta UDP 2013,
los promedios de identificacin poltica se distribuyen de la forma que aparece en el
cuadro N1
Cubos OLAP
GSE
P32- Utilizando una escala de 0 a 10,
donde 0 representa ms de izquierda y
10 ms de derecha, en qu posicin se
ubicara Ud.?
Medio Alto
Medio
Bajo
Total
Media
5.31
5.03
4.97
5.09
Desv. tp.
2.127
1.994
2.112
2.080
Varianza
4.522
3.976
4.460
4.325
N
207
249
287
743
Lo que buscamos contrastar a un nivel de confianza del 90% (se compara con
F(2,31)) es la hiptesis nula que todos los niveles socioeconmicos tienen la misma
tendencia poltica
ANOVA:
EJEMPLO
Las hiptesis se plantean de la siguiente forma:
H0: alto = medio = bajo
H1: Al menos una media es diferente de las otras
ANOVA:
EJEMPLO
2. Adicionalmente debemos seleccionar
las opciones de descriptivos y pruebas e
homogeneidad de varianzas.
ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS
Descriptivos
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu posicin se
ubicara Ud.?
Intervalo de confianza
para la media al 95%
Desviacin
Lmite
Lmite
N
Media
tpica
Error tpico inferior
superior
Mnimo
Mximo
Medio Alto
207
5.31
2.127
.148
5.02
5.61
0
10
Medio
249
5.03
1.994
.126
4.78
5.28
0
10
Bajo
287
4.97
2.112
.125
4.72
5.21
0
10
Total
743
5.09
2.080
.076
4.94
5.24
0
10
El
valor
de
sig
0.354>0.1
no
nos
permite rechazar la
hiptesis nula que las
varianzas son distintas
(uno de los supuestos).
ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS
El estadstico de prueba (F) est determinado por:
F=
7,715
= 1,788
4,316
Como
la
significacin
0.168>0.05, no
existe
evidencia
emprica
suficiente para sealar que
las medias son diferentes,
por lo que no es posible
rechazar la hiptesis nula.
ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS
1,78
2,31
ANLISIS DE VARIANZA:
COMPONENTES DE ANOVA DE UN FACTOR
SC(Factor): Es una medida de variacin entre las medias muestrales. (entre grupos).
Mide las desviaciones de las medias en cada grupo a la media total.
SC(Dentro del grupo): Representa la variacin que corresponde al azar. Mide las
desviaciones de cada observacin a la media del grupo correspondiente.
ANLISIS DE VARIANZA:
COMPONENTES DE ANOVA DE UN FACTOR
Anlisis de Varianza
Fuente de Variacin
Suma Cuadrados
GL
CM
CM=SC/GL
Factor
SC(Factor)
k-1
CMF
SCF/(k-1)
Error
nt-k
CME
SCE/(nt-1)
Total
SC(Total)
nt-1
CMT
F
CMF/CME
F=
CM ( factor )
CM ( Error )
ANLISIS DE VARIANZA:
EJERCICIO
Descriptivos
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu posicin se ubicara Ud.?
Intervalo de confianza para la
media al 95%
Desviacin
N
Media
Error tpico
Mnimo
Mximo
tpica
Lmite
Lmite inferior
superior
1.- Aprueba
262
5.89
1.980
.122
5.65
6.13
0
10
2.395
4.50
2.047
.103
4.30
4.70
0
10
Desaprueba
9.- NS/NR
85
5.33
1.615
.175
4.98
5.67
0
10
Total
743
5.09
2.080
.076
4.94
5.24
0
10
ANOVA de un factor
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu
posicin se ubicara Ud.?
Suma de
cuadrados
gl
Media cuadrtica
F
Sig.
Inter-grupos
311.953
2
155.976
39.842
.000
Intra-grupos
2897.014
740
3.915
Total
3208.967
742
ANLISIS DE VARIANZA:
COMPARACIONES MLTIPLES
Qu hacemos cuando tenemos evidencia emprica suficiente para sealar que al
menos una media es diferente de las otras?
Debemos utilizar test de comparaciones mltiples que nos permite comparar entre las
medias para ver cules difieren de otras.
ANLISIS DE VARIANZA:
COMPARACIONES MLTIPLES. TEST DE SCHEFF
Hiptesis:
H0: aprueba = desaprueba
Comparaciones mltiples
Variable dependiente: P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu
posicin se ubicara Ud.?
Scheff
(I) P36.- Ud. aprueba o desaprueba la
Intervalo de confianza al 95%
forma en que Sebastin Piera se ha
desempeado como Presidente de la
Diferencia de
Repblica?
medias (I-J)
Error tpico
Sig.
Lmite inferior
Lmite superior
*
1.- Aprueba
2.- Desaprueba
1,394
.158
.000
1.01
1.78
2.- Desaprueba
9.- NS/NR
9.- NS/NR
1.- Aprueba
9.- NS/NR
1.- Aprueba
2.- Desaprueba
.567
*
-1,394
*
-,827
-.567
*
,827
.247
.158
.236
.247
.236
.072
.000
.002
.072
.002
-.04
-1.78
-1.41
-1.17
.25
1.17
-1.01
-.25
.04
1.41
10
11