You are on page 1of 11

PRUEBA DE HIPTESIS

Diferencia de medias para ms de 2 muestras


Mtodos Cuantitativos Avanzados
Nincen Figueroa
Carrera de Ciencia Poltica
Universidad Diego Portales

nincen.figueroa@mail.udp.cl

2015

DIFERENCIA DE MEDIAS PARA MS DE

DOS MUESTRAS

Cuando buscamos probar hiptesis relacionadas con la diferencia o


igualdad de medias para ms de dos muestras, no es posible utilizar la
pruebas de hiptesis vistas anteriormente. En esta situacin, debemos
utilizar ANOVA de un factor (Anlisis de varianza), el cual es un
mtodo de prueba de igualdad de tres o ms medias poblacionales, por
medio del anlisis de las varianzas muestrales.
En general, cuando analizamos la diferencia en ms de 2 muestras,
ANOVA de un factor nos permite aminorar el riesgo de cometer error
tipo I

ANOVA:
ANLISIS DE VARIANZA
Los anlisis que podemos realizar con ANOVA refieren a situaciones en que
queremos:
Analizar las evaluaciones a figuras polticas segn nivel socioeconmico
Comparar la confianza (medida en escalas de 1 a 7) que tienen las personas
de diferentes religiones respecto de algunas instituciones.
Probar que el ingreso de los hogares en tres comunas distintas es igual:
Dar cuenta de diferencias en los aos de escolaridad segn identificacin
partidaria.
Cubos OLAP
P39.- Qu cree usted que es lo ms relevante para encontrar trabajo?
1.- La Educacin que usted tenga
P32- Utilizando una escala de 0 a 10, donde 0
2.- Su Apellido
representa ms de izquierda y 10 ms de derecha,
3.- Tener contactos o Pitutos
en qu posicin se ubicara Ud.?
Total

Media
4.99

Desv. tp.
2.105

Varianza
4.429

N
422

5.91
5.10
5.10

1.942
2.033
2.079

3.773
4.135
4.324

58
253
733

ANOVA:
ANLISIS DE VARIANZA
El anlisis de varianza (ANOVA) est basado en una comparacin de dos
estimadores diferentes de la varianza comn de las distintas poblaciones.
Estos estimadores especficamente son la varianza entre muestras y la
varianza dentro de las muestras.
La variacin entre grupos es la variacin entre las medias de los diferentes factores debidas
al azar (error de muestreo ) y al efecto de los factores, si es que existe.
La variacin dentro de los grupos es la variacin debida al azar (error de muestreo) entre
individuos a los que se ha dado el mismo factor o tratamiento.

El trmino un factor se utiliza porque los datos muestrales estn separados


en grupos segn una caracterstica o factor determinado. En otras palabras,
empleamos solo una propiedad o caracterstica para categorizar y
diferenciar las poblaciones.

ANOVA:
DISTRIBUCIN F
La inferencia respecto a la varianza se basa en la utilizacin de la
distribucin F de Snedecor, cuyas caractersticas son:
No tiene valores negativos, por lo que F es igual a 0 o positiva
Es asimtrica y se encuentra sesgada hacia la derecha
Existen muchas distribuciones F diferentes, la que ser diferente para cada par de
grados de libertad

gln = n1 1 gld = n2 1
t ( gl , ) Unilateral

t ( gl , ) Bilateral
2

ANOVA:
SUPUESTOS Y REQUISITOS

Para realizar la prueba ANOVA de un factor debemos considerar y suponer que:


Las poblaciones tienen distribuciones que son aproximadamente normales.
Las poblaciones tienen la misma varianza o similares (debemos realizar una
prueba de homogeneidad de varianza)
Las muestras son aleatorias e independientes
Las muestras son independientes entre s (es decir, no estn aparejadas o
asociadas de ninguna forma).
Las diferentes muestras provienen de poblaciones que estn categorizadas de
una sola forma.

ANOVA:
ANLISIS DE VARIANZA
Para realizar el anlisis de varianza (ANOVA), debemos seguir el mismo
procedimiento realizado en las pruebas de hiptesis para muestras
pareadas y muestras independientes, los cuales son:
1.
2.
3.
4.
5.

Planteamiento de hiptesis
Calcular el valor de tabla en base al nivel de significacin
Dibujar regiones de aceptacin y rechazo
Clculo de estadstico de prueba
Decidir y concluir respecto de la prueba de hiptesis

ANOVA:
PLANTEAMIENTO

DE HIPTESIS

Para el caso de ANOVA de un factor, las hiptesis se


formulan siguiendo la forma:
H0: 1 = 2= 3.= k
H1: Al menos una media es diferente de las otras
1 2
1 3
2 3

ANOVA:
EJEMPLO
Se desea saber si la tendencia poltica de las personas (medido en una escala de 0 a
10) se diferencia segn nivel socioeconmico. Segn datos de la Encuesta UDP 2013,
los promedios de identificacin poltica se distribuyen de la forma que aparece en el
cuadro N1
Cubos OLAP
GSE
P32- Utilizando una escala de 0 a 10,
donde 0 representa ms de izquierda y
10 ms de derecha, en qu posicin se
ubicara Ud.?

Medio Alto
Medio
Bajo
Total

Media
5.31
5.03
4.97
5.09

Desv. tp.
2.127
1.994
2.112
2.080

Varianza
4.522
3.976
4.460
4.325

N
207
249
287
743

Lo que buscamos contrastar a un nivel de confianza del 90% (se compara con
F(2,31)) es la hiptesis nula que todos los niveles socioeconmicos tienen la misma
tendencia poltica

ANOVA:
EJEMPLO
Las hiptesis se plantean de la siguiente forma:
H0: alto = medio = bajo
H1: Al menos una media es diferente de las otras

ANOVA:
EJEMPLO
2. Adicionalmente debemos seleccionar
las opciones de descriptivos y pruebas e
homogeneidad de varianzas.

1. Debemos seleccionar las variables


a utilizar. En factor debe ubicarse una
variable cualitativa de agrupacin y
en la lista de dependientes, las
variables a contrastar.

ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS
Descriptivos
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu posicin se
ubicara Ud.?
Intervalo de confianza
para la media al 95%
Desviacin
Lmite
Lmite
N
Media
tpica
Error tpico inferior
superior
Mnimo
Mximo
Medio Alto
207
5.31
2.127
.148
5.02
5.61
0
10
Medio
249
5.03
1.994
.126
4.78
5.28
0
10
Bajo
287
4.97
2.112
.125
4.72
5.21
0
10
Total
743
5.09
2.080
.076
4.94
5.24
0
10

Prueba de homogeneidad de varianzas


P32- Utilizando una escala de 0 a 10, donde 0 representa
ms de izquierda y 10 ms de derecha, en qu posicin
se ubicara Ud.?
Estadstico de
Levene
gl1
gl2
Sig.
1.035
2
740
.356

El
valor
de
sig
0.354>0.1
no
nos
permite rechazar la
hiptesis nula que las
varianzas son distintas
(uno de los supuestos).

ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS
El estadstico de prueba (F) est determinado por:

Varianza entre los grupos


F=
Varianza dentro de los grupos
ANOVA de un factor
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y
10 ms de derecha, en qu posicin se ubicara Ud.?
Suma de
Media
cuadrados
gl
cuadrtica
F
Sig.
Inter-grupos
15.430
2
7.715
1.788
.168
Intra-grupos
3193.536
740
4.316
Total
3208.967
742

F=

7,715
= 1,788
4,316

Como
la
significacin
0.168>0.05, no
existe
evidencia
emprica
suficiente para sealar que
las medias son diferentes,
por lo que no es posible
rechazar la hiptesis nula.

ANLISIS DE VARIANZA:
EJEMPLOS. RESULTADOS SPSS

1,78

2,31

ANLISIS DE VARIANZA:
COMPONENTES DE ANOVA DE UN FACTOR
SC(Factor): Es una medida de variacin entre las medias muestrales. (entre grupos).
Mide las desviaciones de las medias en cada grupo a la media total.

SC(Dentro del grupo): Representa la variacin que corresponde al azar. Mide las
desviaciones de cada observacin a la media del grupo correspondiente.

SC(Total)= Es una medida de variacin total. Mide las desviaciones de cada


observacin a la media total.

ANLISIS DE VARIANZA:
COMPONENTES DE ANOVA DE UN FACTOR
Anlisis de Varianza
Fuente de Variacin

Suma Cuadrados

GL

CM

CM=SC/GL

Factor

SC(Factor)

k-1

CMF

SCF/(k-1)

Error

SC(Dentro del grupo)

nt-k

CME

SCE/(nt-1)

Total

SC(Total)

nt-1

CMT

F
CMF/CME

Considerando los componentes anteriores, el estadstico de prueba F es posible


calcularlo con la siguiente frmula:

F=

CM ( factor )
CM ( Error )

ANLISIS DE VARIANZA:
EJERCICIO
Descriptivos
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu posicin se ubicara Ud.?
Intervalo de confianza para la
media al 95%
Desviacin
N
Media
Error tpico
Mnimo
Mximo
tpica
Lmite
Lmite inferior
superior
1.- Aprueba
262
5.89
1.980
.122
5.65
6.13
0
10
2.395
4.50
2.047
.103
4.30
4.70
0
10
Desaprueba
9.- NS/NR
85
5.33
1.615
.175
4.98
5.67
0
10
Total
743
5.09
2.080
.076
4.94
5.24
0
10
ANOVA de un factor
P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu
posicin se ubicara Ud.?
Suma de
cuadrados
gl
Media cuadrtica
F
Sig.
Inter-grupos
311.953
2
155.976
39.842
.000
Intra-grupos
2897.014
740
3.915
Total
3208.967
742

ANLISIS DE VARIANZA:
COMPARACIONES MLTIPLES
Qu hacemos cuando tenemos evidencia emprica suficiente para sealar que al
menos una media es diferente de las otras?
Debemos utilizar test de comparaciones mltiples que nos permite comparar entre las
medias para ver cules difieren de otras.

ANLISIS DE VARIANZA:
COMPARACIONES MLTIPLES. TEST DE SCHEFF
Hiptesis:
H0: aprueba = desaprueba

H0: aprueba = ns/nr

H0: desaprueba = ns/nr

Ha: aprueba desaprueba

Ha: aprueba ns/nr

Ha: desaprueba ns/nr

Comparaciones mltiples
Variable dependiente: P32- Utilizando una escala de 0 a 10, donde 0 representa ms de izquierda y 10 ms de derecha, en qu
posicin se ubicara Ud.?
Scheff
(I) P36.- Ud. aprueba o desaprueba la
Intervalo de confianza al 95%
forma en que Sebastin Piera se ha
desempeado como Presidente de la
Diferencia de
Repblica?
medias (I-J)
Error tpico
Sig.
Lmite inferior
Lmite superior
*
1.- Aprueba
2.- Desaprueba
1,394
.158
.000
1.01
1.78
2.- Desaprueba
9.- NS/NR

9.- NS/NR
1.- Aprueba
9.- NS/NR
1.- Aprueba
2.- Desaprueba

.567
*
-1,394
*
-,827
-.567
*
,827

.247
.158
.236
.247
.236

.072
.000
.002
.072
.002

-.04
-1.78
-1.41
-1.17
.25

1.17
-1.01
-.25
.04
1.41

*. La diferencia de medias es significativa al nivel 0.05.

GRFICOS DE ERROR PARA MS DE DOS MUESTRAS

10

11

You might also like