You are on page 1of 19

Estadstica para la

Investigacin Experimental

TEMA 3: Contrastes sobre medias

Contrastes sobre medias en SPSS

1. Introduccin

2. Medias

3. Contrastes sobre una muestra

4. Contrastes sobre dos muestras independientes

5. Contrastes sobre dos muestras relacionadas

1
Recordar: Distribucin t-Student

La distribucin t-Student es parecida a la Normal.

Se utiliza cuando se desconoce la varianza de la poblacin.

A medida que la muestra es mayor (n>100) es casi equivalente usar


t-Student o la normal.

En la t-Student se tiene en cuenta el tamao de la muestra. Hay una t


distinta para cada tamao de la muestra.

Los g.l. son n-1 cuando hay una muestra, siendo n el tamao de la
muestra.

Si comparamos 2 muestras:

g.l = (n1-1) + (n2-1)


3

Introduccin

En SPSS, los contrastes paramtricos que se pueden estudiar son


aquellos que en las hiptesis hacen referencia a la media de una
poblacin normal, cuando tenemos una muestra, dos
independientes, o dos relacionadas. Se denomina prueba T.
Procedimientos en SPSS:
Medias
Prueba T para una muestra.
Prueba T para dos muestras independientes.
Prueba T para muestras relacionadas (apareadas).
Estas pruebas se encuentran en le men Analizar /Comparar medias

2
Introduccin

Si la variable categrica tiene tres o ms categoras el procedimiento es Anlisis


de la Varianza (ANOVA de una va)
Tanto la t de Student como el ANOVA, la variable cuantitativa debe cumplir dos
requisitos:
a) La variable cuantitativa debe distribuirse segn la Ley Normal en cada uno de
los grupos que se comparan (CRITERIO DE NORMALIDAD).
b) Las varianzas de la distribucin de la variable cuantitativa en las poblaciones
de las que provienen los grupos que se comparan deben ser homogneas
(CRITERIO DE HOMOCEDASTICIDAD).
El primero es el ms importante. Aunque puede asumirse que se cumple para
muestras grandes (n > 100), debe explorarse siempre, con grficos y pruebas de
normalidad. En SPSS las pruebas de normalidad ms completas estn en la
opcin EXPLORAR.
5

Introduccin

Muestras apareadas o relacionadas: Cuando para cada observacin en


un grupo tenemos una observacin asociada en el segundo grupo.
Ejemplo. Cuando en un grupo tenemos las observaciones de unos
pacientes antes del tratamiento, y en el segundo tenemos las
observaciones tras el tratamiento.
Muestras independientes: Cuando puede suponerse que los individuos
de un grupo de tratamiento han sido extrados independientemente de
los del otro.
Ejemplo. Se quiere estudiar si el nivel de hierro es similar en los
individuos que padecen una determinada enfermedad frente a los
individuos sanos

3
Medias en SPSS

El procedimiento Medias ofrece, estadsticos descriptivos que


pueden calcularse teniendo en cuenta los distintos grupos y
subgrupos definidos por una o ms variables independientes.
Analizar Comparar medias Medias

Contrastes sobre una muestra

Planteamiento de hiptesis:
Bilateral:
H0: La media del grupo es IGUAL a la media de la poblacin
H1: La media del grupo NO es Igual a la media de la poblacin
Unilateral:
H0: La media del grupo NO es Mayor a la media de la poblacin
H1: La media del grupo es MAYOR a la media de la poblacin

H0: La media del grupo NO es Menor a la media de la poblacin
H1: La media del grupo es MENOR a la media de la poblacin

4
Ejemplo: Contrastes sobre una muestra

El problema ms simple que se puede resolver con la t de Student es el


referido a una sola muestra, sta tendra n-1 grados de libertad.
Ejemplo:
En el fichero Hbitos Se puede afirmar que en la poblacin el n de
hermanos incluido el sujeto (NUMHER) es 3?
Planteamiento:
H0: = 3 (la media poblacional vale 3)
H1: 3 (la media poblacional es diferente a 3)
Se soluciona el problema calculando una cantidad t, con una expresin muy
parecida a la que se utiliza para calcular z usando la normal
x-
t
s Sustituir la desviacin tpica (s) por el error tpico
n de la media
9

Ejemplo: Contrastes sobre una muestra

x- 2,69 - 3 - 0,31
t 2,86
s 0,108 0,108
n

Clculo p-valor: Transformar Calcular variable . P = (CDF.T(-2.865,174))*2


Resolucin con SPSS y comprobar resultados de la tabla Prueba para una
muestra
Analizar Comparar medias Prueba T para una muestra

Explicar resultados: (contraste de hiptesis, Intervalo de confianza)

10

5
Prueba T de Student para dos muestras independientes

El objetivo estadstico comparar tendr 2 variables: una variable fija


(categrica dicotmica) que formaran los grupos y una variable
aleatoria (numrica) que se desea medir.
A la variable fija se le denomina factor independiente y a la variable
numrica: variable dependiente

Contraste de hiptesis:
H0: A = B
H1: A B

11

Prueba T de Student para dos muestras independientes

Se tiene que comprobar si la diferencia que existe entre las dos


medias muestrales es debida a la variabilidad aleatoria o al efecto
del factor. Para su resolucin se aplica la t de Student.

Estadstico t de Student:

media 1 media 2
t n1 n2 2
EEDM
EEDM = Error estndar de la diferencia de medias

12

6
Prueba T de Student para dos muestras independientes

Clculo del Error estndar de la diferencia de medias (EEDM):


1. Si las varianzas de las muestras son homogneas
Calculamos la varianza ponderada por sus grados de libertad:

Se define EEDM:

1 1
EEDM sp
n1 n2

13

Prueba T de Student para dos muestras independientes

Clculo del Error estndar de la diferencia de medias (EEDM):


2. Si las varianzas de las muestras no son homogneas
Se utiliza el test t modificado se llama test de Welch
2
s12 s22
n1 n2
g.l * 2 2
s12 s22
n1 n2
n1 1 n2 1
media 1 media 2
Y el contraste sera: t g.l*
s12 s22
n1 n2
14

7
Diagrama de aplicacin para dos muestras independientes

Muestras Independientes

n1 y n2 30 n1 o n2 < 30

Normalidad

SI NO
Normalidad al
Levene transformar?

Homogeneidad Heterogeneidad SI NO
de varianzas varianzas
U de Mann-
t de Student t para varianzas Whiney
desiguales: Welch

15

Prueba T de Student para dos muestras independientes

En SPSS

Analizar Comparar medias Prueba T Student para dos muestras


independientes

16

8
Ejemplo: Prueba T para muestras independientes

SPSS nos ofrece una tabla con:


Una prueba de homogeneidad de varianzas (la prueba de Levene), que
nos informa sobre el segundo requisito para aplicar la comparacin de
medias mediante la prueba t de Student: la homogeneidad de varianzas.
El programa hace un contraste a travs de estadstico F de Snedecor y
nos aporta una significacin estadstica, asociado a la hiptesis nula de
que las varianzas son homogneas.
Una doble salida de la comparacin de medias en los dos grupos,
expresada en dos filas:
En la fila superior es cuando han asumido varianzas iguales
En la fila inferior cuando no han asumido varianzas iguales

17

Prueba T de Student para dos muestras independientes

Ejemplo: se compara el nivel de ruidos en dB durante la maana en


una zona de Madrid dividida en la zona centro y zona alrededor del
centro. (Abrir archivo ruidos)
Solucin (SPSS y Excel)
No comprobar normalidad ya que n1 y n2 > 30 (n1 =119 y n2 =89)
Analizar Comparar medias Prueba T Student para dos muestras
independientes
Comprobar los
resultados de las
tablas obtenidas
con excel y
explicacin

18

9
Prueba T para muestras independientes
Si no se cumple la Normalidad uno o los dos grupos formados no se
podr usar t de Student.
Soluciones:
Transformacin variable dependiente.
Test de la U de Mann_Whitney.

19

Prueba T para muestras independientes


Transformacin variable dependiente
Se realiza una transformacin de la variable dependiente para
conseguir una mayor aproximacin a la normalidad.
La transformacin complica la interpretacin de los resultados.
Ejemplo: abrir archivo: aceitunas
Se desea comprobar la aceptacin (precio ms calidad) que tienen en
el mercado dos tipos de aceites provenientes de olivares con
diferentes tipos de aceitunas: aceite tipo Picual y aceite tipo
Hojiblanca. La valoracin de la aceptacin se ha obtenido a travs de
un algoritmo complejo donde intervienen la produccin de aceite del
olivar, sabores, preferencias de la gente, precio, etc.
20

10
Prueba T para muestras independientes
Ejemplo: abrir archivo: aceitunas
Recordar:
No se puede usar t-Student si la muestra es pequea y no se puede
asumir la normalidad Transformacin de la variable
dependiente para conseguir la normalidad.
Recordar la media geomtrica.
Utilizar la transformacin ln.
Conclusin del ejemplo:
La media geomtrica de la aceptacin es de 1,10 veces superior en el
grupo 1 (aceituna Picual).

21

Test de la U de Mann_Whitney
La U de Mann_Whitney es un procedimiento no paramtrico que
sustituye a la t para comparar las medias de dos grupos
independientes.
Como requiere ordenar los valores antes de realizar el test, no
compara las dos medias, sino las dos medianas.
Se debe usar la U de Mann-Whitney si:
Alguna de las dos muestras contiene menos de 30 observaciones
y no se puede asumir la normalidad (ni transformando la variable)
Se trata de una variable ordinal en vez de ser realmente
cuantitativa
La muestra es muy pequea (<10 observaciones en alguno de los
dos grupos)
22

11
Test de la U de Mann_Whitney
El test de Mann_Whitney consiste en ir comparando cada individuo
de un grupo con cada individuo del otro para contabilizar el n de
veces que alguien de un grupo presenta un valor superior a alguien de
otro.
Para facilitar las comparaciones se debe comenzar ordenando en
cada grupo de mayor a menor la variable comparada.
Una vez hallada cualquiera de las cantidades de U, se puede calcular
un valor z que permite hacer un contraste de hiptesis:

23

Test de la U de Mann_Whitney
Ejemplo: (abrir archivo abono)
Se han utilizado dos tipos de abonos para aumentar el peso en
gramos en la produccin de tomates en dos invernaderos diferentes. El
objetivo es conocer la produccin de tomates de mayor contenido en
peso. Por tanto, se quiere estudiar la influencia del abono en la
produccin. Abono 1 Abono 2
120 99 Un grupo (2) tiene menos
100 70 de 10 observaciones.
92 69
87 68 En SPSS:
79 55
Clic Analizar Pruebas no
60 50
55 30 paramtricas Cuadros de
50 9 dilogo antiguo Dos
20 3 muestras independientes
18
16
15
5
24

12
Test de la U de Mann_Whitney

Nota:
Con muestras pequeas (n 30) el SPSS ofrece el nivel crtico
bilateral exacto asociado al estadstico U, el cual se obtiene
multiplicando por 2 la probabilidad de obtener valores menores o
iguales que U (esta probabilidad se calcula utilizando el algoritmo de
Dineen y Blakesley, 1973).

Con muestras grandes (n > 30), el SPSS ofrece una tipificacin del
estadstico U (incluyendo correccin por empates) que se distribuye
aproximadamente N(0, 1):

25

Prueba T muestras relacionadas

La prueba T para dos muestras relacionadas permite contrastar


hiptesis referidas a la diferencia entre dos medias relacionadas.

Recordamos que hay emparejamiento si:


Se realizan mediciones repetidas en un mismo individuo
Se compara entre si (de dos en dos) parejas naturales de
individuos.

Contraste de hiptesis:
H0: antes = despus H 0 : dif 0
H1: antes despus H 0 : dif 0

26

13
Prueba T muestras relacionadas

Desde el punto de vista estadstico, este contraste es idntico al


presentado en el apartado Prueba T para una muestra. La nica
diferencia existente entre ambos contrastes es que all tenamos
una muestra de puntuaciones obtenida al medir una sola variable y
ahora tenemos dos muestras relacionadas (o una muestra de pares
de puntuaciones) que convertimos en una sola muestra de
diferencias restando las puntuaciones de cada par.

El estadstico o prueba T sigue siendo una tipificacin de la media


muestral de las diferencias

Este estadstico T se distribuye segn el modelo


t de Student con n-1 grados de libertad y, por
tanto, nos permite conocer la probabilidad
asociada a los diferentes valores que es posible
obtener en muestras aleatorias de tamao n.
27

Prueba T muestras relacionadas

Pasos para comparar dos grupos emparejados:

Calcular la variable diferencia entre los valores antes y los valores


despus de cada unidad de estudio.

Cuando el tamao de la muestra es menor que 30, comprobar si la


variable diferencia sigue una distribucin Normal
- Si sigue una distribucin Normal: t de Student para muestras
relacionadas

- Si no sigue una distribucin Normal: Test de Wilcoxon

28

14
Muestras relacionadas: t de Student

3. Calcular el error estndar de la media de la diferencia.


SDIF
EEM
n
4. Calcular g.l = n-1

5. Calcular t para datos relacionados:


DIF
t n -1
S DIF
n
6. Comparar el valor tabulado t con el valor tabulado de la t de
Student

29

Prueba T muestras relacionadas en SPSS

Para contrastar hiptesis sobre dos medias relacionadas:


Analizar Comparar medias Prueba T para muestras
relacionadas

30

15
Ejemplo Prueba T muestras relacionadas

Nota: la conductividad elctrica es la facilidad de un material para conducir la


electricidad. Se mide en -1 m-1.
Se quiere realizar un estudio de la mejora del aislamiento elctrico de una serie de
materiales antes y despus de un proceso mecnico (compresin). Para ello
medimos la conductividad elctrica antes y despus del proceso Obtenindose los
resultados siguientes:
Id Antes Despus
1 4,0 5,6
2 3,9 4,7
3 4,8 4,8
4 5,1 4,9
5 5,6 3,2
6 6,1 4,8
7 6,4 3,7
8 6,4 4,0
9 6,5 6,4
10 6,4 4,8
11 6,4 4,4
12 6,4 3,3
13 6,8 6,0
14 7,6 4,4
15 8,1 6,4
31

Ejemplo Prueba T muestras relacionadas

Solucin en SPSS
1. Calcular una nueva variable: diferencia
2. Comprobar que la variable diferencia sigue una distribucin Normal (Shapiro-Wilk)
3. Analizar Comparar medias Prueba T para muestra relacionada

Explicacin de las tablas obtenidas en SPSS

32

16
Muestras relacionadas: test de Wilcoxon

El test de Wilcoxon es no paramtrico y no requiere ninguna


condicin de aplicacin.

Se debe utilizar si:


Los datos a comparar son ordinales
Son datos cuantitativos pero la muestra es pequea (n<30) y
adems no sigue una distribucin normal en la variable
diferencia entre las dos mediciones relacionadas.

Si el test t relacionado no se cumple el supuesto de normalidad


para la variable diferencia, se puede intentar la transformacin.
Cuando la transformacin no se logra la normalidad, se recurrir al
test de Wilcoxon

33

Muestras relacionadas: test de Wilcoxon

Pasos para realizar el test de Wilcoxon

1. Hallar las diferencias entre cada par de individuos relacionados


2. Se ordenan las diferencias (en valor absoluto) de menor a mayor.
3. Se asignan rangos a cada dato (usando su valor absoluto) pero se
debe aplicar la correccin por empate, esto es, a cada uno se le
asigna un nmero de orden y a los que estn empatados, se les
asigna el rango medio de los que tengan el mismo valor absoluto
de la diferencia.
4. Se suman los rangos de las diferencias negativas por un lado y los
de las diferencias positivas por otro.
5. Se calcula la suma y la media de los rangos.

34

17
Muestras relacionadas: test de Wilcoxon

Pasos para realizar el test de Wilcoxon (sigue)


6. Calcular test z.

(k se refiere al nmero rangos distintos en los que existen empates


y ti al nmero de puntuaciones empatadas en el rango i). El SPSS
ofrece el nivel crtico bilateral resultante de multiplicar por 2 la
probabilidad de obtener valores menores o iguales que Z.

35

Ejemplo Test de Wilcoxon

Una determinada fbrica produjo bombas de extraccin de agua por parejas.


Se quiere ver el resultado de las bombas despus de 10 aos, donde unas
siguen funcionando actualmente y otras desaparecieron. Se ha valorado la
actividad de la bomba de 0 a 3, asignndose 0 a las bombas que no llegaron
a utilizarse, 1 a las que se utilizaban espordicamente, 2 a las que lo hacan
regularmente y 3 a las que adems de utilizarse regularmente tenan un
mantenimiento continuo.

Pareja Bomba A Bomba B


1 1 0
2 2 1
En SPSS:
3 3 1 Clic Analizar Pruebas
4 1 0 no paramtricas
5 2 1 Cuadros de dilogo
6 2 1 antiguo Dos
7 3 2 muestras relacionadas
8 1 2
9 1 1

36

18
Muestras relacionadas: test de Wilcoxon

Realizar el ejemplo:
- En Excel
- En SPSS

37

19

You might also like