You are on page 1of 15

Anlisis cuantitativ o de datos con SPSS

Pruebas paramtricas
Manual de trabajo para el Taller de Mtodos Estadsticos para
I nvestigadores.

En general las pruebas paramtricas son ms potentes que las


pruebas no paramtricas, pero exigen que se cumplan una serie de
supuestos como la normalidad en la distribucin variable, la
homocedasticidad (igualdad de varianzas) y la independencia de
las observaciones, requiriendo algunas pruebas que se cumplan todo
el conjunto de supuestos o alguno de ellos, dependiendo de la
prueba a utilizar, sin los cuales, estas pruebas pierden todo su
potencial y resulta imprescindible recurrir a sus homlogas no
paramtricas.
Las pruebas paramtricas a estudiar sern:

Prueba t (para una muestra o para dos muestras relacionadas


o independientes) y prueba

Temas a tratar

Pruebas paramtricas de
comparacin de medias
Condiciones de parametricidad
Variable numrica
Normalidad
Homocedasticidad
Seleccin de la muestra
Muestras independientes
Muestras dependiente so
relacionadas
Tipos de pruebas paramtricas

ANOVA (para ms de dos muestras independientes).

Importante.
Ho (hiptesis nula) representa la
afirmacin de que no existe
asociacin entre las dos
variables estudiadas.
Ha (hiptesis alternativa) afirma
que hay algn grado de
relacin o asociacin entre las
dos variables. Dicha decisin
puede ser afirmada con una
seguridad que se decide
previamente a travs del nivel
de significacin

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 1 de 15

Condiciones de parametricidad.
a.
Variable numrica: la v ariable de estudio (la dependiente) debe estar medida en una
escala que sea, por lo menos, de interv alo e, idealmente, de razn.
b.
Normalidad: los v alores de la v ariable dependiente deben seguir una distribucin normal;
por lo menos, en la poblacin a la que pertenece la muestra.
Debido a esto es preciso comprobar si la distribucin de nuestro estudio sigue esta estructura
terica. Para ello una simple exploracin v isual de los datos puede sugerir la forma. Existen, no
obstante, otras medidas como son los grficos de normalidad y los contrastes de hiptesis
(Prueba de Kolmogorov -Smirnov (se usa cuando n50) y la Prueba de Shapiro-Wilk (se usa
cuando n<50) que pueden ayudarnos a decidir, de un modo ms riguroso, si la muestra de la
que se dispone procede o no de una distribucin normal. Cuando los datos no sean normales
se emplearn otros mtodos estadsticos que no exijan este tipo de restricciones (los llamados
mtodos no paramtricos).
c.
Homocedasticidad (homogeneidad de v arianzas) entre los grupos a comparar: las
v arianzas de la v ariable dependiente en los grupos que se comparan deben ser
aproximadamente iguales.
Existen v arias pruebas que permiten comprobar la igualdad de v arianzas (F de Fisher, prueba
de Lev ene, prueba de Bartlett, etc.). En este estudio, desarrollaremos la prueba de Lev ene,
esto es, aquella que emplea SPSS para comprobar que las v arianzas de la v ariable
dependiente en los grupos que se comparan sean aproximadamente iguales.
d.
La n muestral: no debe ser inferior a 30, y cuanto ms se acerque a la n poblacional
mejor. Dado que las pruebas paramtricas realizan estimacin de parmetros de la poblacin
a partir de muestras estadsticas, es lgico pensar que cuanto ms grande sea la muestra, ms
exacta ser la estimacin; en cambio, cuanto ms pequea, ms distorsionada ser la media
de las muestras por los v alores raros extremos.

Seleccin de la muestra
Muestras independientes. Son aquellas cuyo univ erso de poblacin resulta diferente. Es
el caso, por ejemplo, de la v ariable sexo, que se div ide en dos univ ersos diferentes: hombres y
mujeres; o el de la v ariable estado civil, definida por solteros, casados, divorciados, viudos,
etc.

a.

Muestras dependientes o relacionadas. Se refieren a las prov enientes de un univ erso


muestral, a las que se aplicar un plan experimental, mediante el cual se espera un cambio,
de manera que en el anlisis de las observaciones existen dos perodos: antes y despus del
tratamiento.

b.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 2 de 15

Tipos de pruebas paramtricas


A continuacin en la siguiente tabla resumimos el tipo de
prueba que debe utilizarse segn el contraste planteado:

Prueba t para una muestra.


Contrasta si la media de una
poblacin difiere significativamente
de un v alor dado conocido o
hipotetizado.

a.

Prueba t para dos muestras


independientes. Esta prueba debe
utilizarse cuando la comparacin se
realice entre las medias de dos
poblaciones independientes, por
ejemplo, en el caso de la
comparacin de las poblaciones de
hombres y mujeres.

b.

Tipo de Contraste

Pruebas

Una muestra

Prueba T

Dos muestras independientes

Prueba t para muestras


independientes

Dos muestras relacionadas

Prueba t para muestras


relacionadas

Ms de dos muestras
independientes

ANOVA

PRUEBA T PARA MUESTRAS INDEPENDIENTES


CASO 01 CON SPSS
La v ariable raza se desea saber si est relacionada con el peso de
los indiv iduos (una v ariable cuantitativa, cuya medida est en
kilogramos).
Es decir, pretendemos responder a la pregunta:
Est relacionada la raza del individuo con su peso?
REVI SAR EL SI GUIENTE V DEO TUTORI AL: (encontrars la explicacin
paso a poso del desarrollo y resolucin del caso)
http://youtu.be/dMp5dafERVM
En este caso se trata de comparar las medias de una v ariable
cuantitativ a (peso) en dos grupos establecidos por una v ariable
(raza); por lo que el procedimiento estadstico correspondiente es
Prueba t para muestras independientes.

Prueba t para dos muestras


relacionadas. Existe una segunda
alternativa para contrastar dos
medias. Esta se refiere al supuesto
caso en el que las dos poblaciones
no sean independientes, es decir, el
caso en el que se trate de
poblaciones relacionadas, por
ejemplo, en los diseos apareados,
diseos en los que los mismos
indiv iduos son observ ados antes y
despus de una determinada
interv encin.

c.

Prueba ANOVA para ms de


dos muestras independientes.
ANOVA es el acrnimo de anlisis de
la varianza. Es una prueba
estadstica desarrollada para realizar
simultneamente la comparacin
de las medias de ms de dos
poblaciones. A la asuncin de
Normalidad debe aadirse la de la
homogeneidad de las v arianzas de
las poblaciones a comparar.

d.

Si del ANOVA resultase el rechazo


de la hiptesis nula de igualdad de
medias, se debe proseguir el
anlisis con la realizacin de los
contrastes a posteriori (post hoc).

PASO 1: Verificar el cumplimiento de normalidad y homocedasticidad.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 3 de 15

Se hace clic en Grficos y luego se activ a grficos con pruebas de normalidad.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 4 de 15

Seguidamente, se nos muestra las pruebas de normalidad:

Pruebas de normalidad
a

Kolmogorov-Smirnov
Estadstico
gl
Sig.

Raza del individuo


observado
Peso del Negro
,174
17
individuo Blanco
,166
15
observado
*. Este es un lmite inferior de la significacin verdadera.

Shapiro-Wilk
Estadstico
gl

Prueba de Kolmogorov -Smirnov (se


usa cuando n50) y la

Sig.

,182

,943

17

,350

,200*

,903

15

,107

a. Correccin de la significacin de Lilliefors


En nuestro ejemplo en ambos grupos el p-v alor es no significativo
(esto es, p-valor > 0,05). Por lo que aceptamos Ho, es decir, se
asume la normalidad de la v ariable cuantitativa peso en ambos
grupos (raza blanca y raza negra).

Prueba de Shapiro-W ilk (se usa


cuando n<50).
Si p>0.05 se acepta Ho, en caso
contrario se rechaza; teniendo en
cuenta que:

Ho= El peso de los individuos


tiene distribucin normal.
Ha= El peso de los individuos no
tiene distribucin normal .

PASO 2:
Para completar el anlisis inferencial debemos recurrir al contraste de hiptesis, es decir, Prueba T
para muestras independientes.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 5 de 15

En v ariables para contrastar seleccionar peso y en v ariables de agrupacin raza, luego pulsar en
Definir grupos y considerar los grupos 1 y 2, pulsar en Continuar y Aceptar.

Paso 03
Los resultados que se muestran son:

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 6 de 15

Estadsticos de grupo
Raza del

Media

individuo

Desviacin
tp.

observado

Peso del

Error tp.
de la
media

Negro

17

69,4118

7,34046

1,78032

Ho: las v arianzas son


homogneas

Blanco

15

69,2667

8,07524

2,08502

Ha: las v arianzas no son


homogneas

individuo
observado

Una prueba de homogeneidad de


v arianzas (la prueba de Lev ene), El
programa hace un contraste a
trav s del estadstico F de
Snedecor y nos aporta una
significacin estadstica, o v alor p

p-v alor es 0.382 > 0.05, concluimos que las varianzas en los grupos son homogneas.

La prueba T propiamente dicha, para la igualdad de medias nos da la siguiente informacin:

El v alor de T (t), los grados de libertad del estadstico (gl) y, lo ms importante, el v alor de pvalor (Sig. Bilateral) asociado al contraste.

El v alor de la diferencia de medias entre los dos grupos, su error tpico, y el interv alo de
confianza al 95% de dicha diferencia de medias
En el ejemplo con el que estamos trabajando la t de Student en la fila superior (se han asumido
varianzas iguales): el estadstico t= 0.053 (con 30 grados de libertad) y el v alor p-valor o sig.
bilateral es 0,958.
Conclusin:
No hay asociacin entre el peso y la raza, ya que la media del peso de los de raza negra y los de
raza blanca no son estadsticamente dif erentes al nivel de significacin alfa = 0,05.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 7 de 15

ANOVA
Comparacin de medias de una v ariable cuantitativa en tres o
ms grupos establecidos por una v ariable categrica
REVI SAR (encontrars la explicacin paso a poso del desarrollo
y resolucin del caso):
http://youtu.be/gOJgq2odXBI

CASO 02 CON SPSS


Hay relacin entre el peso de los individuos y su estado civil?
Antes que nada debemos comprobar si se cumple el requisito de
normalidad en la distribucin de la v ariable cuantitativa en todos
y cada uno de los estratos.

Cuando la v ariable cualitativa


tiene tres o ms categoras, el
anlisis de asociacin entre esta
v ariable y una cuantitativa ya no
puede llev arse a cabo por el test t
de Student, sino que debe
recurrirse a una tcnica conocida
como Anlisis de Varianza
(ANOVA).
Esta prueba contrasta las hiptesis:

Ho: las medias de las


distribuciones de la variable
cuantitativa en todos y cada
uno de los grupos
independientes son iguales:
Ha: alguna de las medias de
las distribuciones de la variable
cuantitativa en todos y cada
uno de los grupos
independientes es diferente.

PASO 01.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 8 de 15

Con respecto a los test de normalidad, se encuentra significacin estadstica (p-v alor > 0,05) en el
test de Shapiro-Wilk(n<50) en los tres grupos de estado civ il, lo que llev a a asumir la normalidad en
la distribucin de la v ariable peso en la poblacin de la que prov ienen los indiv iduos de la muestra.
Pruebas de normalidad
a

Estado civil del


individuo
Peso del Soltero
individuo Casado
observado
Otro

Kolmogorov-Smirnov
Estadstico
,167
,178
,141

gl

Shapiro-Wilk
Sig.

11
10
11

Estadstico

gl

Sig.

,200

,908

11

,229

,200

,907

10

,263

,200

,957

11

,735

*. Este es un lmite inferior de la significacin verdadera.


a. Correccin de la significacin de Lilliefors

PASO 02
Ejecutar la prueba ANOVA:

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 9 de 15

Los resultados que se obtienen se muestran a continuacin:


Primero se nos muestra un cuadro resumen con los estadsticos descriptiv os (de la v ariable
cuantitativ a) ms relev antes en cada grupo que se v a a contrastar: las medias (y sus I nterv alos de
Confianzas al 95%), las desv iaciones tpicas y los v alores mximo y mnimo.
Descriptivos
Peso del individuo observado
Intervalo de
confianza para la
media al 95%
Error
tpico

Lmite
inferior

Lmite
superior

Mnimo

Mximo

8,17090

2,46362

66,6925

77,6711

58,00

82,00

64,0000

5,09902

1,61245

60,3524

67,6476

58,00

72,00

11

71,3636

6,74200

2,03279

66,8343

75,8930

59,00

81,00

32

69,3438

7,56737

1,33774

66,6154

72,0721

58,00

82,00

Media

Soltero

11

72,1818

Casado

10

Otro
Total

Desviacin
tpica

Luego, la homogeneidad de varianzas, el test de Levene.


En nuestro ejemplo la significacin estadstica p-valor (Sig)= 0.492, pudiendo asumirse la
homogeneidad de v arianzas.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 10 de 15

Prueba de homogeneidad de varianzas


Peso del individuo observado
Estadstico de

gl1

gl2

Sig.

Levene

Para llev ar a cabo el contraste, se


recurre al estadstico F de
Snedecor, que en nuestro ejemplo
v ale 4.480 y tiene un p-v alor (sig)
=0.020 > 0.05
Conclusin:

,727

29

,492

Por ltimo, aparece la salida del ANOVA

las v ariables PESO y grupos de


ESTADO CVIL muestran
asociacin;
Se rechaza la Hiptesis nula.
En este caso habra lugar a ev aluar
los contrastes a posteriori, puesto
que se ha encontrado diferencias
significativas en el ANOVA.

ANOVA de un factor

PASO 03
Pulsar en la casilla Post hoc y seleccionar algn tipo de pruebas segn v arianzas iguales o diferentes,
los contrastes a posteriori ms usadas son Tukey, Bonferroni, DMS. Para el ejemplo se seleccion la
prueba DMS y Tukey-b (por tener diferentes tamaos de grupos)

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 11 de 15

Los resultados se muestran a continuacin:


En el cuadro de comparaciones mltiples v emos que cada grupo de ESTADO CIVIL se compara con
los otros dos, obtenindose en cada contraste la diferencia de medias, el I C95%, el error estndar y
el p-valor sig., en la que en algunos casos es no-significativo.

Comparaciones mltiples
Variable dependiente: Peso del individuo observado
Diferencia de
medias (I-J)

Sig.

8,18182 *

2,98795

,81818

Soltero
Otro

(I) Estado civil del individuo

DMS

Soltero

Lmite inferior

Lmite superior

,010

2,0708

14,2929

2,91594

,781

-5,1456

6,7819

-8,18182 *

2,98795

,010

-14,2929

-2,0708

-7,36364 *

2,98795

,020

-13,4747

-1,2526

Soltero

-,81818

2,91594

,781

-6,7819

5,1456

Casado

7,36364 *

2,98795

,020

1,2526

13,4747

Casado
Otro

Casado

Otro

Intervalo de confianza al 95%

Error
tpico

*. La diferencia de medias es significativa al nivel 0.05.

De igual manera la prueba de Tukey nos proporciona los subconjuntos homogneos, como en
nuestro caso hay diferencia significativa en los grupos estados civil, se muestra los tres grupos en
diferente subconjunto; lo indica que hay diferencia entre los grupos.

Peso del individuo observado


Estado civil del individuo

Subconjunto para alfa = 0.05


1

Tukey Ba,b

Casado

10

64,0000

Otro

11

71,3636

Soltero

11

72,1818

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 12 de 15

PRUEBA T PARA MUESTRAS RELACIONADAS O


PAREADAS
CASO 03 CON SPSS

REVI SAR EL SI GUIENTE VI DEO TUTORI AL (encontrars la explicacin


paso a poso del desarrollo y resolucin del caso):
http://youtu.be/tBVX4vbmbks

Entonces necesitamos probar si:


Hay diferencia significativa entre el peso antes de los ejercicios
anti estrs y despus de los ejercicios anti estrs?

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Consideraremos la comparacin
de las medias de dos poblaciones
en base a dos muestras
emparejadas o relacionadas. Por
ejemplo, los datos de la v ariable
peso y supongamos que queremos
establecer la influencia de un
programa de ejercicios anti estrs,
por lo que se mide el peso antes y
despus de iniciar los ejercicios anti
estrs, aqu cada caso representa
a un mismo sujeto..
Las hiptesis a plantear son:
Ho: El niv el promedio de peso antes
del los ejercicios anti estrs es igual
al peso despus del los ejercicios
anti estrs.
Ha: El niv el promedio de peso
antes del los ejercicios anti estrs es
diferente al peso despus del los
ejercicios anti estrs.

Pgina 13 de 15

Se encuentran los siguientes resultados en: Estadsticos de muestras relacionadas, la media, tamao
muestral comn, desv iacin tpica y error tpico de la media de cada una de las dos v ariables.

Estadsticos de muestras relacionadas


Media

Desviacin tp.

Error tp. de la
media

Peso antes del tratamiento


anti estrs

69,3438

32

7,56737

1,33774

66,2500

32

5,90790

1,04438

Par 1
Peso despus del
tratamiento anti estrs

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 14 de 15

Finalmente, encontramos los resultados de la prueba T de muestras relacionadas: media, desviacin


tpica y error tpico de la media para la diferencia de las dos muestras, un interv alo de confianza y
un contraste para la diferencia de las medias.
Prueba de muestras relacionadas

Par 1

Peso antes del


tratamiento anti estrs Peso despus del
tratamiento anti estrs

Media
3,09375

Diferencias relacionadas95% Intervalo de


Desviacin Error tp. de la confianza para la
Inferior Superior
tp.
media
2,55721

,45205 2,17178

4,01572

t
6,844

gl

Sig.
(bilateral)
31
,000

Puesto que la significacin o P-valor Sig. bilateral = 0.000 < 0.05 se concluye que hay diferencia
significativa entre el peso antes y despus de iniciar los ejercicios anti estrs, podemos decir que, hay
ev idencia estadstica para afirmar que los ejercicios anti estrs ayudan a reducir el peso.

Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata

Pgina 15 de 15

You might also like